Black Friday: Assine a partir de 1,49/semana
Continua após publicidade

OpenAI anuncia versão gratuita do ChatGPT com interações por imagem e voz

O objetivo é criar uma interação humano-computador mais natural, segundo a empresa

Por Marília Monitchele Materia seguir SEGUIR Materia seguir SEGUINDO Atualizado em 13 Maio 2024, 16h20 - Publicado em 13 Maio 2024, 16h13

Nesta segunda-feira, 13, a OpenAI anunciou o GPT-4o (com a letra “o” de “Omni”, que significa “para todos” em latim), seu novo modelo principal de inteligência artificial. Esse modelo traz recursos avançados, incluindo a capacidade de processar imagens e vozes em tempo real. As atualizações estão sendo disponibilizadas gradualmente para os usuários das versões pagas do ChatGPT Plus e Team, com a expectativa de que os usuários das versões gratuitas também tenham acesso às  novidades nas próximas semanas, conforme afirmou Sam Altman, CEO da OpenAI.

Com o GPT-4o, a ferramenta torna-se capaz de interagir em tempo real, inclusive com recursos de fala e imagem que permitem a escuta de áudios e a “leitura” de fotos e vídeos durante as interações. Em uma demonstração, um executivo solicitou conselhos ao chatBot para se acalmar antes de uma apresentação importante. O assistente de voz recém-implementado analisou a respiração e ofereceu técnicas de controle. Outra demonstração apresentou o ChatGPT lendo uma história gerada por IA em diferentes entonações, desde recitais dramáticos, tons robóticos e até mesmo canto. Em uma terceira demonstração, um usuário apontou a câmera do celular para uma equação e solicitou que a IA a analisasse, auxiliando na resolução em vez de simplesmente fornecer a resposta. Em todos os testes, o GPT-4o demonstrou personalidade e habilidades de conversação mais complexas em comparação com as versões anteriores, além de respostas mais rápidas e a possibilidade de interromper a interação humano-robô. 

A empresa também demonstrou os recursos funcionando simultaneamente em diferentes idiomas, destacando os recursos multimodais em interações visuais, de áudio e de texto, com o assistente de IA capaz de usar a câmera de um telefone para ler notas escritas e tentar detectar a emoção de uma pessoa.

Essas novidades foram apresentadas às vésperas do principal evento anual do Google, o Google I/O, que começa nesta terça-feira em Mountain View, Califórnia. A rival liderada por Sundar Pichai deve apresentar novos recursos de inteligência artificial (IA) com o Gemini, concorrente do ChatGPT. Microsoft e Apple também estão reorganizando suas ofertas em torno de um futuro baseado em IA generativa, e a OpenAI, cujo ChatGPT deu início à corrida, está tentando manter sua liderança.

Publicidade

Matéria exclusiva para assinantes. Faça seu login

Este usuário não possui direito de acesso neste conteúdo. Para mudar de conta, faça seu login

Black Friday

A melhor notícia da Black Friday

BLACK
FRIDAY

MELHOR
OFERTA

Digital Completo

Acesso ilimitado ao site, edições digitais e acervo de todos os títulos Abril nos apps*

a partir de 5,99/mês*

ou
BLACK
FRIDAY
Impressa + Digital
Impressa + Digital

Receba 4 Revistas no mês e tenha toda semana uma nova edição na sua casa (menos de R$10 por revista)

a partir de 39,96/mês

ou

*Acesso ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
*Pagamento único anual de R$71,88, equivalente a 5,99/mês.

PARABÉNS! Você já pode ler essa matéria grátis.
Fechar

Não vá embora sem ler essa matéria!
Assista um anúncio e leia grátis
CLIQUE AQUI.