Avatar do usuário logado
Usuário
OLÁ, Usuário
Ícone de fechar alerta de notificações
Avatar do usuário logado
Usuário

Usuário

email@usuario.com.br
Abril Day: VEJA por apenas 4,00

OpenAI anuncia versão gratuita do ChatGPT com interações por imagem e voz

O objetivo é criar uma interação humano-computador mais natural, segundo a empresa

Por Marília Monitchele Materia seguir SEGUIR Materia seguir SEGUINDO 13 Maio 2024, 16h13 • Atualizado em 13 Maio 2024, 16h20
  • Nesta segunda-feira, 13, a OpenAI anunciou o GPT-4o (com a letra “o” de “Omni”, que significa “para todos” em latim), seu novo modelo principal de inteligência artificial. Esse modelo traz recursos avançados, incluindo a capacidade de processar imagens e vozes em tempo real. As atualizações estão sendo disponibilizadas gradualmente para os usuários das versões pagas do ChatGPT Plus e Team, com a expectativa de que os usuários das versões gratuitas também tenham acesso às  novidades nas próximas semanas, conforme afirmou Sam Altman, CEO da OpenAI.

    Com o GPT-4o, a ferramenta torna-se capaz de interagir em tempo real, inclusive com recursos de fala e imagem que permitem a escuta de áudios e a “leitura” de fotos e vídeos durante as interações. Em uma demonstração, um executivo solicitou conselhos ao chatBot para se acalmar antes de uma apresentação importante. O assistente de voz recém-implementado analisou a respiração e ofereceu técnicas de controle. Outra demonstração apresentou o ChatGPT lendo uma história gerada por IA em diferentes entonações, desde recitais dramáticos, tons robóticos e até mesmo canto. Em uma terceira demonstração, um usuário apontou a câmera do celular para uma equação e solicitou que a IA a analisasse, auxiliando na resolução em vez de simplesmente fornecer a resposta. Em todos os testes, o GPT-4o demonstrou personalidade e habilidades de conversação mais complexas em comparação com as versões anteriores, além de respostas mais rápidas e a possibilidade de interromper a interação humano-robô. 

    A empresa também demonstrou os recursos funcionando simultaneamente em diferentes idiomas, destacando os recursos multimodais em interações visuais, de áudio e de texto, com o assistente de IA capaz de usar a câmera de um telefone para ler notas escritas e tentar detectar a emoção de uma pessoa.

    Essas novidades foram apresentadas às vésperas do principal evento anual do Google, o Google I/O, que começa nesta terça-feira em Mountain View, Califórnia. A rival liderada por Sundar Pichai deve apresentar novos recursos de inteligência artificial (IA) com o Gemini, concorrente do ChatGPT. Microsoft e Apple também estão reorganizando suas ofertas em torno de um futuro baseado em IA generativa, e a OpenAI, cujo ChatGPT deu início à corrida, está tentando manter sua liderança.

    Publicidade

    Matéria exclusiva para assinantes. Faça seu login

    Este usuário não possui direito de acesso neste conteúdo. Para mudar de conta, faça seu login

    Domine o fato. Confie na fonte.

    15 marcas que você confia. Uma assinatura que vale por todas.

    ABRILDAY

    Digital Completo

    A notícia em tempo real na palma da sua mão!
    Chega de esperar! Informação quente, direto da fonte, onde você estiver.
    De: R$ 16,90/mês Apenas R$ 1,99/mês
    ABRILDAY

    Revista em Casa + Digital Completo

    Receba 4 revistas de Veja no mês, além de todos os benefícios do plano Digital Completo (cada revista sai por menos de R$ 7,50)
    De: R$ 55,90/mês
    A partir de R$ 29,90/mês

    *Acesso ilimitado ao site e edições digitais de todos os títulos Abril, ao acervo completo de Veja e Quatro Rodas e todas as edições dos últimos 7 anos de Claudia, Superinteressante, VC S/A, Você RH e Veja Saúde, incluindo edições especiais e históricas no app.
    *Pagamento único anual de R$23,88, equivalente a R$1,99/mês.