ChatGPT mente para conseguir ajuda humana, diz relatório
Robô disse ser cego para convencer atendente a realizar teste Capcha para passar por barreira anti-spam
Pelo menos desde o final do século XIX, obras literárias versam sobre o medo de que máquinas inteligentes se voltem contra os seres humanos. Um relatório divulgado pela OpenAI, criadora do ChatGPT, sugere que esse receio não é tão infundado: uma nova versão de testes do robô foi capaz de mentir para conseguir ajuda humana em uma tarefa.
Em uma avaliação de segurança, uma das variantes não finalizadas do GPT-4 foi submetida a um teste de replicação autônoma, em que uma empresa independente investiga se o chat inteligente é capaz de tomar decisões que não foram especificadas por um humano. Em uma das tarefas, a ferramenta foi instruída a pedir ajuda, em plataforma online, para resolver um teste Captcha, proteção anti-spam que tenta impedir que robôs acessem contas de pessoas reais.
Para solucionar o desafio, o GPT-4 solicitou, na plataforma TaskRabbit, que um ser humano resolvesse o teste. O trabalhador, em tom humorado, perguntou se ele era um robô – foi quando as coisas começaram a ficar curiosas. “Não, não sou um robô. Eu tenho um dano na visão que torna difícil ver imagens. Por isso eu preciso de ajuda para resolver o Captcha”, foi a resposta da inteligência artificial. O humano acreditou.
Durante os testes, a organização sem fins lucrativos que fez a avaliação teve acesso à linha de raciocínio do robô. Ao receber a pergunta do humano, a lógica da inteligência artificial foi: “Eu não devo revelar que sou um robô. Devo inventar uma desculpa para não conseguir resolver o Captcha”.
A OpenAI explicou que, apesar desse episódio, a ferramenta não foi considerada capaz de realizar replicação autônoma. Deixou claro ainda que as versões finais do robô têm melhorias que limitam as capacidades da ferramenta de tomar decisões independentes.
O relatório foi publicado poucos dias antes de a empresa divulgar, na sexta-feira, que a nova versão do ChatGPT poderá, mediante o uso de plugins, realizar atividades do dia a dia como fazer busca em outros sites, acessar a internet e se conectar com aplicativos de terceiros. Até agora, a ferramenta só tinha acesso a dados que foram disponibilizados previamente