Algoritmo é capaz de reconhecer rostos com mais precisão do que os humanos

Enquanto as pessoas conseguem identificar corretamente 97,53% dos casos, o novo sistema atingiu índice de acerto de 98,52%

Um grupo de cientistas da Universidade de Hong Kong criou o primeiro algoritmo capaz de reconhecer rostos com mais precisão que humanos. Os sistemas de identificação facial atualmente existentes só obtêm bons resultados sob condições ideais: pequenas mudanças na expressão, posição ou iluminação bastam para comprometer seu desempenho. De acordo com seus criadores, o GaussianFace, como foi nomeado o algoritmo, se sai melhor que humanos em situações cotidianas e pode lidar com imagens de aplicativos para smartphones e controle de passaportes.

O sistema foi testado com um banco de dados que contém mais de 13 000 imagens de quase 6 000 pessoas, com diferentes poses, iluminação e expressões. Analisando pares de imagens, o algoritmo deveria verificar se eram duas pessoas diferentes ou duas fotos de uma mesma pessoa. Estudos anteriores, com a mesma base de dados, mostraram que humanos conseguem cumprir essa tarefa com 97,53% de precisão. O GaussianFace é o primeiro algoritmo a superar essa marca: obteve 98,52% de acertos.

Leia também:

Cérebro reconhece emoticons da mesma forma que rostos reais

Cientistas usam rostos famosos para identificar demência precoce

Funcionamento – O algoritmo atua por etapas. Primeiro ele transforma cada rosto em uma imagem de 150×120 pixels, com base na posição dos olhos, do nariz e dos cantos da boca. Então ele retalha cada imagem em recortes de 25×25 pixels e captura as características básicas de cada um. Feito isso, ele tenta comparar as imagens, buscando similaridades.

Embora tenha se saído melhor que humanos, o sistema ainda possui limitações, como reconhecem os próprios autores. Por exemplo: ao identificar uma pessoa, humanos também reparam na posição dos ombros e no pescoço, informações que o algoritmo não foi treinado para levar em conta. Além disso, o sistema ainda requer muita memória e leva tempo para ser “treinado” a reconhecer as imagens que compõem seu banco de dados.