next up previous contents
Next: Extração de características Up: Reconhecimento de Faces Previous: Vídeo   Sumário

Cronologia e estado-da-arte

Segundo Pentland [3], o primeiro sistema famoso de reconhecimento automático de faces provavelmente é o de Kohonen, proposto em 1989. Kohonen demonstrou que uma simples rede neural pode desempenhar reconhecimento de faces usando imagens de faces registradas (normalizadas e alinhadas). Foi empregada uma rede que computa a descrição das faces através da aproximação dos auto-vetores da matriz de auto-correlação das imagens de face. Como sabemos, esses auto-vetores mais tarde ficaram conhecidos como eigenfaces. O sistema de Kohonen não foi um sucesso prático, pois ele depende de alinhamento e normalização das faces. Nos anos seguintes, muitos pesquisadores tentaram esquemas de reconhecimento de faces baseados em características locais, como bordas, distâncias entre pontos característicos e outras abordagens com o emprego de redes neurais. Enquanto muito sucesso foi obtido em bases de imagens pequenas com faces alinhadas, nenhum trabalho obteve sucesso em problemas mais realísticos de grandes bases de dados e com localização, orientação e escala da face são desconhecidas [3]. O método de reconhecimento de faces utilizando a transformada de Karhunen Loève foi proposto em [38] e está descrito com maiores detalhes na seção 4.2. Em [24], foi demonstrado que o erro residual da codificação usando eigenfaces pode ser usada tanto para detectar faces em imagens naturais como para a determinação precisa da localização, escala e orientação de faces na imagem. Também foi mostrado que esse método pode ser associado ao método de reconhecimento usando eigenfaces para obter reconhecimento de faces confiável em imagens com pouca restrição. A partir de 1993, surgiram vários outros sistemas de reconhecimento robustos a imagens não normalizadas. Segundo Pentland [3], os três melhores são: Para avaliar os algoritmos de reconhecimento de faces, há o programa FERET (Face Recognition Technology) [42], o qual é conhecido por ser o teste mais abrangente proposto até agora. A base de dados do FERET possui faces com variações em posição, escala e iluminação de modo consistente com as fotografias $3 \times 4$ ou as de carteira de habilitação para motoristas americanos. Há imagens de pessoas obtidas de fotos tiradas em datas diferentes (a diferença chega a um ano). O maior teste do FERET possui imagens de 1196 pessoas diferentes. Nesse teste, os algoritmos citados acima possuem desempenho muito similar. Em imagens frontais do mesmo dia, o desempenho dos algoritmos foi de mais de 95% de acerto. Para imagens obtidas com câmeras e iluminações diferentes, o desempenho foi entre 80 e 90%. Para imagens tomadas um ano depois, a taxa de reconhecimento típica foi de 50%. A diferença entre os algoritmos foi menor que 0.5%. Para testes com 200 pessoas, os três algoritmos praticamente não erraram. Entretanto, nesse experimento, mesmo um simples método de combinação por correlação pode, algumas vezes, propiciar o mesmo resultado, com a diferença de se tratar de um método lento. Por isso, Pentland [3] sugere que, para que um novo algoritmo seja considerado potencialmente competitivo, esse deve ser testado com bases de dados com, no mínimo, 200 indivíduos, devendo resultar em uma taxa de reconhecimento maior que 95%. Porém, como sabemos, esses resultados são válidos para imagens estáticas, e ainda não há um bom método definitivo de testes de algoritmos destinados a reconhecimento de pessoas a partir de seqüências de vídeo.
next up previous contents
Next: Extração de características Up: Reconhecimento de Faces Previous: Vídeo   Sumário
Teofilo Emidio de Campos 2000-09-18