next up previous contents index
Next: Métodos Propostos e Resultados Up: Revisão de Reconhecimento de Previous: Vídeo   Contents   Index


Considerações Sobre o Estado-da-Arte

Segundo [Pentland, 2000], o primeiro sistema conhecido de reconhecimento automático de faces provavelmente é o de Kohonen, proposto em 1989. Kohonen demonstrou que uma simples rede neural pode desempenhar reconhecimento de faces usando imagens de faces registradas (normalizadas e alinhadas). Foi empregada uma rede que computa a descrição das faces através da aproximação dos auto-vetores da matriz de auto-correlação das imagens de face. Como sabemos, esses auto-vetores ficaram posteriormente conhecidos como eigenfaces. O sistema de Kohonen não foi um sucesso prático, pois ele depende de alinhamento e normalização das faces. Nos anos seguintes, muitos pesquisadores tentaram esquemas de reconhecimento de faces baseados em atributos locais (bordas, distâncias entre pontos característicos e outras abordagens) com o emprego de redes neurais. Enquanto muito sucesso foi obtido em bases de imagens pequenas com faces alinhadas, nenhum trabalho obteve sucesso em problemas mais realísticos de grandes bases de dados e com localização, orientação e escala da face desconhecidos [Pentland, 2000]. O método de reconhecimento de faces utilizando a transformada de Karhunen-Loève foi proposto em [Kirby and Sirovich, 1990] e está descrito com maiores detalhes na seção 3.2.2. Em [Turk and Pentland, 1991], foi demonstrado que o erro residual da codificação usando eigenfaces pode ser usada tanto para detectar faces em imagens naturais como para a determinação precisa da localização, escala e orientação de faces na imagem. Também foi mostrado que esse método pode ser usado para obter o reconhecimento de faces confiável em imagens com poucas restrições. A partir de 1993, surgiram vários outros sistemas de reconhecimento robustos a imagens não normalizadas. Segundo Pentland [Pentland, 2000], de acordo com os métodos de avaliação FERET (descrito a seguir), os três melhores algoritmos são os que foram propostos em [Moghaddam and Pentland, 1997], [Moghaddam et al., 1998], [Zhao et al., 1999] e [Wiskott et al., 1997]. Desses trabalhos, os três primeiros baseiam-se em PCA e em métodos discriminantes, divergindo no método de classificação. Já [Zhao et al., 1999] é baseado em Gabor jets, flexible templates e casamento de grafos. Para avaliar os algoritmos de reconhecimento de faces, foi criado o programa FERET (Face Recognition Technology) [Phillips et al., 1998], que é conhecido por ser o conjunto de testes (com bases de imagens estáticas) mais abrangente proposto até o momento. A base de dados do FERET possui faces com variações de translação, escala e iluminação de modo consistente com as fotografias $q$ ou as de carteira de habilitação para motoristas americanos. Há imagens de pessoas obtidas de fotos tiradas em datas diferentes (a diferença chega a um ano). O maior teste do FERET possui imagens de 1196 pessoas diferentes. Nesse teste, os algoritmos citados acima possuem desempenho muito similar. Com imagens frontais adquiridas no mesmo dia, o desempenho daqueles algoritmos foi de mais de 95% de acerto. Para imagens obtidas com câmeras e iluminações diferentes, o desempenho foi entre 80 e 90%. Para imagens tomadas um ano depois, a taxa de reconhecimento típica foi de 50%. A diferença entre os algoritmos foi menor que 0.5%. Para testes com 200 pessoas, os três algoritmos praticamente não erraram. Entretanto, nesse experimento, mesmo um simples método de combinação por correlação pode, algumas vezes, propiciar o mesmo resultado, com a diferença de tratar-se de um método lento. Por isso, Pentland [Pentland, 2000] sugere que, para que um novo algoritmo seja considerado potencialmente competitivo, esse deve ser testado com bases de dados possuindo, no mínimo, 200 indivíduos, devendo resultar em uma taxa de reconhecimento maior que 95%. Porém, esses resultados são válidos somente para imagens estáticas, e ainda não há um bom método definitivo de testes de algoritmos destinados a reconhecimento de pessoas a partir de seqüências de vídeo. A maioria das bases de seqüências de imagens de faces disponível foi criada para testar métodos de rastreamento e de determinação da orientação tridimensional. Por isso, em geral, elas possuem poucas pessoas diferentes. Nos experimentos descritos em [Li et al., 2000] foram realizados testes com uma base de seqüências de imagens de 20 sujeitos, sendo que o treinamento foi realizado com apenas 10 deles, pois os autores também fizeram testes de identificação de ``conhecido/desconhecido''. Melhor taxa de acerto obtida foi de 94,31
next up previous contents index
Next: Métodos Propostos e Resultados Up: Revisão de Reconhecimento de Previous: Vídeo   Contents   Index
Teofilo Emidio de Campos 2001-08-29