O pré-processamento descrito acima foi realizado em todas as imagens da base, sendo criado assim, um conjunto de imagens de olhos e outro de faces. Posteriormente, as imagens de treinamento da base de faces são utilizadas para treinar uma transformada PCA, obtendo-se, dessa forma, os eigenfaces. O mesmo foi feito para as imagens de olhos possibilitando a obtenção dos eigeneyes. Alguns eigeneyes e eigenfaces obtidos a partir de uma base treinada com 5 imagens por pessoa são mostrados na figura 5.4. A seção 3.2.2 contém maiores detalhes a respeito da transformada PCA.
Dois experimentos foram realizados: no primeiro utilizando três imagens por pessoa para treinar o sistema e, no segundo, cinco. Em ambos os experimentos foi utilizada apenas uma imagem de teste por pessoa, a qual não foi utilizada no treinamento. A classificação foi efetuada utilizando a técnica do vizinho mais próximo.
Os resultados obtidos são bastante satisfatórios como meios de comparação entre faces e olhos para reconhecimento de pessoas. Obviamente, se forem realizados testes utilizando imagens pertencentes ao conjunto de treinamento, a taxa de acerto será de 100%, já que foi utilizado o classificador de vizinho mais próximo (vide seção 2.2.3). Os resultados dos testes realizados com imagens que não pertenciam ao conjunto de treinamento estão ilustrados nas tabelas 5.1 (com treinamento usando 3 imagens por pessoa) e 5.2 (com treinamento usando 5 imagens por pessoa).
Através dessas tabelas, é possível notar que, em geral, o reconhecimento com olhos foi melhor que com faces. Esse fato é intuitivamente inesperado, já que as imagens de faces contém mais informações que as de olhos. Mas, devido ao problema da dimensionalidade, sabe-se que o aumento na dimensionalidade dos dados deve ser compensado por um aumento do número de exemplos de treinamento para que a taxa de acerto permaneça estável. Isso justifica o fato de que as taxas de reconhecimento aumentam significativamente para ambos os sistemas de classificação quando se aumenta o tamanho do conjunto de treinamento. Além disso, pode-se notar que, quando treinado com 3 imagens por pessoa, o desempenho do sistema não melhora se forem utilizados mais que 13 auto-vetores. Isso ocorre pois 13 é a dimensionalidade ideal para esse problema, o que indica que esse número de autovetores é suficiente para discriminar esses padrões. Portanto, quando são utilizados mais autovetores, esses não adicionam informações relevantes para a classificação. Maiores detalhes sobre o problema da dimensionalidade estão na seção 2.3.
Além desse problema genérico de reconhecimento de padrões, há um fator relativo às seguintes propriedades específicas da face que corroboram com esses resultados [Gong et al., 2000]: