next up previous contents
Next: Outras Abordagens para o Up: Reconhecimento de Padrões Previous: Reconhecimento de Padrões   Sumário


Abordagem estatística

Basicamente, um sistema de reconhecimento estatístico de padrões pode ser composto pelas seguintes partes [14,13] (vide figura 1): um sistema de aquisição de dados (por exemplo: sensores ou câmeras); um sistema de pré-processamento, para eliminar ruídos ou distorções; um extrator de características, que cria um vetor de características com dados extraídos dos objetos adquiridos, reduzindo os dados a atributos, propriedades ou características; um seletor de características, que analisa o conjunto de características e elimina as mais redundantes; e um classificador, que analisa um padrão obtido e toma uma certa decisão.

Figura: Um sistema genérico de reconhecimento de padrões (baseada em [14] e [13]).
\includegraphics[width=13cm, height=4cm]{pat_rec.eps}

O classificador toma decisões baseando-se no aprendizado obtido a partir de um conjunto de treinamento, o qual contém exemplos de padrões de todas as classes existentes no sistema. O reconhecedor de padrões é avaliado através de um conjunto de testes, preferencialmente composto por padrões de todas as classes, mas que não estão no conjunto de treinamento. Além do classificador, o pré-processamento, o extrator e o seletor de características podem ser dependentes dos dados de treinamento. Essa estrutura não é particular dos métodos de reconhecimento estatístico, sendo também comum em outras abordagens de reconhecimento de padrões. Mas todos os sistemas de reconhecimento possuem um extrator e/ou um seletor de atributos. Na abordagem de template matching e em alguns casos de redes neurais, são utilizados dados no mesmo formato em que esses são adquiridos para classificá-los. No caso de sistemas estatísticos, quando o problema abordado for muito complexo, torna-se essencial o uso de extração e seleção de característica. Exemplos de problemas complexos são aqueles em que há muitas classes ou quando a dimensão dos padrões no formato em que são adqüiridos for muito alta. Na abordagem estatística, cada padrão é representado em termos de $d$ características (features) ou atributos, sendo visto como um ponto em um espaço $d$-dimensional. O objetivo é que tal espaço seja gerado de forma que suas características permitam que vetores de padrões pertencentes a categorias diferentes fiquem dispostos de maneira que o processo de classificação seja simplificado. Por exemplo, pode ser desejável que os vetores ocupem regiões compactas e disjuntas em um espaço de características de $d$ dimensões. A efetividade do espaço de características é determinada pelo quanto os padrões de classes diferentes podem ser separados. Assume-se que cada padrão é uma observação obtida aleatoriamente segundo uma certa probabilidade condicional a uma determinada classe. Dado um conjunto de padrões de treinamento contendo elementos de todas as classes, o objetivo é estabelecer fronteiras de decisão no espaço de características que separem os padrões de classes diferentes. Na teoria de decisão estatística, a fronteira de decisão é determinada para cada classe, que pode ser especificada (aprendizado supervisionado) ou aprendida (aprendizado não-supervisionado). No caso de sistemas de reconhecimento de faces, normalmente é realizado aprendizado supervisionado [2], isto é, as imagens de treinamento possuem um rótulo que identifica de quem é a fotografia. Por esse motivo não serão não serão descritos métodos não-supervisionados de aprendizado, detalhes a respeito desse assunto podem ser encontrados em [15]. Para efetuar a classificação, também pode-se usar uma abordagem baseada em análise de funções discriminantes: primeiramente uma forma paramétrica da fronteira de decisão é especificada (por exemplo, linear ou quadrática), posteriormente a melhor fronteira de decisão da forma especificada é encontrada com base na classificação dos padrões de treinamento. Tais fronteiras podem ser construídas usando, por exemplo, o critério de erro médio quadrático [13,12]. Existem várias técnicas estatísticas de reconhecimento de padrões, cada qual com seu nicho de aplicações. Nas seções 4, 5 e 6 há mais detalhes sobre alguns métodos estatísticos de extração e seleção de atributos, e classificação.
next up previous contents
Next: Outras Abordagens para o Up: Reconhecimento de Padrões Previous: Reconhecimento de Padrões   Sumário
Teofilo Emidio de Campos 2000-09-18