Introdução ao Reconhecimento Estatístico

Next: Métodos de Classificação Up: Abordagem estatística Previous: Panorama de Reconhecimento de Contents Index

Introdução ao Reconhecimento Estatístico

Basicamente, um sistema de reconhecimento estatístico de padrões pode ser composto pelas seguintes partes [Duda and Hart, 1973,Jain et al., 2000] (vide figura 2.1): um sistema de aquisição de dados (por exemplo: sensores ou câmeras); um sistema de pré-processamento, para eliminar ruídos ou distorções; um extrator de características (ou atributos), que cria um vetor de características com dados extraídos dos objetos adquiridos, reduzindo os dados a atributos, propriedades ou características; um seletor de características, que analisa o conjunto de características e elimina as mais redundantes; e um classificador, que analisa um padrão obtido e toma uma certa decisão.

.38pat_rec.eps Um sistema genérico de reconhecimento de padrões (baseado em [Duda and Hart, 1973] e [Jain et al., 2000]).

O classificador toma decisões baseando-se no aprendizado realizado a partir de um conjunto de treinamento, o qual contém exemplos de padrões de todas as classes existentes no sistema. Conforme será detalhado posteriormente, em reconhecimento estatístico de padrões, a classificação é realizada utilizando estimativas de distribuições probabilísticas, por isso o nome dessa abordagem. O reconhecedor de padrões é avaliado através de um conjunto de testes, preferencialmente composto por padrões de todas as classes, mas que não estejam no conjunto de treinamento. Além do classificador, o pré-processamento, o extrator e o seletor de características podem ser dependentes dos dados de treinamento. No caso de sistemas estatísticos, quando o problema abordado for muito complexo, torna-se essencial o uso de extração e seleção de características. Exemplos de problemas complexos são aqueles em que há muitas classes ou quando a dimensão dos padrões no formato em que são adquiridos for muito alta. Na abordagem estatística, cada padrão é representado em termos de

características (features) ou atributos. Um padrão é representado por um vetor de características ${\bf x} = [x_1, x_2, \cdots, x_N]^t$ , modelado como um vetor aleatório, em que cada

( $1 \leq j \leq N$ ) é uma característica [Theodoridis and Koutroumbas, 1999]. Cada padrão medido ${\bf x}_i$ é uma instância de ${\bf x}$ . O espaço formado pelos vetores de características é chamado de espaco de características, o qual possui dimensão

. Uma classe $\omega _i$ (a

-ésima classe de um conjunto de classes $\Omega$ , de

classes) é um conjunto que contém padrões os quais possuem alguma relação ou peculiaridade em comum. Em um exemplo simples de biometria, podemos ter um espaço de características ${\bf x}$ em que

representa altura (em cm),

representa peso (em Kg) e

representa o tamanho dos pés (em cm). Nesse mesmo espaço de três dimensões, cada instância de ${\bf x}$ representa as medições tomadas de uma pessoa em um determinado instante. Cada classe representa uma família de pessoas, por exemplo: `Simpson', `Jetson', `Kennedy' e `Brun'. Nesse caso, o problema de classificação define-se por: dada uma pessoa desconhecida, extrair suas características para obter seu vetor de características ${\bf x}$ e determinar a qual família provavelmente essa pessoa pertence. Os padrões são tratados como vetores aleatórios pois um padrão desconhecido pode ser o representante de uma classe conhecida que sofreu alterações aleatórias proporcionadas por ruídos oriundos do método de aquisição (sensores), da influência de outros fatores externos ou mesmo dos mecanismos de extração de características intrínsecos ao sistema de reconhecimento.

Next: Métodos de Classificação Up: Abordagem estatística Previous: Panorama de Reconhecimento de Contents Index

Teofilo Emidio de Campos 2001-08-29