Basicamente, um sistema de reconhecimento estatístico de padrões pode ser composto pelas seguintes partes [Duda and Hart, 1973,Jain et al., 2000] (vide figura 2.1): um sistema de aquisição de dados (por exemplo: sensores ou câmeras); um sistema de pré-processamento, para eliminar ruídos ou distorções; um extrator de características (ou atributos), que cria um vetor de características com dados extraídos dos objetos adquiridos, reduzindo os dados a atributos, propriedades ou características; um seletor de características, que analisa o conjunto de características e elimina as mais redundantes; e um classificador, que analisa um padrão obtido e toma uma certa decisão.
O classificador toma decisões baseando-se no aprendizado realizado a partir de um conjunto de treinamento, o qual contém exemplos de padrões de todas as classes existentes no sistema. Conforme será detalhado posteriormente, em reconhecimento estatístico de padrões, a classificação é realizada utilizando estimativas de distribuições probabilísticas, por isso o nome dessa abordagem. O reconhecedor de padrões é avaliado através de um conjunto de testes, preferencialmente composto por padrões de todas as classes, mas que não estejam no conjunto de treinamento. Além do classificador, o pré-processamento, o extrator e o seletor de características podem ser dependentes dos dados de treinamento.
No caso de sistemas estatísticos, quando o problema abordado for muito complexo, torna-se essencial o uso de extração e seleção de características. Exemplos de problemas complexos são aqueles em que há muitas classes ou quando a dimensão dos padrões no formato em que são adquiridos for muito alta.
Na abordagem estatística, cada padrão é representado em
termos de características (features) ou atributos. Um padrão é representado por um vetor de características
, modelado como um vetor aleatório, em que cada (
) é uma característica [Theodoridis and Koutroumbas, 1999]. Cada
padrão medido é uma instância de . O espaço formado pelos vetores de características é chamado
de espaco de características, o qual possui
dimensão .
Uma classe (a -ésima classe de um conjunto de classes , de classes) é um conjunto que contém padrões os quais possuem alguma relação ou peculiaridade em comum.
Em um exemplo simples de biometria, podemos ter um espaço de características
em que representa altura (em cm),
representa peso (em Kg) e representa o tamanho dos pés (em
cm). Nesse mesmo espaço de três dimensões, cada instância de representa as
medições tomadas de uma pessoa em um determinado instante. Cada classe
representa uma família de pessoas, por exemplo: `Simpson', `Jetson', `Kennedy'
e `Brun'. Nesse caso, o problema de classificação define-se por: dada uma
pessoa desconhecida, extrair suas características para obter seu vetor de
características e determinar a qual família provavelmente essa pessoa pertence.
Os padrões são tratados como vetores aleatórios pois um padrão desconhecido pode ser o representante de uma classe conhecida que sofreu alterações aleatórias proporcionadas por ruídos oriundos do método de aquisição (sensores), da influência de outros fatores externos ou mesmo dos mecanismos de extração de características intrínsecos ao sistema de reconhecimento.
Next:Métodos de Classificação Up:Abordagem estatística Previous:Panorama de Reconhecimento de
  Contents
  Index
Teofilo Emidio de Campos
2001-08-29