Next: Método Proposto para Seleção
Up: Funções critério
Previous: Desempenho de um Classificador
  Contents
  Index
Distâncias entre Classes
Visando a otimizar o conjunto de características para minimizar a probabilidade de erro independentemente de classificadores específicos, deve-se maximizar a distância entre padrões de classes diferentes no espaço de características.
Quando se dispõe de um conjunto de amostras treinamento para cada classe, pode-se supor que tal conjunto possui uma boa representação das mesmas e estimar a distância entre as classes.
Considerando um espaço métrico
, uma distância ou métrica é uma função
que deve obedecer as seguintes condições [Lima, 1970]:
-
;
-
-
;
-
;
Há várias formas de medir-se a distância entre conjuntos de classes diferentes no espaço de características. Dentre elas, pode-se citar [Theodoridis and Koutroumbas, 1999,Kohn, 1998]:
- Distância entre os centróides das classes: Para calcular essa medida, basta determinar os centróides das classes e medir a distância entre eles.
- Distância entre vizinhos mais próximos, mais distantes e média: No cálculo dessas distâncias, devemos considerar, respectivamente, o mínimo, o máximo ou a média das distâncias entre os padrões de treinamento de duas classes diferentes;
- Distâncias baseadas em matrizes de espalhamento: Essas distâncias utilizam medidas de separabilidade baseadas em análise de discriminantes. Na seção 3.2.3 (equações 3.19 e 3.20), há uma breve descrição de matrizes de espalhamento.
- Distância de Mahalanobis: A distância de Mahalanobis (equação 2.17) pode ser utilizada para medir a distância entre classes de padrões. Isso pode ser feito através da soma ou da média da distância entre todos os padrões de duas classes diferentes.
- Distância de Bhattacharyya e divergência. Essas são distâncias baseadas nas funções densidade de probabilidade das classes, de forma que a distância espacial entre os conjuntos não é considerada, mas sim a diferença entre a forma deles.
- Distâncias nebulosas. As distâncias nebulosas são medidas que utilizam informações obtidas a partir da fuzzyficação dos conjuntos, como os suportes dos conjuntos e os coeficientes de pertinência dos padrões. Em [Bloch, 1999], há uma revisão bastante completa de distâncias nebulosas aplicadas a processamento de imagens. Em [Campos et al., 2001], foi utilizada uma distância nebulosa como função critério de um algoritmo de seleção de características. Os resultados obtidos com essa abordagem estão descritos na seção 3.4.
É importante lembrar que uma distância (ou métrica) é definida somente para entre dois elementos, ou seja, não se pode medir a distância entre três ou mais classes. Porém, na maioria dos problemas de reconhecimento de padrões reais, têm-se mais de duas classes. Por isso, ao efetuar seleção de características com base em alguma distância, é necessário definir uma função critério que possa avaliar a separabilidade entre todas as classes de uma maneira global. Para a maioria das distâncias citadas acima, isso pode ser feito através de operações simples como a soma, a média ou o ínfimo dos resultados obtidos para todos os pares de conjuntos (classes) existentes. Na seção 5.3 está descrita uma função critério para várias classes inspirada na distância descrita na seção 3.4.
Maiores detalhes e informações sobre outras medidas de distância (ou métricas) podem ser encontrados em [Kohn, 1998,Theodoridis and Koutroumbas, 1999,Duda and Hart, 1973,Bloch, 1999].
Next: Método Proposto para Seleção
Up: Funções critério
Previous: Desempenho de um Classificador
  Contents
  Index
Teofilo Emidio de Campos
2001-08-29