next up previous contents index
Next: Resultados com os Dados Up: Método Proposto para Seleção Previous: Considerações Sobre o Comportamento   Contents   Index

Experimentos de Seleção de Características com Dados Artificiais

Para avaliar o desempenho dessa função critério para seleção de características, realizamos testes com os métodos de busca SFSM [Pudil et al., 1994] em dados artificiais. O método SFSM foi escolhido devido a sua velocidade, visto que realizamos testes com o método ASFSM e constatamos que a diferença entre qualidade dos conjuntos de características obtidos após a seleção com os métodos adaptativos (ASFSM) e não-adaptativos (SFSM) não compensa a diferença de tempo de execução entre esses dois métodos (vide seção 5.2.1 e o artigo [Campos et al., 2000c]).

Comparamos a função critério que utiliza a distância nebulosa baseada em tolerância com o desempenho de um classificador de mínima distância ao protótipo. Para avaliar o desempenho dos conjuntos de dados, utilizamos dois classificadores: k-vizinhos mais próximos e o de mínima distância ao protótipo.

Esse algoritmo foi testado 100 vezes (cem experimentos de seleção) em um conjunto de dados artificiais de seis dimensões, duas classes, com 100 exemplos por classe. Segue a descrição da distribuição das duas classes nesse espaço de características:

Nas figuras 3.16, 3.17 e 3.18, os padrões da classe $\omega _i$ são representados por asteriscos (*), e os da classe $\omega_j$ são representados por círculos (o). Para criar tais figuras, foram gerados aleatoriamente 100 padrões por classe seguindo as distribuições descritas. Visando a facilitar a visualização dos resultados de seleção de características, eferuamos a redução para obter um espaço de dimensionalidade 2.

[width=8cm, height=8cm]icapr_a.eps Amostragem dos dados artificiais utilizados em [Campos et al., 2001] nas características 1 e 2.

[width=8cm, height=8cm]icapr_b.eps Amostragem dos dados artificiais utilizados em [Campos et al., 2001] nas características 3 e 4.

[width=8cm, height=8cm]icapr_c.eps Amostragem dos dados artificiais utilizados em [Campos et al., 2001] nas características 3 e 4.

Antes de realizar a seleção de características, normalizamos os dados de forma que todos os padrões do espaço de treinamento ficassem com média 0 e variância unitária em relação a todas as características. Isso é importante para evitar problemas com os classificadores e também com a função critério, pois esses utilizam a distância Euclidiana para efetuar medições [Belhumeur et al., 1997,Theodoridis and Koutroumbas, 1999]. Além disso, com a normalização dos padrões no espaço de características, a tarefa de determinar o tamanho ideal da bola torna-se mais simples. Em nossos experimentos, utilizamos uma bola de raio $\tau = 0.5$. As figuras 3.16, 3.17 e 3.18, mostram exemplos dos dados com essa normalização já realizada.

Conforme mensionado anteriormente, para avaliar os resultados, foram geradas amostragens com 100 padrões para cada classe com as distribuições descritas anteriormente. Essas amostragens foram geradas 100 vezes. Assim, o total de padrões gerados foi 20000, e foi realizado um total de 100 experimentos de seleção de características. A distância foi utilizada com $\tau = 0.5$ e o classificador de k-vizinhos com $k=3$. As taxas de acerto foram calculadas pela média nos 100 experimentos.


next up previous contents index
Next: Resultados com os Dados Up: Método Proposto para Seleção Previous: Considerações Sobre o Comportamento   Contents   Index
Teofilo Emidio de Campos 2001-08-29