next up previous contents
Next: Algoritmos de seleção Up: Técnicas de Seleção de Previous: Discriminantes Lineares   Sumário


Seleção de Características

Métodos automáticos de seleção de características são importantes em muitas situações em que tem-se disponível um conjunto grande de características e é desejável selecionar um subconjunto adequado. Além de ser uma forma de redução de dimensionalidade, uma aplicação importante é a fusão de dados procedentes de multiplas modalidades de sensores ou de múltiplos modelos de dados. A importância de redução de dimensionalidade está explicita na seção 3.1.4. Seleção automática de características é uma técnica de otimização que, dado um conjunto de $D$ características, tenta selecionar um subconjunto de tamanho $d$ que maximiza uma função critério. Formalmente, dado um conjunto $Y$ de $D$ características, o algoritmo de seleção de características deve encontrar um subconjunto $X \subseteq Y$ tal que $\vert X\vert = d$, e
\begin{displaymath}
J(X) = \max_{Z \subseteq Y, \vert Z\vert=d}{J(Z)},
\end{displaymath} (8)

em que $J(.)$ é a função critério, a qual pode, por exemplo, ser definida por, $1 - p_e$, sendo $p_e$ é a probabilidade de erro. É desejavel que a função critério seja maior quanto menor for a redundância entre as características, e quanto maior a facilidade de discriminar padrões de classes diferentes. Dessa forma, o algoritmo de seleção de características poderá reduzir a dimensionalidade sem que um classificador perca o poder de distinguir classes no espaço de características. Uma conseqüência da aplicação de um bom algoritmo de seleção de atributos é a redução do número necessário de amostras de treinamento para se obter bons resultados com um classificador, ou seja, a redução de curse of dimensionality. Além da escolha da função critério, também é importante determinar a dimensionalidade apropriada do espaço de características reduzido. Uma forma simples de resolver esse problema é efetuar seleção de características para vários valores de $d$. Em [13], os autores defendem que há uma relação entre o tamanho do conjunto de treinamento e a dimensionalidade ideal para um sistema de classificação. Sendo $n$ o tamanho do conjunto de treinamento, é seguro que não ocorre o curse of dimensionality se forem usadas menos que $n/10$ características. Apesar da importância de seleção de atributos, não há regras ou procedimentos definitivos para essa tarefa em cada aplicação particular [43], principalmente quando o número de características disponíveis é grande. Por esse motivo, um grande conjunto de algoritmos de seleção de atributos tem sido proposto. Em [48], Jain et al. propôs uma taxonomia sobre este tópico. A seguir serão descritos separadamente alguns algoritmos de seleção de características e algumas funções critério.

Subsections
next up previous contents
Next: Algoritmos de seleção Up: Técnicas de Seleção de Previous: Discriminantes Lineares   Sumário
Teofilo Emidio de Campos 2000-09-18