Métodos automáticos de seleção de características são importantes em muitas situações em que se tem disponível um conjunto grande de características e deseja-se selecionar um subconjunto adequado. Além de ser uma forma de redução de dimensionalidade, uma aplicação importante é a fusão de dados procedentes de múltiplas modalidades de sensores ou de múltiplos modelos de dados. A importância de redução de dimensionalidade está explícita no capítulo 3.
A seleção automática de características é uma técnica de otimização que, dado um conjunto de características, tenta selecionar um subconjunto de tamanho
(
) que maximiza uma função critério.
Formalmente, dado um conjunto de
características, o algoritmo de seleção de características deve encontrar um subconjunto
tal que
, em que
denota a cardinalidade de
, e
![]() |
(3.21) |
Dessa forma, o algoritmo de seleção de características poderá reduzir a dimensionalidade de forma que ocorra a menor queda possível no poder de distinção das classes por um classificador no espaço de características. Uma conseqüência da aplicação de um bom algoritmo de seleção de atributos é a redução do número necessário de amostras de treinamento para obter-se bons resultados com um classificador, ou seja, a redução do problema da dimensionalidade (vide seção 2.3).
Além da escolha da função critério, também é importante determinar a
dimensionalidade apropriada do espaço de características reduzido. Uma forma
simples de resolver esse problema é efetuar a seleção de características para
vários valores de . Conforme foi mencionado na seção
2.3, em [Jain et al., 2000], os autores defendem que,
em problemas práticos,
sendo
o tamanho do conjunto de
treinamento, é seguro não ocorrer o problema da dimensionalidade se forem usadas menos que
características.
Apesar da importância de seleção de atributos, não há regras ou procedimentos definitivos para essa tarefa em cada aplicação particular [Castleman, 1996], principalmente quando o número de características disponíveis for grande. Por esse motivo, um grande conjunto de algoritmos de seleção de atributos tem sido proposto. Em [Jain and Zongker, 1997] foi proposta uma taxonomia sobre este tópico. A seguir serão descritos separadamente alguns algoritmos de seleção de características e algumas funções critério.