Next: Regra dos K vizinhos
Up: Classificador Bayesiano
Previous: Taxa de probabilidade de
  Contents
  Index
A partir da formalização da taxa ou probabilidade de erro, pode-se descrever um classificador que minimiza esse quantificador de desempenho. Inicialmente, é necessário mostrar definições duais às das equações 2.4, 2.5 e 2.6. A probabilidade de acerto ao se classificar um dado em é
|
(2.7) |
A probabilidade de acerto ao se atribuir um vetor à classe é
|
(2.8) |
A probabilidade de classificação correta ou probabilidade de acerto ou taxa de acerto é
|
(2.9) |
Obviamente, a mínima taxa de erro é obtida quando a taxa de acerto é máxima
|
(2.10) |
A máxima taxa de acerto é obtida quando cada é escolhido como o domínio onde
.
Assim, o classificador Bayesiano de mínima taxa de erro pode ser definido como:
ou, simplesmente,
|
(2.13) |
Após essa descrição do classificador de Bayes de mínima taxa de erro, a seguinte questão ingênua pode surgir: se o classificador Bayesiano é um classificador ótimo, então por que outros classificadores são utilizados? O motivo é que o classificador de Bayes só pode ser executado se a probabilidade a priori e a função densidade de probabilidade
forem conhecidas, o que geralmente não ocorre. Em problemas práticos, na fase de treinamento são utilizados métodos de estimação dessas probabilidades. Entretanto, quando a distribuição das classes possui formas ``complicadas'' e descontínuas, o preço computacional desses métodos torna-se muito alto quando se deseja obter uma representação precisa dessas probabilidades.
Uma abordagem para se resolver esse problema é assumir um modelo para
. A estimativa de distribuição mais bem conhecida e, provavelmente, uma das mais simples, é a de distribuição normal. Nesse caso, assume-se que:
|
(2.14) |
em que
é o valor esperado (tomado pela média) da classe , e é a matriz de covariância definida por:
|
(2.15) |
denota o determinante de e a média (ou esperança) de uma variável aleatória. É comum o uso do símbolo
para denotar a função de densidade propabilística Gaussiana.
A partir dessas definições e das anteriores, contrói-se o classificador Bayesiano para distribuições normais.
Next: Regra dos K vizinhos
Up: Classificador Bayesiano
Previous: Taxa de probabilidade de
  Contents
  Index
Teofilo Emidio de Campos
2001-08-29