9 Avaliacao ApreMaq2008

Aprendizagem de Mquina
Avaliao de Paradigmas
Alessandro L. Koerich
Mestrado/Doutorado em Informtica
Ponti f ci a Uni ver si dade Catli ca do Par an (PUCPR)
Mestrado/Doutorado em Informtica Aprendizagem de Mquina 2 Alessandro L. Koerich (alekoe@ppgia.pucpr.br)
Introduo
Vimos anteriormente muitos algoritmos de
aprendizagem
A pergunta que sempre se faz :
Qual deles o melhor?
Pode existir uma preferncia por aqueles de
menor complexidade computacional, ou que
levam em conta algum conhecimento a priori da
forma dos dados, etc.
Introduo
Entretanto, quando isso no importa...
Existem razes para escolher um algoritmo em
relao a outros?
Introduo
Quando temos dois algoritmos que possuem a
mesmo desempenho sobre um conjunto de
exemplos de treinamento:
Escolhemos sempre o mais simples, pois ele deve
apresentar um desempenho melhor sobre um
conjunto de exemplos de teste!
Introduo
Entretanto, a maneira utilizada para avaliar o
desempenho de algoritmos de aprendizagem :
Avaliar o erro (ou acerto) em exemplos fora do
conjunto de exemplo de treinamento!
Ou seja, sobre um Conjunto de Exemplos de
Testes.
Avaliao de Desempenho
Para que avaliar desempenho (generalizao)?
1. Para verificar se o algoritmo possui um
desempenho bom o suficiente para ser til
2. Para comparar seu desempenho com o de
outros algoritmos
Instabilidade
Um algoritmo de aprendizagem pode ser
considera instvel se:
uma pequena alterao nos dados de
treinamento levar a classificadores
significativamente diferentes e mudanas
relativamente grandes na preciso
Mtodo da Validao Cruzada
Particionar aleatoriamente o conjunto de dados em
trs partes
Passo 1: Define pelo menos trs conjuntos disjuntos:
1. Conjunto de exemplos de treinamento
2. Conjunto de exemplos de validao
3. Conjunto de exemplos de teste
Passo 2: Utiliza o Conjunto de Treinamento para fazer
a aprendizagem do algoritmo. Utiliza o Conjunto de
Validao para verificar a generalizao do algoritmo
(ajustar os parmetros).
Passo 3: Depois do algoritmo treinado, avalia
sua generalizao sobre o Conjunto de Testes.
OBS 1: O Conjunto de Testes no pode ser utilizado
para ajustar parmetros!
OBS 2: Cuidar com a distribuio de exemplos por
classe que compem os conjuntos. Probabilidades a
priori diferentes!
OBS 3: Mtodo melhor adaptado a grandes
conjuntos de dados.
Como calcular o desempenho?
1. Taxa de acerto (%):
Num. Exemplos Classif. Corretamente
Num Total de Exemplos
2. Taxa de erro (%):
Num. Exemplos Classif. Incorretamente
Num Total de Exemplos
Como calcular o desempenho mdio e
varincia?
1. Treinar n vezes o algoritmo (diferentes
parmetros)
2. Avaliar os n algoritmos treinados (taxa de
acerto)
3. Calcular a taxa de acerto mdia
4. Calcular a varincia
Mtodo Validao Cruzada n-Fold
Chamado de n-fold cross validation
uma generalizao do mtodo validao
cruzada
Passo 1: O conjunto de dados de tamanho n (n
exemplos) dividido em mconjuntos disjuntos
de tamanho n/m
Passo 2: O algoritmo treinado mvezes, cada
vez com um conjunto diferente sendo deixado
de fora para fazer a validao.
Mtodo Validao Cruzada n-Fold
Passo 3: O desempenho estimado como sendo
o erro mdio ou taxa de acerto mdia sobre
estes mconjuntos de validao.
Tambm chamado de Leave-one-out

9 Avaliacao ApreMaq2008

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

9 Avaliacao ApreMaq2008

Uploaded by

Copyright:

Available Formats

Aprendizagem de Mquina

You might also like