Professional Documents
Culture Documents
Introduccin
Algoritmo de bsqueda
Medidas
Ejemplo
Parmetros de ajustes
Algoritmos
Queremos encontrar cualquier variable de entrada que se puede utilizar para dividir
el conjunto de datos en dos conjuntos de datos ms pequeos. El objetivo es
aumentar la homogeneidad de cada uno de los dos conjuntos de datos con respecto a
la variable de destino
La particin recursiva
Medidas
Ganancia de la informacin
Desde una perspectiva de teora de la informacin, interpretamos una medida de 0 (es decir,
una entropa de 0) como indicativo de que no necesitamos ms informacin para clasificar una
observacin especfica dentro del conjunto de datos, todas las observaciones pertenecen a la
misma clase. Por el contrario, una medida de 1 sugiere que necesitamos la mxima cantidad de
informacin extra para clasificar nuestras observaciones en una de las dos clases disponibles. Si
la divisin entre las observaciones donde llueve maana y donde no llueve maana no es 50% /
50%, pero tal vez el 75% / 25%, entonces tenemos menos informacin adicional con el fin de
clasificar nuestras observaciones, el conjunto de datos ya contiene algunos informacin acerca
de qu manera la clasificacin se va a ir. Al igual que la entropa, nuestra medida de la
"informacin necesaria" es, pues, entre 0 y 1.
Otras medidas
Tutorial
Resumen
Resumen de Comandos
Draw.tree() comando
Party
Plot ()
Plotcp() comando
Print () comando
Printcp()comando
Rattle
Rpart
Gradica el rbol