Professional Documents
Culture Documents
KNN y KMeans
PYTHON PARA MACHINE LEARNING
DA 2.
ESTEBAN A. VACA C.
Clustering
Cluster: analiza y agrupa objetos de datos basados
nicamente en la informacin encontrada en los
datos que describe los objetos y sus relaciones.
Objetivo del Clustering: Los objetos de un grupo
sean similares entre s y diferentes de los objetos de
otros grupos.
KNN - Definicin
KNN es un algoritmo simple que almacena todos los
casos disponibles y clasifica los nuevos casos sobre
la base de una medida de similitud.
KNN es conceptualmente simple, pero capaz de
resolver problemas complejos
Puede trabajar con relativamente poca
informacin
KNN - Definicin
El aprendizaje es sencillo (hay aprendizaje en
absoluto!)
La memoria y el costo de la CPU)
problema de la seleccin de caractersticas
Sensible a la representacin
Clasificacin KNN
Clasificacin KNN-Distancia
KNN - Aplicaciones
Clasificacin e Interpretacin - legal, mdica,
noticias, banca
La resolucin de problemas - la planificacin, la
pronunciacin
Funcin de aprendizaje - control dinmico
Ensear y ayudar - helpdesk, formacin de usuarios
Qu es K-means?
1. Aproximacin de clustering particional
2. Cada grupo est asociado con un centroide
(punto central)
3. Cada punto se asigna a la agrupacin con el
centroide ms cercano
4.
Detalles de K-means
1.
2.
3.
4.
5.
6.
Distancia euclidiana
Actualizacin de centroide
Nosotros utilizamos la siguiente ecuacin para calcular el n
dimensiones se utiliza la siguiente ecuacin para calcular el punto
centroide dimensiones n medio de k puntos de n-dimensionales
Ejemplo de K-means
Seleccione tres centroides iniciales
Ejemplo de K-means
La asignacin de los puntos a grupos K. cercanos y volver a calcular los centroides