Professional Documents
Culture Documents
RAPIDMINER
Programa informtico para el anlisis y minera de datos.
Fue desarrollada en la universidad de Dortmund en 2001.
Tiene edicin gratuita (Community Edition) y edicin de paga (Enterprise
Edition, Big Data Edition, OEM Edition).
Por qu usarlo?
Posibilita la obtencin de valiosa informacin sobre el consumidor como sus
gustos e intereses, permitiendo personalizar la oferta de una empresa y lo que
hace posible aumentar la productividad a travs de modelos que solucionan los
problemas de prediccin, clasificacin y segmentacin de informacin.
sea que nos amoldamos a lo que el cliente quiere.
Se puede utilizar en:
Investigacin y educacin.
Creacin de un prototipo.
Aplicaciones empresariales.
KNIME
Es totalmente gratuito.
Fue desarrollado en la universidad de Constanza, Alemania.
Esta desarrollado sobre la plataforma eclipse y programado en java.
Es una herramienta grfica y dispone de una serie de nodos y flechas que se
despliegan y combinan de manera grfica e iterativa. Los nodos implementan
distintos tipos de acciones que pueden ejecutarse sobre una tabla de datos
como:
Manipulacin de filas, columnas, como muestreos, agrupaciones,
transformaciones.
Creacin de modelos estadsticos y de minera de datos, como rboles de
decisin, mquinas de vector soporte, regresiones.
Scoring o aplicacin de dichos modelos sobre conjuntos nuevos de datos.
Como es open-source hace posible su extensin mediante la creacin de
nuevos nodos que implementen algoritmos a la medida del usuario.
KNIME es utilizado desde el 2006 en la investigacin farmacutica pero
tambin se utiliza en otras reas como: anlisis de datos de clientes CRM
(Customer Relationship Management), inteligencia de negocios y anlisis de
datos financieros.
WEKA
Plataforma para el aprendizaje automtico y minera de datos.
Fue escrito en java y desarrollado en la universidad de Waikato.
Contiene una coleccin de herramientas de visualizacin y algoritmos para
anlisis de datos y modelado predictivo, unidos a una interfaz grfica de
usuario para acceder fcilmente a sus funcionalidades.
Puntos a favor de WEKA:
Est disponible libremente bajo la licencia pblica general de GNU.
Es muy portable porque est completamente implementado en Java y puede
correr en casi cualquier plataforma.
Contiene una extensa coleccin de tcnicas para pre-procesamiento de datos y
modelado.
Es fcil de utilizar por un principiante gracias a su interfaz grfica de usuario.
WEKA proporciona acceso a bases de datos va SQL gracias a la conexin
JDBC (Java Database Connectivity) y puede procesar el resultado devuelto por
una consulta hecha a la base de datos
COMO TRABAJAR CON WEKA
1.-Simple CLI: Intrprete de comandos o consola.
2. Explorer: Interfaz grfico principal Proporciona acceso a las distintas
funcionalidades a travs de mens y formularios de datos.
3. Experimenter: Automatiza el proceso de ejecucin de varios filtros y
clasificadores con diferentes parmetros sobre un conjunto de datos y
proporciona estadsticas de dicho proceso.
*Permite comparar rendimientos y distribuir la carga de trabajo entre varias
mquinas (experimentos grandes).
4. KnowledgeFlow: Similar al funcionamiento interno del programa, permite
crear una secuencia o circuito que recoge todo el experimento.