Professional Documents
Culture Documents
BUSINNES ANALYTICS
AND BEYOND
Evaluacin y seleccin de herramientas BI. Caso
prctico Power Pivot
Profesor de la asignatura
scar Quero Hijano
Lectura 1
Alumno
Jos Luis Palillero Huerta
Hadoop
Hadoop es un framework de trabajo que permite manejar grandes cantidades de informacin de
una manera eficaz y sencilla mediante el uso de hardware comn.
Hadoop consiste en tres modulos principales:
Hadoop Common, Mdulo de utilidades comunes el cual soporta los dems mdulos por
los que est compuesto Hadoop.
Hadoop Distributed File System (HDFS), Sistema de archivos distribuidos que facilita la
gestin de los ficheros y los archivos con un alto grado de fiabilidad y banda ancha, adems,
es muy econmico.
Hadoop MapReduce Implementacin del algoritmo de procesamiento de datos Map
Reduce, cuenta con un alto rendimiento y trabaja de manera paralela con los datos
distribuidos a travs del HDFS
La parte ms importante y con ms funcionalidad dentro de Hadoop es el MapReduce, la parte
MapReduce es la encargada de tratar los datos del HDFS que se quieren procesar y dar unos
resultados.