You are on page 1of 4

BIG DATA HADOOP,

BUSINNES ANALYTICS
AND BEYOND
Evaluacin y seleccin de herramientas BI. Caso
prctico Power Pivot
Profesor de la asignatura
scar Quero Hijano
Lectura 1

Alumno
Jos Luis Palillero Huerta

Actividad 1 : Big data hadoop, businnes analytics and beyond


Resumen
Los mercados y las empresas estn viviendo una transformacin de base tecnolgica y social cuya
principal derivada es el crecimiento exponencial de datos tanto dentro como fuera de los sistemas
empresariales.
Este crecimiento se caracteriza principalmente por estar formado en un 80% de datos no
estructurados. Las organizaciones se encuentran ante el reto de capturar, transformar, analizar y
almacenar datos con sistemas tradicionales que no son capaces de resolver esta nueva
problemtica adecuadamente.
Este nuevo escenario est lleno de retos y oportunidades. Por un lado es marco perfecto para el
despliegue de iniciativas basadas en Big Data. Por otro, es necesario reducir las barreras de
adopcin en el seno de la organizacin.
Qu es Big Data?
Big Data es una nueva generacin de tecnologas y arquitecturas diseadas para extraer valor
econmico de grandes volmenes de datos heterogneos habilitando una captura, identificacin y/o
anlisis a alta velocidad.
Big Data se caracteriza por tener las Vs:

Volumen: hace referencia a la necesidad de procesamiento intensivo y complejo de


subconjuntos de datos de gran tamao que contienen informacin de valor para una
organizacin mediante tecnologas de Big Data.
Variedad: a medida que se multiplican los canales de interaccin con clientes, empleados,
proveedores y procesos de negocio, la informacin de valor es cada vez ms el resultado
de la combinacin de datos de mltiple origen y tipologa que puede estar en forma
estructurada, semiestructurada o no estructurada.
Velocidad: aunque los ciclos de negocio se han acelerado, no todos los datos de una
organizacin tienen la misma urgencia de anlisis asociada. La clave para entender en qu
punto del espectro de la velocidad es necesario trabajar (desde el procesado en lote hasta
el flujo de datos continuo) est asociada a los requerimientos de los procesos y los usuarios.
Valor: en el contexto de Big Data, valor hacer referencia a los beneficios que se desprenden
del uso de Big Data (reduccin de costes, eficiencia operativa, mejoras de negocio)
Veracidad: los datos deben ser validados y verificados para tener acorde un contexto sobre
lo que se requiere el anlisis del negocio.

Ilustracin 1 Las V's de Big Data

Actividad 1 : Big data hadoop, businnes analytics and beyond

Hadoop
Hadoop es un framework de trabajo que permite manejar grandes cantidades de informacin de
una manera eficaz y sencilla mediante el uso de hardware comn.
Hadoop consiste en tres modulos principales:
Hadoop Common, Mdulo de utilidades comunes el cual soporta los dems mdulos por
los que est compuesto Hadoop.
Hadoop Distributed File System (HDFS), Sistema de archivos distribuidos que facilita la
gestin de los ficheros y los archivos con un alto grado de fiabilidad y banda ancha, adems,
es muy econmico.
Hadoop MapReduce Implementacin del algoritmo de procesamiento de datos Map
Reduce, cuenta con un alto rendimiento y trabaja de manera paralela con los datos
distribuidos a travs del HDFS
La parte ms importante y con ms funcionalidad dentro de Hadoop es el MapReduce, la parte
MapReduce es la encargada de tratar los datos del HDFS que se quieren procesar y dar unos
resultados.

Ilustracin 2 Arquitectura hadoop fases map & reduce


Big Data Analytics
Es una nueva herramienta empresarial la cual nos permitir examinar grandes repositorios de datos
de Big Data, con el objetivo de ayudar en la toma de decisiones descubriendo patrones ocultos,
correlaciones desconocidas, predicciones y otra informacin til y as permitir lograr ventajas
competitivas para las empresas u organizaciones que lo posean.
El objetivo principal de Big Data Analytics es ayudar en la toma de decisiones de negocio al permitir
analizar grandes volmenes de datos de bases de datos transaccionales, as como otras fuentes
de datos que pueden quedar sin explotar por la inteligencia de negocio (BI)
Big Data Analytics si solo analizara bases de datos estructuradas se podra realizar herramientas
ms conocidas de anlisis predictivo y minera de datos. No obstante como tambin recoge datos
de fuentes no estructuradas o semi-estructuradas. Como resultado, una nueva clase de tecnologa.
Las tecnologas relacionadas con Big Data Analytics incluyen NoSQL bases de datos, Hadoop y
MapReduce .

Actividad 1 : Big data hadoop, businnes analytics and beyond


Conclusin
Big Data, Hadoop, BA suponen un proceso de cambios en la organizacin, no slo desde la
perspectiva tecnolgica sino principalmente desde la de negocio.
La explotacin de datos anteriormente inabordable habilita no slo una mayor comprensin del
negocio, sino tambin proporciona la capacidad de reimaginar los servicios que se ofrecen.
De hecho, Big Data representa una oportunidad para que desde el departamento TI se impacte en
el negocio de forma realmente significativa.
El CIO debe liderar la adopcin de un conjunto de tecnologas como lo es Big Data, Hadoop,
Business Analytics y de mejores prcticas para extraer valor de los datos, para lo que ser
necesario redefinir nuevas funciones y realizar un rediseo organizacional. En particular, se necesita
de nuevos roles como el del cientfico del dato (data science). La falta de talento es uno de los
obstculos de las organizaciones que van a tener de apoyarse en los servicios de terceros.

You might also like