Professional Documents
Culture Documents
Big Data es un trmino popular usado para describir el crecimiento exponencial y la disponibilidad
de datos, de forma estructurada o no. Big Data es se aplica generalmente a colecciones de datos
tan grandes y complejas que se vuelve muy difcil de procesar aplicando tecnologas de
procesamientos de datos tradicionales.
Qu problema soluciona?
Estas tecnologas apuntan a solucionar los problemas de procesamiento de grandes volmenes de
datos. Los sets de datos estn creciendo cada vez ms rpido debido a que estos son recolectados
por sistemas ubicuos como dispositivos mviles, registros de software, cmaras y sensores
inalmbricos de redes. En el mundo la capacidad para guardar informacin ha venido doblndose
cada 40 meses desde 1980, en 2012, cada da se generaban 2.5 Exabytes de datos.
Las derivaciones de Big Data incluyen anlisis, captura, bsqueda, transmisin, visualizacin y
seguridad. La tendencia hacia colecciones de datos ms grandes es debido a la informacin
adicional que se puede obtener del anlisis de colecciones particulares ms grandes, contrario al
anlisis de colecciones ms pequeas pero ms numerosas; lo que permite que se hallen
correlaciones en la coleccin. Big data usa estadstica inductiva para inferir leyes (regresiones,
relaciones no lineares, y efectos causales) de grandes sets de datos para revelar relaciones, y
dependencias para realizar predicciones de comportamientos.
Cmo funciona?
En 2004 Google public un artculo de un proceso llamado MapReduce. Este framework provee un
modelo de procesamiento paralelo y una implementacin asociada para procesar enormes
cantidad de datos. Con MapReduce, las consultas son divididas y distribuidas a travs de nodos
paralelos y procesadas en paralelo. Luego los resultados son recolectados y entregados. El
framework fue muy exitoso, por lo tanto una implementacin de MapReduce fue adoptada por un
proyecto open source de Apache llamado Hadoop.
Aplicaciones
1. Comprendiendo los clientes: Big data es usado para entender mejor los clientes y sus
comportamientos y preferencias. Las compaas estn ansiosas por integrar sus sets de
datos tradicionales con datos de los medios sociales y registros de los navegadores para
obtener una imagen ms completa de sus clientes. El objetivo ms grande, en la mayora
de los casos, es crear modelos predictivos. Como ejemplos podemos tomar Target, una de
las cadenas de supermercados ms grandes de Estados Unidos, puede predecir cuando
uno de sus clientes tendr un beb.
2. Comprendiendo y optimizando procesos de negocio: Big data est siendo usado cada vez
ms para optimizar procesos de negocio. Los minoristas estn en la capacidad de
optimizar su inventario basados en las predicciones generadas por redes sociales,