You are on page 1of 6

UPSAM

Taller 2: Minera de datos y Big Data


Artculos de la Vanguardia y El Pas
Jose Carlos Rubio Escribano -- 64082 21/11/2013

Contenido
Anlisis Big Data: El tesoro oculto del siglo XXI ......................................................................... 3 Anlisis Los datos que hay en m ............................................................................................... 4 Big Data y minera de datos .......................................................................................................... 5

Anlisis Big Data: El tesoro oculto del siglo XXI En este artculo de La Vanguardia se explica el gran aumento de trnsito de informacin que est sufriendo internet en los ltimos aos. El cmo se ha tenido que crear nuevas unidades de medida como el Petabyte, el Exabyte, el Zetabyte o el YottaByte para poder cuantificar la cantidad de datos que se manejan en el universo digital. Las grandes compaas como Google, Twitter o Facebook procesan gran parte de esta informacin, y han encontrado la manera de sacarle valor, analizando estos datos masivos y almacenndolos debidamente, para su posterior toma de decisiones o venta a empresas privadas o gubernamentales. Tambin se han dado cuenta del valor que tienen los datos otras muchas compaas que estn empezando a procesarlos tambin pero a menor escala en todos los mbitos posibles, marketing, sanidad, educacin, sociologa el valor de Big Data se ha convertido en una revolucin en el mundo actual, que consigue predecir, sin explicar las razones y con una gran eficacia, el comportamiento humano y de sociedades enteras. Debido a las relaciones existentes entre los grandes volmenes de datos, un buen anlisis de Big Data es capaz de cosas tan dispares como recomendar con una alta posibilidad de acierto los productos en los que el cliente est interesado, el da que un vuelo va a ser ms barato, o crear el traductor ms preciso del mundo. Con la aparicin del paradigma de Big Data aparece un nuevo mercado, con una nueva fuente de ingresos, los datos. Y el valor se desplaza a quienes los controlan. Esto presenta un nuevo riesgo en el motor de la transformacin de las actividades econmicas y sociales, debido a la prediccin del comportamiento humano, que puede ticamente sobrepasarse en varios aspectos, como la presuncin de inocencia o simplemente en la capacidad de libre decisin de las personas. Por ello es importante que no slo unas pocas empresas manejen las tecnologas de anlisis y proceso de Big Data, sino que todos tengamos acceso a esa informacin para tomar decisiones de valor sobre todos los temas importantes, como educacin, cultura, etc.

Anlisis Los datos que hay en m Este artculo de El Pas Semanal explica las consecuencias de la introduccin del mundo del Big Data en el ser humano, mediante mltiples sensores capaces de captar casi cualquier reaccin o cambio por pequeo que sea en el cuerpo de una persona. Esto ha generado un salto importante en el campo de la biometra, que ahora es capaz de estudiar con mayor precisin los fenmenos biolgicos. Existen dos vertientes claramente diferenciadas, los que desean tener controlado en todo momento su organismo, tanto lo que comen, como el ejercicio que hacen, las horas de sueo, la temperatura de su piel con el objetivo de mejorar su calidad de vida y fundirse y ser uno con los datos y las personas que critican una desmesurada medicin de uno mismo. En la historia ha ocurrido lo mismo con otras corrientes, tanto filosficas como mdicas, incluyendo en el primer grupo a personas tan ilustres como el psiclogo Sigmund Freud que utiliz la cocana con sus pacientes o el terapeuta Anton Stock, que consumi distintos tipos de venenos con el fin de analizarlos y sentir en su propio organismo los efectos. En la actualidad es innegable que las tecnologas han puesto las cosas mucho ms fciles para las personas que quieren controlar su cuerpo en todo momento, gracias a los sensores, cada vez ms portables y precisos, y a la aparicin de los telfonos mviles y nuevos ordenadores, se pueden procesar en tiempo real, analizar e incluso compartir con los amigos o subirlos a internet casi instantneamente, creando una red de cultura y datos, alrededor del cuerpo humano, masiva y a nivel global.

Big Data y minera de datos La capacidad que tenemos en la actualidad para almacenar, capturar y comprender los grandes volmenes de datos estn cambiando la ciencia, la medicina, los negocios y la tecnologa. Segn EMC en la actualidad slo se analizan el 05% de los datos, lo cual no indica que sean pocos datos debido al gran aumento que han tenido, sobre todo en los ltimos aos, debido a los nuevas tecnologas como telfonos inteligentes, tablet y al crecimiento de internet en el mundo. Prueba de esto es que el 90% de los datos creados en todo el mundo han sido creados en los ltimos aos. Gracias a la minera de datos las empresas que estn sabiendo sacarle partido son capaces de ahorrar millones de euros anuales, gracias a la buena interpretacin de los datos, lo que demuestra su importancia en trminos econmicos. Tambin ha acelerado varios procesos de investigacin mdica y cientfica, con lo que en trminos sanitarios y mdicos tambin tiene un gran valor. Estos precedentes han llevado a multitud de empresas a colocar los datos, en el corazn de sus operaciones para poder sacarle valor. Big data se define con el modelo de las 3 V, que incluye Velocidad: la rapidez con la que se accede a los datos y su procesado Volumen: los datos son cada vez ms numerosos y las empresas cada vez procesan mayores volmenes de datos Variedad: dentro de Big data entran todo tipos de datos estructurados y desestructurados. Debido a los nuevos tipos de datos no estructurados, hacen falta nuevas tecnologas de almacenamiento, ya que las bases de datos relacionales no pueden con los nuevos datos. Tambin se requieren nuevos mtodos de programacin para procesar los datos y una manera de conseguir sacarles el valor que tienen. Y es aqu donde entran en juego las nuevas bases de datos, como nosql, la computacin en memoria, y el marco de trabajo

hadoop (escalable, eficiente y fiable), para el tratamiento, el procesamiento y valorizar los datos masivos que existen en el mundo actual.

You might also like