Professional Documents
Culture Documents
I. INFORMACIÓN GENERAL
Código : PIN-1804
Pilar : Inteligencia de negocios
Programa : Big Data
Curso : Big Data
Créditos : 3
Duración : 48 horas
CAPACITACIÓN RECOMENDADA
Al finalizar el curso, el alumno será capaz de usar herramientas Big Data. Adicionalmente,
estará preparado para:
Diseñar una solución de inteligencia de Big Data para consumirse por herramientas
de reportes especializado
V. LÍNEA DE ESPECIALIZACIÓN
Análisis de Análisis
Business
información interactivo de
Intelligence -
del negocio la información Big Data
SQL Server
con Power BI del negocio
2016
para Excel con Power BI
VII. METODOLOGÍA
RECURSOS DE APRENDIZAJE
Desktop/Laptop
Silabo
Marco teórico
Diapositivas
Laboratorios
Lecturas
Videos
Tareas
LEYENDA
Duración
CAPÍTULO Nº 1: Introducción al Big Data
2.0 h
Modo: Sesión presencial (2.0 h)
Temas Habilidades
Laboratorio Nº 1:
Ejercicio 1.1: Casos sobre Big Data.
Actividades de autoaprendizaje sugeridas
Lecturas:
Términos y conceptos de Big Data.
Caso de éxito de soluciones de Big Data.
Tecnologías y herramientas para almacenamiento y tratamiento de datos de Big Data.
Actividades de autoaprendizaje obligatorias
Tarea Nº1:
Curso Introduction to Data Science.
Modo: Sesión no presencial (0.5 h)
Autoevaluación N°1:
Análisis de datos y tendencias de Big Data.
Laboratorio Nº 2:
Ejercicio 2.1: Exploración de una solución Big Data.
Actividades de autoaprendizaje sugeridas
Lecturas:
Big Data y sus componentes.
Los skills del científico de datos.
Importancia de la ciencia de datos.
Actividades de autoaprendizaje obligatorias
Tarea N°2:
Curso: Data Science Methodology
Modo: Sesión no presencial (0.5 h)
Autoevaluación N°2:
¿Qué son los Data Lake?
Laboratorio Nº 3:
Metodología de proyectos de Big Data.
Actividades de autoaprendizaje sugeridas
Lecturas:
Operatividad de una solución de Big Data.
Actividades de autoaprendizaje obligatorias
Tarea N°3:
Curso: Big Data 101
Modo: Sesión no presencial (1.5 h)
Autoevaluación N°3:
Diseño de una solución Big Data.
Duración
EVALUACIÓN PARCIAL (EP)
1.5 h
Duración
CAPÍTULO Nº 4: Hadoop
8.0 h
Modo: Sesión presencial (8.0 h)
Temas Habilidades
Laboratorio Nº 4:
Ejercicio Nº 4.1: Revisión de una arquitectura Hadoop.
Actividades de autoaprendizaje sugeridas
Lectura:
- Hadoop en el entorno Big Data.
Trabajo de investigación
- Investigar otras distribuciones de Hadoop.
Actividades de autoaprendizaje obligatorias
Tarea N° 4:
- Curso Hadoop 101.
Modo: Sesión no presencial (1.0 h)
Autoevaluación N°4:
- Bases de datos NoSQL y sus características.
Laboratorio Nº 5:
Ejercicio Nº 5.1: Crear el cluster de Hadoop.
Ejercicio Nº 5.2: Añadir nodos al cluster de Hadoop.
Ejercicio Nº 5.3: Manejar HDFS.
Actividades de autoaprendizaje sugeridas
Lectura:
Lección 1: Cluster Hadoop.
Actividades de autoaprendizaje obligatorias
Tarea N°5:
Curso: MapReduce and YARN.
Modo: Sesión no presencial (0.5 h)
Autoevaluación N°5:
Crear un nodo en Hadoop.
Duración
CAPÍTULO Nº 6: Componentes de Hadoop
9.0 h
Modo: Sesión presencial (9.0 h)
Temas Habilidades
Laboratorio Nº 6
Ejercicio Nº 6.1: Crear Jobs Map Reduce.
Ejercicio Nº 6.2: Crear consultas Pig.
Ejercicio Nº 6.3: Crear consultas Hive.
Ejercicio Nº 6.4: Implementar Flume.
Ejercicio Nº 6.5: Implementar Sqoop
Ejercicio Nº 6.6: Implementar Oozie
Actividades de autoaprendizaje sugeridas
Lecturas:
Lección 1: Procesos Map Reduce.
Actividades de autoaprendizaje obligatorias
Tarea N°6:
Curso: Accessing Hadoop Data Using Hive.
Duración
CAPÍTULO Nº 7: Administración de Hadoop
4.0 h
Modo: Sesión presencial (4.0 h)
Temas Habilidades
Laboratorio Nº 7:
Ejercicio Nº 7.1: Health Check en Hadoop.
Ejercicio Nº 7.2: Configurar parámetros óptimos de Hadoop.
Actividades de autoaprendizaje sugeridas
Lectura:
Lección 7: Administrando Hadoop.
Modo: Sesión no presencial (1.0 h)
Autoevaluación N°7:
Crear un Health Check Hadoop.
Duración
CAPÍTULO Nº 8: Big Data 2.0 – Spark
5.0 h
Modo: Sesión presencial (5.0 h)
Temas Habilidades
Laboratorio Nº 8:
Ejercicio Nº 8.1: Implementar Spark.
Ejercicio Nº 8.2: Scala y Python.
Actividades de autoaprendizaje sugeridas
Lectura:
Big Data Spark.
Actividades de autoaprendizaje obligatorias
Tarea N° 8:
Curso: Spark Fundamentals I.
Duración
EVALUACIÓN FINAL (EF)
2.0 h
X. BIBLIOGRAFÍA
Hadoop
https://azure.microsoft.com/es-es/solutions/hadoop/
Consulta: 05 de diciembre del 2017
Cognitive Class
https://cognitiveclass.ai/courses/
Consulta: 05 de diciembre del 2017
Hortoworks Tutoriales
https://hortonworks.com/tutorials/
Consulta: 05 de diciembre del 2017
Apache Hadoop
http://hadoop.apache.org/
Consulta: 05 de diciembre del 2017
Apache Pig
http://pig.apache.org/
Consulta: 05 de diciembre del 2017
Apache Flume
http://flume.apache.org/
Consulta: 05 de diciembre del 2017
Apache Sqoop
http://sqoop.apache.org/
Consulta: 05 de diciembre del 2017
Apache Hive
http://hive.apache.org/
Consulta: 05 de diciembre del 2017
Apache Spark
http://spark.apache.org/
Consulta: 05 de diciembre del 2017