You are on page 1of 14

Establecer la conexion con las herramientas de Integracion de datos de Pentaho.

OBJETIVO
Establecer un flujo de datos entre dos bases de datos.

QUE SE REALIZAR EN ESTA ETAPA.


La comunicacin requiere un emisor, un receptor, un canal y un mensaje, basado en eso, estableceremos una comunicacin entre 2 bases de datos usando una herramienta de Acceso Manejo de ETL llamada Spoon de la suite de pentaho, y enviaremos como mensaje el contenido de una tabla.

Repositorio de datos Web Project server

INSTALACIN.
La versin comunity edition pentaho no requiere instalacin, simplemente se descomprime, el archivo que actualmente corresponde a la ltima versin es: pdi-ce-4.4.0-stable.zip Se puede descargar desde: http://sourceforge.net/projects/pentaho/files/Data%20Integration/4.4.0-stable/

Es posible que el driver que permite la conexin de Pentaho a Mysql no est y sea necesario adicionarlo, se soluciona ubicando el archivo mysql-connector-java-5.1.23-bin.jar en la carpeta data-integration\libext\JDBC. (el archivo mysql-connector-java-5.1.23-bin.jar est junto a este documento en el mismo zip ).

Es necesario verificar que tengan una versin de java instalado en su computador, pueden descargarlo de: http://www.oracle.com/technetwork/java/javase/downloads/jre-6u25-download-346243.html

EJECUCIN.
Lo primero que realizamos es componer un flujo de datos, esto se hace por medio de la herramienta Spoon. Se ejecuta por medio de Spoon.bat

Si solicita Acceso a usuario y contrasea a un repositorio, no es necesario. Oprimir cancelar

INICIO DE LA HERRAMINETA.
La ventana inicial nos presenta un men de opcines, por ahora ver en File > New -> transformacin Esto nos lleva a una ventana donde podemos inicial un proceso ETL.

En el costado izquierdo estn las herramientas. Al lado derecho estas se arrastran, colocan de acuerdo a su utilidad.

UBICAR COMPONENTES DE LA ETL


Para obtener informacin de nuestro origen de datos, iniciamos con la opcin Table Input y lo ponemos arrastramos al rea de trabajo.

Con doble click abrimos el men que dispone de varias opciones 1. 2. 3. 4. Nombre del paso. Conexin a usar Consulta que se requiere realizar. Opciones de desempeo como limitar nmero de columnas, entre otras.

DEFINIR LA CONEXIN A LA BASE DE DATOS ORIGEN


click en New.. y llegamos a la siguiente ventana que se llena como se v a continuacin.

Se llenan los campos con esta informacin: Connection Name: Connection Type: Access: Host Name: Database Name: Port Number: UserName: Password: poli MySQL Native(JDBC) polienero2014.cuit8lfnw4w1.us-east-1.rds.amazonaws.com sakila 3306 poliEnero2014 poliEnero2014

Si est bien al hacer click en Test aparece algo parecido a:

Aceptamos el ok del test de la conexin Ok en la conexin.

Regresamos a la ventana Donde definimos las caractersticas de la consulta de cual deseamos extraer informacin.

DEFINICIN DE LA CONSULTA AL SISTEMA ORIGEN

Ahora podemos visualizar el contenido de la base de datos haciendo click en Get SQL select Statment Y luego de cargar podemos navegar en la estructura de tablas de la base de datos.

Si seleccionamos la tabla contactos, y luego click en OK. El sistema automticamente construye una consulta con todos los campos de la tabla.

Podemos limitar o editar la consulta que realiza el sistema desde esa caja de dialogo.

Damos OK

DEFINICIN DEL DESTINO DE LA INFORMACIN


Adicionamos una conexin Output lugar donde dejaremos los datos de las tablas:

En Access Previamente creamos una base de datos con una tabla

.. se hace doble click en el icono de conexin de Microsoft Access Output. Y despliega una ventana donde se puede realizar la conexin.

Click en OK

EJECUCIN DEL PROCESO ETL


En la parte superior hay una barra de herramientas que nos permiten hacer la ejecucin del ETL ahora construido.

CLick en el botn verde Play : Emerge una ventana de parmetros de la configuracin (en casos particulares se adicionan parmetros, en este caso no)

Se ejecuta la transformacin por medio del botn Launch y luego se acepta la ejecucin.

El resultado de la operacin es exitoso. (ntese que en la parte superior de cada conexin hay un signo que indica correcto)

(En caso de error aparecen lneas rojas indicando en donde falla el proceso.)

VER EL RESULTADO

Se actualiza la tabla en Access y como resultado obtenemos la migracin de la informacin.

Se ha cumplido el objetivo. Se ha llevado informacin de un sistema a otro. En este ejemplo la transformacin es pequea, y se entiende como un filtro de registros (ya que no se estn realizando operaciones complejas sobre estos).

Entrega del trabajo 1. Documento de office con la captura de las pantallas de los procesos que realizaron, incluyendo el de ejecucin exitosa del proceso 2. Adjunto archivo con extencin .ktr que contiene el ejercicio realizado.

You might also like