You are on page 1of 54

Transfor

m
Realizado por:
Valeria Haro
Wilson Prez

Agenda

Introduccin
Elementos
Bibliografa

INTRODUCCIN
Son

herramientas que nos permiten


realizar transformaciones de datos.

Estos

ayudan a los ingresos y la carga


de datos informacin desde los archivos
externos
para
que
puedan
ser
procesados.

TRANSFORM

Add checksum
Este

paso calcula las sumas de comprobacin


para uno o ms campos en el flujo de entrada y
aade esto a la salida como un nuevo campo.

configuracin

Resultados

Add Constant
Este

paso aade un campo constante al flujo.

Add sequence
Este

paso slo agrega un valor de secuencia.

Configuracin

Resultados

Add xml
El

paso de la columna XML permite codificar el


contenido de una serie de campos en una fila
en XML. Este XML se aade a la fila en la forma
de un campo de cadena.

Configuracin

Resultados

Calculator
Crea

nuevos campos mediante la realizacin de


clculos matemticos.

Configuracin

Resultados

Concat files
Se

utiliza para concatenar varios campos en un


solo campo destino.

Configuracin

Resultados

Replace in string
Reemplazar

todas las apariciones de una


palabra en una cadena con otra palabra.

Configuracin

Resultados

Number range.
Crea

ciertos rangos basados en un


campo numrico

Configuracin

Resultados

Select Values
Seleccin,

cambio de nombre, cambio de


tipos de datos y la configuracin de la
longitud y la precisin de los campos.

Select Values

Set field Values


Remplaza

otra.

los campos de una columna por

Set field Values

Sort rows
Ordena

las filas basndose en los campos


especificados y si deben ser ordenados en
orden ascendente o descendente.

Sort rows

Split field to row


Permite

dividir una fila que contiene un


campo delimitado en mltiples filas nuevas.

La

fila original no se entrega de resultado.

Split field to row

String operations
Aplicar

las operaciones, tales como el


recorte, relleno y otros, para el valor de
cadena.

String operations

String cut
Permite

cortar parte de una subcadena. Si


el campo designado est fuera de rango,
se devuelve blanco.

Unique rows

Unique rows
Elimina

entradas.

las

filas

duplicadas

de

las

Unique rows

Value Mapper
Mapea

de un valor a otro.

Value Mapper

Flow

Dummy
Permite

visualizar la salida de datos.

Filter Rows
Permite

filtrar los datos de un


mientras cumplan alguna condicin

flujo

Filter Rows

Case

Append streams

Append streams

Stream lookup

Stream lookup

Merge Join

Merge Join

Combination lookup/update

Dimension lookup/update

Dimension lookup/update

Dimension lookup/update

Web services lookup

Web services lookup

Web services lookup

Bibliografa
Pentaho

Kettle Solutions- (Building


Open Source ETL Solutions with
Pentaho Data Integration) - Matt Casters/Roland
Bouman/Jos van Dongen
http://wiki.pentaho.com
http://
rpbouman.blogspot.com/2006/06/pentaho-data-inte
gration-kettle-turns.html

You might also like