You are on page 1of 12

Inteligencia de negocios, sistemas de gestin de conocimiento en

organizaciones, Datawarehousing

Definicin de Business Intelligence
Fue Howard Dresner, posterior consultor de Gartner Research, el primero que
acu en 1989 el trmino de Business Intelligence (BI). ste, defini BI como:

BI es un proceso interactivo para explorar y analizar informacinestructurada
sobre un rea (normalmente almacenada en un datawarehouse), para descubrir
tendencias o patrones, a partir de los cuales derivar ideas y extraer conclusiones.
El proceso de Business Intelligence incluye la comunicacin de los
descubrimientos y efectuar los cambios. Las reas incluyen clientes, proveedores,
productos, servicios y competidores.

En conclusin y con palabras ms coloquiales llamamos BI al conjunto de
estrategias y herramientas que permiten reunir, depurar y transformar datos de los
sistemas transaccionales, y normalmente desestructurados, en informacin
estructurada para su explotacin directa (reporting, anlisis OLTP/OLAP) o para
analizarla y as convertirla en conocimiento, teniendo as el soporte a la toma de
decisiones del negocio.

En la actualidad Business Intelligence constituye una disciplina puntera para
obtener conocimiento de un negocio.

Avance de la historia.-
DSS: sistema de soporte a las decisiones.
EIS: sistema de informacin para ejecutivos.
BIS: sistema de Inteligencia de negocios.

Dos puntos de vista
Desde la perspectiva del usuario final
-Dependencia de terceros en la obtencin de la informacin
-Tiempos muertos en la bsqueda y no anlisis de la informacin
Existe la necesidad de acceder a los datos corporativos de manera directa y
Autnoma

Desde la perspectiva de sistemas
-Recursos exclusivamente asignados a la generacin de reportes
-Retardos en la entrega de reportes
Existe la necesidad de satisfacer los requerimientos de informacin de los
usuarios finales

Por qu Business Intelligence ?
Existe la necesidad de tomar decisiones rpidas, como se vio en la introduccin,
para lograr que las organizaciones sean competitivas, y estas restricciones de
tiempo limitan a las personas en su capacidad de tomar buenas decisiones. Sin
embargo SGBD e incluso herramientas ERP,CRM o SCM sofisticadas que se
utilizan en las empresas, suelen tener una estructura bastante inflexible para este
fin, porque aunque se adaptan, en mayor o menor medida, a permitir manejar los
datos, no nos permiten extraer informacin de ellos y mucho menos extrapolar
conocimiento.

Encontramos entonces que las herramientas tradicionales tienen limitaciones:

- Rigidez a la hora de visualizar los datos. El usuario tiene que ceirse a
vistas/informes predefinidos que se hicieron en tiempo de diseo. De manera que
si el usuario desea obtener nuevos informes, necesitara poseer conocimientos
tcnicos para realizar consultas que puedan interrogar a la base de datos o, de lo
contrario, se vera obligado a acudir a los departamentos de sistemas de
informacin de su empresa.
- Largos tiempos de respuesta. Normalmente consultas complejas requieren la
unin de tablas y si stas tienen gran volumen de informacin se producen
esperas que dificultan a los usuarios la fluidez de su trabajo.
- Lagunas de datos. Las organizaciones suelen tener sus datos normalmente
representados en diferentes sistemas de informacin y aadidos

Presentndose problemas como:

Al no usar BIS, las empresas poseen muchos sistemas independientes y utilizan
hojas Excel para los reportes, esto provoca.

Datos redundantes e inconsistentes.
Limitado anlisis cruzado-funcional.
Dificultad en la toma de decisiones.

Business Intelligence proporciona

La informacin correcta, a la persona correcta, en el formato correcto, en el
momento correcto.

Las organizaciones quieren.- Eficiencia, Flexibilidad.

Las plataformas BI son mejor solucin a las herramientas tradicionales en dos
aspectos:

BI como solucin tecnolgica:

- BI permite centralizar, depurar y afianzar los datos: ya que lo que se hace con la
plataforma BI es reunificar y homogeneizar mediante un almacn de datos,
pudiendo explotar ste sin esfuerzo. De esta manera todas las personas poseen la
misma informacin, siempre actualizada, y pueden acceder a ella de una manera
ms rpida y sencilla.

- Ayuda a descubrir informacin que no es evidente para las aplicaciones
tradicionales, porque la manera de presentar la informacin de las herramientas BI
nos ayuda a descubrir pautas, tendencias, cambios, casi imposibles de descubrir
cuando no tenemos la informacin centralizada o se encuentra mal relacionada.
Todo esto con un simple vistazo a la aplicacin.

- Permite a usuarios con perfil no tcnico construir nuevos informes y navegar por
los datos de la compaa, con el objetivo de descubrir informacin que les resulte
relevante.

- Y por ltimo ayuda a optimizar el rendimiento de nuestros sistemas, porque las
herramientas BI estn diseadas para perfeccionar las consultas de alto nivel,
realizando las transformaciones oportunas a cada sistema (OLTP - OLAP), y
liberando los servidores operacionales.

BI como ventaja competitiva:

Hay una serie de caractersticas que nos aporta BI y que al final constituyen una
ventaja competitiva para nuestro proyecto/negocio.

- La primera es que permite hacer un seguimiento real de nuestros planes
estratgicos. As si disponemos de proyectos en marcha, BI nos ayudar, con la
utilizacin de un cuadro de mando, a crear, manejar y monitorizar las mtricas y
objetivos presentes del proyecto.

- Adems da la posibilidad de aprender de los errores cometidos en el pasado, ya
que se realizan histricos de los datos relevantes. Ayudando as a no tropezar dos
veces en la misma mala decisin o accin.

- Se obtiene el verdadero valor de las aplicaciones de gestin: Durante mucho
tiempo las empresas han explotado con dificultad y ayudados por tcnicos sus
bases de datos, pero con una plataforma BI todos los empleados, desde directores
hasta analistas, podrn manejar la informacin adecuada, integrada y actualizada
pudiendo as tomar decisiones adecuadas en el momento adecuado sin que
empleados subordinados tengan que estar preguntando a sus directivos
constantemente por informacin.

BI es un sistema informtico utilizado para servir de apoyo, ms que automatizar,
el proceso de toma de decisiones. El apoyo a la decisin significa que el sistema
puede ayudar a las personas a reunir informacin, para que puedan generar
alternativas y as tomar decisiones.

Decisin: del latn decisio determinacin que se toma sobre una determinada
cosa a travs de un proceso mental-cognitivo.

Informacin: conjunto de datos procesados, que constituyen un mensaje que
cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje.

Informacin = Respuestas

Las respuestas permiten tomar decisiones a travs de DATOS.

Concluyendo que:
Informacin + inteligencia = Buena Decisin

Arquitectura de BI

En la figura 1 se ilustran los componentes que conforman un sistema BI, stos
son:


- Fuentes de informacin, que nutrirn de datos al sistema.

- Proceso ETL, que extrae, transforma y carga los datos de las fuentes de
informacin al datawarehouse.

- Datawarehouse, que rene los datos de la organizacin. Es una coleccin de
datos integrada, esto es, contiene los datos de todos los sistemas operacionales
de la organizacin, y es no voltil, la informacin no se modifica ni se elimina.

- Motor OLAP que permite capacidad de clculo, consultas, anlisis de escenarios
en grandes volmenes de datos.

- Herramientas Front-end, que son las herramientas de visualizacin que permiten
la navegacin por los datos para su anlisis por parte del usuario final.

Figura 1 Componentes de Business Intelligence

Descripcin de los Componentes de Business Intelligence

1. Fuentes de Informacin: Son los principales sistemas transaccionales de la
compaa de donde saldr la informacin a ser analizada. Pueden ser sistemas
ERP, CRM, Sistemas Core, fuentes internas, externas. Datos estructurados o no
estructurados.

Las fuentes de informacin a las que podemos acceder se clasifican en tres tipos:

- Sistemas operacionales, o transaccionales que incluyen aplicaciones
desarrolladas a medida, ERP, CRM, SCM, etc.

- Sistemas de informacin departamentales: componen diferentes archivos ms
informales en los que los diferentes departamentos pueden almacenar
informacin que tambin puede ser interesante almacenar en el datawarehouse
segn el modelo de negocio: presupuestos, hojas de clculo, ficheros planos.

- Fuentes de informacin externas, que constituyen un origen de datos importante
para enriquecer la informacin de la organizacin, por ejemplo se podran
incorporar estadsticas del Instituto Nacional de Estadstica que completarn la
informacin de la que se dispone.

Es primordial identificar de qu fuentes vamos a recuperar la informacin, en qu
formato se encuentra y qu calidad tiene esta informacin. Normalmente la
informacin que se carga en un datawarehouse es estructurada, es decir, va a
poder almacenarse en tablas, aunque tambin podra ser informacin no
estructurada como informes, vdeos, correos electrnicos, etc.

Y por supuesto, es importante contrastar que la informacin que se dispone en las
fuentes de la organizacin, es la que se necesita para alimentar los modelos de
anlisis o de negocio
Si no se dispone de la informacin necesaria habra que llevar a cabo una
modificacin de las fuentes de datos transaccionales de la empresa para que
stas empezaran a recogerla.

2. ETL: Significa. Extraccin, Transformacin y Carga. Se divide en 5 pasos:

Extraccin: Este proceso recupera los datos fsicamente de las distintas fuentes
de informacin. En este momento disponemos de los datos en bruto.

Limpieza: Este proceso recupera los datos en bruto y comprueba su calidad,
elimina los duplicados y, cuando es posible, corrige los valores errneos y
completa los valores vacos, es decir se transforman los datos -siempre que sea
posible- para reducir los errores de carga.

Transformacin: Este proceso recupera los datos limpios y de alta calidad y los
estructura y sumariza en los distintos modelos de anlisis. El resultado de este
proceso es la obtencin de datos limpios, consistentes, sumarizados y tiles.

Integracin: Este proceso valida que los datos que cargamos en el
datawarehouse son consistentes con las definiciones y formatos del
datawarehouse; los integra en los distintos modelos de las distintas reas de
negocio que hemos definido en el mismo. Estos procesos pueden ser complejos.

Actualizacin: Este proceso es el que nos permite aadir los nuevos datos al
datawarehouse.

Las herramientas ETL son clave en proyectos Business Intelligence, la salida que
devuelva la herramienta BI depende directamente de los datos de entrada que se
dispongan, tiene una importancia crtica que estos datos pasen los subprocesos
mencionados.

3. Datawarehouse: Almacn de datos La aparicin de los datawarehouse o
Almacenes de datos son la respuesta a las necesidades de los usuarios que
necesitan informacin consistente, integrada, histrica y preparada para ser
analizada para poder tomar decisiones.

Un DW es una coleccin de datos orientados a temas, integrados, no-voltiles y
variante en el tiempo, organizados para soportar necesidades empresariales Bill
Inmon

Un datawarehouse debe estar orientado a un rea, ser integrado, indexado en el
tiempo, y no voltil:

- Orientado a un rea: La informacin se clasifica dentro del datawarehouse para
atender a las diferentes reas de inters de la organizacin o los diferentes
problemas de negocio. Diferentes reas necesitarn informacin diferente para
llevar a cabo su actividad, realizando esta clasificacin se otorgar a cada rea de
negocio slo la informacin que necesita, ignorando el resto, que le resultara no
relevante.

- Integrado: Se integran dentro del datawarehouse los datos obtenidos de las
diferentes fuentes de informacin (sistemas operacionales y/o fuentes externas).
La integracin se lleva a cabo estableciendo medidas uniformes, y convenciones
para nombrar a los datos y para adoptar claves.

- Indexado en el tiempo: En el datawarehouse la informacin se almacena
conforme a diferentes momentos del tiempo, de manera que la informacin
almacenada son fotografas de los distintos periodos. Almacena la informacin y
es gracias a ello por lo que podemos realizar consultas que tengan en cuenta la
evolucin histrica de los datos.

- No voltil: La informacin no se modifica, como pasara en los sistemas
transaccionales, lo que significa que los usuarios no la mantienen. Una vez la
informacin est en el datawarehouse sta no variar, slo se incrementar.

El datawarehouse es entonces, una gran base de datos corporativa, pero a
menudo se hace necesario su divisin en unidades ms pequeas, los datamarts.
Esto es til por ejemplo en el caso de grandes organizaciones globalizadas,
resultara muy ineficienteque las diferentes sedes tuvieran que acceder al
datawarehouse cada vez que necesitaran acceder a informacin corporativa. Pero
no se emplean solo en ese caso, los datamart pueden ser utilizados para los
diferentes departamentos dentro de la empresa, o incluso para los diferentes
grupos de trabajo. La separacin de los datos se puede hacer con el criterio que la
organizacin quiera, segn reas geogrficas, departamentos, periodos de tiempo,
modelos de negocio, etc.

4. Olap Server OLAP = Procesamiento analtico en lnea.

OLAP del ingls On-Line Analytical Processing es la tecnologa ms extendida
para la recuperacin de datos del datawarehouse.

Desglosando la definicin:
- Es interactivo porque los usuarios se movern a travs de la informacin,
realizarn consultas de la misma, como si se encontraran navegando en ella. As
el usuario se mueve de una perspectiva de su negocio a otra teniendo disponible
toda la informacin de la empresa.

- Es una tecnologa multidimensional porque permite extraer la informacin desde
diferentes perspectivas, que son las dimensiones, como se ver ms adelante.

- Es a escala empresarial, ya que dispone de toda la informacin existente en la
organizacin.

Los usuarios trabajarn de manera intuitiva con la informacin, sin necesidad de
saber cmo es el formato fsico de los datos, conocer el lenguaje SQL, los
nombres de las tablas, la arquitectura OLAP o dems conocimientos tcnicos.

Son herramientas de software que proporcionan anlisis de datos almacenados
en una base de datos a travs de diferentes dimensiones de datos
multidimensionales. Por ejemplo, se proporciona una serie en el tiempo y puntos
de vista de anlisis de tendencias.

El componente principal de OLAP es el servidor OLAP, que es un MOTOR
especialmente diseado y designado para soportar y operar estructuras de datos
multidimensionales.

Las caractersticas tcnicas que diferencian a OLAP de OLTP son las siguientes:

- En una aplicacin OLTP los datos se actualizan con la misma frecuencia que son
ledos, mientras que en una aplicacin OLAP se actualizarn conforme lo haga el
datawarehouse subyacente.

- El tiempo de respuesta en una aplicacin OLTP es ms crtico que en una
aplicacin OLAP ya que maneja datos de la actividad diaria de la empresa, y
pudiera tratarse de una transaccin importante para un cliente, por ejemplo.

- Las aplicaciones OLTP son usadas por un gran nmero de usuarios dentro de la
organizacin debido a la informacin que tratan, por lo que deben soportar un alto
nivel de concurrencia, mientras las que una aplicacin OLAP en principio est
destinada a un nmero menor de usuarios que sern los tomadores de decisiones
de la organizacin.

- La frecuencia con la que se trabaja con una aplicacin OLTP es bastante
constante, ya que realiza operaciones diarias de la empresa, mientras un OLAP
puede utilizarse de manera diaria en algunos periodos y mensual en otros.

- Y la diferencia ms importante es que las consultas que se realizan sobre OLTP
son de carcter ms sencillo y sobre una menor cantidad de datos que las
realizadas sobre OLAP, que suelen ser consultas complejas que conllevan el
anlisis de gran cantidad de datos.

Como se ha dicho, OLAP permite utilizar la informacin desde diferentes
perspectivas, a estas perspectivas se las llama dimensiones porque conforman las
diferentes dimensiones del cubo. El cubo es la estructura multidimensional que
utiliza OLAP para albergar la informacin, que grficamente representado es como
se ilustra en la figura 2.

Ilustracin 2. Cubo genrico

Los ejes x, y y z son las dimensiones del cubo y los valores x1, x2,,xn ; y1,y2,
,yn
; z1,z2,,zn son las medidas sobre las que se analiza la informacin.

You might also like