Professional Documents
Culture Documents
Lenin Alevski Huerta Arias A01063834 Jos Pablo Arciga Aragn A01062487 Filiberto Villagmez Gonzlez A01063318
informacin en conocimiento de forma que se pueda optimizar el proceso de toma de decisiones en los negocios.
Datos
S 5 , 2, 4.0
Information
organizado de datos procesados, que constituyen un mensaje que cambia el estado de conocimiento del sujeto o sistema que recibe dicho mensaje.
Conocimiento
S El
conocimiento es un conjunto de informacin almacenada mediante la experiencia o el aprendizaje (a posteriori), o a travs de la introspeccin (a priori). En el sentido ms amplio del trmino, se trata de la posesin de mltiples datos interrelacionados que, al ser tomados por s solos, poseen un menor valor cualitativo.
fue comprado en cada tienda y bajo que condiciones. No obstante, este esquema no nos permite analizar fcilmente que productos fueron vendidos juntos en la misma canasta de mercado. El anlisis de la canasta de mercado nos da una idea de cmo comercializar varias combinaciones de productos. Por ejemplo: si la pasta congelada se vende bien en conjunto con refrescos, entonces estos 2 productos deberan estar colocados cerca en el supermercado o comercializados con precios complementarios.
Ejemplo
extenderse fcilmente a otras situaciones. En la industria de la manufactura, por ejemplo, es til para ver qu productos se ordenan juntos, porque la empresa podra querer ofrecer paquetes de productos con precio de paquete.
S La tabla de hechos de ventas al por menor no puede ser usada
fcilmente para realizar anlisis de canasta de mercado ya que en las bases de datos relacionales simples, no fueron diseadas para este propsito. Las herramientas para la minera de datos y las tcnicas OLAP nos pueden ayudar para el anlisis de la canasta de mercado.
Entre las herramientas de bases de datos encontradas en el apartado de la inteligencia de negocios se encuentran:
S La minera de datos S Las herramientas OLAP S Data Warehouses S Data Marts S Query & Report
S Las
funcionalidades de estas herramientas son complementarias y estn muy relacionadas entre s. El Data Warehousing nos proporciona almacenamiento eficiente, mantenimiento y recuperacin de datos histricos. OLAP es un servicio que proporciona respuestas rpidas a consultas ad hoc a diferencia del data warehouse. Los algoritmos empleados en La minera de datos se encargan de encontrar patrones en los datos y de reportar modelos al usuario final.
datos en un Data Warehouse son lgicamente organizados, y el rendimiento es altamente sensible a las tcnicas utilizadas para el diseo de la base de datos. [Barquin and Edelstein, 1997].
Data Warehouse
coleccin de datos que es extrada desde diferentes fuentes de informacin a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realizacin de consultas y anlisis, fundamentalmente, para ayudar a la toma de decisiones.
Data Warehouse
de los clientes y proveer la mayor cantidad posible de informacin a los usuarios de la empresa, facilitndose el monitoreo del negocio.
Data Warehouse
primera de ellas es que estn orientados a temas, diferencindose as de los sistemas transaccionales que estructuran los datos en procesos funcionales.
consolidados, lo cual supone un proceso previo de depuracin y homogeneizacin, etapa que puede ser una de las ms complejas al implementar un DW. Por ltimo, los datos son historiados, ya que mantienen el registro histrico de sus valores, lo cual redunda en que, a diferencia de los sistemas transaccionales, no sean voltiles.
Data Mart
Aunque para algunos se trata casi de un sinnimo de Data Warehouse, un Data Mart o cubo de datos puede entenderse como un subconjunto del repositorio de datos, que se orienta a un rea especfica del negocio, como recursos humanos, ventas o marketing, por ejemplo. En otras palabras, un Data Mart corresponde a un almacn de datos ms restringido que un DW en cuanto al volumen de datos que contiene y al alcance dentro de la organizacin.
Desde ese punto de vista, se trata de un repositorio que requiere menores costos y tiempo para construirse respecto de un DW, teniendo en comn el que ambos permiten la realizacin de consultas, a travs del uso de las herramientas OLAP.
Herramientas OLAP
S OLAP (Online
Analytical Processing) son un conjunto de herramientas capaces de responder rpida y gilmente a las solicitudes de informacin de los usuarios y que deben reflejar cualquier lgica de negocio por las que se consulte.
Transaction Processing), las herramientas OLAP presentan informacin multidimensional, es decir, desde mltiples perspectivas. Del mismo modo, los sistemas analticos, al igual que los datos del Data Warehouse, estn orientados a temas, y no slo operan con datos actuales, sino tambin con datos histricos.
Herramientas OLAP
OLAP es identificar tendencias, es decir, permiten apoyar la toma decisiones considerando diversas variables, as como tambin permiten identificar cambios en las preferencias de los clientes. Sin embargo, aunque pueden responder consultas complejas y ratificar informacin, lo hacen siempre dependiendo del usuario, que es quien define las relaciones a considerar.
Que es OLAP
S
OLAP o Proceso analtico en lnea es el nombre formal para el anlisis de cubos multidimensionales - una forma mas intuitiva de ver la informacin empresarial. Con OLAP se puede ver un conjunto de datos de su negocio de muchas y diversas formas sin mucho esfuerzo. Los archivos OLAP o cubos modelan los datos en dimensiones. Una dimensin es una clasificacin de alguna actividad en una organizacin por la cual se puede medir su xito. Por ejemplo, puede monitorear sus ventas contra los productos o clientes en un periodo de tiempo. Hay dos clases de dimensiones que se pueden utilizar, dimensiones regulares y dimensin de medida.
almacenamiento fsico de los datos se realiza en un vector multidimensional. Los cubos OLAP se pueden considerar como una ampliacin de las dos dimensiones de una hoja de clculo.
Un analista financiero podra querer ver los datos de diversas formas, por ejemplo, visualizndolos en funcin de todas las ciudades (que podran figurar en el eje de abscisas) y todos los productos (en el eje de ordenadas), y esto podra ser para un perodo determinado, para la versin y el tipo de gastos. Despus de haber visto los datos de esta forma particular el analista podra entonces querer ver los datos de otra manera y poder hacerlo de forma inmediata. El cubo podra adoptar una nueva orientacin para que los datos aparezcan ahora en funcin de los perodos y el tipo de costo. Debido a que esta reorientacin implica resumir una cantidad muy grande de datos, esta nueva vista de los datos se debe generar de manera eficiente para no malgastar el tiempo del analista, es decir, en cuestin de segundos, en lugar de las horas que seran necesarias en una base de datos relacional convencional.
Son aquellos datos que se quieren medir, por ejemplo, si desea seguir el control de sus ventas, puede utilizar: Clientes: Quines son los mejores, donde se encuentran, que es lo que compran? Productos: Con respecto a los clientes, quien los compra? Qu productos se estn vendiendo? Tiempo: Cmo voy ahora con respecto al ultimo ao o ltimo mes?
se pueden utilizar dimensiones como el Tiempo para llevar control del vencimiento de sus documentos. En contabilidad, una dimensin podra ser su catalogo de cuentas, etc.
dispuestos en niveles jerrquicos o simplemente niveles. Los niveles pueden ser por ejemplo, pas, estado, ciudad. Se puede navegar a travs de esta jerarqua a travs de los niveles o a travs de sus elementos.
S Son
los nmeros que aparecen en el anlisis dependiendo de los elementos seleccionados en las dimensiones regulares. Por ejemplo, en un cubo de ventas, podramos escoger ver las ventas, el nmero de artculos vendidos, ganancia, costo, etc.
una estructura de datos altamente sofisticada que se llama cubo multidimensional. Este cubo puede residir en una base de datos sofisticada como Microsoft Analysis Services o en archivos independientes. Este cubo le permitir analizar su informacin de la manera que desee. Usted podr cruzar todas las dimensiones para obtener nueva informacin que responder a las preguntas que hace y le permitir tomar mejores decisiones.
Microsoft SQL Server, un sistema de gestin de bases de datos. Microsoft ha incluido una serie de servicios de SQL Server relacionados con la inteligencia empresarial y almacenamiento de datos. Estos servicios incluyen servicios de integracin y servicios de anlisis. El servicio de anlisis incluye un conjunto de capacidades OLAP y de minera de datos.
Rebanar
S Taladrar o
Drilling
viendo y obtener una nueva vista de informacin. Por ejemplo, 'Ventas por producto' puede cambiarse fcilmente a 'Ventas por vendedor'. Rebanar es cambiar el valor de una dimensin por otro valor, por ejemplo, de las ventas de Enero a las ventas de Febrero. Rotar es aventar el cubo como si fuera un dado para obtener una nueva cara del cubo
obtener mas detalle. Una especie de taladro que se hunde mas en la informacin. Si usted ve informacin geogrfica, puede pasar de un continente a un pas y luego a una ciudad en particular.
S Con esta simple combinacin de cosas, se puede abrir la
informacin generada por un negocio o informacin corporativa para todos el personal tomador de decisiones en formas que antes no era posible realizarlo.
de datos
Data Mining
orientada a extraer informacin desde grandes volmenes de datos y corresponde a una de las claves de la inteligencia de negocios. El DM es un proceso conocido como KDD (Knowledge Discovery in Databases) que consta de tres fases: preparacin de los datos, extraccin de informacin e interpretacin de los resultados.
Data Mining
verificacin -en donde se prueba una hiptesis del usuario- y los mtodos de descubrimiento -bsqueda de patrones (incluyendo las tcnicas de prediccin)-. Lo anterior se traduce en anlisis exploratorios, los cuales se apoyan en herramientas de visualizacin de datos y construccin de modelos, con el objetivo de realizar predicciones utilizando los patrones detectados en los datos conocidos con informacin del pasado. De all que el DM no es una herramienta orientada slo a las asociaciones estadsticas, sino una tecnologa que es fundamentalmente prospectiva, esto es, que permite descubrir nuevos factores, tendencias y asociaciones desconocidas previamente, llegando incluso a ser predictiva.
en aplicaciones de control de procesos productivos, como herramienta de ayuda a la planificacin y a la decisin en marketing, finanzas, etc.
S Asimismo, la minera de datos es fundamental en la
investigacin cientfica y tcnica, como herramienta de anlisis y descubrimiento de conocimiento a partir de datos de observacin o de resultados de experimentos.
Comprensin del negocio y del problema que se quiere resolver. Determinacin, obtencin y limpieza de los datos necesarios. Creacin de modelos matemticos. Validacin, comunicacin, etc. de los resultados obtenidos. Integracin, si procede, de los resultados en un sistema transaccional o similar. A travs de la experiencia acumulada en proyectos de minera de datos se han ido desarrollando metodologas que permiten gestionar esta complejidad de una manera ms o menos uniforme.
(aquellas que se quiere predecir, calcular o inferir), como a las variables independientes (las que sirven para hacer el clculo o proceso), como posiblemente al muestreo de los registros disponibles.
previo, con el objetivo de prepararlo para aplicar la tcnica de minera de datos que mejor se adapte a los datos y al problema, a este paso tambin se le conoce como preprocesamiento de los datos
Se construye:
S Modelo predictivo.
S Modelo de clasificacin . S Modelo de segmentacin.
comportamiento esperado del cliente utilizando los datos de uso de los servicios.
modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar distintos modelos, aunque generalmente cada tcnica obliga a un preprocesado diferente de los datos
Inteligencia artificial y de la estadstica, dichas tcnicas, no son ms que algoritmos, ms o menos sofisticados que se aplican sobre un conjunto de datos para obtener unos resultados.
S Redes neuronales
S Regresin lineal
S rboles de decisin S Modelos estadsticos S Agrupamiento o Clustering
Redes neuronales
inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexin de neuronas en una red que colabora para producir un estmulo de salida. Algunos ejemplos de red neuronal son:
S El Perceptrn. S El Perceptrn multicapa. S Los Mapas Autoorganizados, tambin conocidos como redes
de Kohonen.
datos. Rpida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse ms de 2 variables.
utilizado en el mbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolucin de un problema.
S Algoritmo ID3
S Algoritmo C4.5
Algoritmo ID3
de tuplas de valores, cada uno de ellos denominados atributos, en el que uno de ellos, ( el atributo a clasificar ) es el objetivo, el cual es de tipo binario ( positivo o negativo, si o no, vlido o invlido, etc. ).
S De esta forma el algoritmo trata de obtener las hiptesis que
decisin.
ecuacin que se emplea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que modifican la variable de respuesta.
vectores segn criterios habitualmente de distancia; se tratar de disponer los vectores de entrada de forma que estn ms cercanos aquellos que tengan caractersticas comunes. Ejemplos:
S Algoritmo K-means. S Algoritmo K-medoids.
modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar distintos modelos, aunque generalmente cada tcnica obliga a un preprocesado diferente de los datos
validacin comprobando que las conclusiones que arroja son vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos
Negocios Hbitos de compra en supermercados Patrones de fuga Fraudes Recursos humanos Comportamiento en Internet Terrorismo Juegos
S S S
son quiz las ms conocidas en este mbito, ya que son fundamentales para el desarrollo y manejo de listados e informes basados en la informacin presente en los almacenes de datos y Data Marts.
para distribuir informacin, sin embargo, hoy est tomando un rol ms estratgico, siendo considerado por los especialistas como una herramienta fundamental para la transformacin del negocio, para innovar y generar ventajas competitivas. Para ello, en los prximos aos los proyectos de este tipo apuntarn ms decididamente a llevar informacin de valor a un mayor nmero de miembros de la organizacin y a visualizarlas como un apoyo a la interconexin con clientes, proveedores y socios de negocios.
Principales Aplicaciones
Esto acta como un factor necesario en las empresas hoy en da ya que es considerado informacin privilegiada para responder a los problemas de negocio (entradas de nuevos mercados, control financiero, etc.), los principales productos de la inteligencia de negocios son:
S Cuadros de mando integrales (mirada global del negocio). S Sistemas de soporte de decisin ( Sistema que sirve de apoyo en la toma
de desiciones).
Acta sobre..
S
Una solucin de inteligencia de negocios completa nos permite: Observar qu est ocurriendo? Comprender por qu ocurre? Predecir qu ocurrira? Colaborar qu debera hacer el equipo? Decidir qu camino se debe seguir?
Datamart
Data Warehouse
S S
Arquitectura
Retroalimentacin de la BI
La Inteligencia de negocios es esencialmente una ciencia de la economa, de acuerdo con el mtodo cientfico. Esto significa que se basa en los datos en lugar de simples conjeturas. Estos datos son recolectados usando justa, exacta, imparcial medios, y organizados de una manera lgica con el fin de producir los mejores resultados.
Bibliografa
Teorey, Toby J. Database modeling & design : logical design. San Francisco, Cal. : Morgan Kaufmann Publishers, 2006. Kimball, Ralph. The data warehouse toolkit : The complete guide to dimensional modeling. New York, N.Y. : Wiley, c2002 http://www.cientec.com/analisis/ana-claves.html
http://www.mitecnologico.com/Main/Introspeccion
Biblioteca Digital
Bibliografa
S http://www.sitcorp.com/?p=31
S http://www.olapxsoftware.com/es/WhatIsOlap.asp
S http://www.slideshare.net/davidreyblanco/qu-es-un-
modelo-predictivo-y-para-qu-vale roceso
S http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos#P
S http://es.wikipedia.org/wiki/Perceptr%C3%B3n