You are on page 1of 128

UNIVERSIDAD TECNICA DE BABAHOYO FACULTAD DE ADMINISTRACION FINANZA E INFORMNATICA F.A.F.

ESCUELA DE SISTEMAS

TESIS DE GRADO PREVIA A LA OBTENCION DEL TITULO DE INGENIERIA EN SISTEMAS TEMA: DATAWAREHOUSE COMO HERRAMIENTA PARA MEJORAR LA TOMA DE DESICIONES EN LA EMPRESA DISTRIBUIDORA DE VEHICULOS METROCAR

AUTORAS: CABALLERO VALENCIA ROSA EUGENIA. ELIZONDO AVILES GLORIA GREY.

BABAHOYO- ECUADOR 2011

INDICE I El problema 1.1 Planteamiento del problema 1.1.1 Formacin del problema 1.1.2 Delimitacin del problema 1.2 Objetivo 1.3 Justificacin II Marco terico 2.1 Antecedentes Investigativo 2.2 Fundamentacin cientfica 2.2.1 Datamining (Minera de Dato) 2.2.2 Fundamento sobre Dataming 2.2.3 Dnde se utiliza Datamining? 2.2.4 Los objetivos principales de Datamining 2.2.5 Algunas Herramienta utilizadas en Datamining de la inteligencia artificial 2.2.6 La estructura del Datamining 2.2.7 Los Modelos de Datamining 2.2.8 Datamining dentro de una arquitectura Datawehousing 2.2.9 Creacin de un proyecto Datamining 2.2.10 Fases generales para la creacin de un proyecto Datamining 2.2.11 Las fases para la creacin de un proyecto Datamining segn Jos Emilio gondar nores 2.2.12 Recomendaciones para la creacin de un proyecto data mining 1 1 2 2 3 4 5 5 5 5 7 13 14 15 16 17-18 19 20 21 22-23-24 25

2.2.13 Aplicaciones de data mining 2.2.14 Por que usar Data Mining? 2.2.15 Algunas herramientas de Data Mining 2.2.16 Data Mining vs Estadisticas 2.2.17 Mercadeo y Data Mining 2.2.18 Data Mining y los procesos de venta 2.2.19 Ejemplos de Utilizacin de Data Mining 2.2.19.1 Paales y cervezas: un caso famoso acerca del comportamiento de los consumidores 2.2.19.2 Data Mining para pymes 2.2.19.3 Data Mining en SAS 2.2.19.4 Spoke: Data Mining de tu correo electrnico 2.2.19.5 Data Mining y la medicina basada en la evidencia 2.2.19.6 Aplicacin del FBI para detectar terroristas 2.2.19.7 Deteccin de fraudes en las tarjetas de crdito 2.2.19.8 Descubrimiento el por que de la desercin de clientes de una compaa operadora de telefona mvil 2.2.19.9 Prediciendo el tamao de las audiencias televisivas 2.2.19.10 Aplicacin en la universidad 2.2.19.11 Investigaciones espaciales: Proyecto SKYCAT 2.2.19.12 En clubes deportivos 2.2.20 Extensiones de data mining 2.2.20.1 Web Mining 2.2.20.2 Text Mining

26 26-27 28-29 30-31-32 33-34-35 36 37 38 38-39 40-41 42 43 44 45 45 46 47 47 48 49 50 51-52

2.2.21 Competencia y Oportunidades 2.2.22 La prxima generacin 2.2.23 Tiempos de cambio 2.2.24 Tecnologas imperantes 2.2.25 Qu se puede aportar la investigacin de mercados en este contexto? 2.2.26 Datamart 2.2.26.1 Datamart OLAP 2.2.26.2 Datamart OLTP 2.2.27 La toma de decisiones 2.2.27.1 El modelo de decisiones 2.2.27.2 La experiencia en la toma de decisiones 2.2.27.3 La toma de decisiones en la teora de decisin 2.2.27.4 La toma de decisiones en la empresa publica 2.2.28 Del lechero al supermercado virtual III Marco Metodolgico 3.1. Modalidad de la investigacin 3.1.1. Investigacin cuantitativa 3.1.2. Investigacin cualitativa 3.2. Tipos de investigacin 3.3 Poblacin y muestra 3.3.1. Mtodos, tcnicas e instrumentos 3.3.2 Interpretacin de datos

53-54 55-56 57-58 59-60-61-62 63 64 65 65 66-67-68 69 70 71 72 73-74-75-7677 78 78 78 78 78 79 79 80-90

IV Marco propositivo 4.2 Descripcin de la propuesta 4.2.1 Metodologa de desarrollo 4.2.2. Anlisis previo 4.2.3 Desarrollo de la propuesta 4.2.3.1 Diseo y anlisis de la base de datos multidimensional 4.2.3.2 Esquema Estrella 4.2.3.3 Complementos del QLIK VIEW 4.2.3.6 Crear un cuadro de tabla y un grafico pivotante 4.2.3.7 Cubos 4.2.3.9 Medidas 4.3. Impacto del sistema en la empresa V Conclusiones VI Recomendacin

91-92 93 93 94 94 95-96 97 98-105 106-109 110-111-112 113 114-115-116 117 118-119

DEDICATORIA

A Dios. Por darme salud y fortaleza para que mis anhelos se hagan realidad. A Mis Padres. Jos Caballero Valencia y Flor Valencia Galecio Por estar en cada minuto de mi vida apoyndome, guindome por el camino correcto e impulsando a feliz trmino mi carrera. De manera muy Especial a mi MADRE que aunque ya no est aqu entre nosotros, este trabajo es para ella y por ella. Pilar fundamental en mi vida y mi carrera. A Mis Hermanos y Sobrinas. Por su apoyo incondicional, sus consejos, cario y tolerancia en mis peores momentos. Por demostrarme y por hacerme entender que unidos somos ms fuertes y no hay obstculo, dolor ni miedo que pueda vencernos. A mi ngel guardin Alisson, Te Amo Bebe. A mi amiga. Gloria Elizondo porque juntas hemos luchado para que este prominente trabajo se haga realidad, sobrellevando y enfrentando dificultades y muchas adversidades en lo largo de nuestra carrera universitaria y amistad de las cuales hemos sabido salir triunfantes. A cada una de aquellas personas quienes directa e indirectamente con sus consejos y buenos deseos me supieron guiar.

Caballero Valencia Rosa Eugenia.

DEDICATORIA

Primeramente doy infinitamente Gracias a Dios, por que ha estado conmigo a cada paso que doy, cuidndome y dndome fortaleza para continuar.

A mi madre Rosala Elizondo Avils, quien a lo largo de mi vida ha velado por mi bienestar y educacin siendo mi apoyo en todo momento. Depositando su entera confianza en cada reto que se me presentaba sin dudar ni un solo momento.

A mi ta Victoria Elizondo Avils por su total comprensin y valiosa ayuda con el cuidado de mi hija.

A mi hija Anneris Cevallos Elizondo, por su comprensin y cario a lo largo de mi etapa universitaria.

De igual manera a mi amiga y compaera Rosa Caballero, que juntas hemos logrado enfrentar muchas dificultades en el transcurso de este ciclo de nuestra vida, logrando cumplir nuestras metas.

Elizondo Avils Gloria Grey

AGRADECIMIENTO

Las autoras dejan constancia de su agradecimiento a las siguientes instituciones y personas; por la valiosa colaboracin prestada en la ejecucin de la presente tesis de grado:

Al Ab. Ausberto Colina Gonzalvo, Decano de la Facultad de Administracin Finanzas e Informtica

Al Ing. Jos Sandoya Villafuerte, Director de Escuela de Sistemas y Electrnica.

Al Ing. Ral Ramos Morocho, lector de tesis por su apoyo incondicional para llegar a feliz trmino en nuestra tesis.

Al Ing. Freddy Jordn Cordones, Director de tesis por su ayuda y apoyo incondicional para concluir nuestra propuesta de investigacin.

A Carlotita Loor, Asistente de Secretaria.

Al personal administrativo y Gerente General de empresas METROCAR por su apoyo en nuestra investigacin.

A todos y cada uno de los docentes que impartieron sus conocimientos para as poder alcanzar nuestra meta profesional.

La responsabilidad de este trabajo De investigacin con sus resultados, Conclusiones y recomendaciones Pertenecen exclusivamente a las autoras.

. Rosa Eugenia Caballero Valencia

Gloria Grey Elizondo Avils.

CAPITULO I

EL PROBLEMA.

1.1.

PLANTEAMIENTO DEL PROBLEMA.

En la ciudad de Babahoyo se encuentra la empresa Metrocar dedicada a la comercializacin de vehculos nuevos y seminuevos en la marca chevrolet, la empresa dispone de sus sistemas de facturacin e inventarios en los cuales se registran las diferentes transacciones que se llevan a cabo durante toda la gestin comercializadora de la empresa, pero no existen herramientas para la gerencia de varios departamentos, pues estos necesitan una serie de datos especiales y adicionales para fundamentar mejor sus decisiones, as tenemos por ejemplo que:

No sabemos cuntos carros se han vendido, pero no sabemos las preferencias en cuanto a color, cilindraje, modelos, aos, equipamiento interno, etc.

No sabemos cuntos clientes han comprado carros ya sea a crdito o contado pero no sabemos los porcentajes de entrada, los plazos ms frecuentes, las instituciones con las que generalmente se financian, etc.

De lo expuesto se puede deducir que los gerentes de los diferentes departamentos estn tomando sus decisiones en base a su criterio o experiencia y no estn fundamentando esas decisiones en datos reales, eso es un inconveniente serio para la empresa ya que si el criterio del gerente

departamental falla muy probamente se harn comparas inadecuadas, pudiendo esto repercutir en una disminucin en las ventas. De forma similar, si se toma una decisin equivocada respecto a polticas de crdito o marketing se tendr dificultades con los clientes.

10

1.1.1. FORMULACIN DEL PROBLEMA.

Cmo mejorar la toma de decisiones gerenciales en la empresa Metrocar a travs de una herramienta Datawarehouse?

1.1.2. DELIMITACIN DEL PROBLEMA.

Objeto de Estudio: Ingeniera en Sistemas. Campo de Accin: Ingeniera del Software.

11

1.2.

OBJETIVOS

General

Desarrollar un sistema Datawarehouse cuyo apoyo permitir mejorar la toma de decisiones gerenciales que se llevan a cabo en la empresa Metrocar.

Especficos

Realizar una investigacin bibliogrfica sobre los sistemas Datawarehouse, bases de datos y la toma de decisiones.

Diagnosticar la toma de decisiones que se realiza actualmente en la empresa Metrocar para determinar el porcentaje error que usualmente se tiene.

Desarrollar el Datawarehouse mediante la utilizacin de herramientas de software libre.

12

1.3.

JUSTIFICACIN

Con el avance de la informtica, la gran mayora de empresas han

ido

sistematizando sus procesos, eso significa que se ha desarrollado los sistemas especialmente orientados a registrar magnticamente todas las transacciones que se llevan a cabo en la gestin general de una empresa. Como resultado de esto, se han generado sistemas transaccionales que han almacenado la informacin en diversos tipos de bases de datos.

Por otro lado la toma de decisiones gerenciales generalmente son realizadas en base a la experiencia o mejor criterio del gerente, pero hoy en da estamos en un mundo comercial tan competitivo que no se puede dar el lujo de equivocarse en una decisin, por ms pequea que esta sea. Es por ello que surgen los repositorios de datos, donde se almacena toda la informacin transaccional que generalmente no se aprovecha.

Un Datawarehouse permite extraer informacin que est disponible en la base pero que los sistemas transaccionales no la utilizan o no la dan mayor importancia pero que son de vital importancia como apoyo a la toma de decisiones por parte de la gerencia de la empresa. As por ejemplo como saber cul es el color de automvil que ms se ha vendido, que caractersticas internas le gusta ms a la gente, etc. Esa informacin est disponible en la base solamente que hay que extraerla adecuadamente para que el gerente pida ms automviles del color que ms se vende.

Si se dispone de un Datawarehouse las decisiones gerenciales de la empresa van a estar mejor fundamentadas y habr menos posibilidades de equivocacin, lo cual es favorable a la empresa y por lo tanto se justifica plenamente la realizacin de este trabajo como tesis de grado.

13

CAPITULO II

MARCO TEORICO

2.1. ANTECEDENTES INVESTIGATIVOS.

Partiendo del hecho de que la eficiencia actualmente es un componente normal de las grandes instituciones, todo esfuerzo que se haga por elevarla es vlido. Debo manifestar que lamentablemente no existen muchos trabajos relacionados con la minera de datos y de los que existen hemos concluido que los repositorios de datos son elementos muy importantes para obtener informacin de apoyo a la toma de decisiones que se lleva a cabo de manera frecuente

2.2 FUNDAMENTACION CIENTIFICA Este trabajo investigativo se fundamentar cientficamente en los siguientes temas:

2.2.1 Datamining (Minera de datos)

El Datamining (minera de datos), es el conjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica o

semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.

Bsicamente, el Datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a las redes neuronales.

De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin.

14

Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin que surge entre la informacin y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. Vea ms diferencias entre datos, informacin y conocimiento.

Aunque en Datamining cada caso concreto puede ser radicalmente distinto al anterior, el proceso comn a todos ellos se suele componer de cuatro etapas principales:

Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el cliente desea bajo la orientacin del especialista en Datamining.

Pre procesamiento de los datos. Se refiere a la seleccin, la limpieza, el enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de Datamining.

Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia Artificial.

Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

15

Carga de trabajo en las fases de un proyecto de Datamining En resumen, el Datamining se presenta como una tecnologa emergente, con varias ventajas: por un lado, resulta un buen punto de encuentro entre los investigadores y las personas de negocios; por otro, ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios. Adems, no hay duda de que trabajar con esta tecnologa implica cuidar un sinnmero de detalles debido a que el producto final involucra "toma de decisiones".

2.2.2. Fundamentos sobre Datamining.

Cada da generamos una gran cantidad de informacin, algunas veces conscientes de que lo hacemos y otras veces inconscientes de ello porque lo desconocemos. Nos damos cuenta de que generamos informacin cuando registramos nuestra entrada en el trabajo, cuando entramos en un servidor para ver nuestro correo, cuando pagamos con una tarjeta de crdito cuando reservamos un boleto de avin. Otras veces no nos damos cuenta de que generamos informacin, como cuando conducimos por una va donde estn contabilizando el nmero de automviles que pasan por minuto, cuando se sigue nuestra navegacin por Internet o cuando nos sacan una fotografa del rostro al haber pasado cerca de una oficina gubernamental.

16

Con qu finalidad queremos generar informacin? Son muchos los motivos que nos llevan a generar informacin, ya que nos pueden ayudar a controlar, optimizar, administrar, examinar, investigar, planificar, predecir, someter, negociar o tomar decisiones de cualquier mbito segn el dominio en que nos desarrollemos. La informacin por s misma est considerada un bien patrimonial. De esta forma, si una empresa tiene una prdida total o parcial de informacin provoca bastantes perjuicios. Es evidente que la informacin debe ser protegida, pero tambin explotada.

Qu nos ha permitido poder generar tanta informacin? En los ltimos aos, debido al desarrollo tecnolgico a niveles exponenciales tanto en el rea de cmputo como en la de transmisin de datos, ha sido posible que se gestionen de una mejor manera el manejo y almacenamiento de la informacin. Sin duda existen cuatro factores importantes que nos han llevado a este suceso:

El abaratamiento de los sistemas de almacenamiento tanto temporal como permanente.

El incremento de las velocidades de cmputo en los procesadores.

Las mejoras en la confiabilidad y aumento de la velocidad en la transmisin de datos.

El desarrollo de sistemas administradores de bases de datos ms poderosos.

Actualmente todas estas ventajas nos han llevado a abusar del almacenamiento de la informacin en las bases de datos. Podemos decir que algunas empresas almacenan un cierto tipo de datos al que se ha denominado dato-escritura, ya que slo se guarda (o escribe) en el disco duro, pero nunca se hace uso de l. Generalmente, todas las empresas usan un dato llamado dato-escritura-lectura, que utilizan para hacer consultas dirigidas. Un nuevo tipo de dato al cual se ha

17

llamado dato-escritura-lectura-anlisis es el que proporciona en conjunto un verdadero conocimiento y nos apoya en las tomas de decisiones.

Es necesario contar con tecnologas que nos ayuden a explotar el potencial de este tipo de datos. La cantidad de informacin que nos llega cada da es tan inmensa que nos resulta difcil asimilarla. Basta con ir al buscador Altavista y solicitar la palabra information para ver que existen 171.769.416 sitios donde nos pueden decir algo al respecto. Suponiendo que nos tomemos un minuto para ver el contenido de cada pgina, tardaramos entonces 326 aos en visitarlas todas. Esto es imposible, y, por lo tanto, existe una clara necesidad de disponer de tecnologas que nos ayuden en nuestros procesos de bsqueda y, an ms, de tecnologas que nos ayuden a comprender su contenido.

Como bien sabemos, algunos sistemas producen una cantidad inmensa de datos; estos datos con frecuencia contienen valiosa informacin que puede resultar muy til y ser vista como vetas de oro por los ojos de un ejecutivo de una corporacin. Las dimensiones de las base de datos grandes (montaas) y sus velocidades de crecimiento, hacen muy difcil para un humano su anlisis y la extraccin de alguna informacin importante (oro). An con el uso de herramientas estadsticas clsicas esta tarea es casi imposible.

El Datamining surge como una tecnologa que intenta ayudar a comprender el contenido de una base de datos. De forma general, los datos son la materia prima bruta, en el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin del confronto entre la informacin y ese modelo represente un valor agregado, entonces nos referimos al conocimiento. En la figura 1.1 se ilustra la jerarqua que existe en una base de datos entre dato, informacin y conocimiento. Se observa igualmente el volumen que presenta en cada nivel y el valor que los responsables de las decisiones le dan en esa jerarqua. El rea interna dentro del tringulo representa los objetivos que se han

18

propuesto. La separacin del tringulo representa la estrecha unin entre dato e informacin, no as entre la informacin y el conocimiento.

El Data Mining trabaja en el nivel superior buscando patrones, comportamientos, agrupaciones, secuencias, tendencias o asociaciones que puedan generar algn modelo que nos permita comprender mejor el dominio para ayudar en una posible toma de decisin.

Figura 1.1. Relacin entre Dato, Informacin y conocimiento

El descubrimiento de conocimiento en base de datos (KDD, de Knowledge Discovery in Databases) combina las tcnicas tradicionales con numerosos recursos desarrollados en el rea de la inteligencia artificial. En estas aplicaciones el trmino "Minera de Datos" (Data Mining) ha tenido ms aceptacin. En algunos casos las herramientas provenientes de la inteligencia artificial son nuevas, no del todo comprendidas y carentes de un soporte terico formal. Pero en este caso el objetivo es tan valioso, que los resultados prcticos han rebasado a la elegancia acadmica.

Con todo lo anterior podemos decir que Data Mining es el proceso de descubrir patrones de informacin interesante y potencialmente tiles, inmersos en una gran base de datos en la que se interacta constantemente. Data Mining es una combinacin de procesos como:

19

Extraccin de datos Limpieza de datos. Seleccin de caractersticas. Algoritmos.

Anlisis de resultados. Las herramientas de Data Mining exploran gran cantidad de datos dentro de una BD grande, y mediante su anlisis predicen posibles tendencias o

comportamientos futuros entro de una empresa, permitiendo al experto tomar decisiones en los negocios de una forma rpida y utilizando un conocimiento que de otra forma no habra encontrado. Mediante la utilizacin de estas herramientas se pueden generar nuevas oportunidades de negocio. Algunas posibilidades que ofrecen estas herramientas son:

Prediccin automatizada de tendencias y comportamientos. Descubrimiento automatizado de modelos desconocidos. Descubrimiento de anomalas y acciones fraudulentas por parte de clientes. Este producto est fuertemente relacionado con anlisis estadsticos, el objetivo de generar hiptesis potenciales de inters que son posteriormente verificadas (Vea la figura 1.2.).

20

Encontrar patrones significativos en todos los datos puede proporcionar una ventaja competitiva a cualquier organizacin..

Otra definicin que se puede dar de Data Mining y que es muy comn encontrar dice: "Una actividad de extraccin cuyo objetivo es el de descubrir hechos contenidos en las bases de datos". En la mayora de los casos se refiere a un trabajo automatizado. Si hay alguna intervencin humana a lo largo del proceso, este no es considerado como minera de datos por parte algunas personas. La palabra descubrimiento est relacionada con el hecho de que mucha de la informacin valiosa es desconocida con anterioridad. En todo caso, estas tcnicas pueden ayudar a confirmar cualquier sospecha sobre el comportamiento del sistema en un particular contexto. En cuanto a los hechos escondidos, estos estarn principalmente bajo la forma de reglas las cuales nos ayudarn a entender el modelo del sistema relacionado con los datos observados.

Por otra parte, las reglas tambin pueden ser usadas en la prediccin de ciertos estado del sistema (lo que se busca). Desde un punto de vista acadmico el trmino Data Mining es una etapa dentro de un proceso mayor llamado KDD. Lo que en verdad hace el Data Mining es reunir las ventajas de varias reas como la Estadstica, la Inteligencia Artificial, la Computacin Grfica, las Bases de Datos y el Procesamiento Masivo, principalmente usando como materia prima las bases de datos.

El Data Mining es una tecnologa compuesta por etapas que integra varias reas y que no se debe confundir con un gran software. Durante el desarrollo de un proyecto de este tipo se usan diferentes aplicaciones software en cada etapa que pueden ser estadsticas, de visualizacin de datos o de inteligencia artificial, principalmente. Actualmente existen aplicaciones o herramientas comerciales de Data Mining muy poderosas que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto. Sin embargo, casi siempre acaban complementndose con otra herramienta.

21

2.2.3. Dnde se utiliza Data Mining?

La utilidad de Data Mining se puede dar dentro de los siguientes aspectos:

Sistemas parcialmente desconocidos: Si el modelo del sistema que produce los datos es bien conocido, entonces no necesitamos de la minera de datos ya que todas las variables son de alguna manera predecibles. Este no es el caso del comercio electrnico, debido a los efectos del comportamiento humano, el clima y de decisiones polticas entre otros. En estos casos habr una parte del sistema que es conocida y habr una parte aparentemente de naturaleza aleatoria. Bajo ciertas circunstancias, a partir de una gran cantidad de datos asociada con el sistema, existe la posibilidad de encontrar nuevos aspectos previamente desconocidos del modelo.

Enorme cantidad de datos: Al contar con mucha informacin en algunas bases de datos es importante para una empresa encontrar la forma de analizar "montaas" de informacin (lo que para un humano sera imposible) y que ello le produzca algn tipo de beneficio. Potente hardware y software: Muchas de las herramientas presentes en la minera de datos estn basadas en el uso intensivo de la computacin, en consecuencia, un equipo conveniente y un software eficiente, con el cual cuente una compaa, aumentar el desempeo del proceso de buscar y analizar informacin, el cual a veces debe vrselas con producciones de datos del orden de los Gbytes/hora (repetimos, algo humanamente imposible). Por ejemplo, las tcnicas de Datamining son utilizadas habitualmente para el anlisis y explotacin de datos de un Datawarehouse (vase la seccin 1.2). El uso del Data Mining puede ser provechoso en el caso de poseer un Data Warehouse que contenga datos sobre sus procesos productivos, datos de seguimiento de clientes, datos externos de mercado, datos sobre la actividad de competidores, etc.

22

Una vez que las herramientas de Data Mining fueron implementadas en computadoras cliente servidor de alto rendimiento o de procesamiento paralelo, pueden analizar bases de datos masivas para brindar respuesta a preguntas tales como, cuales clientes tienen ms probabilidad de responder al prximo envo de correo promocional, y por qu? y presentar los resultados en formas de tablas, con grficas, reportes, texto, hipertexto, etc.

Un ejemplo trivial de minera de datos, es su uso en un departamento de ventas. Si una tienda registra las ventas de un cliente y es sabido que ese cliente compra muchas camisas de seda, el sistema de Data Mining har una correlacin entre ese cliente y las camisas de seda. El departamento de compras mirar la informacin y realizar envos de informacin sobre camisas de seda a ese cliente, o a todos los clientes que sigan ese modelo obtenido. En este caso el sistema de Data Mining es usado para recoger o extraer informacin nueva sobre los clientes, la cual estaba oculta anteriormente.

El Data Mining tambin es fundamental en la investigacin cientfica y tcnica, como herramienta de anlisis y descubrimiento de conocimiento a partir de datos de observacin o de resultados de experimentos.

2.2.4. Los objetivos principales de Data Mining. Data Mining persigue ciertos objetivos de manera especfica, a saber: Descripcin: El principal producto del proceso de la minera de datos es el descubrimiento de reglas. Estas mostrarn nuevas relaciones entre las variables o excepciones de acuerdo a la empresa en que se utilice este proceso. Ello enriquecer el anlisis y la descripcin de la forma en que trabaja una compaa y ayudar en la planificacin y en el diseo de futuros cambios. Es posible que algunas de las reglas descubiertas no puedan ser cambiadas, pero si resulte posible realizar modificaciones apropiadas en la organizacin con el propsito de mejorar su desempeo.

23

Prediccin (Forecasting):Una vez descubiertas reglas importantes, estas pueden ser utilizadas para estimar algunas variables de salida. Puede ser en el caso de secuencias en el tiempo, o bien en la identificacin e interrupcin a tiempo, de una futura mala experiencia de crdito. En esta tarea, se complementan las tcnicas estadsticas tradicionales con aquellas provenientes de la inteligencia artificial. Conceptos adaptativos como los algoritmos genticos y las redes neuronales, permiten realizar predicciones ms acertadas, especialmente en casos de gran complejidad y con relaciones internas.

2.2.5 Algunas herramientas utilizadas en Data Mining de la Inteligencia artificial. Redes Neuronales (Neural Networks): Grupo de unidades interconectadas y organizadas por capas. Estas pueden ser funciones matemticas y nmeros almacenados en computadoras digitales, pero pueden ser elaboradas tambin mediante dispositivos analgicos como los transistores a efecto de campo. A pesar del incremento en velocidad y de la escala de integracin en los semiconductores, la mejor contribucin de las redes neuronales tendr que esperar por computadoras ms rpidas, masivas y paralelas.

Mapas caractersticos de Kohonen (Self-organizing Maps): Es una red neuronal donde los datos son mostrados a la estructura y esta se sensibiliza a los patrones presentes. Una vez entrenada es capaz de identificar tales patrones en nuevos datos.

Reconocimiento de patrones (Pattern Recognition): Se trata de un grupo de tcnicas orientadas a evaluar la similitud y las diferencias entre seales. Se involucran en esto a varios tipos de pre-procesamiento tales como la transformada de Fourier.

24

K-nearest neibor: Un procedimiento para clasificar a los records de un archivo mediante la identificacin de grupos (clusters) y decidiendo a cual grupo pertenece cada uno de los records.

Algoritmo Gentico (Genetic Algorithm): Imitando la evolucin de las especies mediante la mutacin, reproduccin y seleccin, estos algoritmos proporcionan programas y optimizaciones que pueden ser utilizados en la construccin y entrenamiento de otras estructuras como las redes neuronales.

2.2.6. La estructura del Data Mining

Dadas bases de datos de suficiente tamao y calidad, la tecnologa de Data Mining puede generar nuevas oportunidades de negocios al proveer estas capacidades:

Prediccin automatizada de tendencias y comportamientos: Data Mining automatiza el proceso de encontrar informacin predecible en grandes bases de datos. Preguntas que tradicionalmente requeran un intenso anlisis manual, ahora pueden ser contestadas directa y rpidamente desde los datos. Un tpico ejemplo de problema predecible es el marketing, Data Miningusa datos en anuncios publicitarios anteriores para identificar posibles objetivos para maximizar los resultados de la inversin en futuros anuncios. Otros problemas predecibles incluyen pronsticos de problemas financieros futuros o identificar segmentos de poblacin que probablemente respondan similarmente a eventos dados (por ejemplo, anuncios de televisin).

Descubrimiento automatizado de modelos previamente desconocidos. Las herramientas de Data Mining barren las bases de datos e identifican modelos previamente escondidos en un slo paso. Otros problemas de descubrimiento de modelos incluye detectar transacciones fraudulentas de tarjetas de crditos e

25

identificar datos anormales que pueden representar errores de tipeado en la carga de datos.

Las tcnicas de Data Mining pueden redituar los beneficios de automatizacin en las plataformas de hardware y software existentes y puede ser implementadas en sistemas nuevos a medida que las plataformas existentes se actualicen y nuevos productos sean desarrollados. Cuando las herramientas de Data Mining son implementadas en sistemas de procesamiento paralelo de alto performance (rendimiento), pueden analizar bases de datos masivas en minutos.

Procesamiento ms rpido significa que los usuarios pueden automticamente experimentar con ms modelos para entender datos complejos. La alta velocidad hace que sea prctico para los usuarios analizar inmensas cantidades de datos. Grandes bases de datos, a su vez, producen mejores predicciones.

Las bases de datos pueden ser grandes tanto en profundidad como en ancho: Ms columnas. Los analistas muchas veces deben limitar el nmero de variables a examinar cuando realizan anlisis manuales debido a limitaciones de tiempo. Sin embargo, variables que son descartadas porque parecen sin importancia pueden proveer informacin acerca de modelos desconocidos. Un Data Mining de alto rendimiento permite a los usuarios explorar toda la base de datos, sin preseleccionar un subconjunto de variables.

Ms filas. Muestras mayores producen menos errores de estimacin y desvos, y permite a los usuarios hacer inferencias acerca de pequeos pero importantes segmentos de poblacin.

2.2.7. Los Modelos de Data Mining

Cun exactamente es capaz Data Mining de decirle cosas importantes que usted desconoce o que van a pasar? La tcnica usada para realizar estas hazaas en Data Mining se llama Modelado. Modelado es simplemente el acto de construir un

26

modelo en una situacin donde usted conoce la respuesta y luego la aplica en otra situacin de la cual desconoce la respuesta. Por ejemplo, si busca un galen espaol hundido en los mares lo primero que podra hacer es investigar otros tesoros espaoles que ya fueron encontrados en el pasado. Notara que esos barcos frecuentemente fueron encontrados fuera de las costas de Bermuda y que hay ciertas caractersticas respecto de las corrientes ocenicas y ciertas rutas que probablemente tomar el capitn del barco en esa poca. Usted nota esas similitudes y arma un modelo que incluye las caractersticas comunes a todos los sitios de estos tesoros hundidos.

Con estos modelos en mano sale a buscar el tesoro donde el modelo indica que en el pasado hubo ms probabilidad de darse una situacin similar. Con un poco de esperanza, si tiene un buen modelo, probablemente encontrar el tesoro.

Este acto de construccin de un modelo es algo que la gente ha estado haciendo desde hace mucho tiempo, seguramente desde antes del auge de las computadoras y de la tecnologa de Data Mining. Lo que ocurre en las computadoras, no es muy diferente de la manera en que la gente construye modelos. Las computadoras son cargadas con mucha informacin acerca de una variedad de situaciones donde una respuesta es conocida y luego el software de Data Mining en la computadora debe correr a travs de los datos y distinguir las caractersticas de los datos que llevarn al modelo. Una vez que el modelo se construy, puede ser usado en situaciones similares donde usted no conoce la respuesta.

Si alguien le dice que tiene un modelo que puede predecir el uso de los clientes, Cmo puede saber si es realmente un buen modelo? La primera cosa que puede probar es pedirle que aplique el modelo a su base de clientes - donde usted ya conoce la respuesta. Con Data Mining, la mejor manera para realizar esto es dejando de lado ciertos datos para aislarlos del proceso de Data Mining. Una vez que el proceso est completo, los resultados pueden ser testeados contra los

27

datos excluidos para confirmar la validez del modelo. Si el modelo funciona, las observaciones deben mantenerse para los datos excluidos.

2.2.8 Data Mining dentro de una arquitectura Data Warehousing

Las tcnicas de Data Mining son utilizadas habitualmente para el anlisis y explotacin de datos de un Data Warehouse. El uso del Data Mining puede ser provechoso por ejemplo en el caso de que una empresa posea un Data Warehouse que contenga datos sobre sus procesos productivos, datos de seguimiento de clientes, datos externos de mercado, datos sobre la actividad de competidores, etc., es una poderosa tecnologa nueva con gran potencial para ayudar a las compaas a concentrarse en la informacin ms importante de su base de informacin (Data Warehouse).

Para aplicar mejor tcnicas avanzadas de Data Mining, stas deben estar totalmente integradas con el Data Warehouse as como con herramientas flexibles e interactivas para el anlisis de negocios. Varias herramientas de Data Mining (de algunas hablaremos en el Captulo III) actualmente operan fuera del Warehouse, requiriendo pasos extra para extraer, importar y analizar los datos. Adems, cuando nuevos conceptos requieren implementacin operacional, la integracin con el Warehouse simplifica la aplicacin de los resultados desde Data Mining. El Data Warehouse puede ser aplicado para mejorar procesos de negocios en toda la organizacin, en reas tales como manejo de campaas promocionales, deteccin de fraudes, lanzamiento de nuevos productos, etc.

El punto de inicio ideal es un Data Warehouse que contenga una combinacin de datos de seguimiento interno de todos los clientes junto con datos externos de mercado acerca de la actividad de los competidores. Informacin histrica sobre potenciales clientes tambin provee una excelente base para la prediccin de tendencias. Este Warehouse puede ser implementado en una variedad de

28

sistemas de bases de datos relacionales y debe ser optimizado para un acceso a los datos flexible y rpido.

Las soluciones que aporta el Data Mining estn basadas en la implementacin, a travs de la programacin, de interfaces de uso general y algoritmos propios y disponibles para todos que permiten una eficiente exploracin y organizacin de los datos. Estos algoritmos apoyan la identificacin de patrones, relaciones y anomalas de inters potencial para los que toman las decisiones en los negocios. Adems de implementar estos algoritmos en un mtodo accesible para el usuario la tecnologa del Data Mining requiere una comprensin de varias bases de datos e implementacin de soluciones de Data Mining para aprovechar las

caractersticas de dichas bases de datos (si hay alguna) y que hacen que las tareas del Data Mining sean ms eficientes en grandes volmenes de datos. Adems de las implementaciones de algoritmos, consideraciones claves relativas al Data Mining seran la preparacin de datos y el asegurar la escalabilidad y rendimiento en grandes volmenes de datos.

2.2.9. Creacin de un proyecto Data Mining

La creacin de un proyecto de Data Mining pasa por diferentes fases, estas varan de autor en autor y tambin dependen de dnde se vaya a implantar dicho proyecto, aqu presentamos una forma general para la creacin de un proyecto de DM y una forma ms especfica, estas fases sirven como una gua parcial para elegir una buena forma de implantar un proyecto de este tipo, al final de esta seccin presentamos algunas recomendaciones para crear un proyecto de Data Mining de Juan Uwaldo Redondo.

2.2.10. Fases generales para la creacin de un proyecto Data Mining

En esta parte se emplean cuatro fases independientemente de la tcnica especfica de extraccin de conocimiento usada.

29

Filtrado de datos. Seleccin de Variables. Extraccin de Conocimiento. Interpretacin y Evaluacin. Estas fases las explicamos enseguida.

Filtrado de datos: El formato de los datos contenidos en la fuente de datos nunca es el idneo, y la mayora de las veces no es posible utilizar ningn algoritmo de minera. Mediante el preprocesado, se filtran los datos (se eliminan valores incorrectos, no vlidos, desconocidos, etc.), se obtienen muestras de los mismos (mayor velocidad de respuesta del proceso), o se reducen el nmero de valores posibles (mediante redondeo, agrupamiento, etc.).

Seleccin de variables: An despus de haber sido preprocesados, se sigue teniendo una cantidad ingente de datos. La seleccin de caractersticas reduce el tamao de los datos, eligiendo las variables ms influyentes en el problema, sin apenas sacrificar la calidad del modelo de conocimiento obtenido del proceso de minera. Los mtodos para la seleccin de caractersticas son dos:

Los basados en la eleccin de los mejores atributos del problema. Los que buscan variables independientes mediante test de sensibilidad, algoritmos de distancia o heursticos.

Extraccin de Conocimiento: Mediante una tcnica se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar distintos modelos.

Interpretacin y evaluacin: Finalmente se procede a su validacin, comprobando que las conclusiones son vlidas y satisfactorias. En el caso de haber obtenido

30

varios modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, se alterar alguno de los procesos anteriores en busca de nuevos modelos.

2.2.11. Las Fases para la creacin de un proyecto DM segn Jos Emilio Gondar Nores

Jos Emilio Gondar Nores nos dice que las fases que se siguen para la creacin de un proyecto DM son las siguientes. Fase I: Disear una estrategia para el proyecto DM. Fase II: Construccin y diseo de una BD: Data Warehouse y OLAP Fase III: Creacin aplicaciones inteligentes del modelo Data Mining. Fase IV: Formacin del equipo humano fijo de Data Mining. Fase V: Lanzamiento del modelo de DM, evaluacin de la calidad y correccin de los errores del modelo de DM. Estas fases son un tanto ms especficas que las que veremos posteriormente, su explicacin es la siguiente.

Fase I: Disear una estrategia para el proyecto DM: Durante esta fase se debe disear, lo mejor posible, una estrategia y una metodologa, adems de adaptar la situacin del entorno a un plan para la creacin de un proyecto de Data Mining, como recordar, al inicio de este captulo hicimos mencin del hecho que un proyecto de Data Mining e incluso un proyecto de cualquier otra ndole, su planificacin y la forma en que deba trabajarse depender en gran medida de las circunstancias a las cuales nos estemos enfrentando, debemos apegarnos a lo que el usuario o cliente nos solicite, no entregar ms pero tampoco menos, otro de los factores clave, tambin es el considerar los recursos econmicos con los cuales se cuente para trabar un proyecto de Data Mining. Otro de los puntos a establecer es el tiempo lmite en el cual se deber trabajar con un proyecto de este tipo.

31

Fase II: Construccin y diseo de una BD: Data Warehouse y OLAP: Se considera la implementacin del almacn de datos (Data Warehouse). Las 4 etapas tpicas de construccin y modelado de un DW son las siguientes: Indicadores y Dimensiones del Negocio. Identificacin del origen de datos. Pruebas e Implementacin. Evaluacin y Explotacin. Para Bases de Datos se emplean, entre otros, el software Oracle y Microsoft. La implementacin del OLAP tiene 4 fases: Fusin de Datos. Depurar los Datos. Agregar los Datos. Organizar los Datos. Para OLAP se emplean, entre otros, el software Microsoft y Microstrategy.

Fase III: Creacin de Aplicaciones Inteligentes del Modelo de DM: Esta fase integra los siguientes puntos: Creacin de aplicaciones inteligentes (Inteligencia Artificial) del modelo de DM: creacin p. ej., de patrones, reglas de asociacin, rboles de decisin, etc. Integracin de todas las BD (es decir, de toda la informacin del DW). Creacin de un nico fichero de datos: ficheros lineales ( todos los casos y variables tiene el mismo valor) y no lineales (en este tipo de ficheros existen situaciones, sujetos y acciones ocultas o incompletas). Planteamiento de un DM (Metodologas o estrategias). Hay dos tipos de planteamientos: SEMMA (SAS): S. Samplig: Muestreo. E. Exploration: Exploracin de las Bases de datos. M. Modification: Modificacin o transformacin de variables para crear (en su caso) variables ms aptas para los anlisis. M. Modelling: Modelado estadstico.

32

Assessment: Evaluacin del DM, medido en coeficiente %. CRISP-DM (SPSS): Comprensin del negocio. Compresin de los datos. Preparacin de los datos. Modelado. Evaluacin. Lanzamiento.

Fase IV: Formacin del equipo humano fijo de Data Mining: La formacin del staff de diseo, desarrollo y mantenimiento del DM considera a 5 personas fijas: Jefe de proyecto. Coordinador de DM. Analista de DM. Diseador de DW. Ayudante de DM.

En esta fase se debe realizar la explicacin a este equipo de la lgica de sistema y del funcionamiento de la aplicacin del DM y la seleccin del staff. Se plantean en esta fase dos posibles situaciones:

El cliente crea su propio equipo y ste mantiene el DM. Se ayuda a crear este equipo para que trabaje de modo autnomo del creador.

El cliente subcontrata un servicio de Outsourcing. En este caso, se debe plantear una oferta de servicio de apoyo y consultara constante Post-hoc (posterior a la implantacin de la solucin de DM). Esto da lugar a viajes, estancia y gastos.

Fase V: Lanzamiento del modelo de DM, evaluacin de la calidad y correccin de los errores del modelo de DM: La evaluacin y correccin de los errores del

33

modelo de DM afecta a la gestin y control de calidad del modelo DM. Hay tres tipos de tareas:

Estudiar posibles errores y detectarlos en el funcionamiento de la aplicacin. Plantear posibles correcciones o soluciones a dichos errores. Evaluar la calidad del sistema o aplicacin del DM construido.

2.2.12. Recomendaciones para la creacin de un proyecto Data Mining

Juan Uwaldo Redondo nos da algunas recomendaciones para poder implantar un proyecto de Data Mining.

Analice sus necesidades de informacin. Sea realista con ellas y contemple los futuros crecimientos. Evite que en poco tiempo su sistema se quede pequeo o poco operativo.

No tenga complejos tcnicos por no ser un experto. Usted es quien mejor conoce su empresa y a sus clientes.

Pida asesoramiento externo. La visin de alguien experto en procesos y ajeno a la compaa, introducir un soplo de aire fresco y una visin ms rica del problema. No mate moscas a caonazos. No implante sistemas que no necesita. Adems de caros, sern un obstculo y una hipoteca para futuros crecimientos.

Si pide una valoracin externa de sus sistemas y procesos, elija con cuidado. Si invita a Ferrari, le vendern un Ferrari aunque lo que usted necesite sea una furgoneta.

Contraste opiniones. Utilice la situacin para proponer mejoras en los procesos, en las rutinas, y en la forma de trabajar. Puede ser un excelente pretexto para revisar procedimientos y recortar costes. En cualquier caso, no informatice el caos.

34

No implante nada que no necesite de verdad. Si lo implanta mantenga una visin a medio-largo plazo.

Utilice las herramientas y los recursos de los que ya dispone. Contratar un proyecto o un sistema ms caro no va a hacer que aumente su rentabilidad.

2.2.13. Aplicaciones de data Mining.

Existen algunas de las aplicaciones de Data Mining dentro de varias reas, esta parte est muy enfocada a aspectos empresariales debido a que Data Mining es frecuentemente utilizado en estos rubros, no obstante, hemos procurado incluir algunas aplicaciones de carcter cientfico para demostrar que DM puede ser empleado muy bien en ambos escenarios. En la seccin 3.1, Por qu usar Data Mining? veremos las razones del por qu es necesario en ocasiones utilizar una tecnologa de este tipo, en el apartado 3.2 Algunas Herramientas de Data Mining citaremos algunos ejemplos de las herramientas software que son empleadas para el manejo de Data Mining.

Hay una discusin importante acerca de que si Data Mining es la contraparte de la estadstica, si una ayuda a la otra o son reas que estn peleadas, de esto hablaremos un poco en la seccin 3.3, Data Mining vs. Estadstica. Hemos hecho mencin, en los captulos anteriores, que Data Mining es un gran apoyo a la toma de decisiones dentro del marketing, es por ello que ahora abordaremos, en el punto 3.4, Mercadeo y Data Mining, la relacin existente entre ambos procesos. Durante el apartado 3.5 Ejemplos de utilizacin de Data Mining presentamos varios ejemplos, algunos de los cuales ya se han llevado a la prctica.

2.2.14 Por qu usar Data Mining? Sin duda alguna que el uso de Data Mining:

35

Contribuye a la toma de decisiones tcticas y estratgicas proporcionando un sentido automatizado para identificar informacin clave desde volmenes de datos generados por procesos tradicionales o elementos software.

Permite a los usuarios dar prioridad a decisiones y acciones, por ejemplo, qu segmentos de clientes son desechables en una empresa.

Proporciona poderes de decisin a los usuarios del negocio que mejor entienden el problema y el entorno y es capaz de medir las acciones y los resultados de la mejor forma.

Genera Modelos descriptivos: En un contexto de objetivos definidos en los negocios permite a empresas, sin tener en cuenta la industria o el tamao, explorar automticamente, visualizar y comprender los datos e identificar patrones, relaciones y dependencias que impactan en los resultados finales de la cuenta de resultados (tales como el aumento de los ingresos, incremento de los beneficios, contencin de costes y gestin de riesgos)

Genera Modelos predictivos: permite que relaciones no descubiertas e identificadas a travs del proceso del Data Mining sean expresadas como reglas de negocio o modelos predictivos. Estos outputs pueden comunicarse en formatos tradicionales (presentaciones, informes, informacin electrnica compartida, embebidos en aplicaciones, etc.) para guiar la estrategia y planificacin de la empresa.

Si una empresa tiene menos de 100 mil clientes probablemente le baste con Access. Sorprendentemente, el aprovechamiento de recursos relativamente simples de ofimtica como Excel, Access, etc. de los que ya disponemos es muy escaso. Por ejemplo, pocos saben que se puede realizar un anlisis de series temporales con Excel, sin necesidad de acudir o contratar otras complejas y caras aplicaciones informticas. Tal vez slo necesita una Intranet, o tener al menos a

36

su empresa en una red de rea local. Adems de una muy simple programacin de algunas rutinas con Visual Basic, para dotar a su empresa de un potente Data Mining.

El coste? Al menos entre 20 y 50 veces menor que contratar una solucin propietaria con un proyecto llave en mano de consultora. Slo en compaas de grandes dimensiones o en aquellas en las que el volumen y frecuencia de los datos es igual de grande, est probablemente justificada una inversin, casi siempre desorbitada, en un complejo y potente sistema.

Sin embargo, para empresas grandes, la innovacin y la originalidad son habilidades fundamentales para su supervivencia, su xito y prosperidad depende tambin de decisiones eficientes y competitivas que deben ser tomadas en cortos intervalos de tiempo. Para tomar decisiones, es fundamental contar con informacin de calidad, lo cual es proporcionado por Data Mining.

2.2.15 Algunas herramientas de Data Mining

En esta seccin presentamos algunos ejemplos de herramientas software empleadas para trabajar Data Mining.

Weka: Magnfica suite de minera de datos de libre distribucin. Weka es una coleccin de mquinas virtuales para implementar algoritmos para tareas de minera de datos. Los algoritmos pueden aplicarse directamente a un conjunto de datos o pueden utilizarse desde un programa de Java. Weka contiene herramientas para el procesamiento de datos, clasificacin, asociacin,

visualizacin, entre otras. Tambin est bien preparado para desarrollar esquemas. Weka es un software abierto emitido por GNU.

MLC++: Conjunto de libreras y utilidades de minera de datos.

37

Es una biblioteca de clases de C++. Proporciona algoritmos que pueden ser usados por usuarios finales, analistas, profesionales e investigadores. El objetivo principal es proporcionarles una variedad ancha de herramientas que pueden ayudarlos a llevar procesos de minera de datos, acelerar el desarrollo de nuevos algoritmos mineros, proporcionar herramientas de comparacin y de despliegue de informacin.

Xelopes: Librera con licencia pblica GNU para el desarrollo de aplicaciones de minera de datos. Es una librera de plataforma independiente para utilizacin de Data Mining. Proporciona algoritmos de minera de datos muy eficaces que usted puede integrar transparentemente en sus aplicaciones. Apoya la automatizacin de seleccin de parmetros de los mtodos para que stos puedan desplegarse totalmente automticamente.

Herramientas de Microsoft. Microsoft ha decidido implementar su API de Data Mining utilizando OLE DB para el acceso a los datos. Esta API define un lenguaje basado en SQL especialmente desarrollado con el fin de definir que reglas y patrones que nos gustara encontrar. Los modelos obtenidos en este proceso son tratados mediante tablas SQL especiales. Microsoft SQL Server 2000 incluye esta tecnologa basada en OLE DB, y en dos algoritmos: Microsoft Decision Trees y Microsoft Clustering, ambos basados en tcnicas de Inteligencia Artificial y desarrollados por Microsoft Research. Microsoft SQL Server es el sistema gestor de Bases de Datos de Microsoft. Su diseo se ha realizado pensando en la seguridad, fiabilidad y escalabilidad, por lo que es ideal para aquellas empresas que buscan agilidad en el control y anlisis de su informacin. Entre sus mltiples funcionalidades se puede destacar la integracin servicios OLAP, directivas de seguridad, optimizacin de recursos de sistema, y un completo paquete pensado para el anlisis de los datos.

38

Por otra parte, las herramientas comerciales de Data Mining que existen actualmente en el mercado son variadas y excelentes. Las hay orientadas al estudio del web o al anlisis de documentos o de clientes de supermercado, mientras que otras son de uso ms general. Su correcta eleccin depende de la necesidad de la empresa y de los objetivos a corto y largo plazo que pretenda alcanzar. La decisin de seleccionar una solucin de Data Mining no es una tarea simple. Es necesario consultar a expertos en el rea con vista a seleccionar la ms adecuada para el problema de la empresa.

Debemos aclarar que aqu solo estamos presentando ejemplos de herramientas que estn destinadas al uso de Data Mining, hemos hablado de algunos productos comerciales y dado la descripcin que los mismos diseadores de estos productos dan, sin embargo, esto no quiere decir que nosotros estemos a favor de usar tal o cual producto, la decisin depende en su totalidad de la empresa que pretenda usar alguna herramienta de Data Mining como se mencion en el prrafo anterior.

2.2.16 Data Mining vs. Estadstica

Ahora pretendemos explicar las diferencias de Data Mining y estadstica desde una perspectiva constructiva en el uso de ambas herramientas analticas y bajo un contexto empresarial. Ambas ciencias tienen el mismo objetivo: mejorar la toma de decisiones mediante un conocimiento del entorno. Este entorno lo facilitan los datos almacenados en la compaa, cuantitativos o cualitativos y mediante informacin de terceras empresas.

39

Data Mining aventaja a la estadstica en los siguientes supuestos:

Las tcnicas estadsticas se centran generalmente en tcnicas confirmatorias, mientras que las tcnicas de Data Mining son generalmente exploratorias. As, cuando el problema al que pretendemos dar respuesta es refutar o confirmar una hiptesis, podremos utilizar ambas ciencias. Sin embargo, cuando el objetivo es meramente exploratorio (para concretar un problema o definir cuales son las variables ms interesantes en un sistema de informacin) surge la necesidad de delegar parte del conocimiento analtico de la empresa en tcnicas de aprendizaje (inteligencia artificial), utilizando Data Mining. Aqu hemos detectado una primera diferencia de aplicacin de ambas herramientas: Data Mining se utilizar cuando no partamos de supuestos de partida y pretendamos buscar algn conocimiento nuevo y susceptible de proporcionar informacin novedosa en la toma de decisiones.

A mayor dimensionalidad del problema el Data Mining ofrece mejores soluciones. Cuantas ms variables entran en el problema, ms difcil resulta encontrar hiptesis de partida interesantes. O, aun cuando pudiera, el tiempo necesario no justificar la inversin. En ese caso, utilizar tcnicas de Data Mining como rboles de decisin que nos permitir encontrar relaciones inditas para luego concretar la investigacin sobre las variables ms interesantes.

Las tcnicas de Data Mining son menos restrictivas que las estadistas. Una vez encontrado un punto de partida interesante y dispuestos a utilizar algn anlisis estadstico en particular, puede suceder que los datos no satisfagan los requerimientos del anlisis estadstico. Entonces, las variables debern ser examinadas para determinar que tratamiento permite adecuarlas al anlisis, no siendo posible o conveniente en todos los casos. Aqu tambin destaca el Data Mining, puesto que es menos restrictivo que la estadstica y permite ser utilizado con los mnimos supuestos posibles (permite escuchar a los datos).

40

Cuando los datos de la empresa son muy dinmicos las tcnicas de Data Mining inciden sobre la inversin y la actualizacin del conocimiento de nuestro negocio. Un almacn de datos poco dinmico permite que una inversin en un anlisis estadstico quede justificada personal cualificado en estadstica, metodologa rgida y respuestas a preguntas muy concretas- dado que las conclusiones van a tener un ciclo de vida largo. Sin embargo, en un almacn muy dinmico las tcnicas de Data Mining permiten explorar cambios y determinar cundo una regla de negocio ha cambiado. Permitiendo abordar diferentes cuestiones a corto/medio plazo.

Expongamos ahora aquellos contextos en los que es ms adecuado el anlisis estadstico que el de Data Mining:

El objetivo de las investigaciones encontrar causalidad. Si se pretende determinar cules son las causas de ciertos efectos (por ejemplo, si invertir ms en la publicidad de cierto producto tiene como consecuencia un incremento de ventas o si es ms determinante el ofrecer un descuento a los clientes), deberemos utilizar tcnicas de estadstica. Las relaciones complejas que subyacen a tcnicas de Data Mining impiden una interpretacin certera de diagramas causa-efecto.

Se pretende generalizar sobre poblaciones desconocidas en su globalidad. Si las conclusiones han de ser extensibles a otros elementos de poblaciones similares habrn de utilizarse tcnicas de inferencia estadstica. Esto viene relacionado con situaciones en las que se dispone exclusivamente de muestras (con el consiguiente problema de aportar validez a las muestras). En Data Mining, se generarn modelos y luego habrn de validarse con otros casos conocidos de la poblacin, utilizando como significacin el ajuste de la prediccin sobre una poblacin conocida (es lo habitual cuando queremos predecir perfiles de clientes, que ya disponemos de antecedentes para poder validarlo, aunque no siempre es posible acceder a dicha informacin o no siempre es correcto aplicar ciertas muestras).

41

Se ha detallado algunos argumentos acerca de cundo es conveniente utilizar Data Mining o estadstica. Llegado a este punto deseamos destacar que ambas perspectivas constituyen una sinergia y que no son excluyentes una de la otra. En este sentido, la metodologa de un proyecto de Data Mining ha de contener referencias a la estadstica en dos partes destacables del proceso:

Preparacin de los datos (tratamiento de valores errneos, valores omitidos, etc.) y aproximacin a las variables de estudio.

Despliegue del proyecto y posible generacin de hiptesis a refutar con una metodologa y tcnica estadstica.

As pues, Data Mining y estadstica son tcnicas complementarias que permiten obtener conocimiento indito en nuestros almacenes de datos o dar respuestas a cuestiones concretas de negocio.

2.2.17. Mercadeo y Data Mining

Hay un avance sorprendente en el manejo electrnico de datos. Cada da, millones de personas llegan a sus empleos presenciales o en lnea y durante horas digitan en sus computadoras, billones de bytes que registran las transacciones comerciales que reflejan el pulso de las economas del mundo. Hace tan solo unos aos, los datos de las empresas estaban orientados principalmente a alimentar sus sistemas contables, financieros, de inventarios, de produccin, de recursos humanos y de ventas. En la medida que los negocios mundiales se hicieron ms competitivos y complejos, los datos cada vez cobraron ms vida y se convirtieron en informacin vital para la toma de decisiones de los gerentes.

Las revoluciones cientfica, econmica, poltica y tecnolgica, sumadas a la revisin de los conceptos de soberana de las naciones, han vuelto los mercados

42

impredecibles. La sociedad de masas creada por la revolucin industrial se ha fragmentado en miles de pedazos. El consumidor empieza a tener rostro y la diversidad prevaleciente en el mercado le ha cambiado el rostro al mercadeo.

Entender al nuevo consumidor es una tarea cada vez ms compleja, pues la antigua nocin de desarrollar un producto e inducir su compra a un cliente potencial desprevenido mediante el uso de la publicidad masiva ya muri. Para cada producto o servicio hay numerosas opciones de mercados posibles. Seleccionar el mercado y luego segmentarlo es una tarea titnica. Ya no se puede decir como antes que los mejores clientes potenciales son las mujeres entre los dieciocho y los cuarenta y nueve aos, la gente de la generacin X o la gente que se parece a nuestros consumidores actuales. Tras la aparente similitud existe toda una heterogeneidad derivada de las diferencias en educacin, ocupacin, ingresos, etnias, culturas, estilos de vida, percepciones, necesidades y deseos.

Si trabajamos en un conglomerado bancario, una compaa de gas domiciliario a gran escala, un proveedor globalizado de servicios de telecomunicacin, una compaa de seguros a nivel mundial lder en sus mercados, etc., entonces almacenamos grandes cantidades de informacin y queremos agregarles valor, por lo tanto estaremos interesados en automatizar el proceso de informacin y descubrir informacin valiosa que de otra forma seguir siendo subutilizada o simplemente desperdiciada. Empecemos pues a cavar y a construir un tnel en su escenario de mercadeo, para ello es de gran utilidad el proceso de Data Mining

Hacer mercadeo con base de datos con Data Mining puede requerir de una alta inversin econmica y adems la integracin de tres componentes fundamentales:

La informacin almacenada actualmente, mucha de ella proveniente de sus sistemas de informacin que interactan con el cliente.

Tcnicas estadsticas o instrumentos que usen modelos predictivos.

43

Equipos sofisticados de presentacin. Una aplicacin, por ejemplo, es implementar un proceso que genere una muy precisa segmentacin de los clientes. Una vez que el motor del Data Mining ha seleccionado un grupo adecuado de segmentos de clientes de su bodega de datos (Data Warehouse), el prximo paso ser extrapolar los perfiles de los consumidores. Cada vez que llega una nueva cosecha de clientes se aplica un nuevo conjunto de modelos estadsticos y se corre el programa para comparar contra los segmentos existentes o crear otros nuevos. Aqu estamos enfocando la atencin a predecir la lealtad de marca, para citar un ejemplo, pero tenemos muchas otras aplicaciones como son:

Segmentacin del mercado. Tendencias de desercin de clientes. Descubrimiento de transacciones fraudulentas. Mercadeo directo. Mercadeo Interactivo. Anlisis de canasta. Anlisis de tendencias. Perfiles de clientes. Focalizacin de clientes y campaas promocionales.

El mercadeo mediante Data Mining, convierte una plataforma tecnolgica en un sistema de informacin sobre el que se construyen soluciones de negocios. Naturalmente el punto de partida es que las montaas de datos deben ser de oro y no de chatarra. De lo contrario no vale la pena excavar. Se necesitarn equipos de cmputo, sistemas operativos y la infraestructura necesaria para apoyar ese proyecto minero. Luego vendrn las tcnicas de inteligencia artificial y de anlisis estadstico que permitirn extraer el oro de su mina. El primer paso es evaluar los recursos, objetivos y necesidades.

44

2.2.18. Data Mining y los procesos de venta

El Data Mining integra los procesos modernos de ventas en los cuales se pueden aplicar algunas tcnicas que sealamos a continuacin:

El Cross Selling: Esta tcnica se basa en el mercadeo concntrico, esto es, en mltiples ofertas alrededor de un mismo cliente. A mayor cantidad de transacciones o relaciones que sostenga una cuenta con nosotros, mayor ser la capacidad de la empresa de retenerla con el paso del tiempo. Esto requiere de la segmentacin de la clientela para adaptar la oferta a las necesidades del cliente o grupo de stos y de la existencia de alguna matriz que identifique cules Productos se le han colocado a cules clientes (y cules no) para facilitar eventuales ofertas.

El Networking: Cada cliente puede ser una fuente de negocios adicionales, pero existen siempre evidentes "multiplicadores" que por su naturaleza o poder de convocatoria aglutinan nmeros importantes de clientes potenciales. Esta tcnica busca crear redes de cuentas potenciales alrededor de una sola matriz internamente, en nuestra clientela existen normalmente varias de stas y en el mercado tantas ms. Por ejemplo: Pueden ser nuestros clientes los empleados de ellos, sus propios clientes, sus proveedores, afiliados, etc.

Otras aplicaciones en este sentido del Data Mining pueden ser: Para Comunicarnos con nuestra base de clientes y prospectos de manera directa y masiva (cumpleaos, lanzamientos, cobros) . Para contribuir en la conservacin de clientes existentes. Para vender otros productos a nuestra base de clientes y elevar ingresos. Para capturar nuevos clientes con Televisin o Web-Marketing. Por ejemplo, Data Mining podra arrojar resultados a una empresa como:

45

"La mayora de los que compraron un determinado tipo de tabla de surf posiblemente veraneen este ao en Nueva Zelanda". "El 76% de las veces que un cliente llev gaseosa tambin compr detergente biodegradable".

"Tanto los desodorantes de hombre como los de mujer, se venden mejor juntos que separados, entre las 17:00 y las 19:00 del fin de semana, en las sucursales de la zona sur".

Es muy poco probable que a alguna persona de marketing se le hubiera ocurrido comparar datos sobre la venta de estos productos, y ste es slo un ejemplo de la enorme variedad de relaciones que el Data Mining es capaz de encontrar. Cuando el programa encuentra correlaciones interesantes, los traduce en grficos simples, permitindoles a los gerentes tomar decisiones ms racionales, y no slo basadas en la intuicin. No obstante, el Data Mining ayuda a confirmar un presentimiento o a desmentir una creencia: en un ejercicio netamente colaborativo, el ser humano sugiere las ideas (hiptesis) y la mquina las confirma o las rechaza segn la evidencia aportada por los datos.

El Data Mining se utiliza tanto en los negocios como en la ciencia. Desde la comprensin del comportamiento de los clientes hasta el anlisis de las decisiones de expertos, desde la prediccin de los posibles cambios en el mercado hasta el descubrimiento de patrones en el cuidado de la salud, desde la deteccin de fraudes en tarjetas de crdito hasta el descubrimiento de galaxias, desde la mejora de las promociones de ventas hasta la sntesis de drogas, el Data Mining tiene una enorme gama de aplicaciones.

2.2.19 Ejemplos de Utilizacin de Data Mining

Cada ao, en los diferentes congresos, simposios y talleres que se realizan en el mundo se renen investigadores con aplicaciones muy diversas sobre Data

46

Mining. Sobre todo en los Estados Unidos, el Data Mining se ha ido incorporando a la vida de empresas, gobiernos, universidades, hospitales y diversas organizaciones que estn interesadas en explorar sus bases de datos. Podemos decir que "en Data Mining cada caso es un caso". A continuacin se describen varios ejemplos donde se ha visto involucrado el Data Mining.

2.2.19.1. Paales y cervezas: Un caso famoso acerca del comportamiento de los consumidores

Una situacin muy popular sucedi en una cadena de vveres en los Estados Unidos. Utilizando un software de minera de datos para estudiar el comportamiento de sus clientes, encontraron relaciones interesantes entre paales, cervezas, hombres, y da de la semana.

Encontraron que los das jueves y sbado, los hombres que compraban paales tambin compraban cerveza. Informacin como esa, que no siempre es evidente a primera vista, puede ser utilizada para reubicar la mercanca en lugares ms estratgicos, en este ejemplo, manteniendo a los paales y a las cervezas cercanas unos de otros.

Este resultado suministrado por un proceso de minera de datos, puede ser analizado en profundidad por expertos humanos. Si ellos encuentran una explicacin razonable, esta de seguro ser de mucho ayuda para que los ejecutivos de la empresa alcancen sus objetivos de una manera ms eficiente.

2.2.19.2. Data Mining para Pymes

WebMining Ltda., desarrolla estudios y modelos para pequeas y medianas empresas (Pymes) utilizando tcnicas de Data Mining y Web Mining (Vea el captulo V). Se obtiene conocimiento sobre algn negocio utilizando tcnicas de clustering, redes neuronales y rboles de decisin.

47

Entre las variadas aplicaciones de Data Mining que se desarrollan, destacan:

Segmentacin de Clientes: Segmentacin de clientes utilizando tcnicas de agrupamiento difuso.

Clasificacin: Clasificacin de clientes utilizando tcnicas de redes neuronales. Por ejemplo, para aplicaciones de adquisicin de nuevos clientes o deteccin de fuga.

Modelos Predictivos: Desarrollo de modelos predictivos utilizando rboles de decisin o redes neuronales. Estos modelos permiten realizan una prediccin sobre la base de una serie de decisiones.

Induccin de reglas: Que permiten entender el comportamiento de compra de los clientes o realizar predicciones basadas en un cierto objetivo.

Rediseo de sitios Web: Reorganizacin de la estructura de links o contenido de las pginas.

Soporte a decisiones de Marketing o de Negocios: Determinacin de conductas o rasgos de los clientes que realizan ciertas acciones, tales como comprar productos.

Personalizacin: Adaptacin de las vistas de pgina de acuerdo a la informacin obtenida de cada usuario. Esto puede incluir precios dinmicos para cada usuario o promociones que aumenten las ventas.

Estudios de utilidad: Determinacin de la calidad de la interfaz de usuario.

Seguridad: Deteccin de accesos inusuales a datos privados.

48

Anlisis de trfico de redes: Determinacin de los requerimientos de equipo y la distribucin de datos con el fin de manejar eficientemente el trfico de un sitio.

2.2.19.3 Data Mining en SAS

La Compaa Software And Services (SAS) , lder en inteligencia de negocios (Business Inteligencie o BI), contina siendo reconocida como referente en el rea de Data Mining. SAS, el quinto mayor fabricante de software empresarial del mundo, lidera la nueva generacin de software y servicios de que permiten la creacin de una verdadera inteligencia empresarial. Las soluciones de SAS estn implementadas en ms de 40.000 instalaciones, permitiendo la optimizacin de las relaciones con sus clientes y proveedores y ayudando a tomar las mejores decisiones. SAS es el nico proveedor que integra completamente aplicaciones Data Warehousing, aplicaciones analticas y las tradicionales aplicaciones de BI para crear inteligencia a partir de las cada vez mayores cantidades de datos disponibles en una organizacin.

Giga, filial propiedad de Forrester Research, INC., ha publicado recientemente, un informe, Vendor Scorecard: Selecting Software for Predictive Analytics , en el que analiza el software de SAS y de otros tres proveedores. Para la realizacin del informe, se tuvieron en cuenta distintos factores como la estrategia, las propiedades de los productos, la usabilidad, los precios, las opciones de contratacin y la viabilidad y mantenimiento. SAS obtuvo muy buenos resultados con su premiado producto SAS Enterprise Miner, que es la oferta ms completa de Data Mining en el mercado.

Dentro del rea de la estrategia del proveedor, el informe establece que los potenciales compradores de productos de software para anlisis predictivo deberan apostar por SAS por su seria y comprometida dedicacin al anlisis de datos. El informe pone de manifiesto que SAS Enterprise Miner tiene el ms

49

completo portafolio de algoritmos para la modelizacin predictiva. Adicionalmente, apunta que la interoperabilidad de los metadatos con otras soluciones best-ofbreed de SAS para ETL (extraccin, transformacin y carga), reporting y aplicaciones verticales, proporciona la compaa claras ventajas sobre sus competidores.

"Este informe muestra claramente el fuerte compromiso de SAS con el mercado del software de minera de datos", ha dicho Anne Milley, Directora de Estrategia de Inteligencia Analtica de SAS. "SAS suministra soluciones de software analtico que permiten a las compaas identificar fcilmente tendencias y relaciones que son determinantes - ayudndoles a adoptar decisiones de negocio crticas con seguridad. Por ello, consideramos que estamos en una buena posicin para ayudar a nuestros clientes a encarar la necesidad creciente de realizar anlisis avanzados, que son los que producen los mayores beneficios".

SAS muestra pautas y tendencias, explica resultados conocidos e identifica factores que permiten asegurar efectos deseados. Con esta solucin, las compaas pueden incrementar sus ingresos, reducir los costes y mejorar su competitividad. SAS Text Miner, producto aadido a SAS Enterprise Miner, amplia sus capacidades de minera de datos proporcionando un juego de soluciones para poner al descubierto y extraer el conocimiento de una amplia variedad de documentos de texto, incluyendo e-mails, informes de venta y anotaciones realizadas por el personal de los call center. Integrar informacin basada en textos con datos estructurados enriquece las capacidades de modelizacin predictiva y proporciona nuevos almacenes de informacin valiosa para conducir el negocio e investigar potenciales iniciativas.

SAS posee la solucin ms completa del mercado para sostener el proceso completo de creacin de inteligencia dentro de todas las reas de negocio - desde el rea de resultados corporativos, pasando por el de Recursos Humanos, Financiero, el de Ventas o el de Marketing. Esta infraestructura de inteligencia

50

empresarial integral, conocida como SAS Intelligence Architecture, otorga al mercado la agilidad que necesita para adaptarse a los cambios que se producen en el mismo. Construyendo sobre inversiones existentes en tecnologas de informacin, SAS Inteligencie Architecture permite a las compaas seguir respondiendo a las necesidades del mercado, de sus empleados, sus proveedores y de otros protagonistas del entorno.

2.2.19.4 Spoke: Data Mining de tu correo electrnico

Spoke es un programa de Data Mining para una agenda de correo (hasta ah es fcil, los otros programas de redes de contacto tambin lo hacen), y tambin (aqu est la novedad) de todo tu correo. Cuando te das de alta extrae toda la informacin almacenada en Outlook, Lotus Notes o lo que estemos usando (incluidas cuentas de web mail). Detecta a quin hemos mandado correos, de quien los hemos recibido, con qu frecuencia, incluso quien estaba copiado en mensajes que te han enviado a ti. Con todo eso monta una base de datos salvaje de todos tus contactos directos e indirectos.

Adems, aplica un complejo algoritmo para clasificar la intensidad de la relacin teniendo en cuenta muchos factores (cuntos datos de esa persona tienes en tu agenda: si tienes su empresa y puesto, si tienes su telfono o direccin postal, cuntos correos has intercambiado, hace cuanto, etc. Todo esto lo presenta en una agenda, pero tambin en un buen mapa de contactos muy fcil de usar. Puedes seleccionar un contacto y ver a quin ms conoce o quin te ha hablado de l (copindolo en un correo dirigido a ti). Todo esto son funcionalidades en modo aislado.

Cuando conocemos otra gente que tambin lo tenga instalado, las posibilidades se multiplican. Podemos buscar personas que queramos contactar, o empresas, y te indican cules de tus contactos los conocen directa o indirectamente.

51

Tiene todava algunos fallos. No importa bien los caracteres acentuados y hay que hacer bastante limpieza y consolidacin si se desea tener una base de datos realmente operativa; demasiada gente tiene varias direcciones de e-mail.

2.2.19.5 Data Mining y la medicina basada en la evidencia

Con el advenimiento de los modernos sistemas tecnolgicos de informtica mdica, los profesionales de la salud han podido tener acceso a un mundo insospechado de informacin actualizada y de forma veloz. La bsqueda bibliogrfica por internet, merced a las bondades de Mecline y otras libreras, permiti que el mdico dedicara su tiempo en menesteres profesionales mientras la informtica le consegua la preciada documentacin.

Pero con el tiempo, surgi el problema del control de calidad y seriedad cientfica de la informacin en medicina, con lo cual la Medicina Basada en la Evidencia (MBE) apareci como el paladn de los que, con el pasar de los aos, veamos con grandes dudas escrito sobre especialidades mdicas. A la primera visin surgi un auto-cuestionamiento de paranoia larvada, pero el anlisis minucioso de la situacin permiti detectar infinidad de procedimientos errneamente elegidos, resultados criticables, seguridad epidemiolgica ausente, y fue entonces cuando la MBE se consagr como la nica forma de saber si las conductas estratgicas de los profesionales de la salud eran sensatas o arrastraban las costumbres sin fundamentos a travs de los tiempos.

La MBE se puede sentir alimentada en el futuro por la informacin codificada y almacenada en un Data Warehouse de la Salud. Es escalofriante pensar en la recoleccin de datos codificados en las consultas mdicas del mundo entero, donde cada enfermedad puede tener sntomas hasta ahora no sospechados, por la sencilla razn de que hasta ahora a nadie se le ocurri atar los cabos sueltos de la informacin dispersa.

52

La revolucin de la MBE puede encontrar aqu una fuente no slo de inspiracin, sino de confirmacin o rechazo de viejas teoras que se perpetan sin bases cientficas ni estadsticas de valor. Un trabajo colaborativo metacntrico mundial con protocolos de recoleccin de datos uniforme, permitira obtener informacin de singular valor como para permitir afirmar que la enfermedad XXX se presenta con el sntoma YYY en el x% de los casos.

Solamente hay que querer sacar provecho de la informacin disponible. A la informacin existente en salud, el mundo le queda chico. Con el Data Mining de la base de datos de sntomas clnicos, la MBE puede llegar a decirnos que lo que creamos que era de una forma, en realidad es de otra forma. Las races de la medicina clsica pueden llegar a temblar a la luz del "nuevo conocimiento" bajo el paraguas de la MBE, y dentro del Data Warehouse de la salud.

2.2.19.6 Aplicacin del FBI para detectar terroristas

El FBI analizar las bases de datos comerciales para detectar terroristas. A principios del mes de julio de 2002, el director del Federal Bureau of Investigation (FBI), John Ashcroft, anunci que el Departamento de Justicia comenzar a introducirse en la vasta cantidad de datos comerciales referentes a los hbitos y preferencias de compra de los consumidores, con el fin de descubrir potenciales terroristas antes de que ejecuten una accin.

Algunos expertos aseguran que, con esta informacin, el FBI unir todas las bases de datos probablemente mediante el nmero de la Seguridad Social y permitir saber si una persona fuma, qu talla y tipo de ropa usa, su registro de arrestos, su salario, las revistas a las que est suscrito, su altura y peso, sus contribuciones a la Iglesia, grupos polticos u organizaciones no gubernamentales, sus

enfermedades crnicas (como diabetes o asma), los libros que lee, los productos de supermercado que compra, si tom clases de vuelo o si tiene cuentas de banco abiertas, entre otros.

53

La inversin inicial ronda los setenta millones de dlares estadounidenses para consolidar los almacenes de datos, desarrollar redes de seguridad para compartir informacin e implementar nuevo software analtico y de visualizacin.

En otras palabras, el FBI pretende vigilar a ciertos clientes de comercios alrededor de todo el mundo para detectar, por medio de Data Mining, cules de ellos tienen el perfil de terroristas y as tomar medidas de seguridad.

2.2.19.7 Deteccin de fraudes en las tarjetas de crdito

En 2001, las instituciones financieras a escala mundial perdieron ms de 2000 millones de dlares estadounidenses en fraudes con tarjetas de crdito y dbito. El Falcon Fraud Manager es un sistema inteligente que examina transacciones, propietarios de tarjetas y datos financieros para detectar y mitigar fraudes. En un principio estaba pensado, en instituciones financieras de Norteamrica, para detectar fraudes en tarjetas de crdito. Sin embargo, actualmente se le han incorporado funcionalidades de anlisis en las tarjetas comerciales, de combustibles y de dbito. El sistema Falcn ha permitido ahorrar ms de seiscientos millones de dlares estadounidenses cada ao y protege

aproximadamente ms de cuatrocientos cincuenta millones de pagos con tarjeta en todo el mundo aproximadamente el sesenta y cinco por ciento de todas las transacciones con tarjeta de crdito.

2.2.19.8 Descubriendo el por qu de la desercin de clientes de una compaa operadora de telefona mvil

Este estudio fue desarrollado en una operadora espaola que bsicamente situ sus objetivos en dos puntos: el anlisis del perfil de los clientes que se dan de baja y la prediccin del comportamiento de sus nuevos clientes. Se analizaron los diferentes histricos de clientes que haban abandonado la operadora (12,6%) y de clientes que continuaban con su servicio (87,4%). Tambin se analizaron las

54

variables personales de cada cliente (estado civil, edad, sexo, nacionalidad, etc.). De igual forma se estudiaron, para cada cliente, la morosidad, la frecuencia y el horario de uso del servicio, los descuentos y el porcentaje de llamadas locales, interprovinciales, internacionales y gratuitas.

Al contrario de lo que se podra pensar, los clientes que abandonaban la operadora generaban ganancias para la empresa; sin embargo, una de las conclusiones ms importantes radic en el hecho de que los clientes que se daban de baja reciban pocas promociones y registraban un mayor nmero de incidencias respecto a la media. De esta forma se recomend a la operadora hacer un estudio sobre sus ofertas y analizar profundamente las incidencias recibidas por esos clientes. Al descubrir el perfil que presentaban, la operadora tuvo que disear un trato ms personalizado para sus clientes actuales con esas caractersticas. Para poder predecir el comportamiento de sus nuevos clientes se dise un sistema de prediccin basado en la cantidad de datos que se poda obtener de los nuevos clientes comparados con el comportamiento de clientes anteriores.

2.2.19.9 Prediciendo el tamao de las audiencias televisivas

La British Broadcasting Corporation (BBC) del Reino Unido emplea un sistema para predecir el tamao de las audiencias televisivas para un programa propuesto, as como el tiempo ptimo de exhibicin. El sistema utiliza redes neuronales y rboles de decisin aplicados a datos histricos de la cadena para determinar los criterios que participan segn el programa que hay que presentar. La versin final se desempea tan bien como un experto humano con la ventaja de que se adapta ms fcilmente a los cambios porque es constantemente re-entrenada con datos actuales.

55

2.2.19.10. Aplicacin en la universidad

Se pretende conocer si los recin titulados de una universidad llevan a cabo actividades profesionales relacionadas con sus estudios. Se hizo un estudio sobre los recin titulados de la carrera de Ingeniera en Sistemas Computacionales del Instituto Tecnolgico de Chihuahua, en Mxico. Se quera observar si sus recin titulados se insertaban en actividades profesionales relacionadas con sus estudios y, en caso negativo, se buscaba saber el perfil que caracteriz a los ex-alumnos durante su estancia en la universidad. El objetivo era saber si con los planes de estudio de la universidad y el aprovechamiento del alumno se haca una buena insercin laboral o si existan otras variables que participaban en el proceso. Dentro de la informacin considerada estaba el sexo, la edad, la escuela de procedencia, el desempeo acadmico, la zona econmica donde tena su vivienda y la actividad profesional, entre otras variables.

Se descubri que existan cuatro variables que determinaban la adecuada insercin laboral, que son citadas de acuerdo con su importancia: zona econmica donde habitaba el estudiante, colegio de donde provena, nota al ingresar y promedio final al salir de la carrera. A partir de estos resultados, la universidad tendr que hacer un estudio socioeconmico sobre grupos de alumnos que pertenecan a las clases econmicas bajas para dar posibles soluciones, debido a que tres de las cuatro variables no dependan de la universidad.

2.2.19.11. Investigaciones espaciales: Proyecto SKYCAT

Durante seis aos, el Second Palomar Observatory Sky Survey (POSS-II) coleccion tres terabytes de imgenes que contenan aproximadamente dos millones de objetos en el cielo. Tres mil fotografas fueron digitalizadas a una resolucin de 16 bits por pxel con 23040 x 23040 pxeles por imagen. El objetivo era formar un catlogo de todos esos objetos. El sistema Sky Imagen Cataloguing and Analysis Tool (SKYCAT) se basa en tcnicas de agrupacin (clustering) y

56

rboles de decisin para poder clasificar los objetos en estrellas, planetas, sistemas, galaxias, etc. con una alta confiabilidad. Los resultados han ayudado a los astrnomos a descubrir diecisis nuevos qusar (seales radiales lejanas) con corrimiento hacia el rojo que los incluye entre los objetos ms lejanos del universo y, por consiguiente, ms antiguos. Estos qusar son difciles de encontrar y permiten saber ms acerca de los orgenes del universo.

2.2.19.12 En clubes deportivos

El AC de Miln utiliza un sistema inteligente para prevenir lesiones. El club comenzar a usar redes neuronales para prevenir lesiones y optimizar el acondicionamiento de cada atleta. Esto ayudar a seleccionar el fichaje de un posible jugador o a alertar al mdico del equipo de una posible lesin. El sistema, creado por Computer Associates International, es alimentado por datos de cada jugador, relacionados con su rendimiento, alimentacin y respuesta a estmulos externos, que se obtienen y analizan cada quince das.

El jugador lleva a cabo determinadas actividades que son monitoreadas por veinticuatro sensores conectados al cuerpo y que transmiten seales de radio que posteriormente son almacenadas en una base de datos. Actualmente el sistema dispone de 5000 casos registrados que permiten predecir alguna posible lesin. Con ello, el club intenta ahorrar dinero evitando comprar jugadores que presenten una alta probabilidad de lesin, lo que hara incluso renegociar su contrato. Por otra parte, el sistema pretende encontrar las diferencias entre las lesiones de atletas de ambos sexos, as como saber si una determinada lesin se relaciona con el estilo de juego de un pas concreto donde se practica el ftbol.

Los equipos de la NBA tambin utilizan aplicaciones inteligentes para apoyar a su cuerpo de entrenadores. El Advanced Scout es un software que emplea tcnicas de Data Mining y que han desarrollado investigadores de IBM para detectar patrones estadsticos y eventos raros. Tiene una interfaz grfica muy amigable

57

orientada a un objetivo muy especfico: analizar el juego de los equipos de la National Basketball Asociacin (NBA).El software utiliza todos los registros guardados de cada evento en cada juego: pases, encestes, rebotes y doble marcaje (doubl tema) a un jugador por el equipo contrario, entre otros.

El objetivo es ayudar a los entrenadores a aislar eventos que no detectan cuando observan el juego en vivo o en pelcula. Un resultado interesante fue uno hasta entonces no observado por los entrenadores de los Knicks de Nueva York. El doble marcaje a un jugador puede generalmente dar la oportunidad a otro jugador de encestar ms fcilmente. Sin embargo, cuando los Bulls de Chicago jugaban contra los Knicks, se encontr que el porcentaje de encestes despus de que al centro de los Knicks, Patrick Ewing, le hicieran doble marcaje era extremadamente bajo, indicando que los Knicks no reaccionaban correctamente a los dobles marcajes. Para saber el porqu, el cuerpo de entrenadores estudi

cuidadosamente todas las pelculas de juegos contra Chicago. Observaron que los jugadores de Chicago rompan su doble marcaje muy rpido de tal forma que podan tapar al encestador libre de los Knicks antes de prepararse para efectuar su tiro.

Con este conocimiento, los entrenadores crearon estrategias alternativas para tratar con el doble marcaje. La temporada pasada, IBM ofreci el Advanced Scout a la NBA, que se convirti as en un patrocinador corporativo. La NBA dio a sus veintinueve equipos la oportunidad de aplicarlo. Dieciocho equipos lo estn haciendo hasta el momento obteniendo descubrimientos interesantes.

2.2.20. Extensiones de data mining

En este captulo veremos dos extensiones de Data Mining en una forma muy vaga, los hemos incluido ya que cremos importantes las contribuciones de estos procesos, en la seccin 4.1 hablamos del Web Mining y finalmente en el apartado

58

4.2 hacemos mencin del Text Mining, veremos de forma general su descripcin y como es que pueden ser utilizados, lo cual incluye algunos ejemplos muy simples.

2.2.20.1 Web Mining

Una de las extensiones del Data Mining consiste en aplicar sus tcnicas a documentos y servicios del Web, lo que se llama Web Mining(minera de web). Todos los que visitan un sitio en internet dejan huellas digitales (direcciones de IP, navegador, galletas, etc.) que los servidores automticamente almacenan en una bitcora de accesos (logs).

Las herramientas de Web Mining analizan y procesan estos logs para producir informacin significativa, por ejemplo, cmo es la navegacin de un cliente antes de hacer una compra en lnea. Debido a que los contenidos de Internet consisten en varios tipos de datos, como texto, imagen, vdeo, metadatos o hiperligas, investigaciones recientes usan el trmino Multimedia Data Mining (minera de datos multimedia) como una instancia del Web Mining para tratar ese tipo de datos. Los accesos totales por dominio, horarios de accesos ms frecuentes y visitas por da, entre otros datos, son registrados por herramientas estadsticas que complementan todo el proceso de anlisis del Web Mining. Normalmente, el Web Mining puede clasificarse en tres dominios de extraccin de conocimiento de acuerdo con la naturaleza de los datos:

Web Content Mining (minera de contenido web). Es el proceso que consiste en la extraccin de conocimiento del contenido de documentos o sus descripciones. La localizacin de patrones en el texto de los documentos, el descubrimiento del recurso basado en conceptos de indexacin o la tecnologa basada en agentes tambin puede formar parte de esta categora.

Web Structure Mining (minera de estructura web). Es el proceso de inferir conocimiento de la organizacin del WWW y la estructura de sus ligas.

59

Web Usage Mining (minera de uso web). Es el proceso de extraccin de modelos interesantes usando los logs de los accesos al web.

Algunos de los resultados que pueden obtenerse tras la aplicacin de los diferentes mtodos de Web Mining son:

El ochenta y cinco por ciento de los clientes que acceden a /productos/home.html y a /productos/noticias.html acceden tambin a /productos/historias_suceso.html. Esto podra indicar que existe alguna noticia interesante de la empresa que hace que los clientes se dirijan a historias de suceso. Igualmente, este resultado permitira detectar la noticia sobresaliente y colocarla quiz en la pgina principal de la empresa.

Los

clientes

que

hacen

una

compra

en

lnea

cada

semana

en

/compra/producto1.html tienden a ser de sectores del gobierno. Esto podra resultar en proponer diversas ofertas a este sector para potenciar ms sus compras.

El sesenta por ciento de los clientes que hicieron una compra en lnea en /compra/producto1.html tambin compraron en /compra/producto4.html despus de un mes. Esto indica que se podra recomendar en la pgina del producto 1 comprar el producto 4 y ahorrarse el costo de envo de este producto.

Los anteriores ejemplos nos ayudan a formarnos una pequea idea de lo que podemos obtener. Sin embargo, en la realidad existen herramientas de mercado muy poderosas con mtodos variados y visualizaciones grficas excelentes.

2.2.20.2 Text Mining

Con billones de pginas en la red, se requieren de nuevas tecnologas para encontrar, clasificar y detectar particulares patrones en la informacin disponible.

60

La esencia de los mtodos de la minera de datos aplicados a los datos numricos, puede tambin ser aplicada a datos de texto.

Estudios recientes indican que el ochenta por ciento de la informacin de una compaa est almacenada en forma de documentos. Sin duda, este campo de estudio es muy vasto, por lo que tcnicas como la categorizacin de texto, el procesamiento de lenguaje natural, la extraccin y recuperacin de la informacin o el aprendizaje automtico, entre otras, apoyan al Text Mining (minera de texto). En ocasiones se confunde el Text Mining con la recuperacin de la informacin (Informatin Retrieval o IR).

sta ltima consiste en la recuperacin automtica de documentos relevantes mediante indexaciones de textos, clasificacin, categorizacin, etc. Generalmente se utilizan palabras clave para encontrar una pgina relevante. En cambio, el Text Mining se refiere a examinar una coleccin de documentos y descubrir informacin no contenida en ningn documento individual de la coleccin; en otras palabras, trata de obtener informacin sin haber partido de algo. Una aplicacin muy popular del Text Mining es: Don Swanson intenta extraer informacin derivada de colecciones de texto. Teniendo en cuenta que los expertos slo pueden leer una pequea parte de lo que se publica en su campo, por lo general no se dan cuenta de los nuevos desarrollos que se suceden en otros campos.

As, Swanson ha demostrado cmo cadenas de implicaciones causales dentro de la literatura mdica pueden conducir a hiptesis para enfermedades poco frecuentes, algunas de las cuales han recibido pruebas de soporte experimental. Investigando las causas de la migraa, dicho investigador extrajo varias piezas de evidencia a partir de ttulos de artculos presentes en la literatura biomdica. Algunas de esas claves fueron: El estrs est asociado con la migraa. El estrs puede conducir a la prdida de magnesio. Los bloqueadores de canales de calcio previenen algunas migraas.

61

El magnesio es un bloqueador natural del canal de calcio. La depresin cortical diseminada (DCD) est implicada en algunas migraas. Los niveles altos de magnesio inhiben la DCD. Los pacientes con migraa tienen una alta agregacin plaquetaria. El magnesio puede suprimir la agregacin plaquetaria.

Estas claves sugieren que la deficiencia de magnesio podra representar un papel en algunos tipos de migraa, una hiptesis que no exista en la literatura y que Swanson encontr mediante esas ligas. De acuerdo con Swanson, estudios posteriores han probado experimentalmente esta hiptesis obtenida por Text Mining con buenos resultados.

2.2.21. Competencia y Oportunidades

Saber hacer buen uso de los datos de una empresa, puede ser la clave del xito, en estos tiempos inciertos, altamente competitivos. Si no se dispone de un Director de Sistemas en una compaa esta no se debe dejar abrumar por la amplia oferta y adems tiene que pensar siempre, antes de decidir, el beneficio de su inversin.

Si hubiera que hacer una recomendacin prioritaria en todo lo relativo a las tecnologas de informacin en la empresa, esta es sin duda que no se debe dejar impresionar por el argot. Se mezclan conceptos generalmente admitidos en el mundo de la gestin empresarial, con trminos y procesos de consultoras, junto a productos de proveedores especializados y marcas comerciales.

Con tantos ingredientes y tan heterogneos, no es de extraar que se piense que esto es nicamente cosa de expertos. Pero ni es oro todo lo que reluce, ni todas las propuestas son buenas o necesarias para los intereses de una empresa. Lo que s se puede descubrir, es que hacer un uso prctico y eficiente de los datos de

62

los clientes, proveedores, productos, o empleados, con poco ms que las herramientas y recursos de los que ya dispone, es posible. Hay una gran amplia competencia en el mundo empresarial, es por eso que estas requieren transformar los datos con los que cuentan a proyectos, ideas, etc, para obtener los objetivos que ellas mismas se plantean, y emprender campaas de marketing que en verdad los beneficien, y no solo a las compaas, sino que esto se traduzca en un servicio al cliente de calidad.

Es obvio que a un analista le tomara varias vidas, por ejemplo, el examinar detalladamente y desde una perspectiva multidimensional las millones de transacciones diarias de una gran cadena de supermercados para encontrar patrones, regularidades o interrelaciones importantes. (No nos olvidemos que la mayora de los humanos somos mejores detectando anomalas que infiriendo regularidades o relaciones en grandes conjuntos de datos.) Pero lo tiene que hacer. Afortunadamente, cuenta con modernas herramientas para extraer las tendencias tanto pasadas como futuras.

Sin embargo, es importante resaltar que no se realizan grandes hallazgos todos los das. Es necesario utilizar intensivamente las herramientas de Data Mining para descubrir informacin valiosa, que por cierto es muy escasa. Por eso el conjunto Data Mining-Data Warehouse, que es computacionalmente intensivo, puede beneficiarse con un hardware ms poderoso. Incluso las computadoras paralelas aceleran el proceso de bsqueda ofreciendo la posibilidad de realizar mltiples preguntas simultneas.

Las oportunidades dentro de Data Mining bien pueden ser muchas, o todo lo contrario, lo ms importante es saber hacer un uso adecuado de herramientas Data Mining as como de otras auxiliares, a saber, Data Warehouse, si se sabe emplear bien este tipo de tecnologas se tendrn una infinidad de oportunidades a nivel empresarial e incluso en otras reas, no tiene caso contar con alta tecnologa si esta es mal empleada, por ello podemos decir que, hay que saber tomar

63

decisiones para que estas nos ayuden a tomar otras decisiones que sern ms importantes y dejarn ms beneficios a una cierta compaa. As mismo, hay que explorar ms a fondo todos los recursos con los que contamos actualmente para ver cules son asequibles y utilizarlos tal vez en conjunto para sacar mayores ganancias.

2.2.22 La prxima generacin

En muchas reas del saber, el conocimiento se ha venido obteniendo por el clsico mtodo hipottico-deductivo, a partir de un conjunto de observaciones y de unos conocimientos previos, la intuicin y la experiencia del investigador le conduce a formular las hiptesis. Sin embargo, esta intuicin resulta casi imposible de llevar a cabo cuando, en vez de observaciones aisladas y casuales, se analizan millones de datos de grandes bases de datos. Es evidente que el proceso de complejidad creciente experimentado por la humanidad en los ltimos tiempos supera a la mente de cualquier ser humano, escapa plenamente a su control. El considerable crecimiento de la informacin llega a obnubilar la mente, produce stress, sobrecarga la memoria, crea deficiencias en la atencin y genera estados de inmovilidad. No obstante, las computadoras pueden manejar volmenes de informacin infinitamente superiores a los que la mente humana puede dominar, considerando un nmero inhumanamente grande de variables simultneas y hacindolo ms rpidamente de lo que jams ningn ser humano podr realizar; y esto se ir acrecentando en los prximos aos, hemos visto como por algunas pocas dcadas las computadoras han evolucionado a algo que hace 50 o 60 aos era impensable por muchos.

Actualmente, el mejor uso del Data Mining es aquel en donde el analista formula las consultas especficas a fin de que el sistema convalide o desmienta las hiptesis segn los datos. Sin embargo, la tecnologa continuar automatizando cada vez ms el proceso de decisin en s mismo, haciendo que las futuras

64

herramientas de descubrimiento detecten las relaciones y generen esencialmente las hiptesis. Como ltimo objetivo todava lejano se intenta crear un sistema de descubrimiento de conocimiento de propsito general que, a medida que se vuelva ms complejo, agregue sus propios aportes. A travs del anlisis cuidadoso, del examen meticuloso y de la asociacin de datos sin una conexin obvia, podra ser capaz por ejemplo- de descubrir nuevos tratamientos para enfermedades u originales ideas para explicar el origen del universo. Con respecto a este concepto, el futurlogo A. Toffler hace notar que la computadora puede sugerir soluciones imaginativas para ciertos problemas al descubrir relaciones nuevas o que hasta entonces haban pasado inadvertidas. Se podra pedir a la computadora que "piense lo impensable", que piense en lo que aun jams ha sido pensado.

En poco tiempo ms, el Data Mining puede volverse tan comn y fcil usar como el e-mail. Podremos utilizar estas herramientas de forma masiva para analizar datos a gran escala y encontrar, por ejemplo, la mejor tarifa area a Cancn, conseguir el nmero telefnico de un antiguo compaero de clase, o encontrar los precios ms econmicos de las bordadoras de csped. El software se dar cuenta dnde buscar, cmo evaluar lo que encuentra y cundo dejar de buscar. Nuestros ayudantes cognitivos pueden volverse tan indispensables como lo es ahora el telfono.

La pregunta que ahora nos hacemos es Las computadoras ahora pensarn por nosotros?, una posible respuesta es que, nosotros debemos hacer que ellas piensen, o mejor dicho, descubran lo que notros queremos que descubran, que sirvan para lo que nosotros queremos que sirvan, el uso de tecnologas como Data Mining conlleva muchas facilidades hacia la vida de los seres humanos, las computadoras se han hecho para facilitar nuestra vida cotidiana no para complicarla y Data Mining representa una de estas facilidades, la cual por supuesto evolucionar.

65

2.2.23. Tiempos de cambio

En los ltimos aos se ha hecho realidad para la mayora de las empresas un cambio fundamental en su orientacin de negocio. Las nuevas tecnologas de la informacin posibilitan una orientacin de la empresa hacia el conocimiento del cliente. Tales nuevas orientaciones, acompaadas de unas plataformas tecnolgicas que las hacen posible motivan nuevos paradigmas de gestin del conocimiento y de accin de marketing. Conceptos y acciones en torno a CRM, Business Intelligence, data Mining, etc, marcan la actividad de un marketing moderno que no slo busca la efectividad de la accin comercial, sino tambin la eficiencia.

En este sentido, y ante la evolucin del marketing parece que la investigacin de mercados va por otro lado y sigue aplicando, en trminos generales, las mismas metodologas y las mismas herramientas de siempre. Parece como si esta nueva orientacin hacia la integracin de la informacin en busca de un conocimiento que aporte valor diferencial no vaya con ella. Permanece invariable en sus metodologas y aplicaciones en un contexto de transformacin continua en la bsqueda de la eficiencia.

Para no ser del todo injustos, digamos que la investigacin de mercados no ha permanecido del todo impermeable a las nuevas tecnologas de la informacin. Existen empresas de investigacin de mercados que incorporan con brillantez a las metodologas tradicionales herramientas tecnolgicamente avanzadas. As vemos en los ltimos aos encuestas personales en cuya captura de datos que utilizan soportes PDA que transmiten a travs de mensajes SMS los resultados de un cuestionario, lo que permite una tabulacin inmediata y el anlisis es susceptible de realizarse "on line".

Tambin observamos la realizacin de encuestas telefnicas sin la participacin de encuestadores humanos y realizadas a travs de IVR (Interactive Voice

66

Response) donde una mquina llama al encuestado, le expone el cuestionario y las respuestas se obtienen o por el reconocimiento de la voz o por el uso de los nmeros del terminal telefnico.

Indudablemente, la incorporacin de estas herramientas tecnolgicas aporta valor a la investigacin en cuanto que abaratan costes, incorporan calidad a la captura de datos y rapidez al proceso de la investigacin y a la disponibilidad de resultados. Pero supone una mejora, que se nos antoja insuficiente, ya que sigue relegando a la investigacin de mercados a un papel puramente tctico (resuelve necesidades de informacin puntuales: el consabido Estudio) y no estratgico (la incorporacin de la investigacin de mercados a los Sistemas de Informacin de Marketing de la empresa).

Al mismo tiempo, dentro de la industria de las empresas de investigacin de mercados existe tambin la conciencia de que es necesario un cambio hacia una integracin de las fuentes, una modernizacin de las metodologas y una mejor adaptacin a las herramientas implantadas en la casa del cliente. Tal como expresa Enrique Domingo, presidente de ANEIMO: " a la investigacin de mercados le corresponde asumir conscientemente un papel de vanguardia. Para cumplir ese reto, precisa ampliar las estrechas fronteras de su concepcin tradicional como proveedora de datos o informacin."

Sin embargo, aunque existe esa conciencia de la necesidad de un cambio no se sabe muy bien hacia donde y como realizar esa transformacin. Y adems, no existe excesiva prisa por realizarlo, ya que en trminos globales la industria de los Estudios de Mercado va aceptablemente bien, tal como demuestra el ltimo estudio realizado por AEDEMO y publicado el pasado junio de 2003. La causa de esta buena situacin, podra ser segn nuestro criterio particular, que el cliente se ha adaptado a la investigacin de mercado y a sus capacidades actuales, en vez de al revs: que la investigacin se adapte a las necesidades cambiantes de los clientes.

67

2.2.24. Tecnologas imperantes

Frente a la situacin descrita en el sector de la investigacin de mercados, se esta imponiendo en las empresas la necesidad de gestionar internamente el conocimiento del mercado y de sus clientes. Parafraseando al insigne Peter Druker : "El objetivo del marketing actual es hacer de la venta algo superfluo, fcil y sencillo, conocer tan bien al cliente, que el producto o servicio se adapte perfectamente a l y se venda por s mismo".

Figura 1: Evolucin de la facturacin neta de la Industria de los estudios de mercado en Espaa

Fuente: "Industria de los Estudios de Mercado en Espaa" AEDEMO, junio 2003.

La visin anunciada por Ducker ha marcado un camino a seguir, un nuevo paradigma de accin empresarial, donde predomina el enfoque de la empresa hacia el conocimiento cliente. Ese mayor o menor conocimiento y la habilidad para transformarlo en acciones eficaces suponen hoy en da la clave de la competitividad de las empresas.

En este terreno de la orientacin hacia el cliente, en aos anteriores las empresas han interiorizado este enfoque y se han dotado, con gran esfuerzo econmico y humano, de infraestructuras de informacin que permiten soportar tcnicamente ese modelo de relacin con el cliente y con el mercado. Por ello en la actualidad

68

las empresas se encuentran en una segunda fase del proceso, donde lo importante es extraer un buen rendimiento de la infraestructura creada.

En este sentido, conviene destacar que son muchas las empresas que han incorporado estas herramientas pensando que tales inversiones determinaran por si mismas el logro de ventajas competitivas. E incluso, han llegado a pensar que existe una relacin directa entre la inversin realizada y un mayor conocimiento del cliente. La experiencia demuestra que tal creencia es un error.

Para extraes un buen rendimiento de los sistemas informticos creados para la gestin de informacin del cliente es preciso que exista tener en cuenta cuatro hechos fundamentales:

Es preciso contar con una infraestructura tecnolgica suficiente. En este terreno la unificacin de la informacin de clientes en un nico repositorio (datamart, data warehouse, etc.) es el primer paso para poder desarrollar un adecuado enfoque hacia el cliente. Tanto desde la perspectiva del anlisis de la informacin, como desde la gestin eficaz de la relacin con el cliente.

El dato es materia prima. La calidad y consistencia es fundamental. Es muy frecuente encontrar, sobre todo despus de unificar la informacin del cliente en un nico repositorio, que los datos existentes muestran una deficiente calidad, una escasa consistencia y una variedad limitada. Tal hecho impide obtener resultados idneos en el anlisis.

Por muy buenas que sean las herramientas de anlisis (anlisis multivariable, anlisis multidimensional, dataminig, etc.) y muy sofisticadas las tcnicas empleadas (redes neuronales, algoritmos genticos, lgica difusa, etc) si el dato no est bien el resultado final ser siempre decepcionante.

La explotacin de una base de datos no es un acto es un proceso.

69

Existe una relacin directa entre las variables existentes, dando por supuesta su calidad y consistencia, y las utilidades que se puede extraer de una base de datos, contemplando estos beneficios tanto como herramienta de conocimiento como de instrumento de comunicacin "one to one"

Figura 2: Relacin variables disponibles vs utilidades aportadas por una BD de marketing.

Fuente: Elaboracin propia.

Por tanto, se debe decir que la puesta en marcha de sistemas de informacin de marketing orientados bajo prismas CRM no es un hecho, sino un proceso por el cual se capturan progresivamente datos del cliente, se analizan y se va obteniendo un conocimiento creciente de ese cliente y su comportamiento. Se produce un efecto "bola de nieve" de tal forma que la utilidad obtenida de estos sistemas es creciente con el paso del tiempo.

Es preciso un personal con un perfil profesional especial.

70

En el proceso de obtencin de conocimiento de los clientes, por parte de la empresa es preciso contar con un personal que debe poseer las siguientes cualidades:

Un conocimiento adecuado del negocio que le permita anticiparse a las necesidades de informacin de los "clientes" del sistema de informacin de la empresa.

Un buen conocimiento estadstico y analtico que garantice la mejor explotacin tcnica de los datos.

Conocimientos de marketing suficientes que le permitan aportar valor a los anlisis orientndolos a la obtencin de utilidades concretas.

Ciertos conocimientos informticos que ayuden a potenciar una explotacin adecuada de los sistemas.

Habilidades "comerciales y de negociacin" que ayuden a la "venta" del sistema y a la satisfaccin del "cliente interno"

Extrapolando estas caractersticas a un perfil profesional especfico, porque combina lo tcnico de distintas disciplinas (estadstica e informtica) con visin de negocio y habilidades directivas que le permitan manejar con delicadeza diferentes prioridades en niveles de interlocucin interna variados. Tal perfil no es fcil de encontrar.

A travs del manejo de estos cuatro elementos es posible obtener un buen rendimiento de los sistemas y de la informacin en ellos recogida, obteniendo lo que en trminos anglosajones se denominara Business Inteligencie.

71

La aplicacin de las tcnicas y actividades de Business Inteligencie condiciona las necesidades de informacin de los directivos, lo que modifica lo que stos pueden necesitar de las empresas de investigacin de mercados.

2.2.25 Qu se puede aportar la investigacin de mercados en este contexto?

La experiencia profesional en los dos "bandos": en la explotacin de datamarts y en la realizacin de estudios de mercados cualitativos y cuantitativos, permite ser consciente de que a travs de la investigacin de mercados y de sus tcnicas se puede cubrir dos deficiencias fundamentales existentes en los sistemas informatizados de Business Inteligencie:

La ausencia de variables de anlisis

En el mundo de las bases de datos existen varios tipos de empresas: las que disponen de una ingente cantidad de datos del cliente (generalmente las compaas que establecen un contrato con sus clientes- entidades financieras, empresas de energa, telefona etc.) y otras que disponen de escasas variables de segmentacin de sus clientes. Para estas ltimas, las tcnicas de investigacin de mercado pueden aportar variables que contribuyan a un adecuado

enriquecimiento de la base de datos. Con ello se podrn obtener utilidades adicionales de los sistemas de informacin.

La escasez de elementos cualitativos en las bases de datos de marketing

Resulta paradjico, y al mismo tiempo una debilidad importante de los sistemas de informacin de marketing, que casi siempre manejan informacin cuantitativa. Sin embargo, es la informacin cualitativa la que permite averiguar el Por qu? de las acciones de los individuos. Adems, son las variables no racionales- sino

72

emocionales las que condicionan con mayor fuerza el comportamiento de los clientes actuales y potenciales.

La cuestin entonces es: no podra realizarse un enriquecimiento cualitativo de las bases de datos? No podra ponerse en marcha una segmentacin o tipificacin de clientes con las variables existentes de una base de datos, para posteriormente incorporar a cada tipologa de cliente sus opiniones, frenos, actitudes, etc? Con ello se podra realizar un enriquecimiento cualitativo de las bases de datos aportando no slo una descripcin del comportamiento de los clientes, sino una explicacin del mismo y un camino de actuacin en lo emocional

2.2.26 Datamart

Un Datamart es una base de datos departamental, especializada en el almacenamiento de los datos de un rea de negocio especfica. Se caracteriza por disponer la estructura ptima de datos para analizar la informacin al detalle desde todas las perspectivas que afecten a los procesos de dicho departamento. Un Datamart puede ser alimentado desde los datos de un Data warehouse, o integrar por si mismo un compendio de distintas fuentes de informacin.

Por tanto, para crear el Datamart de un rea funcional de la empresa es preciso encontrar la estructura ptima para el anlisis de su informacin, estructura que puede estar montada sobre una base de datos OLTP, como el propio Data warehouse, o sobre una base de datos OLAP. La designacin de una u otra depender de los datos, los requisitos y las caractersticas especficas de cada departamento. De esta forma se pueden plantear dos tipos de data marts:

73

2.2.26.1 Datamart OLAP

Se basan en los populares cubos OLAP, que se construyen agregando, segn los requisitos de cada rea o departamento, las dimensiones y los indicadores necesarios de cada cubo relacional. El modo de creacin, explotacin y mantenimiento de los cubos OLAP es muy heterogneo, en funcin de la herramienta final que se utilice.

2.2.26.2 Datamart OLTP

Pueden basarse en un simple extracto del Data warehouse, no obstante, lo comn es introducir mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las operaciones ms usuales) aprovechando las caractersticas particulares de cada rea de la empresa. Las estructuras ms comunes en este sentido son las tablas report, que vienen a ser fact-tables reducidas (que agregan las dimensiones oportunas), y las vistas materializadas, que se construyen con la misma estructura que las anteriores, pero con el objetivo de explotar la reescritura de queries (aunque slo es posibles en algunos SGBD avanzados, como Oracle).

Los data marts que estn dotados con estas estructuras ptimas de anlisis presentan las siguientes ventajas:

Poco volumen de datos Mayor rapidez de consulta Consultas SQL y/o MDX sencillas Validacin directa de la informacin Facilidad para la historizacin de los datos

74

Si no est familiarizado con el concepto de data marts, puede resultarle til, adems, examinar las siguientes definiciones:

2.2.27 La toma de decisiones

La toma de decisiones es, por as decirlo, la llave final de todo el proceso administrativo: ningn plan, ningn control, Ningn sistema de organizacin tiene efecto, mientras no s de una Decisin. Tan importante es que, quiere reducir el estudio de La administracin al aprendizaje de una tcnica para tomar Decisiones.

Adems, la tcnica para llegar a una decisin vara con el Tipo del problema, con la persona que la toma, y con Las circunstancias que prevalezcan. A probablemente no existe Una tcnica universalmente valida para lograr decisiones buenas Y eficientes.

Pasos que se deben tomar en cuenta para tomar una decisin

Debe de identificarse ante todo con toda claridad el problema sobre el que dbenos decidir. Toda decisin implica la eleccin entre dos o ms alternativas.

Debemos garantizarnos de que tenemos la informacin necesaria para poder decidir.

Debemos plantear con claridad, las diversas posibilidades de accin y ponderarlas. Si decidir es escoger entre diversas alternativas, necesitamos conocerlas todas ellas, compararlas y ponderar sus ventajas y desventajas.

La toma de decisiones estratgicas se presenta a nivel corporativo, a nivel de unidad de negocio y a nivel funcional. Al trmino de esta regresin se encuentran

75

los planes operativos para poner en prcticas la estrategia. Esto hace que la administracin estratgica sea ms especializada.

Casi no es posible imaginar un campo de mayor trascendencia para el humano que el de la toma de decisiones. Tenemos un problema cuando no sabemos cmo seguir. Una vez que tenemos un problema, hay que tomar una decisin (incluyendo la de no hacer nada).

Elegimos una alternativa que nos parezca suficientemente racional que nos permita ms o menos maximizar el valor esperado luego de resuelta nuestra accin. Emitimos en silencio un plan de control, que nos suma en la toma de decisiones, incluyendo decisiones relacionadas con modificar ese plan de control. Demostramos nuestra inteligencia en este proceso en funcionamiento.

Un tpico bastante poco conocido es el papel de la inteligencia en la resolucin de problemas, de la toma de decisiones, del planeamiento de un control.

Randall Beer nos muestra en detalle la toma de decisiones cclicas y encadenadas de un invertebrado cuya red neuronal es plenamente conocida. Aprendemos muchsimo de este enfoque neuroetolsgico: cual es el primitivo origen de nuestra conducta. Le falta la contribucin de la memoria y de la creatividad, que no estn provistas por la red neural.

El anlisis de Esther Thelen referido al control motriz infantil es muy ilustrativo. Es

76

importante la tecnologa de las redes neuronales empleadas en tantsimas aplicaciones, entre ellas la que ahora nos ocupa de la toma de decisiones.

Desde la apoca del percepcin se han aplicado redes artificiales en la toma de decisiones y la resolucin de problemas con la intencin de volver automtico el proceso. Se consigue introducir la habilidad de la toma de decisiones en la red de una forma para nada trivial. Quizs ello imite de lejos la forma como las redes neuronales hmedas del cerebro si auto organizan para aprender por ejemplos memorizados y para combinar posibilidades ya no memorizadas, sino nuevas.

El razonamiento basado en casos es el fluido resultado de aprendizajes emergentes de la infancia. La capacidad combinatoria, la expresin o el control de los sentimientos tambin tienen la misma historia durante la infancia. Es nocin habitual que a esto le atribuya una altsima trascendencia. La maquinaria de la neo corteza cerebral est fuertemente asociada con estas tareas. Lo cual no quita saber, como se sabe, que numerosos sistemas tambin colaboran en los procesos de integracin y de simbolizacin de muy alto nivel.

La toma de decisiones es tambin una ciencia aplicada que ha adquirido notable importancia y es el tema bsico de la Investigacin Operativa.

Muchas personas todava estn bajo el cautiverio de la tutela auto contrado. La tutela es la incapacidad de la persona de tomar sus propias decisiones. Y es auto contrada cuando su causa no es la falta de razn sino la falta de resolucin y coraje para usarla sin desear que nos diga que hacer alguna otra persona. ! Ten coraje para usar tu propia razn! Era el lema en el Siglo de las Luces.

Mediante la lucha y el sufrimiento del Siglo de las luces, apareci "el individuo". Los seres humanos finalmente ganaron su libertad natural para pensar por s mismos. Sin embargo, esto ha sido una gran carga de responsabilidad para

77

muchos. Ha habido demasiados fracasos. Las personas renuncian rpidamente a su libertad natural frente a cualquier culto a cambio de una vida fcil.

La buena toma de decisiones permite vivir mejor. Nos otorga algo de control sobre nuestras vidas. De hecho, muchas de las frustraciones que sufrimos con nosotros mismos se deben a no poder usar la propia mente para entender el problema de decisin, y el coraje para actuar en consecuencia. Una mala decisin puede obligarnos a tomar otra mala decisin, como dijo Harry Truman: "Toda mala decisin que tomo va seguida de otra mala decisin".

Las decisiones racionales generalmente se toman sin darnos cuenta, quizs de manera inconsciente, podemos comenzar el proceso de consideracin. Lo mejor es aprender el proceso de toma de decisiones para decisiones complejas, importantes y criticas. Las decisiones crticas son aquellas que no pueden ni deben ser objetivos incorrectos, debemos preguntarnos: qu es lo ms importante que estoy tratando de lograr en este caso? El estilo y las caractersticas del decidor se pueden clasificar en: el pensador el cowboy (repentino e intransigente), Maquiavlico (el fin justifica los medios), el historiador (como lo hicieron otros), el cauteloso (incluso nervioso), etc..

2.2.27.1 El modelo de decisiones

El modelo de decisiones ms simple que tiene solo dos alternativas se denomina Maniquesmo, adaptado por Zaratustra y luego adoptado por otras religiones organizadas.

El Maniquesmo es el concepto de dualidad que divide todo lo que forma parte del universo en dos alternativas distintas o dos polos opuestos, como por ejemplo el bien y el mal, blanco y negro, da y noche, mente (o alma) y cuerpo, etc. Este concepto de dualidad fue un modelo suficiente de la realidad para aquella poca para que el mundo fuera manejable y calculable.

78

Sin embargo, hoy en da sabemos con certeza que todo cambia y todo tiene un amplio espectro continuo. No existen los opuestos en la naturaleza. Debemos ver el mundo a travs de los ojos de nuestra mente vivida; de lo contrario, no comprendemos bien las ideas complejas.

El oficio del directivo conlleva la toma de decisiones con un cierto grado de riesgo econmico en un marco estratgico definido por la propia empresa y en un entorno econmico-social predeterminado. La idoneidad de estas decisiones estar en funcin de la preparacin, experiencia, personalidad e informacin que posea el directivo.

2.2.27.2 La Experiencia en la Toma de decisiones

En la toma de decisiones la experiencia es un elemento clave puesto que las decisiones deben tomarse sobre una realidad altamente compleja debido al enorme nmero de variables que entran en juego.

La acumulacin de experiencia es larga y costosa. Si consideramos que cuando ms se aprende es como consecuencia de los propios errores, el alcanzar un elevado nivel de experiencia en el mundo empresarial puede llegar a tener un coste terriblemente alto. La consecuencia inmediata es que toda la experiencia que pueda ganarse sin los efectos que pudieran derivarse de una decisin errnea o, simplemente de una decisin no ptima, ser bien recibida y ms econmica, sea cual sea su coste.

Marco de anlisis del proceso de toma de decisiones en las grandes organizaciones.

El anlisis econmico tradicional tiende a analizar las actuaciones de la empresa como el resultado de una decisin unitaria, mientras que la teora de la organizacin reconoce que en las grandes corporaciones el proceso de toma de

79

decisiones suele estar descentralizado y que estas no dependen solo del objetivo de maximizacin de beneficios o ganancias, sino tambin de su estructura organizativa. Por ello, la toma de decisiones en las grandes empresas suele tener en cuenta la necesidad de limitarse a obtener beneficios satisfactorios, sin necesidad de maximizarlos, debido a la obligacin de conjugar los diversos objetivos de las distintas partes que componen la organizacin. Cuando las decisiones se adoptan de forma colectiva solo se suelen tener en cuenta todos los objetivos de la empresa y no solo el de maximizacin de beneficios, pero tambin suelen ser ms lentas (una caracterstica fundamental de las empresas japonesas). La teora de la organizacin est relacionada con la teora de la empresa.

2.2.27.3 La toma de decisiones en la teora de decisin

En la Toma de Decisin, estudio formal sobre la toma de decisiones. Los estudios de casos reales, que se sirven de la inspeccin y los experimentos, se denominan teora descriptiva de decisin; los estudios de la toma de decisiones racionales, que utilizan la lgica y la estadstica, se llaman teora preceptiva de decisin. Estos estudios se hacen mas complicados cuando hay mas de un individuo, cuando los resultados de diversas opciones no se conocen con exactitud y cuando las probabilidades de los distintos resultados son desconocidas. La teora de decisin comparte caractersticas con la teora de juegos, aunque en la teora de decisin el adversario es la realidad en vez de otro jugador o jugadores

80

Los sistemas polticos y econmicos

Los sistemas polticos deben favorecer la participacin ciudadana en la toma de decisiones, en especial las relativas a actividades que afectan a sus vidas; los ricos deben adoptar estilos de vida que no se salgan del marco de los recursos ecolgicos del planeta; y el tamao y crecimiento de la poblacin deben estar en armona con la cambiante capacidad productiva del ecosistema.

El desarrollo sostenible no es, sin embargo, un estado inmutable de armona, sino un proceso de cambio. Este est ya en marcha en el campo del desarrollo agrcola, donde la transicin hacia la agricultura sostenible est mejorando la produccin de alimentos, en especial en el caso de los pobres, adems de proteger el medio ambiente.

En todo caso, lo que quedaba claro era que la incorporacin de consideraciones econmicas y ecolgicas a la planificacin del desarrollo requerirla toda una revolucin en la toma de decisiones econmicas. Permitir la participacin de los trabajadores en la toma de decisiones y en la organizacin de la actividad implica darles informacin adicional y consultarles sobre cmo deben desarrollarse estas actividades.

La prohibicin de los mercados y la centralizacin de la toma de decisiones econmicas pretendan maximizar el uso de los recursos destinados a la industria. El presupuesto de un negocio suele utilizarse como herramienta para la toma de decisiones sobre la gestin y el crecimiento de la actividad de la empresa.

2.2.27.4 La toma de decisiones en la empresa publica

Lo que en la prctica caracteriza o diferencia a una empresa pblica de otra privada es su relacin con los poderes pblicos. A diferencia de la empresa privada, la empresa pblica no busca la maximizacin de los beneficios, las ventas

81

o la cuota de mercado, sino que busca el inters general de la colectividad a la que pertenece, aunque este inters pueda, en ocasiones, ir en contra de los objetivos anteriores que rigen la actuacin de la empresa privada.

Por ello, el proceso de toma de decisiones de la empresa pblica difiere de aquellas que pertenecen al sector privado en tanto en cuanto el poder de iniciativa parte del Estado, que lo ejerce estableciendo sus objetivos y controlando su actividad; el poder de gestin pertenece a las propias empresas, que lo llevan a cabo a travs de sus propios rganos aunque, a menudo, los directivos y administradores son nombrados por el Gobierno. Es frecuente tambin que los trabajadores y los usuarios, mediante las asociaciones de consumidores, estn representados en los rganos decidores.

2.2.28 Del lechero al supermercado virtual

Antes de los aos 30, los supermercados como los conocemos actualmente no existan. La leche era vendida en la lechera local, la carne en la carnicera, los pescados en las pescaderas.

Por su parte los abarrotes eran vendidos en los almacenes. Los consumidores deban visitar diferentes establecimientos de venta al detalle para satisfacer sus necesidades de alimentacin. En esa poca, el hacer compras era una experiencia intensamente personalizada.

Los comerciantes minoristas eran generalmente del mismo vecindario que sus clientes. Para los comerciantes era muy simple conocer las preferencias individuales y atenderlas. Durante la depresin de los 30s, en los EE.UU., los almacenes de barrio comenzaron a dar paso a los supermercados. Estos se caracterizaban por su amplio surtido de todo tipo de alimentos perecibles y no perecibles bajo el mismo

82

techo. La otra caracterstica era autoservicio donde el cliente seleccionaba y llevaban a las cajas por s mismo los productos adquiridos.

Los supermercados ganaron popularidad, no slo porque agregaron valor proporcionando al comprador un solo lugar para comprar lo que necesitaban, sino que, y esto era lo ms importante, podan ofrecer precios bajos en un momento en que la situacin econmica era apremiante.

Como resultado de economas de la escala y del sistema de compras en un solo lugar, los supermercados pudieron ofrecer precios atractivos, sin sacrificar sus mrgenes de utilidad.

Por la Segunda Guerra Mundial, los supermercados eran la forma principal de la distribucin de comestibles en los EE.UU. Debido a su creciente popularidad, los supermercados comenzaron a ver sus mrgenes de beneficio disminuidos debido a la intensa competencia.

En la gran mayora de los pases desarrollados, el supermercado se encuentra dominando otras formas de distribucin de alimentos. Inclusive el almacn de abarrotes se ha convertido en un pequeo supermercado, dando paso a una consolidacin de las empresas de venta de alimentos al detalle.

83

Sin embargo, nuevas iniciativas continan influenciando las formas de venta de alimentos. En los aos 90, aparecen los negocios por afiliacin que hacen ventas en cantidades mnimas ms grandes, Costco, Sam's, y los almacenes de descuento como Wal-Mart y Kmart, los cuales entraron al mercado, ofreciendo una seleccin ms amplia y acercndose a los precios al por mayor. Por nuestros pases han llegado con nombres como PriceSmart y otros.

Las

cadenas

de

supermercados

se

han

estado

defendiendo

abriendo

hipermercados, en los cuales se ampla el surtido incluyendo electrodomsticos, ropa, rotiseras, etc.

La idea de incluir secciones separadas de alimentos gourmets, panadera, farmacia dentro del supermercado est respaldada por los mrgenes de utilidad ms altos permitidos por esos productos, comparados con los obtenidos por los alimentos normales.

Con la accesibilidad en aumento a la Internet de los consumidores, los supermercados ahora hacen frente a un nuevo desafo, como son los supermercados en la Web. La pregunta obligada es si las cadenas de supermercados tradicionales adoptarn el concepto de tiendas virtuales, o se limitarn a quedarse con sus actuales sistemas de venta.

Los supermercados, al menos en los EE.UU., dominan la industria que vende comestibles al detalle, generando 77% de las ventas totales del sector. Por lo tanto, no es ninguna sorpresa que los cinco detallistas ms grandes de los Estados Unidos, son cadenas de supermercado: Kroger Co., Wal-Mart Stores Inc., Albertson's Inc., Safeway y Ahold USA Inc. Estas empresas hacen el 40% del total del total de las ventas del sector.

Mucho de los grandes supermercados del pas del norte, tienen sitios Web. Van desde sitios que solamente proporcionan informacin sobre ubicacin y horas de atencin, a anuncios de ofertas y servicios especiales.

84

Otros incluyen formularios para planear compras y preparar listas. Todos estos servicios estn destinados a promover las ventas en los almacenes reales.

Adicionalmente existe una buena cantidad de tiendas virtuales que ofrecen abarrotes seleccionados por Internet, tales como Whole Food y Godiva, los cuales esperan vender unos $79 millones este ao, por medio de la Internet. La empresa Forreter Research se ha atrevido a predecir que las ventas de especialidades tendrn un enorme incremento y pueden llegar a $6 billones para el ao 2005.

Todo est por verse

Es muy pronto para decir lo que suceder con los supermercados virtuales. Primero, la infraestructura necesaria para soportar a este modelo de negocios no ha madurado lo suficiente. Las grandes mayoras no tiene acceso a la Internet, ya que no pueden afrontar la inversin inicial y el mantenimiento de una conexin. El servicio telefnico mismo est poco desarrollado fuera de las grandes capitales. A medida que la tecnologa se desarrolle y baje de precio esos factores limitantes deberan disminuir. Por su parte los sitios Web aumentarn su tendencia a la individualidad y personalizacin.

Segundo, es difcil que los supermercados reales lleguen a disminuir notoriamente, porque los consumidores seguirn queriendo seleccionar

personalmente sus alimentos. No se percibe que vaya a ocurrir un dramtico cambio de actitud en esta materia, en el futuro cercano.

Sin embargo, la migracin de ventas hacia la Web de productos no perecibles, que no tienen las limitaciones de distribucin de los alimentos, est comenzando lentamente a ocurrir.

85

Tercero, no debemos olvidar que los humanos somos seres sociales. Para muchos de nosotros el ir al Supermercado es hasta una forma de encontrarnos con amigos y parientes, el sbado por la maana.

Presumir que podemos llenar un carrito de mercadera, es parte importante de ese estrato no material de todos nosotros.

Por ltimo el gran impacto de la Internet en las ventas al detalle de alimentos, deber verse en el MERCADEO y no en los supermercados de cemento y acero. La rpida captura de informacin en la Web y la habilidad de asociar esa informacin con los individuos, ayudar a los almacenes e industriales a dar servicios altamente personalizados a sus consumidores.

En cierta medida, utilizada inteligentemente, la Internet puede permitir que los consumidores se sientan que regresan a los das del lechero y carnicero del barrio, que los atenda en forma personal e individualizada, con la conveniencia de hacer las compras desde sus casas.

86

CAPITULO III

MARCO METODOLOGICO.

3.1 MODALIDAD DE LA INVESTIGACIN.

Se puede

manifestar que para este trabajo investigativo aplicaremos dos

modalidades de investigacin las cuales son:

3.1.1 Investigacin Cuantitativa. Esta modalidad de investigacin trata de describir, contextualizar o explicar con tcnicas estadsticas el objeto de estudio. Parte de las tcnicas inductivas (razonamientos que se desarrollan de los casos particulares hasta la generalizacin). En nuestro caso las muestras han sido representativas con relacin al Universo y han permitido la evaluacin del proceso.

3.1.2 Investigacin Cualitativa.-

En cambio esta investigacin trata de

comprender y explicar argumentativamente el objeto de estudio, considerando su contexto histrico, tecnolgico y socioeconmico. Se aplico directamente esta modalidad para evaluar aspectos de comportamiento humano, es decir se investigo los procesos desicionales de la Institucin y su influencia en el proceso administrativo

3.2 TIPOS DE INVESTIGACIN.

Los tipos de investigacin ha utilizar son: Bibliogrfica.Se realiza en base a libros, revistas e internet, permite

fundamentar cientficamente las variables de la presente tesis y se utiliza para elaborar el marco terico. De Campo.- En cambio con este tipo de investigacin se ha podido valorar la problemtica relacionada con la toma de decisiones y ratificarla, luego en base a esto nos orientaremos a la propuesta de solucin.

87

3.3. POBLACION Y MUESTRA. La poblacin o universo de nuestra investigacin est compuesta de la siguiente forma

TIPO DE FUNCION Propietario Jefes de ventas y compras. Empleados TOTAL

N DE PERSONAS 1 7 50 58

3.3.1. METODOS, TECNICAS E INSTRUMENTOS

Con el fin de obtener los mejores resultados posibles se ha seleccionado mtodo inductivo deductivo para efectos investigativos.

el

Este mtodo permite mediante un conjunto de preguntas adecuadas inducir las respuestas sobre la ratificacin de la existencia del problema, una vez que esto ha sucedido se deduce las posibles soluciones al problema.

Tcnicas Entre las tcnicas para recopilar informacin dentro de este proceso investigativo podemos mencionar: La encuesta: que consiste en investigar lo sintomatologa del problema en base a una serie de preguntas relacionadas con las dificultades que atraviesa la Institucin. La entrevista es una indagacin directa con una persona directamente relacionada con el problema, en nuestro caso lo podremos hacer con el Alcalde. Finalmente la observacin que permitir evaluar los procesos de manera visual.

Instrumentos Se utilizaran los siguientes instrumentos en las tcnicas mencionadas

anteriormente:

88

Cuestionarios (Se utilizaran para las encuestas respectivas) Gua de entrevista (Aplicada para la entrevista con el gerente)

INTERPRETACIN DE DATOS. Para la interpretacin de datos vamos a tabular y graficar los resultados de la encuesta, dicha realizacin lo haremos pregunta por pregunta, iniciamos con el cuestionario dedicado a los jefes departamentales de ventas y compras.

1.- Para hacer un pedido recibe la informacin necesaria del producto requerido ?

Frecuencia Porcentaje SI NO 17 41 29% 71%

TOTAL

58

100%

29%
71%

SI

NO

89

2.- Se disponen de historiales de ventas en la empresa?

Frecuencia Porcentaje SI NO 41 17 71% 29%

TOTAL

58

100%

29% 71%

SI

NO

90

3.- Sus decisiones de compra son en base a su experiencia o dispone de informacin de apoyo sobre el historial de ventas?

Frecuencia Porcentaje EXPERIENCIA APOYADO 50 8 86% 14%

TOTAL

58

100%

14%

86%

EXPERIENCIA

APOYADO

91

4.- Considera usted que una decisin apoyada en un historial de ventas es ms acertada? Frecuencia Porcentaje SI NO 58 0 100% 0%

TOTAL

58

100%

SI

NO

92

5.- Considera necesario que la empresa utilice un proceso de minera de datos para obtener informacin relacionada con el historial de venta de los vehculos? Frecuencia Porcentaje SI NO 58 0 100% 0%

TOTAL

58

100%

SI

NO

93

Encuesta realizada al personal que labora en la institucin y tiene relacin directa o indirecta con las ventas de los vehculos. 1.- Cree usted que las decisiones sobre pedidos de vehculos por parte de la empresa son totalmente oportunas?

Frecuencia Porcentaje SI NO 39 19 68% 33%

TOTAL

58

100%

33% 67%

SI

NO

94

2.- Considera usted que la toma de decisiones sobre pedidos de vehculos para la empresa est fundamentada en historiales de ventas?

Frecuencia Porcentaje SI NO 10 48 18% 83%

TOTAL

58

100%

17%
SI NO

83%

95

3.- Usted dispone de informacin relacionada con historiales de ventas de diferentes vehculos?

Frecuencia SI NO 0 58

Porcentaje 0% 100%

TOTAL

58

100%

SI

NO

96

4.-

Cree usted que las decisiones tomadas con informacin de apoyo

relacionada con historiales de venta pueden ser ms acertadas?

Frecuencia Porcentaje SI NO 58 0 100% 0%

TOTAL

58

100%

100%

SI

NO

97

5.- Considera usted que la empresa debera disponer de un software para obtener este tipo de informacin?

Frecuencia SI NO 58 0

Porcentaje 100% 0%

TOTAL

58

100%

100%

SI

NO

98

Entrevista realizada al gerente general. 1. Cree usted que las decisiones que se toman en el plano gerencial estn apoyadas por la informacin necesaria? Me apena tener que manifestarlo as pero realmente las decisiones que se toman son en base solamente a la experiencia del gerente o jefe departamental, es por ello a que a veces las decisiones son tardas o equivocadas.

2. Por qu no se dispone de informacin de apoyo para la toma de decisiones? Generalmente porque la obtencin de una determinada informacin llega muy tarde ya que se les complica a los subalternos poder obtenerla.

3.- Cree usted que una decisin tomada en base a informacin de apoyo puede ser ms adecuada? Considero que si una decisin se toma en base a informacin relacionada con historiales de venta y a ms de ello con la experiencia del ejecutivo esta puede ser ms oportuna y mejor.

4. Creera necesario que la empresa disponga de procesos denominados minera de datos para que se tenga informacin de historiales de ventas que sirvan de apoyo a la toma de decisiones? Creo que la empresa debe disponer de este tipo de software ya que las decisiones son las actividades que direccionan a la Institucin al xito o al fracaso.

99

CAPTULO IV

MARCO PROPOSITIVO

4.1 FUNDAMENTACIN

Para el desarrollo e implementacin del sistema OLAP, se ha utilizado las siguientes herramientas informticas.

MYSQL

es un sistema de gestin de base de datos relacional, multihilo y

multiusuario, desarrollado en su mayor parte en ANSI C con la colaboracin va Internet de trabajadores de todo el mundo.

La idea surge en 1995, cuando David Axmark, Allan Larsson, y Michael "Monty" Widenius fundan la empresa MySQL AB, establecida inicialmente en Suecia. El objetivo de esta empresa era construir un sistema de gestin de base de datos que cumpliese el estndar SQL, pero sin sacrificar velocidad, fiabilidad o usabilidad.

MySQL AB desde enero de 2008 es una subsidiaria de Sun Microsystems, que desarrolla MySQL como software libre en un esquema de licenciamiento dual.

Sus principales caractersticas son:

Definir una base de datos mediante tablas. Almacenar informacin en tablas. Posibilidad de crear y configurar usuarios, asignando a cada uno de ellos permisos diferentes. Facilidad de exportacin e importacin de datos, incluso de la base de datos completa. Realizar cambios en la informacin y estructura de los datos.

100

Combinar y calcular datos para conseguir la informacin necesaria. Posibilidad de ejecutar conjuntos de instrucciones guardadas en ficheros externos a la base de datos. Sub-SELECT(o SELECT anidados). Soporte a multiplataforma. Procedimientos almacenados. Triggers. Cursores. Vistas actualizables.

Para poder extraer la informacin proveniente de la base de datos y obtener datos tiles para la empresa, se utilizar el programa QlikView. Este programa guiar directamente a la toma de decisiones mediante un conjunto de algoritmos internos que permiten encontrar patrones especficos de compras de clientes; este proceso se conoce como Minera de Datos.

QLIKVIEW. Es un sistema muy sencillo de visualizar la informacin al momento y una interfaz extremadamente intuitiva, guiada por simples clic del mouse.

QlikView permite agrupar los datos provenientes de diversas fuentes, y como ste opera totalmente en memoria, la respuesta a cada fuente es sumamente rpida, independientemente del rendimiento del sistema. A medida que aparecen nuevas fuentes de datos disponibles, QlikView ofrece las herramientas para incorporarlas de forma sencilla y fcil, sin necesidad de nuevos diseos de cubos o reconstrucciones totales.

Tiene las siguientes caractersticas:

Acceso a archivos Excel, archivos planos y documentos XML. Acceso ODBC y OLEDB a cada base de datos relacionada. Interfaces estndar con su sistema ERP o almacn de datos. Capacidad para aprovechar definiciones de seguridad y propiciar los derechos de la aplicacin y los datos para los usuarios.

101

Actualizaciones en tiempo real a partir de los sistemas subyacentes de registros sin necesidad de actualizaciones completas.

4.2 DESCRIPCIN DE LA PROPUESTA

La propuesta de solucin al problema de la toma de decisiones consiste en la implementacin de una aplicacin OLAP la cual facilitar la toma de decisiones gerenciales para obtener un mayor beneficio comercial.

Esta aplicacin ha sido desarrollada en diferentes fases, tomando en cuenta la informacin recopilada dentro del proceso de comercializacin que lleva adelante la empresa de manera permanente en base esencialmente a la experiencia del jefe de comercializacin.

4.2.1 METODOLOGA DE DESARROLLO.

Se ha considerado ciertos detalles tcnicos para la creacin y utilizacin del Datawarehouse como: Delimitar el rea de trabajo sobre la cual se va a trabajar en la primera fase del desarrollo. Determinar que sistemas transaccionales estn asociados al rea de trabajo seleccionada. Especificar el origen de los datos operacionales y el modelo de datos fuente. Documentar las bases de datos de los sistemas transaccionales. Determinar las superposiciones y relaciones entre los sistemas transaccionales. Especificar los requerimientos para el soporte a las decisiones (MIS, DSS Y EIS). Estudiar y analizar diferentes herramientas para el sistema OLAP y los diferentes algoritmos de Data Mining que se ajusten al negocio o comercializacin de vehculos. Herramientas de acceso al componente de almacenamiento fsico Datawarehouse. Detallar las diferentes personalizaciones de las herramientas seleccionadas.

102

Puntualizar los mapeos de datos entre Datawarehouse y los sistemas transaccionales. Definir el modelo de datos, requerimientos y arquitectura tecnolgica del Data warehouse.

Disear el Datawarehouse

Especificar la extraccin, transformacin y carga de datos entre los sistemas transaccionales y el Datawarehouse. En donde la extraccin es la seleccin sistemtica de datos operacionales usados para poblar el componente de almacenamiento fsico Datawarehouse, la transformacin es el proceso para convertir, sumarizar y realizar cambios en los datos operacionales para reunir los objetivos de orientacin a los temas a explotar y finalmente la carga es la insercin sistemtica de los datos en el componente de almacenamiento fsico Datawarehouse. Definir las interfaces de usuario para el acceso y explotacin de los datos.

4.2.2 ANLISIS PREVIO

Conociendo la necesidad de contar con una aplicacin que automatice el proceso de toma de decisiones en la empresa Metrocar que permita realizar consultas para obtener datos reales sobre la manipulacin de informacin de compras, ventas, de vehculos, se puede decir que la implementacin de este sistema con seguridad servir de soporte para el crecimientos empresarial generando una ventana competitiva en el mercado, aprovechando de forma oportuna el uso y flexibilidad que nos ofrece las bases de datos multidimensionales gracias a la tecnologa OLAP.

4.2.3 DESARROLLO DE LA PROPUESTA La propuesta de solucin al problema planteado ha sido desarrollada en los siguientes pasos:

103

4.2.3.1. Diseo y Anlisis de la Base de Datos Multidimensional

Para realizar el anlisis de los datos del Datawarehouse se utilizar el algoritmo conocido como Canasta de Mercado cuyo enfoque apunta directamente al negocio de comercializacin de productos en una institucin.

El algoritmo generar datos confiables para la toma de decisiones, tratando de responder dudas e inconvenientes, tales como:

Quienes son los clientes y porque hacen ciertas compras? Que productos tienden a venderse juntos? Conocer que productos deben promocionarse. Basndose en la informacin otorgada por el programa informtico, se podrn tomar ciertas acciones como: Determinar la distribucin de los vehculos en las concesionarias. Determinar qu vehculos poner en oferta. Determinar que cupones de descuento emitir.

Existen dos caractersticas tcnicas del algoritmo Canasta de mercado:

Para predecir un resultado se basa en tcnicas de probabilidad, estadstica y en la frecuencia de ocurrencia de cada transaccin. Genera reglas asociativas, por ejemplo: si un cliente compra un celular, entonces comprar un cargador y/o recargar el saldo disponible.

El funcionamiento del algoritmo para encontrar reglas asociativas que son casi imperceptibles a primera instancia consiste en: Ubicar y extraer la informacin de las transacciones de los clientes. Listar los artculos de cada transaccin. Abstraer los artculos sobre los cuales deseo hacer un anlisis ms profundo.

104

Formar una matriz de concurrencias en cuya casilla ser llenada con el nmero de veces en las cuales los dos artculos se compraron juntos.

Ejemplo: Las interpretaciones que nos mostrar el sistema informtico sern las siguientes: Probablemente, los Jugos de Frutas y las Sodas van a ser adquiridos juntos. Nunca se compra el Detergente con un limpiador de Vidrios o Leche. La Leche nunca se compra con Soda o Detergente.

Como se puede observar, los resultados son claramente entendibles y sobre todo el clculo es fcil de computar, con el cual convierte al algoritmo en una herramienta muy eficiente. En contra punto, presenta ciertas dificultades entre las cuales estn la dificultad para determinar los tems correctos para un anlisis preliminar y sobre todo, es necesario contar con una cantidad de artculos importantes porque se dificulta el trabajo cuando existen pocos tem o en su defecto, cuando ciertos productos no se comercializan frecuentemente.

Ejemplo prctico: Base de datos utilizada: MySql Nombre base de datos: Metrocar. Tablas: Cliente Factura (cabecera y detalle) Producto Proveedor Sucursal Fact table (tabla central que rene la informacin redundante de las dems tablas para generar el datawarehouse)

105

4.2.3.2. Esquema Estrella.

Fig. 4.1 Diagrama Estructural.

106

PANTALLA 4.2 Administrador de conection

PANTALLA 4.2 Creacin de tablas relacionadas

4.2.3.3. Complementos del QLIK VIEW Es una herramienta informtica para extraer la informacin almacenada en el datawarehouse.

PANTALLA 4.3 Pantalla inicial de QLIKVIEW 4.2.3.4 .Establecimiento de la conexin.

107

Se debe crear el script que permite acceder a la base de datos MySQL. Para esto es necesario seleccionar en el Men principal Archivo -> Editor de Script.

PANTALLA 4.4 Permite acceder a la base de datos MYSQL.

PANTALLA 4.5 Crear fuente ODBC.

108

Para conectar a una fuente de datos seleccionar ODBC y presionar el botn Select.

PANTALLA 4.6 Crear fuente ODBC.

PANTALLA 4.7 Seleccionamos origen de datos de equipos para guardar las tablas.

109

PANTALLA 4.8 Sirve para crear nuevo origen de datos.

PANTALLA 4.9 Seleccionamos MYSQL para Conectar la base de datos.

110

PANTALLA 4.10 Damos finalizar a la coneccion MYSQL.

PANTALLA 4.11 Conector/ODBC Dta Source Configuracion

111

En la pantalla precedente se muestra el ingreso del nombre del origen de datos a utilizar, el nombre del servidor (localhost/127.0.0.1/Nombre de PC), el usuario y clave que se crearon en la base de datos MySQL, el nombre de la base de datos; el ingreso se confirma presionando el botn OK. En las siguientes pantallas se ilustra el testeo de la conexin.

PANTALLA 4.12 Seleccionar origen de datos

Conectar a una fuente de datos.

PANTALLA 4.13 Conectar a una fuente de datos

112

4.2.3.5. Seleccin de tablas. Una vez que se cre la conexin, se debe seleccionar las tablas de las cuales se obtendrn los datos; para esto es necesario seleccionar el esquema de la base de datos y, una a una, las tablas y el nombre de las columnas (para todas las columnas). La seleccin de cada tabla y de sus columnas se confirma con el botn Aceptar.

PANTALLA 4.14 Crear sentencia Select

PANTALLA 4.15 Crear sentencia Select opcin cliente

113

La operacin debe repetirse para cada una de las tablas. Una vez que se ha finalizado, se puede visualizar el Script resultante:

PANTALLA 4.16 Editor de Script

El Script se debe confirmar presionando

Aceptar y se debe guardar la

configuracin realizada hasta el momento desde el Men principal mediante la opcin Archivo Guardar.

PANTALLA 4.17 Editor de Script para guardar

114

4.2.3.6. Crear un cuadro de tabla y un grafico pivotante. El Script debe ser ejecutado mediante Ejecutar el Script para obtener los datos; para visualizar el diagrama estrella cargado se debe ingresar a Visor de Tablas, todo ello desde la opcin Archivo del Men Principal.

PANTALLA 4.18 Editor de Script ejecutar script + visor de tablas Lo primero es crear un cuadro de tabla, que permitir ver los datos en forma tabular.

PANTALLA 4.19 Ver datos en forma tabular

115

Luego se podr seleccionar los Atributos de las Dimensiones y las Medidas que se desea ver; la seleccin se confirma presionando Aceptar.

PANTALLA 4.20 Selecciona atributos de las Dimensiones

Si se selecciona algn elemento sobre la tabla resultante, se nota que cambia dinmicamente lo que se muestra en las dems dimensiones o medidas. Para hacer drill sobre las dimensiones se deber crear un grfico pivotante. Para ello se debe seguir los siguientes pasos:

116

PANTALLA 4.21 Nuevo objeto de hoja opcin Grafico

PANTALLA 4.22 Crear el grafico

117

PANTALLA 4.23 Ubicamos el nombre de la tabla.

PANTALLA 4.24. Verificar las unidades vendidas.

118

PANTALLA 4.25. Resultados

Si se selecciona algn elemento de la tabla + -, se nota que cambia dinmicamente lo que muestra en las dems dimensiones o medidas.

4.2.3.7. Cubos.

Es una solucin utilizada en el campo de la llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo es agilizar la consulta de grandes cantidades

119

de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de datos o Sistemas

Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de direccin, minera de datos y reas similares.

La razn de usar OLAP para las consultas es la velocidad de respuesta. Una base de datos relacional almacena entidades en tablas discretas si han sido normalizadas. Esta estructura es buena en un sistema OLTP pero para las complejas consultas multitabla es relativamente lenta. Un modelo mejor para bsquedas (aunque peor desde el punto de vista operativo) es una base de datos multidimensional.

La principal caracterstica que potencia a OLAP, es que es lo ms rpido a la hora de ejecutar sentencias SQL de tipo SELECT, en contraposicin con OLTP que es la mejor opcin para operaciones de tipo INSERT, UPDATE Y DELETE.

En la base de cualquier sistema OLAP se encuentra el concepto de cubo OLAP (tambin llamado cubo multidimensional o hipercubo). Se compone de hechos numricos llamados MEDIDAS que se clasifican por DIMENSIONES. El cubo de metadatos es tpicamente creado a partir del esquema en estrella mencionado anteriormente y un esquema de las tablas en una base de datos

120

relacional. Las medidas se obtienen de los registros de una tabla de hechos y las dimensiones se derivan de la dimensin de los cuadros. 4.2.3.8. Dimensiones. Las Dimensiones son un atributo estructural de los cubos. Estn organizados en jerarquas de categoras y niveles que describen los datos de las tablas de hechos. Estas categoras y niveles describir conjuntos similares de miembros en el que el usuario debe basar un anlisis. Pueden estar basadas en modelos de minera de datos OLAP. Se puede utilizar para almacenar resultados de un anlisis de modelo de minera de datos y puede examinarse dentro del contexto de un cubo virtual. Todas las dimensiones se basan directa o indirectamente en tablas, incluso las que se basan en modelos de minera de datos OLAP. Las dimensiones que se han considerando para este trabajo de investigacin son las siguientes: Id del producto. Id proveedor Id cliente Id sucursal Descripcin del producto

121

4.2.3.9. Medidas. En un cubo una medida es el conjunto de valores de una columna de una tabla de hechos del cubo, valores que suelen ser numrico. Adems, las medidas son los valores centrales del cubo que se analizan. Es decir, las medidas son datos numricos de gran inters para los usuarios finales cuando examina un cubo. Las medidas que se seleccione dependen de los tipos de informacin solicitados por los usuarios.

Las medidas adoptadas para el anlisis del departamento tcnico de la empresa distribuidora de vehculos Metrocar servirn para discrimar las ventas segn la

122

cantidad de productos vendidos (venta en cantidad) o segn el costo del producto vendido (mercado de nicho):

Stock. Costo

4.3 IMPACTO DEL SISTEMA EN LA EMPRESA.

Los mercados estn en un constante cambio; los consumidores se tornan cada da ms crticos; esperan cada vez un mejor producto, ms individualizado y que solucione sus problemas particulares. La Competencia crece cada da ms y nuevos medios de distribucin se apoderan del mercado a una velocidad que no da tiempo para la reaccin. Todos estos factores ejercen una presin sobre la organizacin y la empresa actual.

123

Para poder mantener (y ms que mantener mejorar) una relacin con el cliente, y en consecuencia, mantenerse un liderazgo por sobre la competencia, se hace necesario tener mecanismos de adaptacin a las necesidades del cliente. Es por esta razn que la velocidad y flexibilidad de la organizacin son factores crticos a la hora de definir las ventajas competitivas de la empresa de hoy. Uno de los cambios paradigmticos que se propone es que hoy el cliente en s mismo forma el capital real de la empresa. As, el foco ya no est en el producto sino en los intereses del cliente. Es decir, ofreciendo a nuestros clientes Los productos que ellos necesitan, a travs de los canales de distribucin adecuados y en el tiempo requerido la organizacin podr sobreponerse a los traumticos cambios que se viven en el mercado actual. Para poder lograr estos objetivos (que desde luego no son nada fciles, ni mucho menos triviales) hay que conocer las preferencias de los clientes, que, por si fuera poco, no son las mismas para todos. Aqu juegan un rol importantsimo las bases de datos que pueden albergar gran cantidad de informacin que identificar las necesidades de los clientes. Como ya dijimos, el marketing est cambiando de una estrategia Orientada al producto a una Orientada al cliente. En Lugar de enfocarse en un producto a la vez y tratar de buscar tantos clientes como sea posible que quieran ese producto. La nueva estrategia de marketing se concentra en un cliente a la vez, y trata de maximizar el beneficio de tantos consumidores como ese consumidor en particular existan. En otras palabras, se diferencian clientes, no productos.

124

Para competir en un mercado en que la interaccin es primordial de manera exitosa, la organizacin debe entender como los clientes le agregan valor a la organizacin y ganan valor de la misma. Las Compaas deben saber cmo focalizar el tiempo y esfuerzo en a aquellos clientes que le darn el valor agregado ms alto a la organizacin.

125

V.

CONCLUSIONES.

Las conclusiones que se emiten a continuacin, son obtenidas de la investigacin de campo realizada y tenemos: Las decisiones sobre compras o pedidos de los vehculos muchas veces son inoportunas (demoradas). A veces las decisiones son equivocadas. Las decisiones gerenciales son tomadas en base a la experiencia del gerente o jefe departamental. No se tiene informacin sobre historial de productos o patrones de movimiento comercial. La toma de decisiones no cuenta con informacin de apoyo referida a historial de productos. No se dispone de software que permita obtener historiales de ventas referidos a productos. La aplicacin OLAP permite la optimizacin de tiempo en cuanto al manejo y administracin de base de datos se refiere. Su interfaz de accesible comprensin ayudando de manera fcil y cmoda al usuario. Esta tecnologa informtica es considerada como una herramienta de apoyo al proceso de la toma de decisiones

126

VI.

RECOMENDACIONES

De las conclusiones obtenidas surgen las siguientes recomendaciones: Recomendar que las decisiones sobre compras o pedidos estn mejormente fundamentadas en historiales de ventas de los productos. Implementar procesos de minera de datos para obtener informacin de apoyo a las decisiones de los gerentes o jefes departamentales. Poner este tipo de software al servicio de todos los jefes departamentales. Capacitar al personal en el manejo de este tipo de software. Coordinar con sistemas para que facilite una copia de la base de datos transaccional y all se puede aplicar el software relacionado con la minera de datos. Se recomienda la capacitacin en el del personal de la del Departamento OLAP de y

Comercializacin

manejo

aplicacin

consecuentemente en la interpretacin de los informes. Se recomienda indicar de forma general al personal del Departamento de Comercializacin el manejo y precaucin de la base de datos en Mysql, considerando el ingreso de datos y el formato establecido para cada campo debido a que: No se maneja un solo esquema para el ingreso de datos. No se maneja un solo formato en las celdas por columna considerando los campos.

127

Los datos no son ingresados acorde a los requerimientos de los campos.

Los datos de los campos en un alto porcentaje se encuentran vacos.

Actualizar frecuentemente la base de datos.

128

You might also like