Informe MINERIA de DATOS Rodriguez Oscar - Enviar

1
2

LECCIN 1
Cada proyecto de Microsoft SQL Server Analysis Services define el esquema para los objetos de
una base de datos de Analysis Services individual. Una base de datos de Analysis Services
contiene estructuras de minera de datos y modelos de minera de datos, modelos
multidimensionales (cubos) y objetos de ayuda, como orgenes de datos y vistas de los orgenes
de datos. En este tutorial usar la base de datos AdventureWorksDW2012 como origen de
datos. Implementar los objetos de minera de datos en una base de datos de Analysis Services
denominada BasicDataMining.
Origen de Datos

Vista de Origen de Datos

ProspectiveBuyer (dbo): la tabla de compradores probables de una bicicleta
vTargetMail (dbo): la vista de datos histricos sobre los compradores de una bicicleta
en el pasado

3

LECCIN 2
Crear una estructura del modelo de minera de datos de distribucin de correo directo
Especificar el tipo de datos y el tipo de contenidos

Especificar un conjunto de datos de pruebas para la estructura

Especificar la obtencin de detalles

4

Agregar los modelos nuevos a la estructura de correo de destino
En esta tarea, definir dos modelos adicionales mediante la pestaa Modelos de minera de
datos del Diseador de minera de datos. Para crear los modelos, se usarn el algoritmo Bayes
naive y el algoritmo de clsteres de Microsoft. Estos dos algoritmos se han seleccionado debido
a su capacidad de predecir un valor discreto (por ejemplo, la compra de una bicicleta).

Procesar los modelos de la estructura de distribucin de correo directo
Al implementar un proyecto y procesar la estructura y los modelos, a las filas individuales de la
estructura de datos se les asigna de forma aleatoria el conjunto de pruebas y entrenamiento a
partir de un valor de inicializacin del nmero aleatorio. Normalmente, el valor de inicializacin
del nmero aleatorio se calcula con los atributos de la estructura de datos. Teniendo en cuenta
los fines de este tutorial, para asegurarse de que los resultados son los mismos que los descritos
aqu, asignaremos arbitrariamente un valor de inicializacin de exclusin fijo de 12. El valor de
inicializacin de exclusin se utiliza para inicializar el muestreo aleatorio y asegurarse de que los
datos se dividen aproximadamente de la misma manera para todas las estructuras de minera de
datos y sus modelos.
Establece el valor de inicializacin de exclusin

Implementar y Procesar los modelos

5

LECCIN 4
Explorar el modelo de rbol de decisin
Pestaa rbol de decisin
En la pestaa rbol de decisin, puede examinar los tres modelos de rbol que componen un
modelo de minera de datos.
Dado que el modelo de correo directo incluido en este proyecto de tutorial contiene un nico
atributo de prediccin, Bike Buyer, solo se puede ver un rbol. Si hubiera ms rboles, podra
utilizar el cuadro rbol para elegir uno diferente.
Al examinar el modelo TM_Decision_Tree en el Visor de rbol de decisin observamos que la
edad es el nico factor ms importante a la hora de predecir la compra de bicicletas. Es
interesante ver que al agrupar los clientes por edad, la siguiente rama del rbol es diferente
para cada nodo de edad. Al explorar la pestaa rbol de decisin podemos concluir que los
compradores con una edad comprendida entre 34 y 40 aos con uno o varios automviles
tienen ms probabilidades de comprar una bicicleta, al igual que los clientes jvenes y solteros
que viven en la regin del Pacfico y que no tienen automvil o tienen uno.
Pestaa red de dependencias

Explorar el modelo de agrupacin de clsteres
Pestaa Diagrama del clster

6

Pestaa caractersticas del clster

Pestaa Distincin del clster

7

Explorar el modelo Bayes naive
Red de dependencias

Caractersticas del atributo

Distincin del atributo
La pestaa Distincin del atributo le permite examinar las relaciones entre dos valores discretos
de la compra de una bicicleta y otros valores del atributo. Dado que el modelo TM_NaiveBayes
solo tiene dos estados, 1 y 0, no tiene que hacer ningn cambio en el visor
8

LECCIN 5
Probar la exactitud con grficos de mejora respecto al modelo predictivo
Elegir datos de entrada

Probar un modelo filtrado
Filtros en tablas de casos

9

Evaluar los resultados

Para probar la mejora en la prediccin de los modelos filtrados

10

LECCIN 6
Crear Predicciones
Crear la consulta
Asignar las columnas

Disear la consulta de prediccin
La pestaa Prediccin de modelo de minera de datos muestra informacin de contacto para los
clientes potenciales que son probables compradores de bicicletas. La columna Probabilidad de
resultado indica la probabilidad de que la prediccin sea correcta. Puede utilizar estos
resultados para determinar a qu clientes potenciales debe dirigirse en el correo.

Informe MINERIA de DATOS Rodriguez Oscar - Enviar

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Informe MINERIA de DATOS Rodriguez Oscar - Enviar

Uploaded by

Copyright:

Available Formats

1

You might also like