You are on page 1of 22

ALMACEN DE DATOS:

HEALTH CENTERS




06 de junio del 2014


Materia: Almacenes de Datos

Profesor: MSI Esteban Trujillo Jimnez
E

REFERENCIAS


INDICADORES 3
ESQUEMA 4
DICCIONARIO DE DATOS (ENTIDADES -> ATRIBUTOS) 5
TABLA: CITAS 6
TABLA: CENTROS MEDICOS<< >> 6
TABLA: PACIENTES <<TBPATIENTS>> 7
TABLA: PERSONNEL << TBPROFESSIONAL_STAFF>> 8
TABLA: LUGAR DONDE SE ENCUENTRAN LAS CITAS <<TBREF_APPT_LOCATIONS>> 8
TABLA: CALENDARIO << TBREF_CALENDAR>> 9
TABLA: DISCIPLINAS << TBREF_DICIPLINES>> 9
TABLA: TRABAJADORES EN CITA << TBSTAFF_IN_APPOINTMENTS>> 10
DATA WAREHOUSE (DW) 11
MINERIA DE DATOS 15
CONEXIN 16
MINERIA DE DATOS CON MICROSOFT SQL SERVER 17
CONCLUSION 22

ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 3
INDICADORES

Pacientes
Temas:
Cuales es el rea que ms requiere un pacientes.
Sexo (genero) de pacientes ms atiende consultas.
o DimPaciente: Especialidad y conteo
Pacientes por zona.
o Tabla de paciente agrupado por zona
o DimePacZone: Nombre, zona.

Citas
Temas:
Disciplina mas utilizado.
o Only the count of every area
Cantidad de citas por paciente.
o Especialidad, cdigo de paciente y las veces que ha llegado.
o DimCitasPac
Cantidad de citas por donde fue llevado acabo una cita(en la clnica,
domicilio, escuela o una empresa)
o DimCitasLoc
o ID LOC, NombreLoc, count citas por
Total de citas por fecha.


Disciplina
Temas:

Total de disciplinas




ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 4

Esquema
Esquema original de la base de datos

Fig. 1
La imagen superior, fig. 1, es el escema completo de la base de datos. El cual
se utiluzar durante el trabajo para obtener los resultados reqeridos.





ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 5
DICCIONARIO DE DATOS (ENTIDADES -> ATRIBUTOS)

A continuacin se encuentra un ndice en orden alfabtico de la tablas que contiene
la base de datos Community Medical Centers







Tabla: DIRECCIONES
Column name DataType PK NN UQ BIN UN ZF AI
address_id INT
line_1_number_building INT
line_2_number_street VARCHAR(45)
line_3_area_locality VARCHAR(45)
city VARCHAR(45)
zip_postcode INT
state VARCHAR(45)
ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 6
country VARCHAR(45)

Tabla: CITAS

Column name DataType PK NN UQ BIN UN ZF AI
appointment_id INT
location_code INT
patient_id INT
date_and_time DATETIME
medical_notes VARCHAR(100)
other_details VARCHAR(200)

Tabla: CENTROS MEDICOS<< >>

Column name DataType PK NN UQ BIN UN
medical_center_id INT
address_id INT
ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 7
medical_center_name VARCHAR(100)
medical_center_manager VARCHAR(45)
contact_details VARCHAR(100)
other_details VARCHAR(100)

Tabla: PACIENTES <<tbPatients>>
Column name DataType PK NN UQ BIN UN ZF AI
patient_id INT
address_id INT
medical_center_id INT
first_name VARCHAR(45)
middle_name VARCHAR(45)
last_name_F VARCHAR(45)
last_name_M VARCHAR(45)
gender VARCHAR(20)
ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 8
date_of_birth VARCHAR(50)
date_became_patient DATETIME
other_details VARCHAR(100)

Tabla: PERSONNEL << tbProfessional_Staff>>

Column name DataType PK NN UQ BIN UN ZF AI
staff_id INT
discipline_code INT
staff_details VARCHAR(100)

Tabla: LUGAR DONDE SE ENCUENTRAN LAS CITAS
<<tbRef_Appt_Locations>>
Column name DataType PK NN COMMENTS
Location_code INT

Location_description VARCHAR(45)
At home or at Centre

ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 9
Tabla: CALENDARIO << tbRef_Calendar>>
Column name DataType PK NN UQ BIN
day_date_and_time DATETIME
day_number INT

Tabla: Disciplinas << tbRef_Diciplines>>

Column name DataType PK NN UQ COMMENTS
discipline_code INT


discipline_name VARCHAR(45)
discipline_description VARCHAR(100)
Psycholofy, Physio,
Podiatrist, Social
Worker





ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 10
Tabla: TRABAJADORES EN CITA << tbStaff_in_Appointments>>

Column name DataType PK NN UQ BIN
Appointment_id
INT
staff_id INT

















ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 11
Data warehouse (DW)

Relacin con las tablas de dimensiones con el fact table.
Segn Webopedia.com, "The Matrix Bus Enterprise es una herramienta de
planificacin de almacn de datos y el modelo creado por Kimball". Esto nos
permite presentar las relaciones entre grupo de medida (procesos de negocio)
y las dimensiones (por grupo / filtro). Mediante la creacin de una matriz de
autobs es mucho ms fcil entender el objetivo general del almacn de datos
de las personas, tanto tcnicos y de negocios que ayuda mucho a la hora de
entender el uno al otro.






ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 12

Pantalla de MS SQL server para exportar los datos de mi tabla de la base de datos
principal a la tabla de dimensiones necesitada.

La imagen demuestra la pantalla que sigue para transferir los datos.

ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 13












Imagen: Demuestra el xito de la execucin del proceso de una tabla a la otra.



ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 14

Count the los diferentes genders en la tabla dimensin Pacientes.
De acuerdo de los datos obtenido hay, 30 personas con sexo masculino y 191 del sexo
femenino. Todo con un total de 221 pacientes


Una opcin utilizando el modo grafico de MS SQl server para obtener las vistas.
ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 15
MINERIA DE DATOS

DEFINICION: La mineria de datos se puede entender como el proceso a la cual
se mueve a travs de grandes cantidades de datos para obtener informacin
til. La minera de datos utiliza tcnicas de inteligencia artificial, redes
neuronales, y las herramientas estadsticas avanzadas (como anlisis de cluster)
para revelar las tendencias, patrones y relaciones, que de otra manera podran
haber permanecido sin ser detectados. A diferencia de un sistema experto
(que dibuja inferencias a partir de los datos proporcionados sobre la base de
un conjunto dado de reglas) intentos de minera de datos para descubrir las
reglas ocultas que subyacen a los datos. Tambin se llama surf datos.

Existen varias herriamientas tales como:
Weka una herramienta de cdigo abierto para la minera de datos
RapidMiner una herramientam para la minera de datos y textos
KNIME - una plataforma de codigo abierto que se utiliza para la integracin,
procesamiento, anlisis y exploracin de datos
The Mahout machine learning library
Rattle Una interfaz visual para la mineria de datos
MS SQl Server
La herramienta WEKA fue escogida para llevar acabo el ejercicio.




Fig. 2: La pantalla de inicio de WEKA


ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 16
Conexin: Base de datos












Se escribe la URL de la Base de datos usando el conector jdbc:mysql, la ubicacin del
servidor donde se corre mysql, en este caso Localhost, el puerto 3307 y el nombre de
la base de datos.

Al conectar a la base de datos, WEKA se genera el siguiente error. Se ha cambiado a 3
equipos con el sistema operativos, Windows, editando el archivo indicado pero con lo
mismo. Tambien se encuentra el mismo error en mac.
ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 17

MINERIA DE DATOS CON MICROSOFT SQL SERVER
Con miles de datos, necesitamos limpiarlos (eliminar fragmentos intiles,
repetidos, etc.) y organizarlos, y una vez realizado este proceso decimos que
tenemos Informacin.
La informacin hay que tratarla con un modelo para obtener resultados o
conclusiones a los que llamamos Conocimiento. Es decir, el conocimiento es
informacin analizada. Para este anlisis hay diferentes modelos de minera de
datos. Digamos que un modelo es una forma de aplicar un tratamiento a una
cantidad masiva de datos para extraer informacin de ellos. Podemos citar por
ejemplo dos de ellos:
a) Modelo de red neuronal: en una red neuronal tendramos mltiples nodos
que constituyen puntos de entrada de los datos. Esos datos son agrupados y
sometidos a un tratamiento mediante un algoritmo que da lugar a que se
obtengan unos resultados.
De las redes neuronales suele decirse que son cajas negras, porque el proceso
de tratamiento de los datos hasta obtener el resultado no siempre sigue unas
pautas lgicas o comprensibles por el ser humano. Sin embargo, su inters
radicara en que son herramientas tiles para realizar predicciones, por lo que
son usadas en numerosas aplicaciones.
b) Modelo de rbol de decisin: se trata de la aplicacin del conocido
procedimiento del divide y vencers. Sobre los datos, se van realizando
sucesivas bifurcaciones hasta llegar a un resultado. Sigue unas pautas lgicas,
por lo que se dice que es una caja blanca, o proceso comprensible por el ser
humano. A modo de ancdota, podemos citar un juego web denominado
Akinator el genio adivino. El juego consiste en que pensamos en un personaje
y el sistema nos va haciendo una serie de preguntas: por ejemplo, si es hombre
o mujer. Con esta pregunta, se descartan aproximadamente el 50 % de los
items en la base de datos. A continuacin nos puede preguntar si es un
personaje vivo, con lo cual descarta otro porcentaje significativo. En base a
ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 18
bifurcaciones, se llega finalmente al personaje en la base de datos que
corresponde con el que habamos pensado y se produce la adivinacin.
CMO ESCOGER UN MODELO DE MINERA DE DATOS?
No hay un modelo ptimo de tratamiento de datos. Por tanto, el modelo a
elegir depende de las circunstancias y necesidades. Factores a tener en
cuenta son la efectividad del modelo para dar resultados de calidad, y el si
resulta necesario o no que sea comprensible para el ser humano.
En el caso de escoger una red neuronal, las operaciones que se aplican a los
datos hay que determinarlas. Cmo se hace esto? Digamos que
entrenando a la red neuronal (a esto se le llama machine learning o
aprendizaje automtico) a travs de algoritmos de optimizacin de forma que
dados unos datos de entrada, vamos informando al sistema de si el resultado es
ms o menos bueno. En sucesivas iteraciones, el sistema puede alcanzar un
grado de perfeccionamiento adecuado para su explotacin comercial.
LAS BASES DE DATOS Y LA MINERA DE DATOS
Las bases de datos han sido sin duda una herramienta fundamental que ha
permitido la evolucin de la ciencia de la minera de datos. De hecho, a veces
se usa el trmino KDD (Knowledge Discovery in Databases o Descubrimiento
de Conocimiento en Bases de Datos) como sinnimo de minera de datos.
Las bases de datos puede decirse que son una de las tres patas en que se
apoya la minera de datos, y que son: 1. Bases de datos 2. Estadstica y 3.
Algoritmia
VISUAL DATA MINING O MINERA DE DATOS VISUAL
Una aplicacin curiosa de la minera de datos es obtener imgenes
representativas para realizar el anlisis de datos. Esto permite mostrar lo que
ocurre con miles de datos de forma grfica.
GRAN HERMANO (BIG BROTHER) Y LA MINERA DE DATOS
ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 19
La evolucin de la informtica y de las bases de datos permiten el
almacenamiento masivo de datos de una manera que hace unos aos hubiera
sido inimaginable. Esto ha hecho posible el desarrollo de la telefona mvil
(Has pensado cuntos datos maneja una compaa de telefona mvil que a
cada usuario enva una carta con sus datos personales y los datos de las
llamadas realizadas incluyendo nmero llamado, duracin de la llamada,
tarifa, etc.?) o de los buscadores de internet (al fin y al cabo google naci y
basa buena parte de su negocio en la minera de datos).
Las grandes tecnolgicas como Oracle o Microsoft (con SQLServer) tienen
herramientas para hacer minera de datos. Tambin hay herramientas para la
minera de datos en el mbito del software libre.
Ahora bien, esta extraordinaria capacidad tiene obviamente un peligro,
porque es como el Gran Hermano descrito por George Orwell en su novela
1984. Una forma de tener intervenidas las comunicaciones y pensamientos
de las personas. Digamos que la minera de datos permite saberlo todo (o casi
todo): Qu msica se escucha? De qu se habla? Qu prefiere la gente?
Qu preocupa a la gente? Si esto te parece exagerado, piensa en la
cantidad de datos que almacena FaceBook. Las redes sociales tienen una
componente peligrosa porque permiten saber todo lo que hace, le gusta o no
le gusta a la gente.

ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 20

Un model de cluster para visualizer el algoritm. En esta ilustracin se puede ver
varios grupos diferentes.




ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 21

La imagen superior demuestra otro modelo. Consiste en la demostracin de los
datos en la tabla pacientes de la base de datos.




ALMACEN DE DATOS: HEALTH CENTERS

Almacenes de Datos - MSI Esteban Trujillo Jimnez 22
CONCLUSION

El proyecto me dio a conocer el uso de varias herramientas.
Me demuestro que hay difciles y fciles. A los que hacer anlisis muy complejos y no. Aunque me
present con problemas durante el proyecto, me dio ms fuerza para seguir buscando otras maneras
para obtener el mismo resultado con otras herramientas.

You might also like