You are on page 1of 30

CONTENIDO

Pg.

1
9
15
23

ARTCULO 1

Minera de reglas de asociacin cuantitativa


aplicando anlisis de principales componentes
Karim Guevara Puente de la Vega

Pg.

ARTCULO 2
Evaluacin del uso de energa solar fotovoltaica
en un centro universitario
Abraham Arturo Pacheco Oviedo
Cesar Valdivia Portugal
Cesar Valdivia Llerena

Pg.

ARTCULO 3
Prediccin de la desercin acadmica utilizando
tcnicas supervisadas de minera de datos
Jos Alfredo Sulla Torres

Pg.

ARTCULO 4
Soluciones peridicas a una ecuacin Hamiltoniana
mediante el ndice de Conley
Fermn Flavio Mamani Condori
Adeluz Apaza Valdivia

MINERA DE REGLAS DE ASOCIACIN CUANTITATIVA


APLICANDO ANLISIS DE PRINCIPALES COMPONENTES
Karim Guevara Puente de la Vega
Facultad de Ciencias e Ingenieras Fsicas y Formales
Universidad Catlica de Santa Mara
kguevara@ucsm.edu.pe

ABSTRACT
Mining association rules is a well-researched area,
where many algorithms have been proposed. In this
paper the improved algorithm Rapid Association Rule
Mining (RARM) to which certain characteristics that
would not only generate association rules Boolean
type but also that these rules of association contain
quantitative information is incorporated is proposed,
ie more informative association rules on the amount of
items included in transactions carried out for example
in a supermarket. For this use is the statistical technique
of principal component analysis (PCA), the same that
allows us to discretize the different amounts involved
in transactions and thus incorporate this information
into the association rules. To generate such rules
quantitative association may determine consumer
preferences of customers regarding their shopping,
information not only contains combinations between
items, but the amounts involved of these items are
in each transaction. To test the algorithm proposed
case study of the market basket for a supermarket
was used, from which data were obtained association
rules with quantity indicators for each of them.

Keywords

Mining association rules, mining quantitative


association rules, algorithm Rapid Association Rule
Mining

RESUMEN

La minera de reglas de asociacin es un rea


bien investigada, donde muchos algoritmos han
sido propuestos. En este trabajo se propone la
mejora del algoritmo de Minera de Reglas de
Asociacin Rpida (RARM), al que se incorpora
ciertas caractersticas que permitan no slo
la generacin de reglas de asociacin de tipo
booleanas sino tambin que estas reglas de
asociacin contengan informacin cuantitativa,
es decir, reglas de asociacin ms informativas

respecto a la cantidad de los tems incluidos en


las transacciones que se realizan por ejemplo
en un supermercado. Para ello se hace uso la
tcnica estadstica de Anlisis de Principales
Componentes (PCA), la misma que nos
permite discretizar las diferentes cantidades
involucradas en las transacciones y de esta
forma incorporar esta informacin a las reglas
de asociacin. Al generar este tipo de reglas de
asociacin cuantitativas se podr determinar
cules son las preferencias de consumo de los
clientes respecto a sus compras, informacin
que no slo contenga combinaciones entre los
tems, sino tambin las cantidades involucradas
de estos tems en cada una de las
transacciones. Para probar el algoritmo
propuesto se utiliz el caso de estudio de la
cesta de mercado para un supermercado, a
partir de cuyos datos se obtuvieron reglas de
asociacin con indicadores de cantidad para
cada una de ellas.

Palabras clave

Minera de reglas de asociacin, minera de reglas


de asociacin cuantitativas, algoritmo de Minera de
Reglas de Asociacin Rpida.

1. INTRODUCCIN
La Minera de Datos es el proceso de extraer
conocimiento no explcito de bases de datos. El
objetivo es descubrir situaciones anmalas y/o
interesantes, tendencias, patrones y secuencias
en los datos [6]. Las reglas de asociacin son
una tcnica utilizada por la minera de datos, cuyo
propsito es extraer correlaciones interesantes,
patrones frecuentes, estructuras de asociacin
entre conjuntos de tems en las bases de datos de
transacciones [1]. El trabajo inicial de minera de
reglas de asociacin hecho por Agrawal en [2] y
los subsecuentes trabajos sobre bases de datos,

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

propusieron algoritmos para minimizar el tiempo de


extraccin de estas reglas. Uno de los algoritmos ms
importantes es el denominado Rapid Association
Rule Mining (RARM), cuya caracterstica principal es
la rapidez, dado que ste elimina el cuello de botella
ocasionado por el algoritmo Apriori [2] que es la base
de todos los algoritmos de minera de hoy en da.
Sin embargo, todos estos esfuerzos han sido hechos
orientados a la generacin de reglas de asociacin de
tipo booleana, puesto que la informacin ofrecida por
estas reglas hace referencia, por ejemplo en el caso
de la cesta de mercado, a la relacin de consumo de
uno o ms producto respecto a otro, sin considerar la
cantidad del producto o tem involucrado.
El problema de descubrir reglas de asociacin sobre
datos numricos, introducido en [3] como minado
de reglas de asociacin cuantitativas, ha sido
abordado siguiendo dos esquemas fundamentales:
I) discretizar el dominio de los atributos cuantitativos,
y transformar el problema al minado de Reglas de
Asociacin Binarias [15,17]; II) usar los conceptos
de la teora de los conjuntos difusos para manipular
los valores de los atributos tanto categricos como
cuantitativos (el grado de pertenencia de los valores
de los atributos a los conjuntos difusos es utilizado
en el clculo del soporte y la confianza) [5, 18-26].
En el primer caso, el proceso de discretizacin
de datos nmericos, por lo general consiste en
particionar en intervalos el dominio de los atributos.
Esto conlleva a una prdida de informacin pues si
los intervalos son muy pequeos las ocurrencias de
los intervalos pueden ser pequeas tambin, y no
sobrepasar el umbral para ser frecuentes. As algunos
posibles patrones frecuentes podran perderse
y por consiguiente, reglas interesantes tambin
podran quedar ocultas. Por otro lado, el proceso
de discretizacin puede resultar en intervalos, que
podran no ser semnticamente significativos e
incluso no tener sentido para los expertos humanos.
El esquema basado en conjuntos difusos, a diferencia
de las fronteras duras utilizadas en el esquema de
discretizacin para definir los intervalos, permite
definir fronteras difusas, lo cual aumenta la posibilidad
de modelar las relaciones entre los valores de los
atributos. Adems, incorpora informacin adicional
especfica al problema mediante la definicin de los
conjuntos difusos para cada atributo.
Lo que se quiere lograr mediante el algoritmo
propuesto en este trabajo es la integracin de
la cantidad de tem a la minera. El artculo est
organizado de la siguiente manera: una seccin
de trabajos previos, la seccin de mtodos y
materiales en la que se describe el problema y el
algoritmo propuesto. La seccin de resultados de
los experimentos en la que realiza una descripcin
de estos, posteriormente se discuten los resultados
de los experimentos, para finalmente especificar las
conclusiones y los trabajos futuros que pueden ser
realizados a partir de la propuesta.

TRABAJOS PREVIOS
Desde la introduccin del algoritmo Apriori [2],
hubo un inters sostenido en desarrollar nuevos
algoritmos de minera de reglas de asociacin
que puedan generar resultados de manera ms
eficiente. Es as que el algoritmo RARM [7] hace uso
de una estructura tipo rbol conocida como SupportOrdered Trie Itemset (SOTrieIT) la cual almacena
los datos transaccionales pre- procesados. Esto le
permite a RARM generar 1-itemsets y 2- itemsets
grandes, rpidamente sin escanear la base de datos
por segunda vez y sin la generacin de 2-itemsets
candidatos. Este logra aumentos de velocidad
significativos, porque el principal cuello de botella
de la minera de reglas de asociacin que utiliza la
propiedad Apriori es la generacin de 2-itemsets
candidatos.
Las tcnicas de descubrimiento de reglas de
asociacin son bsicamente booleanas, debido
a que se descartan las cantidades de los tems
comprados y slo se presta atencin a si algo fue
comprado o no. Una excepcin notable es el trabajo
de Agrawal en [3], donde se referencia el problema
de la minera de reglas de asociacin cuantitativas.
Su enfoque es particionar cada atributo cuantitativo
en un conjunto de intervalos que podran traslaparse,
en consecuencia, se aplican tcnicas de minera de
reglas de asociacin Booleanas.

Minera de reglas de asociacin cuantitativa


a)
Enfoque basado en discretizacin
Srikant y Agrawal reportan en [3] el primer algoritmo
para el minado de reglas de asociacin en colecciones
de datos cuyos objetos son descritos por atributos
numricos y no numricos y las denominaron reglas
de asociacin cuantitativas.
La solucin de estos autores consiste en realizar
un particionamiento del dominio de los atributos
numricos y combinar intervalos adyacentes para
disminuir la prdida de informacin inherente al
particionamiento. Luego el problema de minado
de reglas de asociacin en datos numricos es
transformado al problema de minado de reglas de
asociacin en datos binarios, haciendo corresponder
en el problema binario un atributo por cada valor
de cada atributo no numrico, as como por cada
intervalo de cada atributo numrico del problema
cuantitativo. Finalmente, una variacin del algoritmo
Apriori es usado para el minado de los conjuntos
frecuentes de tems, a partir de los cuales son
generadas las reglas de asociacin interesantes
mediante el algoritmo GenRules.
Anlogamente a las reglas de asociacin en datos
binarios, en este enfoque se dice que una regla de
asociacin es interesante si su soporte y su confianza
son mayores o iguales que los umbrales de soporte y
confianza mnimos.
A partir de Srikant y Agrawal varios autores [11, 12,
13-17, 27- 29] se han centrado en cmo discretizar

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

los atributos cuantitativos y en cmo reducir el nmero


de reglas interesantes generadas, siempre teniendo
en cuenta la relacin entre el grado de discretizacin,
el nmero de reglas, el tiempo de ejecucin, y la
prdida de informacin inherente a la discretizacin.
En [11] un enfoque basado en la teora de la
informacin es usado en el proceso de minado de
patrones frecuentes y para esto se construye un
grafo que indica las relaciones informativas fuertes,
a partir de la informacin mutua entre los atributos.
Los cliques en el grafo son utilizados para podar los
conjuntos de atributos no promisorios.
Las tcnicas de agrupamiento tambin han sido
usadas para discretizar el dominio de los atributos
numricos. En [14] el algoritmo adaptativo de
agrupamiento BIRCH [35], es aplicado para
identificar intervalos. En [17] se propone un algoritmo
de agrupamiento para mejorar el particionamiento.
Otro algoritmo, basado en densidad y tipo Apriori, es
propuesto en [27], para agrupar valores del dominio
de los atributos y minar patrones frecuentes.
En [12], otra solucin es reportada, en la cual
los atributos numricos no son inmediatamente
transformados en atributos binarios y el concepto
rea de Inters juega un importante papel en la
obtencin de los patrones frecuentes y las reglas de
asociacin.
Los algoritmos evolutivos tambin han sido usados
para discretizar implcitamente o explcitamente el
dominio de los atributos numricos [10, 13, 28, 29].
b)
Enfoque basado en conjuntos difusos
Los conjuntos difusos son una alternativa para
discretizar el dominio de los atributos numricos y
tambin el dominio de los atributos no numricos.
Los conjuntos difusos [30] pueden ser vistos como
una generalizacin de los conjuntos duros (clsicos).
A diferencia de los conjuntos duros, a los cuales los
elementos pertenecen o no pertenecen, los conjuntos
difusos permiten una gradacin de la pertenencia de
los elementos.
La pertenencia de un elemento del conjunto universo
a un conjunto duro se define mediante una funcin
binaria. Si el valor de la funcin evaluada en el
elemento es 1 (verdadero), entonces el elemento
pertenece al conjunto; si el valor de la funcin
evaluada en el elemento es 0 (falso), entonces el
elemento no pertenece al conjunto.
La teora de conjuntos difusos generaliza las
funciones de pertenencia, ampliando la imagen de
las mismas a un intervalo especificado, tpicamente
[0,1]. En la medida en que el valor de la funcin
evaluada en el elemento est ms cercano a 1, el
elemento pertenecer ms al conjunto, mientras que,
en la medida en que el valor de la funcin evaluada
en el elemento est ms cercano a 0, el elemento
pertenecer menos al conjunto.
Lee y Kwang reportan en [31] el primer algoritmo

para el minado de reglas de asociacin usando


conjuntos difusos. Se asume que por cada atributo
se tienen conjuntos difusos asociados. A partir
ellos son obtenidas reglas de asociacin como la
siguiente: (hamburguesa, precio medio) => (coka,
precio bajo) donde precio medio es uno de los
tres conjuntos difusos asociados al precio de la
Hamburguesa (precio bajo, precio medio, precio
alto) y precio bajo es uno de los tres conjuntos
difusos asociados al precio de la Coka. Sin embargo,
los autores usan un umbral de pertenencia para
transformar los conjuntos difusos en conjuntos
duros y luego resuelven el problema de minado
de reglas de asociacin usando un algoritmo de
minado de reglas de asociacin binarias.
En [24, 32, 33] por cada atributo se tienen conjuntos
difusos asociados. Sin embargo los conjuntos
difusos no son transformados en conjuntos duros.
Las reglas de asociacin son obtenidas a partir de
las combinaciones de conjuntos difusos asociados
a atributos diferentes. El inters de las reglas es
el calculado por medio de una medida llamada
diferencia ajustada.
En [34] los autores se centran en descubrir reglas
ms comprensibles por los especialistas del rea
de aplicacin y definen el factor de significacin y el
factor de certeza (definidos como una extensin del
soporte y la confianza), los cuales son calculados
considerando el grado de pertenencia de cada
atributo a su correspondiente conjunto difuso.

2.

MATERIALES Y MTODOS

Uno de los problemas de las reglas de asociacin


tiene que ver con los tipos de datos tomados en
cuenta al momento de crear las reglas de asociacin
a partir de las transacciones. Una regla de asociacin
es una implicacin de la forma X => Y, donde X, Y
son conjuntos de tems llamados itemsets y X Y
= ; determinando a X como el antecedente y Y el
consecuente.
Existen dos medidas importantes bsicas para las
reglas de asociacin, el soporte (s) y la confianza
(c). El soporte (s) de una regla de asociacin es
definido como el porcentaje sobre la fraccin de
registros que contiene X U Y del total de nmero de
registros en la base de datos. Esto quiere decir que,
el soporte no tiene en cuenta la cantidad del tem.
Debido a que una regla de asociacin de forma
tradicional no considera las cantidades, es que con
este trabajo se propone analizar stas, a travs de
la tcnica de anlisis de principales componentes
(PCA) para proporcionar reglas de asociacin
cuantitativas.
El algoritmo propuesto est basado en el Anlisis
de Componentes Principales. Segn [8], PCA es
una tcnica estadstica, una forma de identificar
patrones en los datos y de expresarlos de manera
que se realce sus similitudes y diferencias. Puesto
que los patrones en datos de alta dimensin
pueden ser difciles de encontrar, donde el lujo de
las representaciones grficas no estn disponibles;

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

PCA es una herramienta poderosa para el anlisis de


estos datos.
El mtodo por medio del cual se aplica PCA tiene
los siguientes pasos, a travs de los cuales se
transformarn nuestros conjuntos de datos en
trminos de reglas de asociacin cuantitativas que
describen ms de cerca las relaciones entre los datos
y las cantidades de estos datos en las transacciones
de la base de datos.
Paso 1: Obtener los datos
Paso 2: Substraer la media de cada una de las
dimensiones. Paso 3:
Calcular la matriz de
covarianza
Paso 4: Calcular los eigenvectores y eigenvalores de
la matriz de covarianza
Paso 5: Seleccionar los componentes principales,
de forma que se reduzca la dimensionalidad sin
prdida de informacin.
Paso 6: Derivar el nuevo conjunto de datos

2.1 Algoritmo para la Minera de Reglas de


Asociacin Cuantitativa aplicando PCA
(MRAC-PCA)

2.2

Algoritmo de Pre-Procesamiento

Para ejecutar el algoritmo de Pre-Procesamiento se


requiere construir el SOTrieIT inicial de la misma forma
cmo se construye un TrieIT. Para construir el SOTrieIT
slo los 1- itemsets y 2-itemsets son extrados de
cada transaccin; despus de que todos los itemsets
de la misma transaccin fueron insertados; el rbol
es ordenado de manera descendente por el nmero
de soporte; el SOTrieIT tiene solamente dos niveles:
uno es para 1-itemsets, el otro es para 2-itemsets.
La figura 3 muestra un ejemplo de SOTrieIT al final
del algoritmo de Pre- Procesamiento. Cada nodo
de esta estructura almacena el par (Ii:s), donde Ii
representa cada uno de los itemsets, y s su soporte.
El algoritmo de Pre-Procesamiento muestra los
pasos realizados cada vez que llega una transaccin.
Por cada transaccin que llega se extraen 1-itemsets
y 2-itemsets. Por cada itemset el SOTrieIT denotado
por Y ser recorrido para localizar el nodo que
almacena su soporte, que es almacenado para los
1-itemsets y 2-itemsets en el primer y segundo nivel,
respectivamente, as como la cantidad para cada
uno de ellos. Ver figura 2.

El algoritmo propuesto se compone de las siguientes


etapas en las cuales se han utilizado diferentes
algoritmos y/o tcnicas que de manera conjunta han
sido aplicados a una base de datos de transacciones
con el objeto de obtener reglas de asociacin
cuantitativas.
Las etapas del algoritmo propuesto se muestran en
la figura 1.

Fig. 2. Algoritmo de Pre-Procesamiento

Fig. 3. SOTrieIT resultante

2.3 Algoritmo de Minera de Itemsets


Grandes

Fig. 1. Etapas del algoritmo propuesto

El algoritmo de Minera de Itemsets Grandes muestra


los pasos realizados cuando el proceso de minera
es iniciado. El SOTrieIT Y es recorrido para descubrir
los 1-itemsets y 2-itemsets grandes. El recorrido
comienza en el primer nivel de izquierda a derecha

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

y ste para cuando se encuentra un nodo que no


satisface el umbral
de soporte mnimo. Despus de ello se utiliza el
algoritmo Apriori para la minera de los dems
itemsets.

Fig. 4

La figura 7 muestra los resultados obtenidos


(Volumen) por los experimentos, en donde:
Para un umbral de soporte mnimo del 2% y
un umbral de confianza mnima del 70% se
obtuvieron 14 reglas booleanas con el algoritmo
RARM y con MRAC_PCA 14 reglas cuantitativas.
Para un umbral de soporte mnimo del 1% y
un umbral de confianza mnima del 70% se
obtuvieron 55 reglas booleanas con el algoritmo
RARM y con MRAC-PCA 52 reglas cuantitativas.
Para un umbral de soporte mnimo del 0.5%
y un umbral de confianza mnima del 70%
se obtuvieron 165 reglas booleanas con el
algoritmo RARM y con MRAC-PCA 150 reglas
cuantitativas.
Para un umbral de soporte mnimo del 0.25%
y un umbral de confianza mnima del 70%
se obtuvieron 555 reglas booleanas con el
algoritmo RARM y con MRAC-PCA 498 reglas
cuantitativas.

Algoritmo de minera de Itemsets Grandes

2.4 Algoritmo Apriori desde la tercera iteracin


Se ha redefinido el algoritmo Apriori donde ya no
se realizarn constantes ledas a la base de datos.
Especficamente, en la funcin recorreTransacciones,
es en donde las cantidades de los tems son extradas
y luego, conforme los contadores de los itemsets
son incrementados, las cantidades respectivas son
puestas dentro del Hash-Tree

Fig. 4. Reglas producidas por RARM y el algoritmo


Propuesto MRAC- PCA

RARM

Fig. 5

Algoritmo Apriori

3. RESULTADOS
Tal como se mencion antes, para probar el algoritmo
se efectuaron cuatro experimentos con diferentes
valores para el umbral de soporte mnimo (2%, 1%,
0.5% y 0.25%) y 70% para el umbral de confianza
mnima.
Los resultados de los casos de prueba se detallan
en esta seccin, teniendo en cuenta el objetivo de
las mismas y el contexto de minera de datos de la
tabla 1.

Regla #1 Habas J&J ==> Apio J&J


De la regla 1 podemos deducir que cuando un
cliente compra Habas J&J tambin compra
Apio J&J.

Regla #9 Apio J&J ^ Lentejas J&J ==> Porro


J&J

De la regla 9 podemos deducir que cuando
un cliente compra Apio J&J y Lentejas J&J,
tambin compra Porro J&J.

Regla #13 Lechuga J&J ^ Lentejas J&J ^


Pimentn J&J ==> Porro J&J

De la regla 13 podemos deducir que cuando

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

un cliente compra Lechuga J&J, Lentejas J&J


y Pimentn J&J, tambin compra Porro J&J.
En cuanto a las reglas obtenidas, se extrajeron 3
reglas del primer experimento, tanto del algoritmo
RARM como del MRAC-PCA, dndoseles a cada
una la siguiente interpretacin.

MRAC-PCA
Regla #1 [ 0.057 - 2.057 ] Habas J&J ==> [
0.542 - 0.587 ] Apio J&J
De la regla 1 podemos deducir que existe una
proporcin directa incremental entre la cantidad
comprada de Habas J&J (kilos) en relacin a la
cantidad de Apio J&J (kilos).
Cov(Habas J&J, Apio J&J) > 0, indica que los
valores altos de Habas J&J estn asociados a
los valores altos de Apio J&J.
Regla #9 [ 0.132 - 0.991 ] Apio J&J ^ [ 1.200
- 0.050 ] Lentejas J&J ==> [ 0.050 - 1.203 ]
Porro J&J
De la regla 9 podemos deducir que existe
una proporcin inversa entre los tems del
antecedente de la regla en relacin a la cantidad
de Porro J&J (kilos), cuya proporcin es
incremental.
Cov(Apio J&J, Lentejas J&J) < 0, indica que los
valores altos de Apio J&J estn asociados a los
valores bajos de Lentejas J&J.
Cov(Apio J&J, Porro J&J) > 0, indica que los
valores altos de Apio J&J estn asociados a los
valores altos de Porro J&J.
Cov(Lentejas J&J, Porro J&J) < 0, indica que los
valores bajos de Lentejas J&J estn asociados a
los valores altos de Porro J&J.
Regla #13 [ 0.203 - 0.908 ] Lechuga J&J ^ [
0.050 - 1.168 ]
Lentejas J&J ^ [ 0.243 - 0.488 ] Pimentn J&J
==> [ 1.239 - 0.05 ] Porro J&J
De la regla 13 podemos deducir que existe una
proporcin directa incremental entre los tems
del antecedente de la regla en relacin a la
cantidad de Porro J&J (kilos), cuya proporcin
es decremental.
Cov(Lechuga J&J, Lentejas J&J) > 0, indica
que los valores altos de Lechuga J&J estn
asociados a los valores altos de Lentejas J&J.
Cov(Lechuga J&J, Pimentn J&J) > 0, indica
que los valores altos de Lechuga J&J estn
asociados a los valores altos de Pimentn J&J.

Cov(Lechuga J&J, Porro J&J) < 0, indica que los


valores altos de Lechuga J&J estn asociados a
los valores bajos de Porro J&J.
Cov(Lentejas J&J, Pimentn J&J) > 0, indica
que los valores altos de Lentejas J&J estn
asociados a los valores altos de Pimentn J&J.
Cov(Lentejas J&J, Porro J&J) < 0, indica que los
valores altos de Lentejas J&J estn asociados a
los valores bajos de Porro J&J.
Cov(Pimentn J&J, Porro J&J) < 0, indica
que los valores altos de Pimentn J&J estn
asociados a los valores bajos de Porro J&J.

4. DISCUSIN
Como se puede apreciar, el volumen de reglas
de asociacin producidas por MRAC-PCA en el
punto anterior, se reduce conforme el Umbral de
Soporte Mnimo disminuye, en comparacin al
algoritmo RARM; esto es, porque el volumen est
sujeto a la covarianza encontrada entre los tems
pertenecientes a una regla, que mide la fuerza de la
relacin lineal entre ellos. Si uno de los valores dentro
de la matriz de covarianza calculada es igual a cero,
entonces, esa regla ser descartada puesto que no
existir relacin lineal alguna. Y as, ya no se tendr
un simple conjunto de reglas, sino, un conjunto de
reglas donde los tems estn ms correlacionados.
La calidad de las reglas de asociacin obtenidas por
MRAC-PCA puede ser medida desde dos puntos de
vista: la precisin y la informacin que ellas proveen.
La precisin de las reglas producidas se da a conocer
mediante los rangos de cantidades obtenidos para
cada tem que compone a una regla determinada. La
tcnica PCA (Anlisis de Principales Componentes)
es la que nos asegura que el conjunto de datos
obtenidos para las cantidades ha sido escogido
de acuerdo a las caractersticas del conjunto de
datos que contribuyen ms, ignorando algunos
conjuntos que no son relevantes. La covarianza
(cov) nos permitir medir el tipo de relacin entre las
cantidades de los tems de una regla.
Estas nuevas reglas son ms informativas que las
reglas obtenidas por RARM, lo cual es claramente
visto en la interpretacin dada a cada regla, debido a
que para el caso de las reglas producidas por RARM
(Reglas Booleanas) slo se tiene como informacin
la relacin que hay entre los tems de la regla y
nada ms, mientras que en las reglas producidas
por MRAC-PCA (Reglas Cuantitativas) se brinda
una informacin ms precisa porque adems de la
relacin entre tems, stas nos proveen la proporcin
de las cantidades de los tems de la regla.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

5. CONCLUSIONES Y TRABAJOS
FUTUROS
Se ha propuesto un algoritmo de minera de reglas
de asociacin cuantitativas basado en el algoritmo
de minera de reglas de asociacin rpida, al cual se
le agrega caractersticas basadas en la tcnica de
Anlisis de Componentes Principales que permiten
que el algoritmo manipule cantidades de tem; cuyas
reglas resultantes de acuerdo a los experimentos
realizados, nos han permitido definir un conjunto de
reglas de asociacin ms informativas y precisas,
debido a la covarianza, nueva medida utilizada para
determinar la calidad de las soluciones, adems del
soporte y la confianza, por medio de la cual se evala
la correlacin de los tems pertenecientes a una regla.
A futuro se sugiere implementar un sistema interactivo
para la minera realizada por el algoritmo propuesto,
de manera que pueda trabajar con un umbral de
soporte dinmico y no se tenga que reiniciar la
minera desde cero, cuando se decida cambiar este
parmetro en medio proceso.
Adecuar el algoritmo propuesto para que realice una
minera de reglas de asociacin cuantitativas con
factor de tiempo, es decir,
que las reglas de asociacin no solo nos informen
sobre las cantidades de los tems, sino que adems
nos permita descubrir patrones secuenciales en el
tiempo

6. REFERENCIAS
[1] Agrawal, R., Imielinski, T., y Swami, A. (1993).
Mining association rules between sets of items
in large databases. In Proceedings of the
1993 ACM SIGMOD International Conference
on Management of Data, P. Buneman and S.
Jajodia, Eds. Washington, D.C., 1993.
[2] Agrawal, R. y Srikant, R. (1994). Fast algorithms
for mining association rules. In Proceeding
20th International Conference Very Large Data
Bases, VLDB, J. B. Bocca, M. Jarke, and C.
Zaniolo, Eds. Morgan Kaufmann, 1994.
[3] Agrawal, R. y Srikant, R. (1996). Mining
Quantitative Association Rules in Large
Relational Tables. In Proceeding of the 1996
ACM SIGMOD Conference, Montreal, Qubec,
Canada, 1996.
[4] Brijs T., Swinnen G., Vanhoof K., and Wets
G. (1999). The use of association rules for
product assortment decisions: a Case Study.
In Proceedings of the Fifth International
Conference on Knowledge Discovery and Data
Mining, San Diego (USA), 1999.
[5] Lopez, F.J., et al.(2008), Fuzzy association rules
for biological data analysis: A case study on
yeast. BMC Bioinformatics. 2008.

[6] Molina, L., (2001). Torturando los Datos Hasta


que Confiesen. Departamento de Lenguajes y
Sistemas Informticos, Universidad Politcnica
de Catalua. Barcelona, Espaa, 2001.
[7] Das A., Ng W., Woon Y. (2001). Rapid Association
Rule Mining. In Proceeding Conference on
Information and Knowledge Management,
Atlanta, Georgia, 2001.
[8] Smith, L. (2002). A Tutorial on Principal
Components Analysis. http://www.cs.otago.
ac.nz/cosc453/student_tutorials/principal_
comp onents.pdf, 2002.
[9] Zhang, Z., Y. Lu,B. Zhang.(1997). An Effective
PartitioningCombining
Algorithm
for
Discovering Quantitative Association Rules,
in First Pacific-Asia Conference on Knowledge
Discovery and Data Mining (PAKDD-97), 1997.
[10] Alatas, B., E. Akin, A. Karci, (2008). MODENAR:
Multi-objective differential evolution algorithm
for mining numeric association rules. Applied
Soft Computing 2008.
[11] K. Ke, J.C., W. Ng,(2006). MIC framework: an
information- theoretic approach to quantitative
association rule mining in ICDE 06, 2006.
[12] Karel, F. (2006). Quantitative and Ordinal
Association Rules Mining (QAR Mining). in
10th International Conference on KnowledgeBased & Intelligent Information & Engineering
Systems (KES 2006). South Coast, UK:
Springer, Heidelberg, 2006..
[13] Salleb-Aouissi, A., C. Vrain, C. Nortet. (2007).
QuantMiner: A Genetic Algorithm for Mining
Quantitative Association Rules. in Twentieth
International Joint Conference on Artificial
Intelligence (IJCAI 2007). Hyderabad, India,
2007.
[14] Miller, R.J., Y. Yang.(1997). Association rules
over interval data. in 1997 ACM SIGMOD
international conference on Management of
Data. Tucson, Arizona, USA: ACM, 1997.
[15] Born, S., L. Schmidt-Thieme. (2004). Optimal
Discretization of Quantitative Attributes
for Association Rules. in Meeting of the
International Federation of Classification
Societies (IFCS). Chicago, USA, 2004.
[16] Fukuda, T., et al. (1996). Mining optimized
association rules for numeric attributes. in
Fifteenth
ACM
SIGACT-SIGMOD-SIGART
symposium on Principles of Database Systems.
Montreal, Quebec, Canada: ACM, 1996.
[17] Zhang, Z., Y. Lu, B. Zhang, (1997). An
Effective Partitioning- Combining Algorithm for
Discovering Quantitative Association Rules,
in First Pacific-Asia Conference on Knowledge
Discovery and Data Mining (PAKDD-97), 1997.
[18] Papadimitriou, S.,Mayroudi, S.(2005). The
fuzzy frequent pattern Tree in 9th WSEAS
International Conference on Computers.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

Athens, Greece: World Scientific and


Engineering Academy and Society, 2005.
[19] Wang, X.,Borgelt, C.,Kruse,R. (2005). Fuzzy
Frequent Pattern Discovering Based on
Recursive Elimination in Fourth International
Conference on Machine Learning and
Applications (ICMLA 05). Los Angeles,
California, USA: IEEE Computer Society, 2005.
[20] Fu, A.W.-C., et al. (1998). Finding fuzzy sets
for the mining of fuzzy association rules for
numerical attributes in First International
Symposium on Intelligent Data Engineering and
Learning (IDEAL98).Hong Kong, China, 1998.
[21] Gyenesei, A., A (2000). Fuzzy Approach for
Mining Quantitative Association Rules, Turku
Centre for Computer Science, 2000.
[22] Tzung-Pei, H., L. Kuei-Ying, W. Shyue-Liang.
(2003). Fuzzy data mining for interesting
generalized association rules. Fuzzy Sets and
System, 2003.
[23] Guoqing, C., W. Qiang, (2002). Fuzzy
association rules and the extended mining
algorithms. Inf. Sci. Inf.Comput. Sci, 2002.
[24] Au, W.-h., K.C.C. Chan. (1999). FARM: A
Data Mining System for Discovering Fuzzy
Association Rules.in 8th IEEE International
Conference on Fuzzy Systems. Seoul, Korea,
1999.
[25] Shitong, W., K.F.L. Chung, S. Hongbin, (2005).
Fuzzy taxonomy, quantitative database
and mining generalized association rules.
Intelligent Data Analysis, 2005.
[26] Serrurier, M., et al., (2007). Learning fuzzy rules
with their implication operators. Data and
Knowledge Engineer, 2007.
[27] Takashi, W., M. Yuki, M. Hiroshi. (2005). Mining
Quantitative Frequent Itemsets Using Adaptive

Density-Based Subspace Clustering. in


Fifth IEEE International Conference on Data
Mining (ICDM05). Houston, Texas, USA: IEEE
Computer Society, 2005.
[28] Mata, J., J.-L.A. Macas, J.-C.R. Santos. (2002).
An evolutionary algorithm to discover numeric
association rules. in 2002 ACM Symposium
on Applied Computing (SAC2002). Madrid,
Spain: ACM, 2002.
[29] Mata, J., J.-L.A. Macas, and J.-C.R. Santos.
(2002). Discovering Numeric Association
Rules via Evolutionary Algorithm. in 6th PacificAsia Conference on Advances in Knowledge
Discovery and Data Mining (PAKDD 2002).
Taipei, Taiwan: Springer, Heidelberg, 2002.
[30] Zadeh, L.A., (2005). Fuzzy Sets. Information
and Control, 2005. [31] Lee, J.-H., H. LeeKwang. (1997). An extension of association

rules using fuzzy sets. in Seventh IFSA World
Congress (IFSA97).

Prague, Czech Republic, 1997.
[32] Chan, K.C.C., W.-H. Au. (1997). Mining fuzzy
association
rules. in Sixth International
Conference on Information and Knowledge
Management. Las Vegas, Nevada, USA: ACM,
1997.
[33] Chan, K.C.C., W.-h. Au. An (1997) Effective
Algorithm for Mining Interesting Quantitative
Association Rules. in 12th ACM Symposium
on Applied Computing (SAC97). San Jose,
California, USA, 1997.
[34] Kuok, C.M., A. Fu, M.H. Wong, (1998). Mining
fuzzy association rules in databases. SIGMOD
Rec.,1998.
[35] Zhang, T., R. Ramakrishnan, M. Livny, (1996).
BIRCH: an efficient data clustering method for
very large databases. SIGMOD Rec., 1996.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

EVALUACIN DEL USO DE ENERGA SOLAR


FOTOVOLTAICA EN UN CENTRO UNIVERSITARIO

Abraham Arturo Pacheco Oviedo

Cesar Valdivia Portugal

Cesar Valdivia Llerena

Facultad de Ciencias e Ingenieras


Fsicas y Formales
Universidad Catlica de Santa Mara

Facultad de Ciencias e Ingenieras


Fsicas y Formales
Universidad Catlica de Santa Mara

Facultad de Ciencias e Ingenieras


Fsicas y Formales
Universidad Catlica de Santa Mara

aapacheco.edo@gmail.com

csrvp@hotmail.com

cesarvaldivia316@hotmail.com

ABSTRACT
The consumption of electricity in the country in
recent years has been increasing considerably and
is expected to follow the growth trend in the coming
years. Photovoltaic solar energy is an alternative to
generate energy, unlike traditional methods, such
as hydropower, power system using resources that
produce pollution in the environment.
It requires an environmental impact assessment
would generate the installation of photovoltaic solar
energy in a university center (Fundo UCSM).
The methodology was applied to simulate the
implementation of solar PV in the farm with the
purpose to determine the layout, number of panels
and other components that determine the investment
required for the current energy consumption in the
farm. Energy consumption was determined from the
average current consumption and considering the
peak consumption months with a tolerance, so that
does not happen shortage in the supply of energy. For
the process of estimating the concenapproximation
to the average value of the area was taken. For
the evaluation of the environmental impacts of the
generation of solar PV analysis of the life cycle (LCA)
was used.
The results obtained for the generation of 5336
GWh of energy using conventional utility power, it is
determined that the greatest environmental impact
is trated radiation in the information provided by
the SENAMI compared with data supplied by other
sources to get a better produced by the generation
of electricity using natural gas, impact of 5 574.70,
without considering other resources. However if
deemed generate photovoltaic solar energy in the
UCSM Fundo, the environmental impact is 1705.39,
much less natural gas only.

Keywords

Photovoltaic Solar Energy, Environmental Impacts

RESUMEN

El consumo de energa elctrica en el pas en los ltimos


aos viene incrementndose considerablemente y se
estima que debe seguir su tendencia al crecimiento
en los prximos aos. La energa solar fotovoltaica
constituye una alternativa de generar energa, distinta
a los mtodos tradicionales, como la hidroenerga,
termoenerga que utilizan recursos que producen
contaminacin en el medio ambiente.
Se requiere evaluar el impacto ambiental que
generara la instalacin de energa solar fotovoltaica
en un centro universitario (Fundo Universidad
Catlica de Santa Mara).
La metodologa aplicada fue simular la
implementacin de energa solar fotovoltaica, en
el fundo con la finalidad de poder determinar el
diseo, cantidad de paneles y dems componentes,
que determinan la inversin requerida para el actual
consumo de energa en el fundo. Se determin el
consumo de energa a partir del consumo actual
promedio y considerando los meses picos de
consumo con un margen de tolerancia, para que
no ocurra desabastecimiento en el suministro de
la energa. Para el proceso de estimar la radiacin
concentrada en la zona se tom la informacin que
proporciona el SENAMI comparados con datos
suministrados por otras fuentes para tener una
mejor aproximacin al valor promedio de la zona.
Para la evaluacin de los impactos ambientales de la
generacin de energa solar fotovoltaica se utiliz el
anlisis del ciclo de vida (ACV).
Los resultados obtenidos para la generacin de 5336
GWh de energa usando energa convencional de la
red, se determina que el mayor impacto ambiental es
el producido por la generacin de energa elctrica
a travs del gas natural, impacto de 5 574.70, sin
considerar los dems recursos. Sin embargo si se
considera generar energa solar fotovoltaica en
el Fundo de la UCSM, el impacto ambiental es de
1705.39, mucho menor del gas natural solamente

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

Palabras clave

Energa solar fotovoltaica, impacto ambiental

1. INTRODUCCIN
El consumo de energa elctrica en el Per se
ha incrementado en los ltimos aos, esto se
puede apreciar en el informe del COES(Comit de
Operacin Econmica del Sistema Interconectado
Nacional) 2011 [1] Resumen Estadstico Anual del
SEIN 2011, donde se observa que la produccin
de energa elctrica en el ao 2011 fue de 35 217,43
GW.h y la del ao 2010 fue 32 426,83 GW.h, lo que
representa un incremento de 8,61% superior al
registrado el ao 2010.
Asimismo, se observa en el informe del COES 2012
[2] en la Tabla 01, que el ao 2012 tambin existe
un incremento de consumo
de
energa
de
5.97% superior al ao 2011. Este incremento
de consumo de energa, est siendo producida
o generada en una mayor proporcin a travs de
Energa Termoelctrica, mtodo convencional de
generacin o produccin de Energa. La generacin
de energa elctrica a travs de la termoenerga
usa recursos No Renovables como D2-Residual,
Carbn y ltimamente Gas Natural. El uso de estos
recursos, produce emisiones de gases como CO2
y otros, que tienen un efecto invernadero y que al
final son causantes de un impacto significativo en
el calentamiento global, aparte de la contaminacin
ambiental que generan.
Tabla 1: Produccin de Energa Elctrica por
Tipo de Generacin
La produccin de energa elctrica en el pas segn
el informe del COES 2012 [2] y que se muestra en
la Tabla 02, muestra un crecimiento importante del
recurso no renovable Gas Natural.

Fuente: COES 2012

Tabla 2: Produccin de Energa Elctrica por


Tipo de Recurso

Fuente: COES 2012

10

Considerando que existe un incremento en el


consumo de energa elctrica en el pas, con una
tendencia creciente en los prximos aos y que este
crecimiento debe ser atendido a travs de generacin
Termoelctrica que debe utilizar el gas natural como
recurso, se estima que la contaminacin del medio
ambiente tambin debe incrementarse.
El uso de la energa solar en nuestro pas es
incipiente y el desarrollo de esta en un futuro
permitir reducir los ndices de contaminacin y de
calentamiento global, por lo que es importante
impulsar el desarrollo de este tipo de energa en
especial la energa solar fotovoltaica, que por la
ubicacin geogrfica y condiciones climticas de
nuestra ciudad existe energa solar en abundancia
en casi todos los das del ao.
El objetivo del trabajo es analizar y evaluar la
generacin de energa solar fotovoltaica en el Fundo
de la Universidad Catlica de Santa Mara a partir
abreviado con las siglas Fundo UCSM para su
autoconsumo y contrastarlos con los que se generan
consumiendo energa convencional de la red, as
como tambin analizar los respectivos impactos
ambientales de este sistema. Esto nos permitir
aplicar la Norma ISO 14040: Anlisis del Ciclo de Vida
(ACV) y medir los impactos ambientales asociados a
la generacin de energa elctrica y de esta manera
impulsar el uso de energas renovables.

2.

MATERIALES Y MTODOS

A partir de los aos 1970 a raz del calentamiento


global, se han dado varios esfuerzos para crear
tecnologa que permita reducir la contaminacin
ambiental y promover un consenso para mejorar
la calidad de vida. Estos esfuerzos de Proteccin
Ambiental han impulsado la implementacin de la
generacin de energa solar fotovoltaica en todo el
mundo con un importante crecimiento en los ltimos
aos.
A raz de este crecimiento de uso de energa solar
fotovoltaica es que surge la idea de implementar el
uso de energa solar fotovoltaica en el fundo UCSM,
para lo cual se determino los componentes que
forman parte del sistema fotovoltaico, a travs de
una investigacin de bibliografa, pginas de Internet
e implementaciones realizadas en el medio, con la
finalidad de poder determinar el diseo y la cantidad
de paneles y dems componentes, que se requiere
para generar el actual consumo de energa del fundo.
Para la determinacin del consumo de energa se
determin a partir del consumo actual promedio
y considerando los meses picos de consumo
con un margen de tolerancia, para que no ocurra
desabastecimiento en el suministro de la energa.
Para el proceso de estimar la radiacin concentrada
en la zona se tom la informacin que proporciona
el SENAMI comparados con datos suministrados por
otras fuentes para tener una mejor aproximacin al
valor promedio de la zona.
La informacin sobre los equipos y sus costos fueron
proporcionados por empresas que vienen realizando
instalaciones similares en la localidad.
Asimismo, para poder determinar los impactos

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

ambientales ocasionados se ha considerado las


Normas que se vienen aplicando en todo el mundo
con la finalidad de contrarrestar el impacto de la
contaminacin ambiental que produce la industria
en general.
Una norma internacionalmente aceptada, es la
norma ISO 14000 (14040 - 14044) que indica como
establecer un Sistema de Gestin Ambiental (SGA),
la cual busca el equilibrio entre la reduccin de los
impactos en el ambiente y el mantenimiento de la
rentabilidad de las industrias.
De acuerdo a norma ISO 14001, en cuanto a la
prevencin de la contaminacin, esta se realiza
con la utilizacin de procesos, prcticas, tcnicas,
materiales, productos, servicios o energa para
evitar, reducir o controlar (en forma separada o en
combinacin) la generacin, emisin o descarga de
cualquier tipo de contaminante o residuo, con el fin
de reducir impactos ambientales adversos [3].

Estimacin de la carga de consumo:

Las cargas de consumo vienen dadas por el


consumo promedio generado por las instalaciones
que corresponden al rea acadmica, el rea del
fundo (ganadera y agrcola) y las que corresponden
a la planta de queso [4], este consumo mensual es el
que se muestra en la tabla 3. En base a este consumo
mensual se ha determinado que el consumo para la
totalidad del fundo es un promedio de 5 336 KWh
por mes.
Tabla 3: Consumo Energa Elctrica mensual
Fundo UCSM

Segn la carga de energa que se tiene en la


actualidad, podemos decir que el consumo promedio
estimado de energa sera:
Considerando un margen del 15%, se tendra que
generar un promedio estimado diario de 224 KWh/
da.
Tabla 4: Consumo promedio Energa
Elctrica a Generar

Fuente: Elaboracin propia

Propuesta de la Implementacin del Sistema


Solar Fotovoltaico
Considerando que la energa a generar en el Fundo
UCSM en la Irrigacin Majes, es para autoconsumo
que satisfaga la realizacin de las actividades
acadmicas, produccin de lcteos, agrcola y
ganadera, la propuesta es implementar un sistema
solar fotovoltaico autnomo (SFA) produce energa
elctrica para satisfacer el consumo de cargas
elctricas no conectadas a la red, empleando un
sistema de acumulacin energtico para hacer
frente a los perodos en los que la generacin es
inferior al consumo [5]. Un Sistema Solar Autnomo,
est compuesto por el generador o paneles solares,
un regulador de carga y descarga, un acumulador
electroqumico o batera, un Inversor o Convertidor
de c.c/c.a. y la Carga.

Figura 2: Esquema de la Propuesta de Implementacin del Sistema


Solar Fotovoltaico [6]
Fuente: SEAL, Recibos Octubre 2012 Fundo UCSM

Componentes del Sistema Solar Fotovoltaico


propuesto

Figura 1: Consumo mensual de energa de la red en el fundo UCSM

Modulo Fotovoltaico
Consiste en una asociacin de clulas protegidas del
medio externo y aisladas del exterior, enmarcadas
en una estructura muchas veces de aluminio,
con la finalidad de tener una resistencia y anclaje
del mdulo. Existe diversidad de mdulos tanto
por su configuracin elctrica, as como por sus
caractersticas estructurales y estticas. En general,
la asociacin de clulas es encapsulada en dos
capas de EVA (etileno-vinilo- acetato), entre una

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

11

lmina frontal de vidrio y una capa posterior de un


polmero termoplstico (frecuentemente se emplea
el tedlar) u otra lmina de cristal cuando se desea
obtener mdulos con algn grado de transparencia
[5].
Dimensionado de los paneles:
Para determinar el nmero de paneles que se
requieren para cubrir el consumo de energa estimada
partimos del clculo de la energa aplicando las
formulas [7], donde:
R: es el rendimiento global

en bornes de la batera, una de las funciones del


acumulador es estabilizar la tensin del sistema y
as evitar uctuaciones dainas en los equipos de
consumo [5].

Dimensionado del Sistema de Regulacin y Control:

El dimensionado del Sistema de Regulacin se


realizar de la manera siguiente:
La potencia de un bloque integrada por 4 mdulos
de paneles es de 7A. Entonces si tenemos un total
de 504 paneles, tendramos 504 / 4 un grupo de 126
grupos de paneles. Si cada grupo tiene una potencia
de 7A entonces tendramos 882A, considerando que
cada regulador debe tener una carga de 49A, esto
nos dara un nmero de 18 Reguladores.

Acumulador Electroqumico
Kb: Coeficiente de perdidas debidas al acumulador
(0,05 no se producen descargas, 0,1 descargas
profundas) Consideramos 0,1. Kc: Coeficiente de
prdidas en el inversor (0,005 condiciones ptimas,
0,1 lejano al optimo) consideradas 0,01
Kv: Coeficiente de otras perdidas (0,05 < Kv < 0,15)
consideradas 0,15
Ka: Coeficiente de auto descarga diaria de bateras
(0,002 baja; 0,005 estacionarias; 0,012 alta auto
descarga) considerada 0,005.
N: Das de autonoma de la instalacin (4 a 10 de
referencia) considerados 4
Pd Profundidad de descarga diaria de la batera 80%,
as considerada.
Donde
Et = 223,94
R = 0,7215
E = 223,94 / 0,7215
E = 310,39
El clculo del nmero de paneles se determina a
partir de [7]:

Wp Intensidad pico HPS Horas sol pico


Np = 310,39 / (0,9 * 0,096 * 7,15) esto es 502,44
mdulos Np = 504 mdulos fotovoltaicos

Dimensionado del Sistema de Estructura de


Soporte:

Para un total de 504 mdulos se requieren estructuras


de soporte con una capacidad de 4 mdulos de 126
estructuras

Regulador de Carga

Un regulador de carga es un equipo electrnico


capaz de evitar la sobrecarga y la descarga excesiva
de un acumulador cuando se alcanzan determinados
umbrales, generalmente determinados por la tensin

12

Es una batera secundaria o recargable, capaz


de almacenar energa elctrica mediante una
transformacin en energa electroqumica. Es capaz
de dar autonoma al sistema fotovoltaico al satisfacer
los requerimientos de consumo en cualquier
momento, independientemente de la generacin.
Tambin contribuye al buen funcionamiento del
sistema al aportar picos de intensidad superiores a
los que proporciona el generador FV y al estabilizar el
voltaje del sistema, evitando uctuaciones dainas
en los equipos de consumo [5].

Dimensionado del Sistema de Acumulacin


(bateras):

La capacidad de acumulacin de la instalacin se


determinar mediante la expresin [7]:

Dnde:
C: Capacidad de acumulacin de Ah. E: Carga de
consumo diario en Ah/da. N: Das de autonoma.
Pd: Profundidad de descarga de la batera, 80%.
Considerando 5 das de autonoma y 20 horas de
trabajo la capacidad de acumulacin es de 8 083 Ah.
Si se requiere que la capacidad de cada batera Cbat
sea de 250 (Ah en 100h) se requiere de:
Nb = 8 083 / 250 = 32,33 aproximando a 33 bateras.

Inversor

Convierte la corriente continua del sistema en


corriente alterna a 220 V, igual a la de la red elctrica
para alimentar de energa elctrica a los aparatos
que trabajan con corriente alterna [5].

Dimensionado del Convertidor Inversor:

La potencia mxima de un Inversor es de 3 kW y


la potencia requerida es de 38.80 kW por lo que
se requiere de 13 Inversores. En lugar de adquirir
esta cantidad de inversores se adquiere el inversor
que supere la cantidad de potencia requerida en
este caso PW 39 000 por lo que debe adquirirse el
superior inmediato PW 60 000.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

Carga

Las cargas tpicas en los sistemas domsticos son


luminarias, radios y televisores, correspondiendo
generalmente a la iluminacin la parte ms
importante del consumo energtico [5]. Para el fundo
UCSM, la carga de energa es la correspondiente
a la iluminacin de aulas, habitaciones y otras
instalaciones, bombas para el uso agrcola, ganadero
y de la planta de lcteos.

3.

Tabla 7: Impacto Ambiental con la


Produccion de Energia Convencional en el
Pais

RESULTADOS Y DISCUSIN

Clculo de la Inversin Requerida

La propuesta de implementacin de un sistema solar


fotovoltaico, requiere una inversin de $ 387 228
dlares, como se determina en la tabla siguiente,
la cual muestra los costos de los principales
componentes a utilizar en el diseo propuesto, aparte
de los costos se considera un costo adicional del
20% del costo de los componentes, utilizados para
los gastos de instalacin, ingeniera y administracin.
Tabla 5: Inversin para la Implementacin de
Energa Solar Fotovoltaica Fundo UCSM

Fuente: Elaboracin Propia

Relacionando el impacto con la produccin a


travs de los ecopuntos se obtiene que de la actual
produccin de energa del pas, el que produce
mayor impacto es el gas natural como se muestra en
la tabla 07 y en la figura 03, esto por que representa
el mayor consumo.

Fuente: Elaboracin Propia

Evaluacin de Impacto

Una de las cualidades del uso de energa solar


fotovoltaica es que constituye una fuente de energa
de abastacimiento inagotable y que contribuye a la
reduccin de los gases de efecto invernadero.
Para la evaluacin del impacto ambiental se
considero que un kWh producido evita la emisin de
gases efecto invernadero [9], con lo que se calculo
los gases de efecto invernadero no emitidos, si se
usa energa solar en lugar de la convencional como
se muestra en la siguiente tabla 06.

Figura 3: Impacto Vs Produccin

Asimismo, con los ecopuntos establecidos los


impactos ambientales que genera el fundo UCSM
por consumir energa convencional de la red, son los
que se muestran en la tabla 08.
Tabla 8: Impacto Ambiental con Energia
Convencional en el Fundo UCSM

Tabla 6: Emisin de Gases no Emitidos a la


Atmosfera

Fuente: Elaboracin Propia

Aplicando la Norma ISO 14040, Anlisis del Ciclo de


Vida [8] y los ecopuntos de impactos ambientales
elaborado por la Asociacin de Productores de
Energa Renovables [10], nos permite establecer
un orden de impacto ambiental de los sitemas de
produccin de energa como se muestra en la tabla
07:

Fuente: Elaboracin Propia

Si la energa consumida por el fundo de la UCSM, es


generada por energa solar fotovoltaica, el impacto
ambiental sera la que se muestra en la tabla 09.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

13

Tabla 9: Impacto Ambiental con Energia Solar


Fotovoltaica en el Fundo UCSM

Fuente: Elaboracin Propia

4.
CONCLUSIONES
FUTUROS

TRABAJOS


La produccin de energa solar fotovoltaica
en el fundo UCSM, requiere de una inversin
aproximada de US$ 387 228 que debe ser evaluada
econmica y socialmente.

El impacto anual de los gases de efecto
invernadero no emitidos por generar energa solar
fotovoltaica en el Fundo UCSM es de CO3 38 419 kg,
SO2 85,16 kg y NOx 106,96 kg.

Aplicando el mtodo ACV de la norma ISO
14040, usando energa convencional de la red, se
determina que el mayor impacto ambiental es el
producido por la generacin de energa elctrica
a travs del gas natural, impacto de 5 574.70, sin
considerar los dems recursos. Sin embargo si se
considera generar energa solar fotovoltaica en el
Fundo UCSM, el impacto ambiental es de 1705.39,
mucho menor del gas natural solamente.

La energas renovables producen un impacto
mucho menor que las energas no renovables, de ah
que es conveniente impulsar su desarrollo, sobre
todo la energa solar fotovoltaica, que es una energa
de poco desarrollo en el pas y que en nuestra ciudad
y departamento tiene niveles altos de radiacin.

5. REFERENCIAS
[1] COES (Comit de Operacin Econmica del
Sistema Interconectado Nacional), Resumen
Estadstico Anual del SEIN 2011, recuperado
desde: http://www.coes.org.pe/dataweb3/2012/
web/avisos/banner/es tadist_anual_2011.pdf
[2] COES (Comit de Operacin Econmica del
Sistema Interconectado Nacional), Resumen
Estadstico Anual del COES SEIN 2012,
recuperado desde: http://contenido.coes.org.pe/
alfrescostruts/download.do?nod eId=4362b8089100-4ed9-a4dd-73e8dc2bf9d6
[3] NORMA INTERNACIONAL ISO 14001, (2008),
Sistemas de Gestin Ambiental, recuperado
desde:http://evlt.uma.es/documentos/
medioambiental/legislacion/ISO_14004_2004.

14

pdf
[4] SEAL, Recibo Luz Octubre 2012 Fundo UCSM
Majes, Oficina de Contabilidad.
[5] Perpin, O, (2012). Energa Solar Fotovoltaica,
Segunda Edicin, Editorial Progensa.
[6] Diaz T, Carmona G. (2010), Instalaciones Solares
Fotovoltaicas, Segunda Edicin, Editorial
McGraw-Hill.
[7] Prado C, (2008), Diseo de un sistema elctrico
fotovoltaico para una comunidad aislada.
[8] NORMA INTERNACIONAL ISO 14040, (2008),
Anlisis del Ciclo de Vida, Principios y Estructura.
[9] Mndez M. J., (2009), Energa Solar Fotovoltaica,
ECA Instituto de Tecnologa y Formacin, FC
Editorial, 7ta Edicin
[10]Asociacin de Productores de Energas
Renovables, (2009), Impactos ambientales de la
produccin de electricidad.
[11] Schallenberg R. Julieta, Piernavieja I. Gonzalo,
(2008), Energas Renovables y Eficiencia
Energtica, Instituto Tecnolgico de Canarias
[12]Colegio
oficial
de
Ingenieros
de
Telecomunicaciones, (2002), Energa Solar
Fotovoltaica, Ibergraphi.
[13] IDAE, (2000), Impactos Ambientales de la
Produccin de Electricidad. Estudio comparativo
de ocho tecnologas de generacin elctrica.
[14] Mndez S. J., Perugache R. C., (2012),
Causalidad y sensibilidad entre precios de los
derechos de emisin europeos y los certificados
de reduccin de emisiones de mecanismos de
desarrollo limpio en el mercado europeo de
transaccin de emisiones.
[15] FJ Rey-Martnez, E. Velasco Gmez, J. MartnGil, LM Navas Gracia y S. Hernndez Navarro,
(2008), Anlisis de Ciclo de Vida de una
instalacin solar trmica en una casa rural en
Valladolid (Espaa).
[16] Elizabeth R. Nesbitt, Paul Thiers, Johnway Gao,
Sharon Zapatero, Manuel Garcia-Perez, Julie
Carrier, Joy Doran- Peterson, John Morgan,
Wang Guangyi, Pierre cristiana Wensel,
Shulin Chen, (2011), La visin de China de la
energa renovable: el estado de la bioenerga y
bioproductos investigacin y comercializacin.
[17] Mohamed A. Hadi, Refaat H. Abdel-Razek, Walid
M. Chakroun, (2013), Evaluacin Econmica del
Uso de la Energa Solar en Kuwait.
[18] Kevin Yessian, Pat DeLaquil, Bruno Merven,
Lightbridge Corporation, (2013), Anlisis
Econmico de Opciones de Energa Limpia para
Kuwait.
[19] M. Mikati, M. Santos, C. Armenta, (2012),
Modelado y Simulacin de un Sistema Conjunto
de Energa Solar y Elica para Analizar su
Dependencia de la Red Elctrica..

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

PREDICCIN DE LA DESERCIN ACADMICA UTILIZANDO


TCNICAS SUPERVISADAS DE MINERA DE DATOS
Jos Alfredo Sulla Torres

Facultad de Ciencias e Ingenieras


Fsicas y Formales
Universidad Catlica de Santa Mara

jsullato@ucsm.edu.pe

ABSTRACT
Educational Data Mining (EDM) is used to study the
data available in the educational field and discover
the hidden knowledge in it. The classification methods
such as decision trees, mined rules, Bayesian network,
etc. can be applied to educational data to predict
the behavior of students, examination performance,
dropout, etc. This prediction will help the authorities
to identify the dropout students and to determine the
projected opening of groups or sections and other
actions. The decision tree algorithm applies J48
original data evaluating students to predict whether or
not drop out. The result of the decision tree predicted
the number of students who are likely to leave the
race. The result can be used by the authorities so
they can take steps to improve decision making.
After evaluation with the original data set of test data
is entered into the system to analyze the results. The
comparative analysis of the results indicates that the
prediction has helped determine more precisely the
improvement in the result. To analyze the accuracy
of the algorithm, compared with the algorithm
RandomTree and was found to be as efficient in terms
of accuracy of student academic results and the time
taken to create the tree.

Keywords

Educational Data Mining, Data Mining Techniques,


Supervised Algorithms.

RESUMEN

La Minera de Datos Educacional (MDE) es usada


para estudiar los datos disponibles en el campo
educativo y descubrir el conocimiento oculto en
ella. Los mtodos de clasificacin como rboles de
decisin, las reglas minadas, red bayesiana, etc. se
pueden aplicar a los datos educativos para predecir
el comportamiento de los estudiantes, el rendimiento
en los exmenes, desercin estudiantil, etc. Esta
prediccin ayudar a las autoridades para identificar
la desercin de estudiantes y poder determinar la
proyeccin de apertura de grupos o secciones y

otras acciones. El algoritmo de rbol de decisin J48


se aplica en los datos de evaluacin original de los
estudiantes para predecir si abandona o no los estudios.
El resultado del rbol de decisin predijo el nmero de
estudiantes que son propensos a abandonar la carrera.
El resultado lo pueden utilizar a las autoridades para
que puedan tomar las medidas para mejorar la toma
de decisiones. Despus de la evaluacin con los datos
originales se introducen un conjunto de datos de prueba
en el sistema para analizar los resultados. El anlisis
comparativo de los resultados indica que la
prediccin ha ayudado determinar con mayor precisin
el mejoramiento en el resultado. Para analizar la exactitud
del algoritmo, se compara con el algoritmo RandomTree
y se encontr que es tan eficiente en trminos de
precisin de los resultados acadmicos del estudiante
y el tiempo tomado para crear el rbol.

Palabras clave

Minera de Datos Educacional, Tcnicas Minera de


Datos, Algoritmos Supervisados

1. INTRODUCCIN
La minera de datos se ha implementado con xito en
el mundo de los negocios desde hace algn tiempo,
pero su uso en la educacin superior es todava
relativamente nuevo, su uso est destinado a la
identificacin y extraccin de conocimiento nuevo y
potencialmente valioso de los datos. EDM es el proceso
de transformacin de datos originales reunidos por los
sistemas educativos en informacin til que pudiera
ser usado para la toma de decisiones y respuesta a las
preguntas de investigacin [1]. En el ambiente tradicional
de enseanza/aprendizaje, el rendimiento y anlisis
del comportamiento se llevan a cabo sobre la base de

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

15

registros de observacin y de papel utilizados. Este


sistema tiene los inconvenientes tales como que no
puede satisfacer las necesidades de cada alumno,
as como falta de aprendizaje dinmico que puede
ser mejorada mediante el uso de cinco pasos de
un proceso de anlisis acadmico, tales como la
captura, informe, predecir, actuar y refinar. El Anlisis
Predictivo es el proceso de tratar con variedad de
datos y aplicar diversas frmulas matemticas para
descubrir la mejor decisin para una situacin dada.
El anlisis predictivo da a la institucin una ventaja
competitiva. Para las instituciones de educacin,
cuyo objetivo es contribuir a la mejora de la calidad
de la educacin superior, el xito de la creacin de
capital humano es el sujeto de un anlisis continuo.
Por lo tanto, la prediccin de xito de los estudiantes
es fundamental para las instituciones de educacin
superior, porque la calidad del proceso de enseanza
es la capacidad de satisfacer las necesidades
de los estudiantes. El anlisis predictivo abarca
una variedad de tcnicas de minera de datos, las
estadsticas, que analizan los hechos actuales e
histricos para hacer predicciones sobre eventos
futuros. El trmino predictivo de minera de datos se
aplica generalmente para identificar los proyectos
de minera de datos con el objetivo de identificar un
modelo de red neuronal o estadstica o un conjunto
de modelos que se puede utilizar para predecir
algunas respuestas de inters. Por ejemplo, una
institucin educativa que desea, puede utilizar
los datos
con prediccin minera, para obtener
un modelo que pueda identificar rpidamente el
ndice de desercin acadmica. La calidad de la
educacin superior implica proporcionar servicios
que probablemente satisfagan las necesidades de
los estudiantes y otros participantes en el sistema
del proceso educativo [2]. Los participantes en el
proceso educativo a travs de sus actividades crean
una gran cantidad de datos que son almacenados
e integrados y utilizados. Todos los participantes en
el proceso educativo podran beneficiarse aplicando
minera de datos a la enorme cantidad de datos
acadmicos almacenados. Dado que la minera de
datos representa el proceso de datos computacional
desde diferentes perspectivas, con el objetivo de
extraer muestras implcitas e interesantes [3], las
tendencias y la informacin de los datos, pueden
ayudar mucho a todos los participantes en el proceso
educativo para mejorar el entendimiento del proceso
de enseanza y descubrir, detectar y explicar el
fenmeno de la educacin [4].
Existen numerosas investigaciones sobre EDM. El
trabajo de S. Anupama Kumar y Vijayalakshmi [5]
utiliza el algoritmo de rbol de decisin C4.5 a las

16

calificaciones iniciales de los alumnos para predecir


el nmero de alumnos quienes aprobarn los cursos,
y luego lo aplica a las calificaciones finales. El anlisis
comparativo de los resultados lo realiza de acuerdo a la
precisin del algoritmo comparndolo con el algoritmo
ID3 encontrando quien es ms eficiente en trminos de
precisin predictiva y tiempo que toma construir el rbol.
Edin Osmanbegovi y Mirza Sulji [6] compara las
diferentes tcnicas y mtodos de prediccin en la
aprobacin de los estudiantes, la aplicacin de los
datos obtenidos de las encuestas realizadas durante
el semestre de verano de la universidad de Tuzla, en la
facultad de economa, durante el ao acadmico 20102011, los datos fueron tomados durante la inscripcin
entre los estudiantes de primer ao. La prueba se evalu
con la calificacin aprobatoria en el examen. El impacto
de las variables socio-demogrficas de los estudiantes
y las actitudes hacia el estudio puede tener un efecto en
aprobacin, todos fueron investigados.
En el trabajo de Minaei-Bidgoli y D.A Kashy [7] presenta
un enfoque para clasificar a los alumnos con el fin de
predecir su calificacin final en base a las caractersticas
extradas de los datos registrados en un sistema
educativo basado en la Web. Se dise, implement
y evalu una serie de clasificadores de patrones y
compar su rendimiento en un conjunto de datos de
un curso en lnea. Usa una combinacin de mltiples
clasificadores que conduce a una mejora significativa
en el rendimiento de clasificacin. Adems, al aprender
una ponderacin adecuada de las funciones utilizadas
a travs de un algoritmo gentico (GA), mejorando an
ms la precisin de la prediccin. El GA demuestra que
mejora con xito la exactitud del rendimiento clasificador
combinado, alrededor del 10 al 12% cuando se compara
con un clasificador que no utiliza GA. Este mtodo
puede ser de gran utilidad en la identificacin de los
estudiantes en situacin de riesgo inicial, especialmente
en las clases muy grandes.
Mohammed M. Abu Tair y Alaa M. El Halees [8] en
su trabajo utiliza la minera de datos para mejorar el
rendimiento educativo de los estudiantes graduados y
superar el problema de las bajas calificaciones de los
estudiantes de posgrado. En este caso de estudio,
extrae conocimiento til a partir de los datos recogidos
de estudiantes graduados de la universidad de Ciencia
y Tecnologa - Khanyounis. Los datos incluyen un
perodo de quince aos [1993-2007]. Despus del
pre-procesamiento de los datos se aplic las tcnicas
de minera de datos para descubrir la asociacin,
clasificacin, clustering y reglas de deteccin de valores
atpicos; en este caso la inclusin de otras tcnicas
de minera de datos hace que tenga un espectro ms
amplio de los resultados y pueda tener otros puntos
adicionales sobre sus resultados.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

En el trabajo de Cristbal Romero, Sebastin Ventura,


Pedro G. Espejo y Csar Hervs [9] se comparan
los diferentes mtodos y tcnicas de minera de
datos para clasificar a los alumnos en funcin de
sus datos de uso en el Moodle y la calificacin final
obtenida en sus respectivos cursos. Se desarroll
una herramienta de minera especfica para hacer
la configuracin y ejecucin de tcnicas de minera
de datos ms fcil para los instructores. Se utilizaron
los datos reales de siete cursos del Moodle con
estudiantes de la Universidad de Crdoba. Tambin
se ha aplicado discretizacin y tcnicas de preprocesamiento para rebalancear los datos numricos
originales con el fin de verificar si se obtienen mejores
modelos de clasificadores. Un modelo clasificador
apropiado para uso educativo tiene que ser preciso
y comprensible para los instructores con el fin de ser
de utilidad para la toma de decisiones.
Por tanto, por medio del uso de las tcnicas
supervisadas de minera de datos es posible clasificar
y predecir la desercin acadmica de los alumnos.
En ese sentido el estudio presenta los siguientes
objetivos: Analizar las tcnicas supervisadas de
rboles de decisin de minera de datos para la
prediccin de desercin acadmica, seleccionar las
tcnicas ms adecuadas para un caso acadmico
(C4.5 y RandomTree) para comparar cul de ellos
es el que nos da los mejores resultados en un caso
de prueba de gestin acadmica de la Universidad
Catlica de Santa Mara de Arequipa.

2.

MATERIALES Y MTODOS

El presente estudio se realiz con los datos


acadmicos de los alumnos del programa profesional
de Ingeniera de Sistemas de la Universidad Catlica
de Santa Mara de Arequipa, comprendida entre los
aos 2004 y 2008.
La herramienta de Minera de Datos utilizada fue
Weka (The Waikato Environment for Knowledge
Analys), que nos presenta diferentes algoritmos la
cual la utilizamos para evaluar nuestra propuesta.
Weka es un conjunto de libreras Java para la
extraccin de conocimiento desde las bases de
datos [1] [4], esta incluye: Diversas fuentes de datos
(ASCII, JDBC), interfaz visual basado en procesos/
flujos, distintos algoritmos de Minera de Datos,
manipulacin de datos, combinacin de modelos y
entorno de experimento del cual slo presentaremos
el mdulo Explorer que es el que se va a utilizar en el
presente trabajo.
La metodologa utilizada fue la de CRISP-DM
(Cross Industry Standard Process for Data Mining)
[10], siguiendo las fases y tareas que propone,
comenzando con la comprensin del negocio,
seguida de la comprensin de datos, luego la
preparacin de datos, realizamos el modelado para
luego realizar la evaluacin y desarrollo.

A.Comprensin del negocio


Esta fase inicial se enfoca en entender los objetivos
y requerimiento del proyecto convirtiendo esto en la
definicin del problema de minera de datos.

a) Determinacin de objetivos de negocio.

La Universidad Catlica de Santa Mara (UCSM)


es una comunidad integrada por profesores,
estudiantes, y graduados. Se dedica al estudio, la
investigacin, la educacin, la difusin del saber, la
cultura, y a la extensin y proyeccin social, bajo la
inspiracin de la fe cristiana.
Tiene como objetivos, entre otros, de docencia y de
gestin integral:
ndices
adecuados
de
postulante/
ingresante,
Programas profesionales acreditados,
Mejora permanente de los servicios de
apoyo acadmico.
Racionalizacin de procesos y funciones.
Presupuesto equilibrado y sostenible

b) Evaluacin de la situacin.

En el mbito universitario, la UCSM adolece de la


problemtica de una tasa significativa de desercin
estudiantil por diferentes motivos, no todos
conocidos, lo que ocasiona que se enfrente a esa
situacin cada vez que se presente, afectando la
planificacin realizada por cada unidad acadmica.
Los datos de los alumnos son capturados desde el
momento en que ingresa a la Universidad, llenando
una ficha de matrcula donde figuran los siguientes
atributos: Nombre y Apellidos, Direccin de vivienda,
Numero de hermanos; de la Oficina de Admisin se
recaban los atributos: Puntaje de Ingreso, Opcin de
ingreso, Categora.
Estos atributos han sido almacenados en diferentes
fuentes de datos a lo largo del tiempo y se ha
centralizado en la oficina de Informtica de la
Universidad.
Los recursos inicialmente disponibles son los
siguientes:
Materiales: Hardware como una computadora
personal y Software con Weka versin 3.7.11
como herramienta de Minera de datos y Latex
como editor de documentos cientficos.
Humanos: El autor de la investigacin, El Jefe
de la Oficina de Informtica, El Asesor de la
investigacin,
Datos del trabajo: Se dispone de una serie de
datos acadmicos de los alumnos del programa
profesional de Ingeniera de Sistemas de la
UCSM comprendida entre los aos 2004 y 2008
que hacen un total de 651 registros de alumnos
y 40067 registros de calificaciones.

c) Determinacin de los objetivos de la Minera


de datos.

Objetivo de minera de datos: Dar soporte mediante


tcnicas de Minera de datos a los objetivos de la
investigacin
Objetivos especficos en la investigacin:

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

17

Realizar un estudio estadstico genrico de


los datos.
Encontrar la cantidad de alumnos que
pertenecen a la categora de abandono o no
abandono.
Conocer estos objetivos permitir determinar
de una mejor manera la planificacin en la
apertura y distribucin de secciones y grupos
de las asignaturas.

B.

Comprensin de los datos

a)

Recoleccin de los datos iniciales.

Los datos iniciales fueron proporcionados por la


Oficina de Informtica de la Universidad Catlica de
Santa Mara, los cuales se recogieron en diferentes
modalidades y momentos. Cuando un postulante
desea ingresar a la Universidad se recaba cierta
informacin, cuando el postulante alcanza un vacante
y se matricula en un Programa Profesional se recoge
otro tipo de informacin mediante un formato de
ficha de matrcula.
Estos datos fueron entregados en el formato de una
hoja de clculo Excel como sigue:
Pestaa ALUMNOS_SISTEMAS:
Campos:
Cdigo
Apellidos
Nombres
Categora
Opcin
Puntaje
Fech. Nac. (Fecha de Nacimiento)
Sexo
Direccin
Departamento
Provincia
Distrito
Est. Civil (Estado Civil)
Hijos
Vive solo
Pestaa CALIFICACIONES:
Campos:
Cdigo (Alumno)
Cod_Asi (Cdigo de la Asignatura)
Asignatura
Cre_Teo (Crditos Tericos)
Cre_Pra (Crditos Prcticos)
Semestre
Nota1 (Nota de Teora 1)
Nota2 (Nota de Teora 1)
Nota3 (Nota de Teora 1)
Pract1 (Nota de Prctica 1)
Pract2 (Nota de Prctica 2)
Pract3 (Nota de Prctica 3)
Aplazados (Nota de Aplazados)
Pro_Pra (Promedio de Prctica)
Promedio (Promedio de la Asignatura)

b)

Describir los datos

Los datos proporcionados por la Oficina de


Informtica, fueron entregados en un archivo de hoja

18

clculo Excel correspondiente a los alumnos desde


el ao 2004 hasta el ao 2008, esto con motivo de
manejar sus notas de los que debieron acabar sus
estudios en el lapso de los 5, 6, 7 aos en algunos
casos.
Todos los campos listados en el punto a) tienen un
formato de campo del tipo TEXTO, ya que al parecer
los datos solicitados a la Oficina de Informtica fueron
recabndose de diferentes tablas y se juntaron en
una hoja de clculo.
Los datos solicitados fueron en una mayor cantidad
a los listados en el punto a) en muchos de los casos
no se cuenta con algunos datos como el Estado
Civil, si tiene Hijos, Vive solo.

c)

Explorar los datos.

d)

Verificar la calidad de los datos

C.

Preparacin de datos

Al realizar la exploracin de los datos, se apreci


que se necesitaba algunos campos que sirvan como
referencia significativa del alumno y luego se pueda
utilizar como fuente de entrada para los modelos en
Weka, para ello se tuvo que realizar las siguientes
actividades:
Transformar los campos necesarios del
tipo Texto a su correspondiente tipo real, como
por ejemplo el Promedio de cada asignatura
convertirlo a tipo Numrico.
Generar nuevos campos como Promedio
Final de todos los cursos para cada alumno,
asignaturas
Aprobadas
y
asignaturas
Desaprobadas.
En esta tarea se observ que existan algunos
registros de alumnos:
No tenan notas ni promedio alguno por lo
que se procedi a identificarlos y omitirlos.
Algunas notas figuran con un smbolo de -- o
NC (Aplazados) que representa que no tienen
nota, por tal motivo no se podan procesar
numricamente.

En esta etapa se convierte todas las actividades


para construir la base de datos final (datos que
alimentarn a la herramienta de modelamiento).
Para ello se procedi a crear una base de datos en
Microsoft SQL Server y a migrar los datos de la Hoja
de Clculo a la nueva base de datos, adems, la
preparacin tratar de:
Eliminar valores anmalos, inconsistencias,
valores ausentes, etc.
Seleccionar datos a tratar.
Modificar valores para su mejor tratamiento
en funcin del algoritmo.

a)

Seleccin de datos

La seleccin de los datos permiti distinguir:


primero, que los campos que no tenan valor alguno
(Direccin, EstadoCivil, Hijos, ViveSolo) se omitan,
segundo, para aquellos registros que no estn
relacionados (alumnos que no tienen notas) no se
consideren, de tal forma que solo se utilicen los
datos que nos sirvan para el minado.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

b)

Limpieza de datos

Las tareas de limpieza de datos a realizar son:


Conversin de tipos: El campo de Promedio
se convirti de tipo de dato Texto a numrico.
Modificar datos errneos: algunos smbolos
especiales por el alfabeto utilizado en la fuente
de datos.
Aadir datos faltantes.
Trimming: Eliminar espacios sobrantes antes
y despus de las cadenas.
Transformacin ETL para la obtencin de la Vista
minable:
Para lograr ello se utiliz el proceso ETL (Extraer,
Transformar y Cargar) que permite mover datos
desde diferentes fuentes, reformatearlos y limpiarlos,
y cargarlos en otra base de datos, para analizar, o
en otro sistema operacional para apoyar un proceso
de negocio. La herramienta utilizada fue SQL Server
Business Intelligence Development Studio, como se
aprecia en la Fig. 1.

e)

Formatear datos

El formateo de los campos se ha realizado para tener


una mejor comprensin en el aspecto sintctico
sin cambiar su significado, dndole nuevas
denominaciones y etiquetas ms comprensibles.

D. Modelado
a)

Seleccin de la tcnica de modelado

b)

Generacin de la prueba de diseo

c)

Construccin del modelo

Antes de seleccionar el modelo apropiado, debemos


de enfocarnos en nuestro objetivo: Cul el propsito
de buscamos?, el propsito que buscamos es la
prediccin de la desercin acadmica.
A continuacin decidimos el tipo de prediccin ms
apropiado, que ser el de clasificacin que predice
en que categora o clase caer el resultado, en
nuestro caso ser de Abandona y No abandona.
Entonces nuestro modelo elegido ser un rbol de
decisin para la clasificacin.
Para ello comparamos algunos clasificadores
populares: J48 es una implementacin open source
en lenguaje de programacin Java del algoritmo C4.5
en la herramienta Weka de minera de datos. Luego
tambin utilizaremos RandomTree para realizar la
tarea comparativa.
Se ha generado un archivo de prueba con registros
adicionales, para las tareas de Minera de datos
supervisadas como clasificacin, por lo tanto se
separa el conjunto de datos en datos originales
y datos de prueba, se construye el modelo sobre
el conjunto originales, y se evala el resultado del
conjunto de prueba.

Fig. 1. ETL para generar el Promedio Final y la cantidad de Aprobados y Desaprobados

c)

Construir datos

d)

Integrar datos

La construccin de los datos ha permitido generar


las cuatro tablas que permitan organizar mejor
lo datos quedando como sigue: ASIGNATURAS,
CALIFICACIONES, ALUMNOS y ALUMNOS_
DETALLE. La tabla ALUMNOS_DETALLE es la que
se va a utilizar en la Herramienta de Minera de Datos
WEKA, para ello se ha generado el correspondiente
archivo
.cvs (comma-separated values) con los
siguientes campos: Codigo, Categora, Puntaje,
Aprobados, Desaprobados, TotalCursos, PromFinal,
Abandono.
La integracin de los datos se ha realizado para
obtener la tabla ALUMNOS_DETALLE que es la que
finalmente se ha utilizado para aplicar la Minera de
datos, en esta se encuentra los siguientes atributos:
Cdigo, Categora, Puntaje (Puntaje de ingreso),
Aprobados (Asignaturas aprobadas), Desaprobados
(Asignaturas desaprobadas), TotalCursos (Total de
Asignaturas), PromFinal (PromedioFinal) y Abandono
(Si / No).

Para llevar a cabo el objetivo de esta investigacin,


aplicaremos minera de datos usando el paquete de
software Weka.
Los datos de entrada a la herramienta, sobre los que
operarn las tcnicas implementadas, deben estar
codificados en un formato especfico, para nuestro
caso fue .csv, que es un tipo de documento en
formato abierto sencillo para representar datos en
forma de tabla, en la que las columnas se separan
por comas y las filas por saltos de lnea, como se
aprecia en la Fig. 2.

Fig. 2.Archivo .csv con los atributos cargados en Weka

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

19

3. RESULTADOS
El principal objetivo del anlisis predictivo es la
mejora de la actividad acadmico del estudiante. El
algoritmo de prediccin J48 se analiza usando los
siguientes mtodos [5].

La matriz de confusin obtenida con el algoritmo


RandomTree:
Tabla 2. Matriz de confusin obtenido por el
algoritmo RandomTree.

a) La precisin del algoritmo es medido usando


la comparacin de los datos originales con los de
prueba de los estudiantes.
b) La eficiencia del algoritmo es medido
comparando el algoritmo J48 con el algoritmo
RandomTree.
Los datos obtenidos de los archivos acadmicos de
la Universidad son alimentados dentro del algoritmo
J48 para analizar su eficiencia. El algoritmo es
analizado en los siguientes trminos:

Tabla 3. Comparacin del algoritmo J48 y


RandomTree.

1. El nmero de instancias predichas como


Abandono o No Abandono.
2. El tiempo que toma derivar el rbol.
Tabla 1. Matriz de confusin obtenida por el
algoritmo J48

La eficiencia del algoritmo se ha medido comparando


el algoritmo J48 con el algoritmo RandomTree.
El rbol generado de la ejecucin del algoritmo
RandomTree con los datos acadmicos de los
alumnos de Ingeniera de Sistemas se muestra en la
Fig. 3.

Las evaluaciones realizadas en la herramienta Weka


con los algoritmos J48 y RandomTree muestran las
grficas obtenidas de las relaciones del atributo
Abandono con los dems atributos considerados:
Categora, Puntaje de ingreso, Aprobados,
Desaprobados, Total de cursos, y Promedio final,
como se aprecia desde la Fig. 4 hasta la Fig. 9

Fig. 4. Abandono de estudiantes en relacin a la Categora.


Fig. 3.

20

Arbol creado con el algoritmo RandomTree en Weka

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

Fig. 5.Abandono de de estudiantes en relacin al Puntaje de ingreso.

Fig. 8. Abandono de estudiantes en relacin al Total de cursos.

Fig. 9. Abandono de estudiantes en relacin al promedio final.


Fig. 6. Abandono de estudiantes en relacin a los cursos
Aprobados.

Fig. 7. Abandono de estudiantes en relacin a los cursos Desaprobados.

4. DISCUSIN
De las visualizaciones obtenidas se puede observar
los resultados de utilizar el algoritmo J48 realizada
en funcin del atributo Abandono del cual se puede
reflejar lo siguiente:
Abandono y Categora: La mayor cantidad de
estudiantes que abandonan la carrera es de
la categora A.
Abandono y Puntaje de Ingreso: La mayor
cantidad de estudiantes que abandonan tiene
un puntaje de ingreso promedio de 80.77.
Abandono y cursos Aprobados: La mayor
cantidad de estudiantes que abandonan
tienen un promedio
de 6.23 cursos
Aprobados.
Abandono y cursos Desaprobados: La mayor
cantidad de estudiantes que abandonan la
carrera tienen un promedio de 6.94 cursos
Desaprobados.
Abandono y Total de cursos: La mayor

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

21

cantidad de estudiantes que abandonan la


carrera tienen un promedio de 11.25 cursos
llevados.
Abandono y Promedio final: La mayor
cantidad de estudiantes que abandonan la
carrera tienen un promedio final de 7.84.

visions, JEDM-Journal of Educational Data


Mining, vol. 1, n 1, pp. 3-17, 2009.
[2] C. Romero y S. Ventura, Educational data
mining: A survey from 1995 to 2005, Expert
systems with applications, vol. 33, n 1, pp.
135-146, 2007.

En lo que respecta a la eficiencia y tiempo de


derivacin de los arboles utilizados en los algoritmos
J48 y RandomTree y al mantener todas las instancias
comn, como se muestra en la Tabla III acerca de la
comparacin de los algoritmos J48 y RandomTree,
especifica claramente que el nmero de instancias
declaradas como Abandono es igual en ambos
algoritmos y lo mismo en las instancias declarados
de No Abandono, pero en el proceso de construccin
del rbol el algoritmo RandomTree es ms detallado
para obtener los resultados. La Tabla III muestra el
anlisis comparativo de ambos algoritmos.

[3] I. H. Witten y E. Frank, Data Mining: Practical


machine learning tools and techniques, Morgan
Kaufmann, 2005.

5.
CONCLUSIONES
FUTUROS

TRABAJOS

[6] E. Osmanbegovic y M. Suljic, Data mining


approach for predicting student performance,
Economic Review, vol. 10, n 1, 2012.

Las diversas tcnicas supervisadas de minera


de datos se pueden aplicar de manera efectiva
en los datos educativos prediciendo la desercin
acadmica.
Del anlisis de las tcnicas de clasificacin se
puede aplicar en los datos educativos para predecir
el resultado de abandono o no del estudiante a
los estudios y conocer la cantidad tentativa de
grupos o secciones que se pueden asignar para su
planificacin.
La eficiencia de los algoritmos de rboles de decisin
J48 y RandomTree se puede analizar en funcin de
su precisin comprobando que ambos algoritmos
obtienen los mismos resultados.
En cuanto al tiempo tomado para derivar el rbol, se
observa que el algoritmo RandomTree es ligeramente
ms veloz que el algoritmo J48 en la construccin del
rbol de decisin.
El anlisis de los resultados realizados en la
Universidad es una prueba para su implementacin.
Para trabajos futuros, el estudio se puede ampliar
con atributos ms distintivos para obtener resultados
ms precisos y tiles para mejorar los resultados
del aprendizaje de los estudiantes. Adems, los
experimentos pueden realizarse mediante otros
algoritmos de

[7] B. Minaei-Bidgoli, D. A. Kashy, G. Kortemeyer y


W. F. Punch, Predicting student performance:
an application of data mining methods with an
educational web-based system, de Frontiers
in education, 2003. FIE 2003 33rd annual, 2003.

[4] A. El-Halees, Mining students data to


analyze e-Learning behavior: A Case Study,
Department of Computer Science, Islamic
University of Gaza PO Box, vol. 108, 2009.
[5] S. A. Kumar y M. Vijayalakshmi, Efficiency of
decision trees in predicting students academic
performance, de First International Conference
on Computer Science, Engineering and
Applications, CS and IT, 2011.

[8] M. M. A. Tair y A. M. El-Halees, Mining educational


data to improve students performance: A case
study, vol. 2, n 2, 2012.
[9] C. Romero, S. Ventura, P. G. Espejo y C. Hervs,
Data Mining Algorithms to Classify Students.,
de EDM, 2008.
[10] P. Chapman, J. Clinton, R. Kerber, T. Khabaza,
T. Reinartz,
C. Shearer y R. Wirth, CRISP-DM 1.0 Step-by-step
data mining guide, 2000.
H. Ferri y J. Hernndez, Prctica de minera de datos,
introduccin al Weka, Universidad Politcnica de
Valencia, 2006.

minera de datos para obtener un enfoque ms


amplio, y salidas ms valiosas y precisas.

6. REFERENCIAS
[1] R. S. Baker y K. Yacef, The state of educational
data mining in 2009: A review and future

22

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

EXISTENCIA DE SOLUCIONES PERIDICAS A UNA ECUACIN


HAMILTONIANA MEDIANTE EL NDICE DE CONLEY
Adeluz Apaza Valdivia

Fermn Flavio Mamani Condori


Facultad de Ciencias e Ingenieras
Fsicas y Formales
Universidad Catlica de Santa Mara

Universidad La Salle

adeav@hotmail.com

ffmamani@gmail.com

ABSTRACT
In this article demonstrates the existence of periodic
solutions of an equation Hamiltoneana, we will use
the Conley index theory, which is a tool to display
issues existence of a differential equation; obtaining
as a result supports Hamiltoneana equation always at
least a periodic solution. These periodic solutions are
found as critical points of a variational problem.

Keywords

Hamiltonian equations, periodical solutions, Conley


index.

RESUMEN

En el presente artculo se demuestra la existencia de


soluciones peridicas de una ecuacin Hamiltoneana,
para ello usaremos la teora del Indice de Conley, que
es una herramienta para mostrar las cuestiones de
existencia de una ecuacin diferencial; obtenindose
como resultado que una ecuacin Hamiltoneana
siempre admite al menos una solucin peridica.
Estas soluciones peridicas son encontradas como
puntos crticos de un problema variacional.

Palabras clave

Existencia, soluciones,
Indice y Conley.

peridicas, Hamiltoneana,

1. INTRODUCCIN
El ndice de Conley es una de las herramientas ms
importantes para demostrar la existencia de las
soluciones peridicas de una ecuacin Hamiltoniana
de la forma:

x = JDx h(t,x)

(1)

2n
> 2 , donde
X
con (t,x)
y
matriz simplctica estndar dada por:

es la

0 In
J=
In 0
2

2n

, )
y DX denota el gradiente de h C ( X
con respecto a la variable x . En el trabajo esta
funcin ser peridica en el tiempo t; esto es,

h(t+T,x) =h(t,x) ; para algn

T>0

y suelen llamarse funciones Hamiltonianas


peridicas.
El objetivo del presente trabajo de investigacin
es aplicar la teora del ndice de Conley en la
demostracin de la existencia de soluciones
peridicas de una ecuacin Hamiltoniana dada
lneas arriba, para lo cual se asumir las siguientes
tres condiciones:
1.
2.

El Hessiano de h es acotado.
El campo vectorial Hamiltoniano dado en
(1) es asintticamente lineal.
3.
La solucin trivial de la ecuacin Hamiltoniana
lineal x = JA (t)x es la nica solucin peridica,
la cual es no degenerada y tiene ndice I .
Bajo estas condiciones, la ecuacin (1) tiene al
menos una solucin T-peridica.
Mucho se ha avanzado al respecto, y algunos de
estos resultados obtenidos los podemos encontrar
por ejemplo en el artculo de Amann and Zehnder [2],
en el trabajo de Agapito [3] quien aplic la teora
de grados topolgicos para reducir la existencia de
una solucin peridica a la existencia de un punto
crtico de una cierta funcin. Apoyndonos en estos
trabajos queremos aplicar el ndice de Conley para
asegurar la existencia de un punto crtico de una
cierta funcin, para as garantizar la existencia de
una solucin peridica.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

23

Definicin 1 (Solucin no degenerada). Sea (t,x)

2. MATERIALES Y MTODOS

una solucin peridica de la ecuacin Hamiltoneana:

Este apartado se inicia con el estudio de algunas


definiciones
y
resultados
sobre
ecuaciones
Hamiltonianas. Luego para dar cumplimiento a nuestro
propsito, veremos la reduccin a un problema finito
dimensional, para encontrar los puntos crticos de una
funcin definida sobre un espacio finito dimensional, y
encontramos condiciones bajo las cuales esta funcin
existe. Por ltimo presentamos el teorema de existencia
de soluciones peridicas.

1.Ecuaciones
lineales.

Hamiltonianas

asintticamente

x = JDx h(t,x)
Se dice que (t,x) es no degenerada si 1 no es
multiplicador de Floquet del sistema:

x = JA(t)x
Caso contrario, diremos que la ecuacin
Hamiltoneana tiene una solucin peridica no trivial.

Observacin 2. El hecho de que la solucin trivial

Consideremos ahora la ecuacin Hamiltoniana:

x = JDx h(t,x)

de la ecuacin Hamiltoneana lineal de la forma:

con solucin peridica x(t), cuya ecuacin linealizada


est dada por:

x = JDx x h(t,x ( t ) )x.


Si hacemos que:

x = JA (t)x
sea la nica solucin peridica, puede ser escrita en
forma equivalente diciendo que 1 no es multiplicador
de Floquet de la ecuacin:

x = JA (t)x

A(t)=Dx x h(t,x ( t ) )

lo cual por definicin significa que la solucin trivial


es no degenerada.

obtenemos el sistema lineal Hamiltoniano:

x = JA(t)x, x(0) = x(T)

(2)

donde A(t) es simtrica y peridica, t


continua y J es la matriz simplctica estndar.

A(t)

es

Para encontrar el ndice de Conley del sistema


lineal Hamiltoniano (2), supondremos que, para cada
x=0 en 2n , la matriz A(t) es definida positiva; es
decir, debe cumplir que:

Definicin 2 (Ecuacin asintticamente lineal).


Diremos que la ecuacin Hamiltoneana:

x = JDx h(t,x)
es asintticamente lineal si existe un camino continuo
de matrices simtricas
tal que:

A(t)x,x >0.
Observacin 1. Como A(t) es definida positiva

y depende continuamente de la variable t, podemos


deducir que existen constantes positivas y tal que:

para todo (t,x)


2
inversa dada por la matriz:

. Ms an,

es uniformemente continua en t cuando

Observacin 3. La definicin dada lneas arriba


debe entenderse como que existe una constante ,
C
que depende nicamente de h y de
tal que para todo L > 0 , se cumple:

A(t) tiene

B(t ) = A 1 ,

lo cual se interpreta tambin diciendo que:

la cual es continua, T-peridica y definida positiva. As,


aplicando la desigualdad precedente se obtiene:

1 || x || 2 B(t ) x, x || x || 2

24

La aplicacin
es determinada nicamente por
y se llama (en caso de existir) la derivada
de
en infinito.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

2. Indice de Conley.
Definicin 3 (Flujo). Una aplicacin continua:
n
n
n

1.
es positivamente invariante en
,
disjunto de
(N) , ambos
,
son
positivamente invariantes en N y
2. El complemento de
en
, el cual
ser denotado por
/
, es una vecindad
de K relativa al flujo
donde cl denota clausura.

se llama flujo en , si para todo X


y t, s
se cumple las siguientes condiciones:

3. Si X
y
, entonces
existe
tal que la porcin compacta de la
rbita satisface
y

De esto se tiene en particular que, para todo


t

Gracias a esto y el hecho que


y
son ambas
continuas, se sigue que la aplicacin
es un
n
n
homeomorfismo de
en
.
n

Debemos indicar que, dado un flujo


en
n
un subconjunto K de
se llama un conjunto
invariante si satisface:

En lo sucesivo los conjuntos N0 y N1 de la definicin


precedente reciben el nombre de bloque aislante y
conjunto de salida, respectivamente. Estos nombres
se justifican debido a la segunda y tercera condicin.

Teorema 1 (Existencia de pareja de Indice).

Sean N una vecindad aislante de un conjunto invariante


aislado K y W una vecindad arbitraria abierta de K en
. Entonces, existe una pareja de Indice (N0 ,N1)
para K relativo al flujo
tal que N0 y N1 son
positivamente invariantes en N

Prueba. Ver por ejemplo Apaza [4] y Conley [6].


Esto quiere decir que el conjunto de puntos
tales que X k y t
es idntico a K.

Definicin 4 (Conjunto invariante aislado). Sea K


un conjunto invariante compacto. Diremos que K es
un conjunto invariante aislado, si existe una vecindad
compacta N de K tal que relativo al flujo
se
tiene K= K (N), donde K(N) denota el mayor conjunto
invariante contenido en . En este caso, la vecindad
compacta recibe el nombre de vecindad aislante.
Notemos que N sea una vecindad compacta de K
significa por definicin que es compacto y K int(N)
Por otro lado, el interior de N puede ser vaco siempre
que K lo sea.
En lo sucesivo se entender por un par compacto
a un par de conjuntos compactos tales que
en la vecindad N.

Definicin 5 (Pareja de Indice).


Diremos que un par compacto
en N es una
pareja de Indice para , si cumple las condiciones
siguientes:

La razn del inters del Teorema 1 est en el hecho


de que el concepto de pareja de Indice juega un
papel imprescindible en la definicin del Indice de
Conley.

Teorema 2 (Equivalencia de pareja de Indice).


Sean (N1 ,N2) y
dos parejas de Indice para K
en la vecindad N Entonces los espacios topolgicos
puntuales (N1 / N2) y
son homotpicamente
equivalentes.

Prueba. Ver Apaza [4] y Rybakowski [8].


Finalmente, habiendo visto el resultado anterior,
estamos en condiciones de establecer que los
espacios en la definicin del Indice de Conley
son homotpicamente equivalentes y todas las
aplicaciones son equivalencias homotpicas. As, al
asumir el teorema de existencia de parejas de Indice
y el teorema de equivalencia homotpica, justifica
plenamente que podemos asociar al conjunto
invariante aislado K=K(N) una nica clase de
equivalencia. As, tenemos la siguiente definicin.

Definicin 6 (Indice de Conley). Sea (N1,N2) una


pareja de Indice para el conjunto K en la vecindad
N relativo al flujo , entonces el Indice de Conley se

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

25

es compacto, y tiene Indice del tipo homotpico de una


esfera puntual Sm donde

define como sigue:

Esta definicin generaliza al Indice clsico de Morse.


Por ejemplo, si p es un punto crtico no degenerado
con respecto al flujo gradiente sobre una variedad
compacta y n el Indice clsico de Morse en p ,
entonces el Indice de Conley del conjunto invariante
es una n-esfera puntual, el cual ser
denotado por Sn .

3.Indice de Conley para el problema reducido.


Nuestro trabajo ahora se centra en encontrar los
puntos crticos del campo vectorial g definido por:

1
g (
z ) = f (u ( z )) = Au ( z ), u ( z ) (u ( z )) (3)
2
donde f es una funcional de clase C1 y A un operador
autoadjunto (ver Amann and Zehnder [2] y Agapito
[3]), y aplicar el Indice de Conley al flujo gradiente del
sistema:

Prueba. Por la Condicin 2 queda claro

que la
solucin x(t)=0 es no degenerada y, por lo tanto,
A(t) es topolgicamente equivalente a un camino
constante; digamos,

De esto se sigue que existe una homotopa de


caminos
definida por:

con la propiedad de que 1 no es multiplicador de


Floquet de la ecuacin:

De ah se tiene que I=J(A0) es el Indice de un


camino constante.
Consideremos ahora que:

donde F representa el operador potencial continuo


descrito en Amann and Zehnder [2]. En el teorema
que sigue mostraremos que el conjunto de
soluciones acotadas de (3) es compacto, siempre
que las condiciones del Teorema de existencia de
soluciones sean satisfechas. Este resultado puede
ser visto como una aplicacin del Indice de Conley.

Teorema 3. Sean Z un subespacio finito dimensional y


tal que para cada z
gradiente viene dado por:

Z su flujo

Asumamos que se cumplen las condiciones:


1. La ecuacin Hamiltoneana es asintticamente lineal;
esto es,

2. La solucin trivial de la ecuacin Hamiltoneana


lineal x=JA (t)x es no degenerada. Denotemos su
Indice por I.
Entonces, el conjunto K de soluciones acotadas de (3)

26

Notemos que Dxxh0(t,x) es acotada y, por lo tanto,


podemos definir una familia de operadores
potenciales continuos

mediante:

que depende continuamente de


entonces que, para algn
de
,F (u) satisface:

Por lo tanto,
continuas

por:

Es claro
independiente

existe una familia de funciones



tal que para cada
su sistema gradiente est dado

Haciendo uso las definiciones de conjunto resolvente,


el espectro de A y la Condicin 1, se consigue que
existen constantes y independientes de

tal que para cada
se cumple:

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

Esto significa que el conjunto K de soluciones


acotadas de (3) es compacto. Resta probar que
el Indice de Conley
es igual a
La
prueba consiste en tomar al conjunto invariante
aislado posible como un conjunto que depende del
parmetro

Para esto consideremos:

una rbita acotada que contiene a z}

el conjunto de soluciones acotadas de la ecuacin:

que tiene la propiedad de contener a


. Luego
por definicin existe un conjunto compacto
tal que

para todo
. Esto
implica que es una vecindad aislante para (ver por
ejemplo Apaza [4]). Haciendo uso la invarianza del
Indice a travs de homotopas, el Indice de Conley
para
es independiente de
, si y slo si:

Observando la ecuacin
,vemos que,
asignando un valor particular
y teniendo en
cuenta que A es topolgicamente equivalente a un
camino constante A0 , se tiene:

Pero, por la Condicin 2 se obtiene


De ello se sigue que, para
, el conjunto
invariante aislado
de
es un punto
crtico hiperblico z=0 ; de esta manera K={0} .
De aqu se consigue fcilmente (ver Apaza [4]), que
el Indice de Conley de un punto crtico hiperblico
es m- esfera puntual, cuya dimensin es igual a la
dimensin de la variedad inestable en el punto crtico
indicado, y los clculos usuales permiten concluir
que:

4. Indice de Conley en la existencia de


soluciones.
Esta seccin tiene por objetivo demostrar el teorema
central del trabajo, que trata sobre la existencia de
soluciones peridicas de una ecuacin Hamiltoneana
asintticamente lineal, aplicando la teora de Indice
de Conley (Ver Conley, Charles C. [5]).

Teorema 4 (Existencia de soluciones peridicas).


2
Sea
con n > 0 ,
una funcin peridica en el tiempo y de periodo .
T > 0
Asumamos que:

1. El Hessiano de h es acotado; es decir, existe un >0 tal


2 , se tiene
que para todo (t,x)
2. El campo vectorial Hamiltoneano dado en (1) es
asintticamente lineal; esto es,

que es uniformemente continua en t cuando


donde
es un camino continuo y
peridico de matrices simtricas.
La solucin trivial de la ecuacin Hamiltoneana lineal
x=JA_ (t)x es la nica solucin peridica, la cual es
no degenerada y tiene Indice I.
Entonces, la ecuacin x=JDx h(t,x) tiene al menos una
solucin T-peridica.

Prueba. Si consideramos

, resulta
que d es un entero, pues dim Z es par. Sea K el
conjunto de rbitas acotadas del flujo gradiente:
z
el cual consiste de puntos crticos de g y de
conexiones entre ellos. Sabemos por lo indicado
que los puntos crticos estn en correspondencia
uno a uno con las soluciones peridicas de la
ecuacin Hamiltoneana:

Haciendo
probado.

el Teorema 3 queda

x=JDx h(t,x).

Por otro lado, debido al Teorema 3 el conjunto


invariante K Z es compacto y de tipo homotpico;
esto es,

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

27

con

.
con ,

Notemos que ste no es el Indice del conjunto


vaco, ya que tal corresponde al de un espacio
puntual de un punto, y de aqu resulta que tenga
Indice del tipo homotpico
para un
punto arbitrario p. Por lo tanto, concluimos que K
es diferente del conjunto vaco, ya que el conjunto
w-lmite de rbitas acotadas de un sistema gradiente
consiste de puntos crticos. Luego, se concluye
que la funcin
posee al menos un punto crtico
y consecuentemente la ecuacin Hamiltoneana
admite al menos una solucin T-peridica.
Ahora, si la rbita peridica encontrada es no
degenerada, a ella, le corresponde un Indice (ver
Apaza [4]), denotado por
,
entonces
el
correspondiente punto crtico z de g es un conjunto
invariante aislado de Indice:

h({z})=[Sm],

donde m=d-j. Si asumimos que z es el nico


punto crtico de g, entonces K={z}, pues estamos
trabajando con un sistema gradiente y por lo tanto,

h(S)=[Sm],

el cual, a su vez, es igual a [Sm ]. En consecuencia


resulta m= m. De esta forma, cuando j j, y
por consiguiente n m , debe aparecer ms de
un punto crtico para g y, consecuentemente, la
ecuacin Hamiltoneana debe tener ms de una
solucin T-peridica. As pues, se desprende la
existencia de al menos de una solucin T-peridica.

III. RESULTADOS
Como producto de este trabajo de investigacin, se
obtienen los siguientes resultados:
1. Dado un subespacio finito dimensional
Z, y debido a las Condiciones 1 y 2 del
Teorema 3, se ha formulado y demostrado
que el conjunto de rbitas acotadas del
flujo gradiente z = DZ g(z) es compacto
y tiene Indice.
2. Haciendo uso la invarianza del Indice a
travs de homotopas, se ha mostrado que
el flujo gradiente indicado tiene Indice de
Conley para K , que hemos denotado por:

28

donde es una esfera puntual de dimensin


con un punto especial , que se ha escrito
como el par
.
3. Teniendo en cuenta que
y como
el conjunto lmite de una rbita acotada del
flujo gradiente consiste de puntos crticos, la
funcin g posee al menos un punto crtico y
en consecuencia la ecuacin Hamiltoneana
admite al menos una solucin T-peridica.

IV DISCUSIN
En el campo de la Ingeniera, la ecuacin
Hamiltoneana, es un enfoque bsicamente
equivalente a una ecuacin diferencial. Por ejemplo,
las ecuaciones del movimiento vienen dadas por un
sistema de ecuaciones diferenciales ordinarias de
primer orden, que se escriben en trminos de una
funcin H llamada Hamiltoneano, que en ciertos
casos puede interpretarse como la energa total
del sistema, es decir, la suma de energa cintica y
energa potencial.
Dentro de este contexto, la ecuacin Hamiltoneana
se caracteriza porque su flujo conserva la estructura
simplctica del espacio de fases; y puede ser reducido
a un problema finito dimensional, para encontrar
los puntos crticos de una cierta funcin definida
sobre un espacio finito dimensional, lo cual equivale
que la ecuacin Hamiltoneana tiene una solucin
peridica. Adems, la ecuacin Hamiltoneana tiene
una solucin peridica de periodo T. Si esta solucin
peridica es no degenerada con ndice j0 j,
entonces existe una segunda solucin T-peridica,
con ndice diferente de j. Es ms, si hay dos
soluciones peridicas no degeneradas, entonces
existe tambin una tercera.

V. CONCLUSIONES
1. Las soluciones peridicas de una ecuacin
Hamiltoneana asintticamente lineal son
encontradas como puntos crticos de un
problema variacional.

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

2. El Indice de Conley es independiente de la


eleccin de pareja de ndice y por lo tanto,
depende solamente del comportamiento
del flujo cerca de un conjunto invariante
aislado.

Systems and the Conley index of isolated


invariant sets. Trans. Amer. Math. Soc.
Volume 291. Number 1. September 1985.

3. La teora de Indice de Conley es una


herramienta para mostrar las cuestiones
de existencia, nmero de soluciones
y propiedades de estabilidad de una
ecuacin diferencial.

VI. REFERENCIAS
[1] Amann, Herbert. Points and Multiple Solutions
of Differential Equations, Mathematische
Zeilschrift. 169, 1979.
[2] Amann, H., and Zehnder, E., Periodic solutions
of asymptotically linear Hamiltonian systems,
Manus. Math. 32, 1980, pp. 149-189.
[3] Agapito, Jose.
Existencia de soluciones
peridicas de una ecuacin Hamiltoneano
particular. Tesis de Maestra, PUCP 1997.
[4] Apaza Valdivia, Adeluz. Indice de Morse. Tesis
de Maestra, PUCP. Diciembre de 1998.
[5] Conley, Charles C. Isolated invariant sets and
the Morse index, CBMS Regional conf. Ser. In
Math. No 38, Amer. Math. Soc. Providence R.I.
May 31-june 4, 1976.
[6] Conley, C. and Zehnder, R. Morse type index
theory for flows and periodic solutions for
Hamiltonian Systems. Math. Research Center
University of Wisconsin-Madison, TSR num
2567, 1983; Comm. Pure Appl. Math. 37 (1984).
[7] Montgomery, J. T., Cohomology of isolated
invariant sets under perturbation, J. Diff. Eq.
13(1973), 257-299.
[8] Rybakowski, K.P. The Homotopy index y Partial
Differential Equations. Springer-Verlag, BerlinHeidelberg; New York (1987)
[9] Rabinowitz, P. Periodic solutions of Hamiltonian
systems. Comm. Pure and Appl. Math., 31,
(1978), 157-184.
[10] Salomon, Dietmar. Connected Simple

Journal Ingeniera & Desarrollo de la Escuela de Ingenieras Fsicas y Formales UCSM.

29

You might also like