You are on page 1of 13

Red neuronal artificial para orientación

profesional “UDProfession”
Neural Network for Professional Orientation
“UDProfession”
Diana Marcela Pulido Morales*
Ana Celmira Gualteros Gualteros**
Jorge Enrique Rodríguez Rodríguez***

Fecha de recepción: 20 de agosto del 2009


Fecha de aceptación: 28 de septiembre del 2009

Resumen

El artículo presenta el desarrollo de un software para orientación profesional,


a través de la implementación de redes neuronales artificia-
les. Inicialmente, se da una introducción sobre el tema de la
orientación profesional. En segundo lugar, se describe la forma
como el psicólogo lleva a cabo el proceso vocacional, destacan-
do la manera como éste razona. Luego se justifica la selección,
el diseño e implementación de redes neuronales artificiales.
Posteriormente, se aborda el diseño del software, basado en as-
pectos, tales como: definición de entradas y salidas para la red
neuronal, modelo de la red, el preprocesamiento de los datos,
método de entrenamiento, entre otros. Por último, se mues-
tra el análisis de pruebas y resultados obtenidos junto con las
conclusiones.

* Tecnóloga en Sistematización de Datos. Integrante del grupo de investigación en Inteligencia Artificial de la Universidad Distrital
Francisco José de Caldas. Correo electrónico: dianapulido49@hotmail.com

** Tecnóloga en Sistematización de Datos. Integrante del grupo de investigación en Inteligencia Artificial de la Universi-
dad Distrital Francisco José de Caldas. Correo electrónico: anymaniacs@hotmail.com

*** Magíster en Ingeniería de Sistemas. Especialista en Ingeniería de Software. Especialista en Diseño y Construcción de
Soluciones Telemáticas. Ingeniero de Sistemas. Docente de la Universidad Distrital Francisco José de Caldas. Correo
electrónico: jrodri@udistrital.edu.co
V Í N C U L O S
JULIO-DICIEMBRE DE 2009
VOLUMEN 6 NÚMERO 2

Palabras clave: orientación profesional, pruebas vocaciona-


les, red neuronal artificial, entrenamiento, preprocesamiento
de datos.

Abstract

This paper shows the development of software for Professional


Orientation, through the implementation of neural networks.
The vocational process allows orientating the young men that
they are finishing your secondary to taking the decision more
succeeded as for your future professional, realizing a series of
vocational tests that measure your preferences and skills.

Key words: professional orientation, vocational tests,


artificial neural network, training, data preprocessing.

Introducción resultantes son exploratorias y limitadas, y


no tienen la última palabra: sólo son instru-
El concepto de orientación profesional, no mentos que ayudan a interpretar la relación
sólo tiene que ver con los jóvenes bachille- entre el estilo de vida y el entorno de vida del
res, que aspiran a ingresar a las institucio- estudiante [10].
nes de educación superior, sino también con
aquellos estudiantes que tras iniciar un pro- Para la realización de “UDProfession”, se se-
grama académico no se sienten satisfechos leccionó, diseñó e implementó una técnica
con él [7]. El proceso de orientación profesio- de aprendizaje computacional (redes neuro-
nal conlleva al desarrollo de ciertas pruebas nales artificiales), que constituyen un buen
vocacionales, en las que se busca que el es- método para resolver este tipo de problemas
tudiante se conozca a sí mismo, explore sus para aquellas tareas de clasificación, identifi-
aficiones y se relacione con las diversas áreas cación, diagnóstico o predicción en las cua-
del conocimiento que le permitan definir un les el balance datos/conocimiento se inclina
perfil profesional específico. Cuanto más hacia los datos y en las que, adicionalmen-
temprana sea la etapa de la vida escolar en te, puede haber la necesidad de aprendizaje
que se inicie este proceso, más adecuados se- en tiempo de ejecución y de cierta tolerancia
rán los resultados. a fallos. En estos casos, las redes neuronales
artificiales se adaptan dinámicamente reajus-
Para ayudar a los jóvenes a tomar una deci- tando constantemente los pesos de sus inter-
sión, los orientadores profesionales utilizan conexiones [1].
numerosas pruebas psicológicas y han di-
señado diversidad de modelos formales y La utilización de redes neuronales en
no formales que miden la capacidad de de- “UDProfession” permite apoyar el proceso
cisión del individuo y evalúan su habilidad vocacional de un estudiante y facilita al psi-
en dicho proceso. No obstante, las medidas cólogo la realización –como se demuestra con
49
49

Diana Marcela Pulido Morales - Ana Celmira Gualteros Gualteros - Jorge Enrique Rodríguez Rodríguez
A T A C T U A L I D A D T E C N O L Ó G I C A

el análisis de pruebas y resultados–, califica- múltiples, distintas e independientes. Gard-


ción e interpretación de las pruebas vocacio- ner define la inteligencia como “la capacidad
nales que son aplicadas al estudiante, cada de resolver problemas o elaborar productos
prueba contiene una cantidad considerable que sean valiosos en una o más culturas”.
de preguntas, esto genera un volumen exten- Howard Gardner añade que igual que hay
so, aproximadamente 500 preguntas. Es im- muchos tipos de problemas que resolver,
portante señalar que la propiedad más rele- también hay muchos tipos de inteligencia.
vante de las redes neuronales artificiales es su Howard Gardner y su equipo de la Univer-
capacidad de aprender a partir de un conjun- sidad de Harvard han identificado ocho ti-
to de patrones de entrenamiento,1 para final- pos distintos:
mente clasificar e interpretar acertadamente
cualquier respuesta dada por el estudiante a • Inteligencia lingüística, la que tienen los
cada una de las pruebas vocacionales [1]. escritores, los poetas, los buenos redac-
tores. Utiliza ambos hemisferios.
¿Cómo se lleva a cabo el proceso • Inteligencia lógica-matemática, la que se
de orientación profesional? utiliza para resolver problemas de lógi-
ca y matemáticas. Es la inteligencia que
La orientación profesional se puede entender tienen los científicos. Se corresponde con
como un proceso estructurado de apoyo téc- el modo de pensamiento del hemisferio
nico dirigido a una persona o grupo en incer- lógico y con lo que la cultura occidental
tidumbre acerca de su conducta vocacional.2 ha considerado siempre como la única
A través de éste se busca que el asesorado inteligencia.
desarrolle un proceso de toma de decisiones • Inteligencia espacial, consiste en formar
funcionales con respecto a su conducta y mo- un modelo mental del mundo en tres di-
tivación vocacionales [2]. mensiones; es la inteligencia que tienen
los marineros, los ingenieros, los ciruja-
El proceso se realiza a través de 8 pruebas nos, los escultores, los arquitectos o los
vocacionales. decoradores.
• Inteligencia musical, es aquella que permite
IAIM (Prueba de Inteligencias desenvolverse adecuadamente a cantan-
Múltiples) tes, compositores, músicos y bailarines.
• Inteligencia corporal-cinestésica, o la ca-
La teoría de las inteligencias múltiples es un pacidad de utilizar el propio cuerpo
modelo propuesto por Howard Gardner en para realizar actividades o resolver pro-
el que la inteligencia no es vista como algo blemas. Es la inteligencia de los depor-
unitario, que agrupa diferentes capacida- tistas, los artesanos, los cirujanos y los
des específicas con distinto nivel de generali- bailarines.
dad, sino como un conjunto de inteligencias • Inteligencia intrapersonal, es la que permi-
te entenderse a sí mismo. No está asocia-
da a ninguna actividad concreta.
1 Los patrones de entrenamiento, son una muestra de
las respuestas dadas a las pruebas y su interpretación. • Inteligencia interpersonal, la que permite
2 La conducta vocacional se refiere a un conjunto de entender a los demás; se la suele encon-
procesos psicológicos (intereses, aptitudes, valores), trar en los buenos vendedores, políticos,
que un individuo desarrolla a lo largo de su ciclo vital
con el propósito final de lograr su autorrealización. profesores o terapeutas [3].
5050
Red neuronal artificial para orientación profesional “UDProfession”
V Í N C U L O S
JULIO-DICIEMBRE DE 2009
VOLUMEN 6 NÚMERO 2

FIP (Formulario de Intereses (SR), razonamiento mecánico (MR), y rapi-


Profesionales) dez y precisión perceptivas (CSA).

Esta prueba tiene como objetivo indicarle Estas pruebas constan de un número determi-
al estudiante el área profesional hacia la que nado de preguntas (aproximadamente sesen-
apuntan sus intereses. No evalúa conoci- ta), con las cuáles se miden los gustos y las
mientos y, por tanto, no hay respuestas bue- aptitudes que tiene un estudiante hacia una
nas ni malas; la correcta será aquella que determinada área profesional. Del grado de
mejor refleje el tipo de actividades que prefie- coherencia y sinceridad con que el estudian-
re desarrollar el estudiante, sus aficiones. De te resuelva estas pruebas, depende el éxito
ahí que se requiera la mayor sinceridad posi- del proceso, porque esto le permite al psicó-
ble a la hora de responder este cuestionario. logo calificar y determinar un buen resultado.
Cada prueba consta de preguntas enfocadas
Esta prueba comprende ocho áreas profe- a un perfil específico, por tanto, se busca que
sionales, agrupadas de la siguiente forma: en cada una de ellas, las respuestas estén di-
ciencias económicas, administrativas y del rigidas hacia un mismo perfil, esto facilitaría
mercadeo, ciencias humanísticas y de inves- la interpretación de éstas; en el caso contrario,
tigación de la cultura, ciencias de la salud y si los resultados obtenidos divergen entre sí
del servicio social, ciencias exactas y natura- de una sola área profesional, el psicólogo debe
les aplicadas a la investigación de la salud y preparar una entrevista personal, en la que
de la alimentación, administración e investi- pueda analizar más a profundidad los gustos
gación de las ciencias agropecuarias, ciencias y las preferencias del estudiante por un ámbi-
exactas y naturales aplicadas a la tecnolo- to profesional en específico y así lograr orien-
gía, áreas artísticas e investigación en cien- tar al estudiante en un área profesional acorde
cias exactas. con sus intereses profesionales y habilidades
para desempeñarse en una determinada área.
DAT (Prueba de Aptitudes
Diferenciales) Una correcta elección profesional debe tener
en cuenta la satisfacción y realización pro-
Ésta es una batería integrada de pruebas de fesionales, el éxito y el bienestar económico
orientación que fueron elaboradas a fin de y personal que de ella puedan derivar. Es-
ofrecer un procedimiento integrado, científico tas metas sólo se logran mediante un trabajo
y bien estandarizado para medir las aptitu- sistemático y disciplinado, cuyo resultado es
des de los alumnos de ambos sexos de los el autoconocimiento, un proceso que se debe
ciclos básico y especializado de la enseñanza cultivar durante toda la existencia [7].
secundaria, para fines de orientación educa-
cional y vocacional. El proceso de orientación profesional bus-
ca lograr que los estudiantes se conozcan a sí
La batería de pruebas de aptitudes diferen- mismos, exploren sus aficiones y destrezas y
ciales, incluye las siguientes: razonamiento se relacionen con las diversas áreas del conoci-
verbal (VR), aptitud numérica (NA), razona- miento, para que, llegado el momento de ele-
miento abstracto (AR), relaciones espaciales gir, lo hagan con conocimiento de causa [7].

51
51

Diana Marcela Pulido Morales - Ana Celmira Gualteros Gualteros - Jorge Enrique Rodríguez Rodríguez
A T A C T U A L I D A D T E C N O L Ó G I C A

¿Por qué redes neuronales estructurales: la eliminación o mal funciona-


artificiales? miento de un porcentaje importante de uni-
dades no provoca un “colapso”, sino una dis-
El estudio de las redes neuronales fue lidera- minución progresiva en el rendimiento de la
do por psicólogos quienes se dedicaron a de- red, características que, desde luego, posee el
sarrollar y evaluar el comportamiento de las cerebro humano. Sin embargo, la caracterís-
neuronas, esto implicaba intentar sistemati- tica más valorada de las redes neuronales ar-
zar el modelo neuronal humano, bajo el cual tificiales es su capacidad de aprendizaje [5].
las neuronas aprenden a través de conexio-
nes entre sí mismas, cada una de estas co- Durante el desarrollo del proceso de orien-
nexiones tiene un peso asociado, la red rea- tación profesional, el psicólogo debe tener
liza su proceso de aprendizaje, ajustando los un criterio amplio, preciso y oportuno para
pesos de tal forma que se logre dar un alto aconsejar de forma acertada a un estudian-
grado de predicción y exactitud a la clase a la te, ya que de esto depende su futuro profe-
que pertenece cada patrón [2]. sional. En muchas ocasiones este proceso se
ve seriamente afectado por el corto tiempo
Inicialmente, se contempló la posibilidad de del que se dispone para dedicar a la interpre-
emplear sistemas expertos, que se definen tación de cada una de las pruebas, asimis-
como un sistema informático que simula el mo, por la divergencia que puede existir en-
proceso de aprendizaje [13], de memoriza- tre cada prueba, cuando lo ideal es que todas
ción, de razonamiento, de comunicación y de las respuestas de las pruebas estuvieran en-
acción de un experto humano en una deter- focadas a hacia uno o máximo dos perfiles;
minada rama de la ciencia; de esta forma se pero este caso no es común, por esto el aná-
suministra un consultor que puede sustituir- lisis que se requiere para cada prueba debe
lo o apoyarlo con unas ciertas garantías de ser minucioso y de ser necesario, el psicólogo
éxito [8]. Estos sistemas se basan en reglas, debe recurrir a una entrevista personal para
cuya función principal es simular el razona- lograr enfocar un área profesional específica.
miento sin ningún tipo de aprendizaje, por
tanto, cualquier condición dada que se salga Con la implementación de “UDProfession”,
de las reglas implementadas, el sistema ex- los psicólogos, disponen de un software que
perto no arrojaría ninguna respuesta; debi- les permite apoyar su labor de orientar a los
do a esto, fue necesario buscar otra técnica estudiantes de bachiller. A continuación, se
capaz de aprender a partir de unos patrones exponen algunos criterios que justifican el
dados como ejemplo, de este modo se decide desarrollo “UDProfession”:
implementar una red neuronal artificial que
tiene la capacidad de aprendizaje para dis- • Unificar el conocimiento y criterio de va-
minuir el margen de error entre la respuesta rios expertos en psicología, a través de la
deseada y la obtenida [11], así responde a la creación de una base de conocimiento so-
necesidad de garantizar la veracidad y pre- bre la cual la red neuronal aprenderá.
cisión en las respuestas que el software debe • Ofrecer a los psicólogos un software que
ofrecer durante el desarrollo del proceso. les ayude a llevar su proceso de orienta-
ción profesional de una forma más inte-
Una característica importante de las redes ractiva con los estudiantes de bachiller.
neuronales artificiales es que son altamente • Las redes neuronales artificiales constan
5252 tolerantes al ruido y robustas frente a fallos de múltiples unidades elementales de

Red neuronal artificial para orientación profesional “UDProfession”


V Í N C U L O S
JULIO-DICIEMBRE DE 2009
VOLUMEN 6 NÚMERO 2

procesamiento o neuronas interconecta- Diseño del modelo neuronal


das y son capaces de aprender [4]; este
factor es vital para el proceso de orien- “UDProfession” cuenta con un modelo de
tación vocacional que se implementó, ya red neuronal tipo feedforward3 compuesto
que el objetivo fundamental es que la red de varias capas de neuronas entre la entrada
aprenda y logre por sí misma interpre- y la salida. El algoritmo de backpropagation4
tar las respuestas que un estudiante da a es implementado sobre la red, éste es una re-
cada prueba y posterior a ello clasificar y gla de aprendizaje que se puede utilizar en
arrojar el resultado deseado. modelos de redes con más de dos capas de
• El tema de la orientación profesional no neuronas. El funcionamiento de la red con-
se constituye una práctica obligatoria en siste en un aprendizaje de un conjunto pre-
los colegios del sector, en los cuales cada definido de pares de entradas-salidas, dados
día más jóvenes terminan su bachillerato como ejemplo. El aprendizaje involucra un
sin saber qué carrera profesional pueden ajuste de los pesos comparando la salida de-
empezar. Al desarrollar este software, seada con la respuesta de la red e iterando
se brinda la posibilidad a todos los estu- hasta encontrar un mínimo error. La impor-
diantes de realizar pruebas vocacionales tancia de este algoritmo consiste en su capa-
y en poco tiempo recibir una orientación cidad de autoadaptar los pesos de las neuro-
oportuna y confiable de la carrera profe- nas de las capas intermedias para aprender
sional que pueden estudiar. la relación que existe entre un conjunto de
• Las redes neuronales van aprendiendo a patrones dados como ejemplo y sus salidas
partir de ejemplos específicos, para lue- correspondientes. Una característica impor-
go tomar decisiones por sí mismas. En tante que se exige a los sistemas de aprendi-
el caso de “UDprofession” se presen- zaje es la capacidad de generalización que se
tan una variedad de posibles respuestas entiende como la facilidad de dar salidas sa-
a cada una de las pruebas y esto conlle- tisfactorias a las entradas que el sistema no
va a diversas interpretaciones de éstas; ha visto nunca en su fase de entrenamiento
por tanto, se seleccionó una parte de es- [6].
tas respuestas para que se tomarán como
patrones de entrenamiento, así la red es- El algoritmo backpropagation requiere el uso
tará en la capacidad de dar una interpre- de neuronas cuya función de activación sea
tación satisfactoria a cualquier tipo de continua y, por tanto, diferenciable. General-
respuesta. mente, la función utilizada será de tipo sig-
• La psicología es un área de estudio que se moidal.5 El objetivo de este algoritmo consiste
relaciona estrechamente con el compor-
tamiento del cerebro humano, en cuanto
a su capacidad de toma de decisiones; es 3 Una red neuronal feedforward consiste en un conjun-
to de neuronas organizadas en capas compuestas por
por esto que la implementación de una una capa de entrada, una o más capas ocultas y una
técnica de aprendizaje computacional de salida, donde la salida de la neurona de una capa,
suministra información para todas las neuronas de la
apoyaría en gran medida el proceso de capa siguiente.
orientación que debe desempeñar el psi-
4 El algoritmo se basa en ,
cólogo cuando empieza el proceso voca- donde wji(t+1) es el nuevo peso, y wji(t) es el peso ac-
cional con los estudiantes, dada la simi- tual.

litud para representar le conocimiento y 5 La función sigmoidal está dada a través de la siguien-
aprender de casos registrados. te ecuación
53
53

Diana Marcela Pulido Morales - Ana Celmira Gualteros Gualteros - Jorge Enrique Rodríguez Rodríguez
A T A C T U A L I D A D T E C N O L Ó G I C A

en hallar un conjunto de pesos que minimi- sión perceptivas, relaciones espaciales y apti-
ce el error cometido al clasificar los patrones; tud verbal). Con los datos de las pruebas an-
para esto, en primer lugar, se realiza una ini- teriores se genera una red con tres capas: la
cialización aleatoria de todos los pesos de la capa de entrada contiene tres neuronas, que
red; a continuación, se entra en la fase itera- corresponden a la respuesta final de cada
tiva en la que se elige un ejemplo aleatoria- una de las pruebas (DAT, FIP, IAIM), la capa
mente del conjunto de ejemplos y se suminis- de salida cuenta con 58 neuronas y en la capa
tra a la red; el resultado es el cálculo de las oculta se definió 60 neuronas (a través de la
salidas y posterior a esto, se comparan las sa- experimentación), véase figura 1.
lidas obtenidas con las salidas deseadas [9].
Las salidas generadas, identificadas como
Un aspecto importante con respecto al apren- clases: (C1, C2, C3,….C58) corresponden a
dizaje en las redes neuronales es conocer todas las áreas profesionales: C1 cinestési-
cómo se modifican los valores de los pesos; ca corporal, C2 cinestésica corporal e intra-
es decir, cuáles son los criterios que se siguen personal, C3 cinestésica corporal y naturista,
para cambiar el valor asignado a las conexio- C4 espacial, C5 espacial y cinestésica corpo-
nes cuando se pretende que la red aprenda ral, C6 espacial y intrapersonal, C7 espacial
una nueva información. Estos criterios de- musical, C8 espacial y naturista, C9 indeter-
terminan lo que se conoce como la regla de minado, C10 interpersonal, C11 interperso-
aprendizaje de la red. De forma general, se nal y cinestésica corporal, C12 interpersonal
suelen considerar dos tipos de reglas: las que y intrapersonal, C13 interpersonal y natura-
responden a lo que se conoce como aprendi- lista, C14 intrapersonal, C15 intrapersonal y
zaje supervisado y las de aprendizaje no su- naturista, C16 lingüística, C17 lingüística y
pervisado [10]. cinestésica corporal, C18 lingüística y espa-
cial, C19 lingüística e interpersonal, C20 lin-
“UDProfession” es una red neuronal con güística e intrapersonal, C21 lingüística y ló-
aprendizaje supervisado que se caracteri- gica matemática, C22 lingüística y musical,
za porque el proceso de aprendizaje se rea- C23 lingüística y naturista, C24 lógica mate-
liza mediante un entrenamiento controlado mática, C25 lógica matemática y cinestésica
por un agente (supervisor, maestro) que de- corporal, C26 lógica matemática y espacial,
termina la respuesta que debería generar la C27 lógica matemática e interpersonal, C28
red a partir de una entrada determinada. El lógica matemática e intrapersonal, C29 lógi-
supervisor comprueba la salida de la red y ca matemática y musical, C30 lógica mate-
en el caso de que ésta no coincida con la de- mática y naturalista, C31 musical, C32 mu-
seada, se procederá a modificar los pesos de sical y cinestésica corporal, C33 musical e
las conexiones, a fin de conseguir que la sa- interpersonal, C34 musical e intrapersonal,
lida obtenida se aproxime a la deseada [10]. C35 musical y naturalista, C36 naturalista,
Para determinar el área profesional se utilizó C37 ciencias humanística y investigación de
una red neuronal, con las siguientes especi- cultura, C38 razonamiento mecánico, C39 ra-
ficaciones: las entradas son los resultados de zonamiento abstracto, C40 relaciones espa-
cada una de las ocho pruebas vocacionales: ciales, C41 aptitud numérica, C42 rapidez
IAIM (Prueba de Inteligencias Múltiples), y precisión perceptivas, C43 aptitud numé-
FIP (Formulario de Intereses Profesionales, rica y razonamiento abstracto, C44 relacio-
DAT (razonamiento abstracto, razonamiento nes espaciales y rapidez y precisión percep-
5454 mecánico, aptitud numérica, rapidez y preci- tivas, C45 aptitud numérica y razonamiento

Red neuronal artificial para orientación profesional “UDProfession”


V Í N C U L O S
JULIO-DICIEMBRE DE 2009
VOLUMEN 6 NÚMERO 2

Figura 1. Red neuronal para el proceso de


orientación profesional

mecánico, C46 aptitud numérica y rapidez y miento y el segundo ambiente, está desarro-
precisión perceptivas, C47 razonamiento ver- llado en PHP (acrónimo de Hypertext Prepro-
bal y rapidez y precisión perceptivas, C48 ra- cessor), en el cual se implementan las pruebas
zonamiento mecánico y rapidez y precisión vocacionales, así mismo, se realiza la califi-
perceptivas, C49 razonamiento mecánico y cación de éstas, para que dichos resultados
razonamiento abstracto, C50 indetermina- sean las entradas a la red neuronal.
do, C51 ciencias económicas administrativas
y del mercadeo, C52 ciencias humanística y Para empezar a configurar la red neuronal,
investigación de cultura, C53 ciencias de la primero se realizó un preprocesamiento de
salud y servicio social, C54 ciencias exactas los datos,6 el cual se encarga de eliminar los
aplicadas salud y alimentación, C55 admi- datos erróneos, inconsistentes, faltantes (lim-
nistración e investigación de ciencias agrope- pieza), etc., para presentarlos de una mejor
cuarias, C56 ciencias exactas aplicadas tecno- forma al iniciar el entrenamiento. Las bases
logía, C57 áreas artísticas, C58 investigación de datos manejan una cantidad considerable
en ciencias exactas. de información, que está llena de datos erró-
neos, datos faltantes, diversos formatos, etc.,
“UDProfession” cuenta con dos ambientes lo que se convierte en un problema para rea-
de trabajo: un ambiente está desarrollado
en java (eclipse), en la cual se implementa el
6 El propósito fundamental del preprocesamiento de
modelo de la red neuronal para su entrena- datos eliminar ruido de los datos.
55
55

Diana Marcela Pulido Morales - Ana Celmira Gualteros Gualteros - Jorge Enrique Rodríguez Rodríguez
A T A C T U A L I D A D T E C N O L Ó G I C A

lizar un análisis adecuado. De este problema Numerización


se deriva el concepto de “calidad de los da-
tos”, y gran parte de la responsabilidad del Este proceso se utilizó porque en las prue-
análisis exhaustivo y el aprendizaje de los bas vocacionales, la mayoría de las respues-
datos dependen de este concepto. tas se dan de forma nominal [14]. La nume-
rización es utilizada para la conversión del
Preprocesamiento de los datos tipo de datos de un valor categórico a un va-
lor numérico, empleando la técnica denomi-
El propósito fundamental del preprocesa- nada: variables Dummy7.
miento de datos es manipular y transformar
cada conjunto de datos haciendo que la in- Normalización
formación contenida dentro de ellos sea más
accesible y coherente [12]. En el preprocesa- La normalización se refiere al escalado o cen-
miento una parte muy importante dentro del trado de los datos, en el que se representan
proceso de minería de datos, se estima que se los datos numéricos en una escala predeter-
lleva el 60% de los esfuerzos y las tareas fun- minada, en este caso de 0 a 1. La fórmula uti-
damentales radican en la limpieza e integra- lizada es la siguiente, ver ecuación 1:
ción de datos [15].

La recopilación de los datos de diferentes


fuentes y aun de una sola implican la ejecu- (Ecuación 1)
ción de una limpieza exhaustiva de los datos
para un excelente análisis, que en ocasiones var_max : valor máximo
se convierte en una tarea bastante tediosa, var_min : valor mínimo
debido a que se pueden tener muchas incon- nuevo_max : nuevo valor máximo
sistencias en los datos que impide un exce- nuevo_min : nuevo valor mínimo
lente aprendizaje de éstos. Estas inconsisten-
cias se verán reflejadas a la hora de tomar Aquí se pretende normalizar el rango de un
decisiones. valor numérico para que los atributos estén
en función de la misma medida [14].
El software inicialmente se pensaba para de-
sarrollar cuatro pruebas psicológicas que Análisis de pruebas y resultados
eran: cuestionario de hábitos y técnicas de
estudio (CHTE), inventario de autoeficacia Para el entrenamiento de la red, se recopilaron
para inteligencias múltiples (IAIM), test de 4.212 patrones, de éstos el 70% se asignó al en-
aptitudes diferenciales (DAT), formulario de trenamiento de la red y el 30% restante para
intereses profesionales (FIP). Pero al analizar pruebas. Este porcentaje se selecciona aleato-
la primera prueba en mención la cual eva- riamente para que la red pueda tomar la ma-
lúa algunos aspectos de los hábitos y técni- yor combinación posible. A continuación, se
cas de estudio, se consideró que no se reali- presentan algunas pruebas realizadas a la red,
zaría porque su resultado no encaminaba a
la salida deseada. Se definieron tres entradas 7 Estas variables toman dos valores, usualmente cero
que hacen referencia a las pruebas; para éstas y uno. Los dos valores significan que la observa-
ción pertenece a una de dos categorías. Las variables
se realizaron el proceso de numerización y la
5656 normalización.
dummy o indicadoras sirven para identificar catego-
rías o clases a las que pertenecen las observaciones..

Red neuronal artificial para orientación profesional “UDProfession”


V Í N C U L O S
JULIO-DICIEMBRE DE 2009
VOLUMEN 6 NÚMERO 2

en las que se modificó la tasa de aprendizaje, ciar en la tabla 1, la mejor corrida es la nú-
el momentum, el umbral y la cantidad de ca- mero 2, ya que en ésta se puede apreciar un
pas ocultas, hasta encontrar la configuración margen de error mucho menor que el de las
más adecuada y que ofreciera los mejores re- demás corridas.
sultados, en cuanto a efectividad de refiere.
En la figura 2 se observa la grafica de error de
En la tabla 1 se pueden apreciar las prue- entrenamiento, que consiste en el error total
bas realizadas, variando los datos de entre- que se presentó en cada época y así analizar
namiento; tasa de aprendizaje, momentum, el comportamiento y aprendizaje de la red.
épocas, capas ocultas, porcentaje de entrena- Ésta fue la corrida que mostró un mejor des-
miento y de prueba. Según los datos resul- empeño, ya que el tiempo de entrenamiento
tantes, la segunda corrida se considera como fue mínimo y la cantidad de épocas fue me-
el mejor entrenamiento, porque el tiempo es nor que en los otros entrenamientos, se pro-
bajo en comparación con otras como la quin- bó con distintos valores en la tasa de apren-
ta, en la que se obtiene el mismo resultado y dizaje, el momentum, el número de épocas y
el error total es menor. Como se puede apre- el número de capas ocultas.

Tabla 1. Muestra de corridas de entrenamiento y pruebas

Datos de Entrenamiento Resultados


Corrida
Aprendizaje
Tasa

Momentum

Épocas

Capas Ocultas

Entrenamiento
% de
% de Prueba
Totales
Patrones
Entrenamiento
Patrones

Prueba
Patrones

Error Total

Entrenamiento
Éxito

Éxito Prueba

Tiempo
1 0.75 1.0 50 30 70 30 4212 2948 1264 118x10-7 93% 96% 29s

2 0.75 1.0 50 60 70 30 4212 2948 1264 6,37x10-9 93% 95% 39s

3 0.9 1.0 100 60 80 20 4212 3369 843 0.2554 99% 100% 94s

4 0.9 0.05 100 65 70 30 4212 3369 843 6,732x10-5 94% 96% 82s

5 0.75 1.0 500 60 67 33 4212 2822 1390 7,62x10-9 99% 100% 646s

6 0.75 1.0 100 160 70 30 4212 3369 843 1,124x10-7 100% 100% 152s

57
57

Diana Marcela Pulido Morales - Ana Celmira Gualteros Gualteros - Jorge Enrique Rodríguez Rodríguez
A T A C T U A L I D A D T E C N O L Ó G I C A

Tabla 2. Ejemplo de una matriz de confusión


Figura 2. Grafica de error de entrenamiento
C1 C2 C3 C4 C5

C1 1 0 0 0 0

C2 0 1 0 0 0

C3 0 0 1 0 0

C4 0 0 0 1 0

C5 0 0 0 0 1

Tabla 3. Muestra de patrones trabajados

Algunas de las salidas no se clasificaron bien, Pruebas


IAIM DAT FIP SALIDAS
debido a que las respuestas generadas de los Personas
datos no ofrecen una interpretación clara,
1 1 1 4 1
porque las entradas de los patrones no se re-
lacionan entre sí y esto implicaría la aplica- 2 31 27 8 9
ción de otro proceso realizado por el experto.
3 16 1 3 36
Para mejorar el entrenamiento, se tomó aleatoria-
4 36 25 6 27
mente los patrones; de esta manera, la red reco-
rrerá una buena cantidad de patrones y no se con- 5 1 2 2 15
centrará tan sólo en unos cuantos, evitando así el
sobreentrenamiento. La matriz de confusión ge-
nerada del entrenamiento de la red neuronal es de
tamaño 58*58, que representa las 58 salidas de En la tabla 4, se puede apreciar la interpretación
la red neuronal; a través de ésta se podrá obser- (área profesional) de los patrones relacionados en
var la efectividad del entrenamiento y la prueba. la tabla 2.
La matriz de confusión hace la comparación en-
tre las salidas obtenidas y las salidas deseadas, de Conclusiones
este modo clasificará la clase resultante, es decir,
las clases que quedaron en la diagonal son las cla- • La implementación de un software que
sificadas correctamente y las que están fuera de permita desarrollar un proceso de orien-
la diagonal son las erróneas. En la tabla 2 se pue- tación profesional es de gran importan-
de apreciar un ejemplo de la matriz de confusión. cia y utilidad en el ámbito académico, ya
que le permite al estudiante ir desarro-
En la tabla 3, se aprecia una muestra de los pa- llando cada prueba vocacional a través
trones que se recopilaron para realizar el en- de un entorno más interactivo y ameno.
trenamiento de la red neuronal, cada núme- Con este desarrollo se ofrecen herra-
ro corresponde al resultado de cada una de mientas alternas para apoyar la selección
5858 las pruebas realizadas por “UDProfession”.

Red neuronal artificial para orientación profesional “UDProfession”


V Í N C U L O S
JULIO-DICIEMBRE DE 2009
VOLUMEN 6 NÚMERO 2

Tabla 4. Muestra de interpretación

Pruebas
Personas IAIM DAT FIP INTERPRETACIÓN

Cinestési- Ciencias de la sa-


Razonamien- Ciencias de la salud y ser-
1 ca-corpo- lud y servicio
to verbal vicio social
ral social

Rapidez y
2 Musical precisión Áreas artísticas Áreas artísticas
perceptivas

Ciencias huma- Ciencias humanísticas in-


Razonamien-
3 Lingüística nísticas y investi- vestigación de cultura
to verbal
gación de cultura

Admón. E in-
Razonamien-
Naturalista vestigación Admón. e investigación
4 to mecánico
de ciencias de ciencias agropecuarias
agropecuarias

Razonamien-
Cinestésica Ciencias econó-
to verbal-apti- Ciencias económicas ad-
5 corporal micas administra-
tud numérica ministrativas del mercado
tivas del mercado

de una carrera profesional a un estudian- Trabajos futuros


te de bachillerato.
• Se seleccionó dentro del área de inteli- • “UDProfession” podría integrar más in-
gencia artificial, una técnica de apren- formación vocacional y alguna activi-
dizaje computacional: redes neuronales, dad interactiva que impulse el proceso y,
que de acuerdo con sus características asimismo, que pueda ampliar el conoci-
presenta un mejor desempeño y confia- miento del estudiante acerca de su perfil
bilidad de respuesta al proceso de orien- profesional.
tación profesional que se implementó. • Implementar más pruebas de orientación
La red neuronal encuentra patrones que profesional, a fin de ampliar la base de
permiten orientar a una persona para in- conocimiento y permitir que la red pue-
gresar a la universidad. da aprender con base en más patrones.
• Se logró sistematizar todas las pruebas • Implementar otras técnicas de aprendi-
de orientación profesional, a través de zaje computacional, tales como: méto-
una interfaz diseñada en PHP, bajo un dos bayesianos, algoritmos evolutivos,
entorno de selección múltiple con única algoritmos basados en aprendizaje incre-
respuesta. mental, entre otros, con el objeto de com-
59
59

Diana Marcela Pulido Morales - Ana Celmira Gualteros Gualteros - Jorge Enrique Rodríguez Rodríguez
A T A C T U A L I D A D T E C N O L Ó G I C A

parar con el algoritmo backpropagation [7] M. A. Mejía. Escoja bien su carrera. Bogotá:
aquí implementado, en cuanto a efectivi- Intermedio. Cáp.1, 2000.
dad se refiere. [8] M. Corredor. Introducción a la Inteligencia
Artificial. Ed. UIS. 1998.
Referencias bibliográficas [9] F. Escolano y M. A. Cazorla. Inteligencia
artificial: modelos, técnicas y áreas de apli-
[1] W. S Mcculloch y W. Pitts. “A logical cal- cación. España: Thompson Editores.
culus of ideas immanent in nervous ac- 2003.
tivity”. Bulletin of Mathematical Biophys- [10] M. L. Rodríguez Moreno. Orientación e
ics, 1943. intervención psicopedagógica. Barcelona:
[2] M. Gallego. Guías de Trabajo para “Con- Barcanova. 1995.
serjería y Orientación Profesional”. [11] M. J. De la Fuente. Redes Neuronales Ar-
Corporación Universitaria Iberoameri- tificiales. España: Universidad de Valla-
cana. Bogotá: el autor, 2005. dolid. 2002.
[3] H. Gardner. Estructuras de la mente: la teo- [12] D. Pyle. Data Preparation for Data Min-
ría de las inteligencias múltiples. México: ing. United States: Morgan Kaufmann.
Fondo de Cultura Económica. 1999. 1999.
[4] L. Álvarez Munárriz. Fundamentos de In- [13] http://es.wikipedia.org/wiki/
teligencia Artificial. España: Universidad Sistema_experto
de Murcia. 1994. [14] http://bdigital.eafit.edu.co/bdigital/
[5] S. Barro y J. Mira. Computación neuronal. PROYECTO/P005.74C268U/fulltext.
España: Universidad de Santiago de pdf
Compostela. 1995. [15] http://svo.laeff.inta.es/Uploads/svo/
[6] J. Hilera y V. Martínez. Redes neuronales svo-datamining/preprocesado.pdf
artificiales “fundamentos, modelos y aplica-
ciones”. España: Alfaomega. 2000.

6060
Red neuronal artificial para orientación profesional “UDProfession”

You might also like