You are on page 1of 19

UNIVERSIDAD NACIONAL DE TRUJILLO

Facultad de Ciencias físicas y matemáticas
Escuela Académico Profesional de Informática

DESARROLLO DE UN SISTEMA EXPERTO BASADO EN
PROCESAMIENTO DE LENGUAJE NATURAL PARA
BRINDAR INFORMACIÓN DE LOS PROGRAMAS
OFRECIDOS A LOS USUARIOS DEL CENTRO DE
IDIOMAS DE LA UNIVERSIDAD NACIONAL DE
TRUJILLO

Nombre de autor(es):
Jonathan Brian Baca Huamán
Junior Eladio Luna Victoria Lozano

Nombre del Asesor:
Juan Orlando Salazar Campos

Trujillo - La Libertad
2017

1

Autor(es) Código(s) Nombres y Apellidos Cargo en el proyecto Email 10227006-12 Jonathan Brian Baca Huamán Estudiante invest.2.4. De acuerdo al diseño de investigación (Descriptiva / Explicativa): Investigación Explicativa 1.com 10227012-12 Junior Eladio Luna Victoria Lozano Estudiante invest.2.com 1.3. juniorlunavictoria@gmail. 1. 2 . Tema de investigación : Desarrollo de un sistema experto basado en procesamiento de lenguaje natural para brindar información de los programas ofrecidos a los usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo. jbbecs@gmail.1.4.3.4.3.3.1.4.1. GENERALIDADES 1. Área y línea de Investigación 1. Línea de Investigación: Sistemas Expertos 1. PROYECTO DE INVESTIGACIÓN PARA TRABAJO DE GRADUACIÓN ESCUELA ACADÉMICO PROFESIONAL DE INFORMÁTICA 1. Título Desarrollo de un sistema experto basado en procesamiento de lenguaje natural para brin- dar información de los programas ofrecidos a los usuarios del Centro de Idiomas de la Univer- sidad Nacional de Trujillo. Área de investigación: Inteligencia Artificial 1. Tipo de investigación 1. De acuerdo al fin que se persigue (Básica/Aplicada): Investigación Aplicada 1.2.

1. Localidad (Dirección.2.6.5. Institución (Universidad/Facultad/Departamento): Universidad: Universidad Nacional de Trujillo (UNT) Facultad: Facultad de Ciencias Físicas y Matemáticas Departamento: Informática. Departamento) : Dirección: Av. Ciudad Universitaria Distrito: Trujillo Provincia: Trujillo Departamento: La Libertad 1. Duración de la ejecución del proyecto (en meses) DEL 24/04/2017 AL 02/03/2018 (10 meses + 6 días) 3 .5. Localidad e Institución donde se desarrollará el proyecto 1. Juan Pablo II S/N. Provincia.1.5. Distrito. 1.

7.7. Cronograma de ejecución del proyecto de investigación (tesis) Tabla 1: Cronograma de ejecución de Tesis Etapas Actividades/Tareas Fecha de Inicio Fecha de Término Horas Semanales Búsqueda de antecedentes 26/04/2017 26/05/2017 21 Recolección de datos Investigación bibliográfica 27/05/2017 13/06/2017 14 Análisis de la realidad realidad 14/06/2017 21/06/2017 12 problemática Análisis de los Datos Justificación del proyecto 22/06/2017 25/06/2017 8 Planteamiento del problema 26/06/2017 28/06/2017 8 Formulación de la hipótesis 29/06/2017 05/07/2017 8 Formulación de los objetivos 06/07/2017 10/05/2017 10 Selección de la metodología 11/07/2017 16/07/2017 10 Metodología de Trabajo Población y muestra 17/07/2017 21/07/2017 10 Marco teórico 22/07/2017 18/08/2017 21 Diseño del sistema experto 19/08/2017 21/10/2017 21 Diseño e Implementación Implementación del prototipo 22/10/2017 18/11/2017 21 del sistema experto Pruebas del prototipo 19/11/2017 17/12/2017 21 Pruebas del sistema experto Análisis de resultados Contrastación de la hipótesis 18/12/2017 31/01/2018 21 Marco teórico 01/02/2018 10/02/2018 21 Redacción del informe Metodología 11/02/2018 20/02/2018 21 Resultados y conclusiones 20/02/2017 02/03/2018 21 4 .1. Cronograma de ejecución 1.1.

TG Etapas Actividades/Tareas Fecha de Inicio Fecha de Término Horas Semanales Preparación del TG Selección y determinación 24/04/2017 25/04/2017 6 del tema Búsqueda de antecedentes 26/04/2017 26/05/2017 21 Recolección de datos Investigación bibliográfica 27/05/2017 13/06/2017 14 Análisis de la realidad realidad 14/06/2017 21/06/2017 12 problemática Análisis de los Datos Justificación del proyecto 22/06/2017 25/06/2017 8 Planteamiento del problema 26/06/2017 28/06/2017 8 Formulación de la hipótesis 29/06/2017 05/07/2017 8 Formulación de los objetivos 06/07/2017 10/05/2017 10 Selección de la metodología 11/07/2017 16/07/2017 10 Metodología de Trabajo Población y muestra 17/07/2017 21/07/2017 10 Marco teórico 22/07/2017 18/08/2017 21 5 .1.TG Tabla 2: Cronograma de ejecución del trabajo de graduación .2.7. Cronograma de ejecución del trabajo de graduación .

Materiales y Equipos: A) Materiales: Dos Resaltadores Faber-Castell Dos Cuadernos Anillados Shark Dos Lápiz Faber-Castell 2B Dos Lapicero Pilot Dos Borradores Un Engrapador Un Perforador Dos Correctores Diez Folder Manila B) Equipos: Laptop Lenovo Ideapad Y580 Laptop Lenovo Thinkpad Y720 Computadora de escritorio Memoria USB Kingston C) Servicios: Servicio eléctrico Servicio de Internet Servicio de transporte Servicio de impresión Servicio de anillado Servicio de empastado 6 . Personal: A) Investigadores: Baca Huamán.1.2.1. Jonathan Brian Luna Victoria Lozano. Recursos disponibles 1.8.8. Junior Eladio B) Asesor: Salazar Campos. Juan Orlando 1.8.

10. Presupuesto Tabla 3: Presupuesto de Materiales y Servicios Descripción Unidad Cantidad Costo Unitario Costo Total Materiales Resaltador Faber-Castell Unidad 2 1.50 5.90 130.00 Total Servicios 435. Autofinanciación: El costo total del proyecto será financiado por los investigadores. Financiamiento 1.00 Corrector Faber-Castell Unidad 2 2.2 Servicio de Internet Horas 720 0.50 7.18 129.50 5.00 Servicio de empastado Juego 1 20 40.00 2.16 115.50 Servicio de impresión Unidad 150 0.25 12.00 4.8.50 1.50 Total Equipos 2126.60 Servicio de transporte Global 145 0.50 782.MM 1.00 Equipos Laptop Lenovo Ideapad Y580 Unidad 1 781.00 8.50 5.00 Engrapador Artesco Unidad 1 6.80 1.30 Costo Total 2603.00 Borrador Artesco Unidad 2 0.00 Lapicero Pilot Unidad 2 3.10 15.FF. 7 .00 Cuaderno Anillado Shark Unidad 2 4.00 6.1.50 Computadora de escritorio Unidad 1 550.3.1.00 4.00 Perforador Artesco Unidad 1 4.50 Laptop Lenovo Thinkpad Y720 Unidad 1 782.50 Servicios Servicio eléctrico Horas 720 0.9.10.00 Servicio de anillado Juego 2 2.50 781. los cuales se divi- dirán los gastos en partes iguales.00 Total Materiales 42.00 Lapiz Faber-Castell 2B Unidad 2 2.00 Memoria USB Kingston Unidad 2 6.00 550. Locales: A) Aulas de la escuela de Informática B) Laboratorios de la escuela de Informática C) Biblioteca de la Facultad de CC.00 Fólder manila Unidad 10 0.

Resumen del proyecto El presente trabajo de investigación se origina como innovación en el servicio de aten- ción al cliente del Centro de idiomas de la Universidad Nacional de Trujillo (CIDUNT). la primera para el desarrollo de un sistema experto que nos facilite la planificación y control del proceso de desa- rrollo.11.1. información de los cursos y además información ge- neral del CIDUNT. cursos disponibles. Para esto se plantean dos etapas dentro del desarrollo. tales como fechas de matrícula. Como resultado de éste trabajo se espera un sistema experto basado en procesamiento de lenguaje natural que propor- cione información en el Centro de idiomas de la Universidad Nacional de Trujillo. Se plantea el desarrollo de un sistema experto que interactúe a través de lenguaje natural para re- solver las dudas con respecto a los programas ofrecidos al usuario del CIDUNT. y una segunda etapa para el procesamiento de lenguaje natural. 8 .

en nuestro país se observa un crecimiento del mercado tecnológico debido a que en los últimos años ha crecido sustancialmente el ámbito económico. Uno de sus proyectos ya gestados es Arturito BCP. La investigación nos muestra que el 80 % de las empresas encuestadas para el año 2020 utilizaran Inteligencia Artificial para la atención al cliente. 2016) En este contexto. Es por ello que IBM se ha enfocado en masificar el uso de Inteligencia Artificial en las empresas del Perú.1. se puede percibir en instituciones locales de Trujillo del departamento de La Libertad. 2017) IBM. lo cual produce insatisfacción en el usuario. 9 . que este tipo de tecnología aún no se han implementado en ningún rubro em- presarial. Antecedentes y fundamentación científica.(Oracle. causando deficiencias en su servicio de atención al cliente y generando no solo un malestar en sus clien- tes sino también en su personal encargado de este proceso. En contraste con esa situación. Esta sociedad nos alcanza un reporte en el cual se explora como el boom digital y la tecnología móvil han reformado el comportamiento del cliente y sus relaciones con las marcas. ventas y servicios para ofrecer una mejor experiencia para el cliente.1. Las empresas locales se muestran indiferentes al uso de esta tecnología. técnica o humanística 2. A pesar de la importancia que tiene el servicio de atención al cliente. (Oracle. el Centro de Idiomas de la Universidad Nacional de Trujillo presenta una realidad semejante. revela que a nivel nacional hay tres proyectos en ejecución y un total de 20 proyectos que se están desa- rrollando con Inteligencia Artificial para este año en los distintos rubros empresariales. esto se evidencia mediante una investigación realizada a finales del 2016 por Forrester Research. desplazando al personal humano. 2016) Oracle se asoció con Coleman Parkes Research para explorar como las marcas están innovando en sus funciones de marketing. una de las empresas de tecnología con más proyectos en nuestro país. PLAN DE INVESTIGACIÓN 2. (Mendoza Riofrío.2. un canal de respuestas automáticas por inbox con un alcance ilimitado debido a su implementación por la plataforma tecnológica IBM Watson. El tiempo em- pleado en los servicios de atención al cliente para hablar con el personal asignado y resolver un problema llega a ser algo molesto. Realidad Problemática: En las empresas el servicio de atención al cliente es primordial para el desarrollo y progreso de la empresa. no se aprecia como prioridad en los planes de la institución. se percibe que las empresas de distintos rubros en el Perú también se están sumando a este boom digital.1. reveló que el 71 % de empresas tienen como prioridad mejorar la experiencia del cliente. 2017) Asimismo. empresa independiente de investigación de mercados que brinda asesoramiento sobre el impacto existente y potencial de la tecnología a sus clientes y al público en general. (Paan.

entre la que se encuentra el uso de ontologías del dominio y otros recursos lingüísticos como WordNet. como la anáfora y la elípsis. El uso de estos agentes permiten a las personas tener interacción con la institución sin restringirse como lo hacen con un personal humano. elípsis y preguntas contextuales. problemas puntuales y comúnes para el procesamiento de lenguaje natural. Además. d) recuperación y presentación de resultados y e) respuesta del usuario. El único inconveniente detectado fue el limitado dominio que se ejerció en el agente conversacional. El resultado que se obtiene de este proyecto fue de un 81. c) tratamiento de consulta.1. los principales errores detectados se debieron a la detección incorrecta de la consulta. Luego de detectar de forma incorrecta la consulta la reformulación de esta se dió con un 75 % de exactitud. además se creó una base de datos para almacenar links de paginas con información complemen- taria sobre la maestría en Ciencias de la Computación. Rojas (2016) desarrolló una interfaz de lenguaje natural que incorpora la resolución de problemas lingüísticos diversos. debido a su sencillez y a su capacidad para poder crear sistemas CBR (Case Base-Reasoning) para cualquier tipo de dominio.4 reformulaciones por pregunta y un 71 % de reformu- laciones de preguntas en la primera iteracción. Martínez et al. b) definir atributos de la conversación. se presentó una metodología para orga- nizar y diseñar la estructura de diálogos de un agente conversacional animado que proporciona sobre la maestría en Ciencias de la Computación del Instituto Tecnológico de la Ciudad de Ma- dero. c) recabar información relacionada. Esta metodología se dividió en cinco fases: a) establecer objetivo.7 segundos. glosario. ademas se calculó un tiempo de respuesta de 35. teniendo un promedio de 1. Este entorno presenta una interfaz textual que permite estable- cer comunicaciones con diferentes usuarios en lenguaje natural escrito.4 % de precisión.2. b) recepción de consulta. Se realiza una evaluación que prueba la efectividad de la paroximación con una fortaleza que debe resaltarse ya que se co- nectan diversas bases de datos heterogeneas (información estrucurada y datos no estructurados externos obtenidos de la web) sin que el usuario requiera de conocimientos técnicos expertos. Esta tesis propuso una arquitectura la cual se compone de cinco módulos principales: a) cone- xión e interacción con la fuente de datos. Antecedentes: Según Domínguez (2011) la implementación y uso de agentes conversacionales es uno de los nuevos e importantes desarrollos dentro del servicio de atención al cliente. Asimismo se usó AIML (Artificial Intelligence Mark-up Language) para crear una base de conocimiento a base de una serie de patrones y respuestas. El objetivo principal de este trabajo fue que el sistema comprenda los mensajes de los usuarios.2. sin embargo al realizar preguntas sobre el dominio establecido se obtuvo un 100 % de funcionabilidad. Para llevar a cabo la implementación de este sistema se ha utilizado el entorno jCOLIBRI. (2006) describe los aspectos mas relevantes del sistema de asistencia interactiva que se ha diseñado. Además este entorno proporcionó una extensión textual compuesta por una serie de métodos: filtro de palabras. indentificador de expresiones propias y clasificación 10 . es capaz de procesar una serie de preguntas encadenadas (serie de preguntas contextuales). Además presentó al- gortimos propios para la resolución de la anáfora. Para llevar a cabo esta tarea se utilizan técnicas de análisis y extracción de información. En este documento. d) análisis de la información recabada y e) desarrollar la base de conocimiento.

lo que implicó el usó de lenguajes para el desarrollo de este tipo de sistema. El proyecto se ha realizado utilizando un marco de desarrollo ágil. Al realizar las pruebas en personas ajenas al proyecto los resultados fueron: un 18 % en la fase inicial. La implementacion al realizarse sobre la página web de la facultad se realizó de manera web. c)base de datos. en contexto con ello esta investigación alcanzo un nivel de validación y verificación del 94 %. fase 1. e)chatbot y f)interfaz. tipo scrum. 3) confirmación de información extraída y 4) interacción con ontologías. d)buscador (SOLR). tienen la certeza de ser aceptados por parte del usuario/cliente y permite una mejor comercialización del sistema. para mostrar una salida coherente en lenguaje humano. Este proyecto se constituyó por cuatro fases: 1) sistema inicial con interfaz textual básica. b)inspección y validad- ción y c) Reducción de casos de pruebas basados en contexto. El objetivo final de la detección de errores y de tener un sistema completamente validado es obtener un nivel de validadción y verificación del 100 %. Se presento como el estandar de facto para los sistemas basados en conocimientos la metodología CommonKADS y además fue usado en esta investigación como base para el desarrollo de un nuevo método. Según Batarseh and Gonzalez (2011) se realizó una investigación la cual presentó un método novedoso para la validación de los sistemas basados en conocimiento. y en caso de no encontrar un patrón de entrada. Para ello. Se ha implementado un asistente virtual cuyo propósito principal es facilitar la bús- queda de información dentro del dominio de la Facultad de Informática de la Universidad Com- plutense (Vallejo Ruiz. todos estos resultados evaluaron la efectividad del sistema en usuarios que tenían relación con el proyecto. 61 % en la segunda y un 84 % en la cuarta etapa. En la investigación Lovera Raffo (2011) permitió al cliente resolver sus inquietudes de forma inmediata mediante el módulo de correo electrónico haciendo uso de sistemas exper- 11 . Sin embargo en el segundo momento. Los resultados obtenidos al realizar 20 consultas de diferentes tipos en 2 grupos correspondientes fueron 48 % en la primera fase. Este metódo fue llamado MAVERICK (Met- hod for Automated Validation Embedded into the Reusable and Incremental CommonKADS) y consto de tres partes principales: a) extracción de casos de prueba. se hace uso del lenguaje de programación AIML. 2) extracción de la información e implementación de sinónimos que utiliza la base léxica de Wordnet y por el pro- pio desarrollador. asimismo un 33 % en la fase siguiente y por último un 55 % de efectividad en la fase 4. Se realizó una evaluación en 3 fases. Los métodos de validación para sistemas basados en conocimiento son importantes por que reducen las perdidas de todo tipo. utilizar un repositorio de urls indexadas para devol- ver las que más se ajusten. la cual constó de 11 sprints. presentó una qrquitectura que se compuso por seis módulos: a)controlador. gracias a esto desarrollaron su etapa de generación de respuesta. Además. 2 y 4. b)analizador. en el cual obtuvo un porcentaje de calidad del 56 %. El programa es capaz de analizar las peticiones del usuario en lenguaje natural para intentar ofrecer respuestas que satisfagan sus necesidades. 2015). el cual fue tras la versión final del sistema logró obtener un porcentaje de calidad del 76 %. El primer momento fue tras la primera versión funcional de la aplicación al finalizar el sprint 9.por temas. que son capaces de reconocer patrones de entrada. así como de una base de datos. y además se tomó en cuenta el evaluar a personas con conocimiento del tema y a personas ajenas al proyecto. Se llegó a la conclusión de que tuvo un desempeño notable tras realizar un test en dos momentos distintos. ajustandose a la hipótesis planteada.

4. llegando a un promedio de 961 milisegundos y la respuesta del cleinte al surgir la interrogante de la satisfacción fue positiva. 2. este es el caso del Centro de Idiomas de la Universidad Nacional de Trujillo.94 % de confiabilidad. Además.2.tos. Problema ¿De que manera brindar información de los programas ofrecidos a los usuarios del Cen- tro de Idiomas de la Universidad Nacional de Trujillo? 2. B) Variables Dependientes: Brindar información de los programas ofrecidos a los usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo.4. Variables: A) Variables Independientes: Sistema experto basado en procesamiento de lenguaje natural. además. b)servidor de base de datos MySQL y c)servidor de aplicaciones que consta de la aplicación en JAVA y del Sistema Experto implementado gracias a JESS (Java Expert System Shell) que generará el mensaje de respuesta. 12 . Hipótesis Mediante un sistema experto basado en procesamiento de lenguaje natural se brinda información de los programas ofrecidos a los usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo.3. el cual sirva como un aporte hacia la comunidad científica. a partir de estos conocmientos poder generar un siste- ma experto basado en procesamiento de lenguaje natural. La prioridad que el servicio de atención al cliente en las empresas es máxima. Inteniería del Software y Tópicos en Ciencias de la Computación I. ya que estas saben que muchas empresas no logran fidelizar a sus usuario no por el producto que ofre- cen sino por la atención que dan. debido a que logró un 91. 2. 2. tales como los de Inteligencia Artificial. la velocidad de respuesta era muy rápida. El presente proyecto de investigación se desarrolla con la finalidad de evitar incomodidades en el usuario a la hora de pedir información sobre los programas ofrecidos por el Centro de Idiomas de la Universidad Nacional de Trujillo. Los resultados obtenidos por este proyecto fueron destacables. significando una pérdida económica. Justificación La oportunidad de poder aplicar conocimientos adquiridos durante nuestro tiempo en la universidad. La arquitectura presentada se organizó en 3 grandes servidores: a)servidor de correo el cuál estuvo compuesto por el servidor de correos Postfix y el filto de correos Spa- mAssitant.1. Su propuesta presentó una arquitectura muy viable para la solución de sistemas expertos en contact centers.

1.4.2.2. a través de encuestas dirigidas al usuario. Objetivo General: A) Desarrollar un sistema experto basado en procesamiento de lenguaje natural para brin- dar información de los programas ofrecidos a los usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo. F) Demostrar que el sistema experto realiza un 100 % de las funciones planteadas. F) Porcentaje de efectividad del sistema experto. D) Nivel de usabilidad del sistema experto.5. E) Nivel de satisfacción de los usuarios. mediante un nivel de exactitud sintác- tica mayor al 85 %. C) Evaluar el tiempo y la precisión de respuesta que brinda el sistema experto correspon- diente a brindar información sobre los programas ofrecidos del Centro de Idiomas de la Universidad Nacional de Trujillo. C) Tiempo de respuesta del sistema experto.2. 2.5. B) Demostrar que el sistema experto puede mantener una comunicación fluida con el clien- te a través del procesamiento de lenguaje natural. Indicadores: A) Porcentaje de cumplimiento de las funciones. 2. a través de una evaluación heurística aplicada a la interfaz gráfica del sistema experto. D) Determinar el nivel de usabilidad del Sistema experto frente al usuario del Centro de Idiomas de la Universidad Nacional de Trujillo.5. Objetivos Específicos: A) Determinar los requerimientos funcionales para el sistema experto a través de una entre- vista con el personal de la institución encargado de brindar información sobre los cursos ofrecidos por el Centro de Idiomas de la Universidad Nacional de Trujillo. B) Nivel de exactitud sintáctica de los Datos. Objetivos 2. 13 . median- te la comparación de los requerimientos funcionales otorgados por el personal encarga- do de la institución (experto humano) y las funciones que realiza el sistema. E) Evaluar la satisfacción de los usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo.

para ser mas exactos es ti- po de experimento puro. a ambos grupos se les administra una medición sobre la variable dependiente en estudio. al igual que las condiciones ambientales y demás factores mencionados al hablar sobre la equivalencia de los grupos(Hernández Sampieri et al. X = Sistema experto basado en procesamiento de lenguaje natural. 2014) Este diseño de la presente investigación se diagrama tal como se observa en la figura 1.(Hernández Sampieri et al. Diseño Experimental La presente investigación presenta un diseño experimental. Figura 1: Diseño experimental Donde: G1 = Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo. cuando la participación es individual). O1 = Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo que usan el sistema experto. Este diseño incluye dos grupos: uno recibe el tratamiento experimental y el otro no (grupo de control). 14 . 2014) En este diseño. Cuando concluye la ma- nipulación. La hora en que se efectúa el experi- mento debe ser la misma para ambos grupos (o ir mezclando un sujeto de un grupo con un sujeto del otro grupo. la manipulación de la variable independiente alcanza sólo dos niveles: presencia y ausencia.. Inicialmente son equivalentes y para asegurarse de que durante el experimento continúen siéndolo (salvo por la presencia o ausencia de dicha manipulación) el experimentador debe observar que no ocurra algo que sólo afecte a un grupo. G2 = Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo.6. O2 = Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo que no usan el sistema experto.1. Los sujetos se asignan a los grupos de manera aleatoria. Diseño con posprueba únicamente y grupo de control. la única diferencia entre los grupos debe ser la presencia-ausencia de la variable independiente..6.2. Metodología de trabajo 2. Es decir.

2. la certeza total es igual a 1. Cuando no se tiene marcos de muestreos previos se utiliza el 50 %.2.6. Figura 2: Uso del programa STATS para obtener la muestra. Población y Muestra A) Población: Usuarios del Centro de Idiomas de la Universidad Nacional de Trujillo. B) Muestra: Un total de 343 usuarios elegidos de forma aleatoria. Porcentaje estimado de la muestra: Es la probabilidad de ocurrencia del fenómeno: representatividad de la muestra vs no representatividad. En la figura 2 se calcula que el tamaño de la muestra es de 343 usuarios con un error máximo aceptable del 5 %. los cuales son: Tamaño del universo: Este dato lo obtenemos del Centro de Idiomas de la Universi- dad Nacional de Trujillo Error máximo aceptable: Este dato hace referencia al % de error que se permite to- lerar de que la muestra no sea representativa de equivocarse. En la presente investigación se optó por la recomendación de Hernández Sampieri et al. (2014) y se hizo uso del programa STATS para calcular la muestra. 15 . Nivel deseado de confianza: Es el complemento del error máximo aceptable( % de acertar en la representatividad de la muestra). El programa STATS nos exige cinco datos para poder hacer el cálculo.

6. Detalla el intercambio de información entre los diferentes agentes involucrados en la ejecución de las tareas descritas en el modelo de tarea. utiliza el modelo del conocimiento y el de comuni- cación. características. B) Nivel de concepto Describe el sistema de conocimiento a construir. El primer nivel o nivel de contexto se compone del modelo organizacional. autoridad y restricciones para actuar de los agen- tes. software o cualquier otra entidad capaz de realizar una tarea. Finalmente el nivel de artefacto tiene al modelo del diseño. Metodología a Aplicar La metodología CommonKADS abarca todo el ciclo de desarrollo de software.3. a) Modelo de la Organización(OM). Determina los problemas y oportunida- des a resolver. unos productos asociados y unas estrategias para su desarrollo. los cua- les caracterizan el alcance para el desarrollo de cada modelo. pretende descubrir problemas y oportuni- dades de mejora. Es la descripción conceptual del conocimiento aplicado a las tareas. b) Modelo de la Tarea(TM). Puede ser humano. Este modelo describe las competencias. cada uno tiene un propósito específico. CommonKADS define estados. modelo de tarea y modelo de agente. a) Modelo de Comunicaciones(CM). Asociados a estas plantillas. Es una herramienta para analizar la organización para la cual el SBC va a ser introducido. considerando el impacto que se produce en la organización. c) Modelo de Agente(AM). A) Nivel de contexto Responde a las preguntas del porqué se debe diseñar el sistema. me- diante un número de modelos interrelacionados que capturan los principales rasgos del sistema organizacional y su entorno. Analiza la estructura y naturaleza del conocimiento utilizado y la comunicación existente. Lo anterior se logra detallando información a través de plantillas referentes a cada modelo. justificando las razones por las cuales se construye el sistema experto. 16 .2. Los modelos mencionados reflejan diferentes puntos de vista del conocimiento inmerso en un problema y en su solución. El segundo nivel llamado de concepto esta compuesto por el modelo de conocimiento y el modelo de la comuni- cación. Según Schreiber (2000) un ciclo de proyecto con la metodología CommonKADS está compuesto por tres niveles conformados por modelos. Un agente es un ejecutor de una tarea. Describe a un nivel general las tareas que son realizadas o serán realizadas en el entorno organizativo en que se propone instalar el SBC pro- porcionando el marco para la distribución de tareas entre agentes.

C) Nivel de artefacto Identifica los aspectos técnicos de programación y de construcción en el ordenador. y mecanismos computacionales para la implementación de SC. produce la especifica- ción técnica en términos de arquitectura. Da solución a preguntas del cómo: ¿Cómo tiene que ser implementado el conocimiento en un sistema basado en ordenador? ¿Cómo debe ser la arquitectura del software? ¿Có- mo se debe traducir el conocimiento a un lenguaje comprensible por el ordenador? En este nivel está el modelo de diseño. construcciones de representación. Este es el corazón de la metodología Common- KADS y modela el conocimiento de resolución de problemas empleado por un agen- te para realizar una tarea. El modelo de la experiencia distingue entre el conocimien- to de la aplicación y el conocimiento de resolución del problema. En general. 17 . plataforma de implementación. El conocimiento de la aplicación se divide en tres subniveles: nivel del dominio (conocimiento decla- rativo sobre el dominio). módulos de software. nivel de inferencia (una biblioteca de estructuras genéricas de inferencia) y nivel de tarea (orden de las inferencias). b) Modelo del Conocimiento(EM). este modelo se utiliza para describir la arquitectura y el diseño técnico del SBC como paso previo a su implementación. a) Modelo de Diseño (DM): Mientras que los otros cinco modelos tratan del análisis del SBC.

F. Metodología de la investigación.. Asistente virtual (chatbot) para la web de la facultad de informática. Fernández Collado. (2011). (2006). P. (2000). (2017). E-Prints Complutense. Repositorio Digital de Tesis PUCP. Domínguez. Martínez. P. Á. Paan. Rojas. R. R. El Comercio. G.USA. Incremental lifecycle validation of knowledge-based systems through CommonKADS. A. University of Central Florida.. I. J. E-Prints Complutense. C. Interfaz en lenguaje natural en sistemas de toma de decisiones para trata- miento de preguntas contextuales con anáfora y elipsis. C. Sistema de asistencia interactiva en lenguaje natural. Y. J. (2014). 18 . A. Vallejo Ruiz. MIT press. El Comercio. J. Oracle. Mcgraw-hill México. A. R. PhD thesis. Diseño e implementación de un sistema experto para una plataforma de contact center. Lovera Raffo.. Instituto Tecnológico de la ciudad de Madero. Mendoza Riofrío. (2016). (2015).Referencias Batarseh. Universitat d’Alacant- Universidad de Alicante. volume 6. S. Hernández Sampieri.. Can virtual experiences replace reality? Technical report. 500 Oracle Parkway. Diseño de un asistente virtual con diálogo emocional. and Gonzalez. Ibm: “queremos masificar el uso de la inteligencia artificial en el perú”. (2011). D.Redwood Shores. C. and Baptista Lucio. Al menos 20 grandes empresas locales ya trabajan proyectos de inteligencia artificial. Schreiber. E. M. and Arteaga. M. PhD thesis. C. Oracle Corpo- ration. (2017). Master’s thesis. Knowledge engineering and management: the CommonKADS methodo- logy.CA 94065. (2016). (2011). A. Ortega.

Jonathan Brian Baca Huaman Junior Eladio Luna V ictoria Lozano Juan Orlando Salazar Campos Asesor 19 .