You are on page 1of 90

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FSICAS Y MATEMTICAS DEPARTAMENTO DE INGENIERIA INDUSTRIAL

ANLISIS CUANTITATIVO DE LA EFECTIVIDAD EN LOS PROGRAMAS DE SENAME BAJO LA NUEVA LEGISLACIN PENAL ADOLESCENTE

MEMORIA PARA OPTAR AL TTULO DE INGENIERO CIVIL INDUSTRIAL

RODRIGO ALEJANDRO MIRANDA SEZ

PROFESOR GUA: JOS INOSTROZA LARA MIEMBROS DE LA COMISIN: LUIS ZAVIEZO SCHWARTZMAN LUCA DAMMERT GUARDIA

SANTIAGO DE CHILE JUNIO 2011

Resumen Ejecutivo
El Servicio Nacional de Menores (o SENAME), institucin dependiente del Ministerio de Justicia, percibe recursos con los cuales implementa polticas focalizadas en la reinsercin y rehabilitacin de jvenes o infantes con antecedentes de violencia intrafamiliar, delincuencia, entre otros. Dicha institucin cuenta con un departamento de estudios que vela por el seguimiento de sus programas y analizar su eficacia y eficiencia. Este estudio complementa las fuentes de informacin que operan en SENAME, respecto a aquellos programas impartidos bajo la Ley de Responsabilidad Penal Adolescente. Con los resultados obtenidos SENAME est en mejores condiciones para responder a preguntas como en qu programas invertir ms recursos? y qu programas deben potenciarse o repensarse? En una primera etapa, este estudio indag acerca de la situacin general de SENAME: conocer su institucionalidad, rol e importancia para el estado chileno. Fue necesario conocer en profundidad la Ley de Responsabilidad Penal Adolescente de manera de caracterizar el mbito y alcances de este estudio. Adems, se realiz un anlisis comparativo entre el sistema penitenciario chileno y SENAME, donde se muestra la importancia de aumentar recursos en prevencin de delitos- en etapas tempranas de la adolescencia, en el cual SENAME adquiere una gran relevancia dado su rol institucional. En una segunda etapa se identificaron y analizaron aquellas fuentes de informacin disponibles y adecuadas de anlisis, para luego proceder a aplicar y generar modelos estadsticos que expliquen fenmenos y/o identifiquen variables relevantes en los programas impartidos por dicha institucin. Dentro de los anlisis realizados se encuentra el de reincidencia en delitos de jvenes atendidos por SENAME a nivel nacional, segmentado por regin, desde la implementacin de la ley. Uno de los resultados centrales fue el clculo de la tasa de reincidencia global cuyo valor es 18,57%. Es decir, casi un quinto de los atendidos por SENAME ya tuvo una condena previa por otro delito. Es importante aclarar que este estudio reconoce la reincidencia solo en aquellos casos en que un atendido es reingresado a un centro SENAME o externo; de este modo, no se consideraron aquellos casos en que, cuando un atendido reincide en un delito y ya cumpli su mayora de edad, ingres al sistema GENCHI o Gendarmera de Chile, en calidad de reo en alguna crcel. Asimismo, se identificaron aquellos programas con mayor efectividad en la rehabilitacin y posterior reinsercin, segmentados por tipo de centro (propio de SENAME o externo) y regin; por ejemplo, aquellos programas basados en reas agrcolas, ganaderos y forestales, en regiones de La Araucana, Los Ros y Los Lagos. En base a estos resultados, se entregaron una serie de recomendaciones a considerar dentro de las actuales polticas implementadas por SENAME. Algunas de ellas son: focalizar recursos en aquellos programas de rehabilitacin y reinsercin donde exista una mayor efectividad en los mismos, realizar un estudio integral que considere la poblacin atendida en SENAME y si estos, habiendo cumplido la mayora de edad, estn en un centro penitenciario, de manera de estimar con mayor precisin dicha efectividad de los programas, entre otros. I

A mi madre, Natacha
II

Agradecimientos

A Nini. A mis amigos incondicionales. A mis tos Miguel, Andrs y ta Vivi. A mis abuelos, Tuco y Rosarito. A mi profesor gua, Jos Inostroza, por apoyarme desde que se gest este estudio. A SENAME, por facilitarme informacin para este estudio, as como las visitas a centros. A quienes estuvieron, han estado y seguirn estando conmigo.

III

ndice

1.

2.

3.

4.

5.

6. 7. 8.

Antecedentes generales .................................................................................................. 1 1.1 Servicio Nacional de Menores ............................................................................. 1 1.2 Ley de Responsabilidad Penal Adolescente ........................................................ 2 1.3 Gasto en Sistema Penitenciario y en Centros de SENAME ................................. 4 1.4 Hacinamiento ...................................................................................................... 7 1.5 Rehabilitacin y reinsercin. ............................................................................... 9 Marco terico .................................................................................................................. 11 2.1 Programas de rehabilitacin y reinsercin.......................................................... 11 2.2 Uso de herramientas estadsticas. ...................................................................... 13 2.3 Una oportunidad: realizar un anlisis estadstico basado en reincidencia delictual. .............................................................................................................. 19 Objetivos .......................................................................................................................... 21 3.1 Objetivo general .................................................................................................. 21 3.2 Objetivos especficos ........................................................................................... 21 Plan de Trabajo ................................................................................................................ 22 4.1 SENAME ............................................................................................................... 22 4.2 Minera de datos.................................................................................................. 23 Aplicacin de modelos, resultados y anlisis .................................................................. 24 5.1 Seleccin del conjunto de datos.......................................................................... 24 5.2 Anlisis de las propiedades de los datos. ............................................................ 29 5.2.1 Missing values.......................................................................................... 30 5.2.2 Outliers .................................................................................................... 32 5.3 Transformacin del conjunto de datos de entrada............................................. 33 5.4 Seleccin y aplicacin de tcnica de minera de datos. ...................................... 34 5.4.1 rbol de Decisin..................................................................................... 35 5.4.2 Red Neuronal ........................................................................................... 35 5.4.3 Nave Bayes.............................................................................................. 36 5.5 Extraccin de conocimiento. ............................................................................... 36 5.5.1 SENAME ................................................................................................... 36 5.5.2 Centro externos ....................................................................................... 39 5.6 Interpretacin y anlisis de datos. ...................................................................... 44 5.6.1 Anlisis de resultados basados en reincidencia ...................................... 44 5.6.2 Anlisis de resultados basados en programas de rehabilitacin y reinsercin ............................................................................................... 58 5.6.3 Desglose de programas de rehabilitacin y reinsercin por regin. ...... 61 Conclusiones y recomendaciones ................................................................................... 74 Referencias ...................................................................................................................... 76 Anexos ............................................................................................................................. 77 Modelos y algoritmos ms comunes en la minera de datos. ......................................... 77

IV

ndice de ilustraciones
Ilustracin 1: Poblacin Penal atendida por Gendarmera ............................................................. 5 Ilustracin 2: Costos mensuales por interno para cada establecimiento concesionado, ponderado por poblacin. ............................................................................................................... 6 Ilustracin 3: Gasto Promedio PML versus Rgimen de PL por adolescente, al 2009 .................... 7 Ilustracin 4: Establecimientos carcelarios con mayor hacinamiento ............................................ 8 Ilustracin 5: Tasas de reincidencia por delito bajo LRPA ............................................................. 12 Ilustracin 6: Tasas de reincidencia por antecedentes bajo LRPA ................................................ 12 Ilustracin 7: Proceso KDD ............................................................................................................ 14 Ilustracin 8: Detalle de campos de base de datos suministrada por SENAME ........................... 24 Ilustracin 9: Matriz de correlacin .............................................................................................. 28 Ilustracin 10: Missing values del conjunto de atributos seleccionados, identificados en el valo. ....................................................................................................................................................... 29 Ilustracin 11: En el centro, rbol de decisin; a la izquierda, bases de datos fraccionadas. ...... 35 Ilustracin 12: En el centro, red neuronal; a la izquierda, bases de datos fraccionadas. ............. 35 Ilustracin 13: En el centro, Nave Bayes; a la izquierda, bases de datos fraccionadas. .............. 36 Ilustracin 14: Tabla de resultados de reincidencia en SENAME bajo modelo rbol de decisin ....................................................................................................................................................... 37 Ilustracin 15: Tabla de resultados de reincidencia en SENAME bajo modelo red neuronal ... 38 Ilustracin 16: Tabla de resultados de reincidencia en SENAME bajo modelo Nave Bayes ..... 39 Ilustracin 17: Resultados comparativos modelos aplicados para caso reincidencia en SENAME ....................................................................................................................................................... 39 Ilustracin 18: Tabla de resultados de reincidencia en centros privados ML bajo modelo rbol de decisin ................................................................................................................................... 40 Ilustracin 19: Tabla de resultados de reincidencia en centros privados ML bajo modelo red neuronal ....................................................................................................................................... 40 Ilustracin 20: Tabla de resultados de reincidencia en centros privados ML bajo modelo Nave Bayes ............................................................................................................................................ 41 Ilustracin 21: Tabla de resultados de reincidencia en centros privados SA bajo modelo rbol de decisin ........................................................................................................................................ 42 Ilustracin 22: Tabla de resultados de reincidencia en centros privados SA bajo modelo red neuronal ....................................................................................................................................... 42 Ilustracin 23: Tabla de resultados de reincidencia en centros privados SA bajo modelo Nave Bayes ............................................................................................................................................ 43 Ilustracin 24: Resultados comparativos modelos aplicados para caso reincidencia en centros privados ML. .................................................................................................................................. 44 Ilustracin 25: Resultados comparativos modelos aplicados para caso reincidencia en centros privados SA. ................................................................................................................................... 44 Ilustracin 26: Situacin jurdica de adolescentes bajo LRPA, tanto en centros de SENAME como externos (ML y SA) ......................................................................................................................... 45 Ilustracin 27: Nivel de escolaridad de poblacin de imputados en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA)................................................................. 46

Ilustracin 28: Nivel de escolaridad de enseanza bsica en poblacin imputada de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) ................................ 47 Ilustracin 29: Nivel de escolaridad de enseanza media en poblacin imputada de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) ................................ 48 Ilustracin 30: Tipo de delitos en poblacin imputada de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA).............................................................................. 49 Ilustracin 31: Nivel de consumo de drogas en poblacin imputada de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA)............................................................ 50 Ilustracin 32: reas de capacitacin y reinsercin de poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) ........................................ 51 Ilustracin 33: Organismos a cargo de capacitacin en poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) ........................................ 51 Ilustracin 34: Nivel de capacitacin en poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA)................................................................. 52 Ilustracin 35: Situacin final de capacitacin en poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) .................................................. 53 Ilustracin 36: Promedio de capacitacin en poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA)............................................................ 53 Ilustracin 37: Relacin padre-adolescente imputado de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA)................................................................................... 54 Ilustracin 38: Nivel de escolaridad alcanzado por el padre del imputado de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) .................................................. 55 Ilustracin 39: Relacin madre-adolescente imputado de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA).............................................................................. 56 Ilustracin 40: Nivel de escolaridad alcanzado por la madre del imputado de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) .................................................. 57 Ilustracin 41: % atendidos en programas de rehabilitacin y reinsercin en centros SENAME, desglosado por regin, tanto para reincidentes como para no reincidentes. .............................. 58 Ilustracin 42: atendidos en programas de rehabilitacin y reinsercin en centros externos medio ML, desglosado por regin, tanto para reincidentes como para no reincidentes............. 58 Ilustracin 43: atendidos en programas de rehabilitacin y reinsercin en centros externos medio SA, desglosado por regin, tanto para reincidentes como para no reincidentes.............. 59 Ilustracin 44: Cuadro de probabilidades de reincidencia, dados los programas de reinsercin de SENAME. ........................................................................................................................................ 59 Ilustracin 45: Cuadro con probabilidades de reincidencia agrupados, promedios y ponderados, por tipo de centro.......................................................................................................................... 60 Ilustracin 46: Programa de administracin, servicios y comercio con mayor probabilidad de xito, segn regiones descritas y centros SENAME o externos ML y SA....................................... 62 Ilustracin 47: Programa agrcola, ganadero y forestal con mayor probabilidad de xito, segn regiones descritas y centros SENAME. .......................................................................................... 62 Ilustracin 48: Programa educacin con mayor probabilidad de xito, segn regiones descritas y centros SENAME o externos ML o SA. ........................................................................................... 64 Ilustracin 49: Programa artesana y confecciones con mayor probabilidad de xito, segn regiones descritas y centros SENAME. .......................................................................................... 65 VI

Ilustracin 50: Programa hotelera y turismo con mayor probabilidad de xito, segn regiones descritas y centros SENAME. ......................................................................................................... 66 Ilustracin 51: Programa artes y cultura con mayor probabilidad de xito, segn regiones descritas y centros SENAME. ......................................................................................................... 66 Ilustracin 52: Programa construccin con mayor probabilidad de xito, segn regiones descritas y centros externos ML y SA. .......................................................................................................... 67 Ilustracin 53: Programa minera con mayor probabilidad de xito, segn regiones descritas y centros externos ML. ..................................................................................................................... 68 Ilustracin 54: Programa alimentos con mayor probabilidad de xito, segn regiones descritas y centros externos ML y SA. ............................................................................................................. 69 Ilustracin 55: Programa construccin con menor probabilidad de xito, segn regiones descritas y centros SENAME. ......................................................................................................... 70 Ilustracin 56: Programa alimentos con menor probabilidad de xito, segn regiones descritas y centros SENAME. ........................................................................................................................... 70 Ilustracin 57: Programa mecnica y electricidad con menor probabilidad de xito, segn regiones descritas y centros SENAME y externos ML o SA. .......................................................... 72 Ilustracin 58: Programa agrcola, ganadero y forestal con menor probabilidad de xito, segn regiones descritas y centros externos ML. .................................................................................... 72 Ilustracin 59: Programa hotelera y turismo con menor probabilidad de xito, segn regiones descritas y centros externos ML. ................................................................................................... 73 Ilustracin 60: Algoritmo k-means ................................................................................................ 82

VII

1. Antecedentes generales
1.1 Servicio Nacional de Menores El Servicio Nacional de Menores (o SENAME) es un organismo gubernamental coadyuvante del sistema judicial, que depende del Ministerio de Justicia. Fue creado por el Decreto Ley N 2.465 del 10 de enero de 1979 y entr en funciones el 1 de enero de 1980. Esta institucin desarrolla sus actividades de acuerdo a las instrucciones que le indican los diversos tribunales, a travs del pas. Todas las prestaciones, salvo las Oficinas de Proteccin de Derechos, estn ligadas a la justicia y los nios, nias y adolescentes que son atendidos, han sido enviados directamente por los Tribunales de Familia, vale decir, se encuentran judicializados.1 Asimismo, la misin de la institucin se traduce en la contribucin al desarrollo del sistema de proteccin social de la infancia y adolescencia a travs del ejercicio de derechos y la reinsercin social y/o familiar de nios, nias y adolescentes vulnerados en sus derechos e infractores de ley, mediante una red de programas ejecutados directamente o por organismos colaboradores del Servicio. De esta manera, los objetivos de SENAME son:2 1. Desarrollar y optimizar la oferta de programas que contribuyan al sistema de proteccin social de la infancia y adolescencia. 2. Fortalecer la implementacin del modelo de reinsercin social y/o familiar, mediante el desarrollo de la funcin normativa-tcnica con criterios de calidad, territorialidad, intersectorialidad e incorporacin del enfoque de gnero. 3. Realizar un proceso de mejora continua de la calidad de las prestaciones optimizando la funcin de supervisin y asesora a la red de programas, mediante el desarrollo de metodologas que permitan una mejor evaluacin y anlisis para la retroalimentacin. 4. Mejorar la eficiencia de los recursos invertidos en la red de programas, a travs de un proceso de mejoramiento de la gestin institucional y de un plan de desarrollo de los organismos colaboradores. Para cumplir con estas obligaciones, SENAME cuenta con centros de atencin directa y con una red de colaboradores acreditados, que postulan con proyectos a licitaciones pblicas. En el caso de los centros directos, estos gastan el 10% del presupuesto institucional, mientras que la red privada utiliza el 90% de este presupuesto.3 Actualmente existen aproximadamente setenta y siete mil jvenes atendidos dichos centros, de los cuales unos veinticinco mil -aproximadamente- forman parte de la ley LRPA o
1 2

http://www.sename.cl/wsename/estructuras.php?name=Content&pa=showpage&pid=1, al 05/05/2011. http://www.sename.cl/wsename/estructuras.php?name=Content&pa=showpage&pid=2, al 05/05/2011. 3 El presupuesto del SENAME del 2010 (aprobado por el Senado el 28 de octubre del 2009, alcanz los M$135.549.646. (Fuente: http://www.senado.cl/prontus_galeria_noticias/site/artic/20091028/pags/20091028175122.html)

pg. 1

Justicia Juvenil4 5. La mayora de ellos proviene de familias pobres no indigentes, donde un 40% de los casos la madre es la jefa de hogar, un 48% de ellas aparece como madre negligente, es decir, no le entrega los cuidados que requiere para desarrollo. Adems, el 58% de quienes ingresan a esta modalidad de atencin son de sexo femenino y el resto, masculino; la mayora ingresa a los ocho aos y permanece entre dos y tres aos, y dos tercios de los nios y nias viven con personas que no son familiares. De ellos, aproximadamente la mitad ha sido vctima de maltrato y un porcentaje similar tiene educacin bsica.6

1.2 Ley de Responsabilidad Penal Adolescente La puesta en marcha de la Ley de Responsabilidad Penal Adolescente fue el 8 de junio del 2007, y con ello se crea por primera vez en Chile un sistema penal especial para las personas mayores de 14 y menores de 18 aos. A continuacin, se presentan los aspectos claves que diferencian el antes y el despus de la puesta en marcha de la LRPA:

Tabla 1: El antes y el despus de la puesta en marcha de la Ley de Responsabilidad Penal Adolescente

ANTES DEL 8 DE JUNIO DEL 2007 Los jvenes menores de 16 aos son inimputables, es decir, se considera que no tienen la capacidad legal de cometer delitos y por lo tanto quedan fuera del sistema penal. Slo los tribunales de familia les pueden aplicar medidas de proteccin. A los adolescentes que tienen entre 16 y 17 aos y estn acusados de haber cometido un delito se les somete a un proceso de discernimiento, con el que se busca determinar si actuaron sabiendo la diferencia entre lo bueno y lo malo, lo lcito y lo ilcito. Segn ese procedimiento, se declara al joven con o sin discernimiento. Si se determina esto ltimo, al adolescente se le aplica una medida de proteccin de los
4 5

DESPUS DEL 8 DE JUNIO DEL 2007 Los jvenes de entre 14 y 17 aos son responsables penalmente por los delitos que cometen, aunque la responsabilidad vara segn la edad.

Con la nueva justicia juvenil desaparece el trmite de discernimiento, considerando tres factores: que el concepto era impreciso y ello se traduca en falta de claridad para el juez y disparidad de criterios; que generaba una sensacin de impunidad, ya que el adolescente sin discernimiento no responda por sus actos; y, por ltimo, que generaba desigualdad ante la ley, ya

Boletn estadstico nacional del 2do trimestre del 2010, p. 22. Disponible online: http://www.sename.cl LRPA: Ley de Responsabilidad Penal Adolescente (Ley 20.084) 6 SENAME y UNICEF [1]: Antecedentes de Justicia Juvenil, asociado a LRPA (Ley de Responsabilidad Penal Adolescente)

pg. 2

juzgados de familia y no es sometido al sistema penal. En cambio, si se establece que actu con discernimiento al delinquir, se inicia un proceso penal en su contra, considerndolo como un adulto. Si bien existen programas de defensa de jvenes, la Ley de Menores no contempla formalmente la intervencin de abogados, por lo que muchas veces no se respetan las normas del debido proceso.

que el nivel econmico del infractor poda influir de manera determinante en su evaluacin.

La Ley de Responsabilidad Penal Adolescente (LRPA) incorpora un juez que controla la ejecucin de las sanciones, y otorga a los jvenes el derecho a defensa desde el inicio de la investigacin, e independiente de su situacin econmica- al debido proceso, a ser odos, a la separacin de los adultos y a la excepcionalidad de la privacin de libertad, es decir, que esta sea aplicada slo como ltimo recurso.

(Fuente: Elaboracin propia)

Asimismo, se instauraron diferentes penas o resoluciones bajo esta ley, las cuales se explican a continuacin:
Tabla 2: Penas asociadas a la LRPA

PENAS PRIVATIVAS DE LIBERTAD Internamiento en rgimen cerrado con programa de reinsercin social: El adolescente reside, privado de libertad, en un centro especializado para adolescentes, bajo un rgimen orientado al cumplimiento de los objetivos de la ley.

PENAS NO PRIVATIVAS DE LIBERTAD Libertad Asistida Especial y Libertad Asistida: Los/as adolescentes son sometidos a un programa de intervencin individual de actividades socioeducativas y de reinsercin social, bajo la supervisin de un delegado. Se diferencian por la intensidad de la intervencin. Internamiento en rgimen semicerrado con Reparacin del Dao: El o la joven est programa de reinsercin social: El obligado a resarcir a la vctima por el adolescente debe residir obligatoriamente dao provocado. en un centro de privacin de libertad, sujeto a un programa de reinsercin social a ser desarrollado tanto al interior del recinto, como en el medio libre. La privacin de libertad es el ltimo Servicios Comunitarios: Los/as recurso, que debe ser aplicado slo en adolescentes infractores deben realizar casos excepcionales, cuando no hubiese actividades no remuneradas a favor de la otro mejor. comunidad o en beneficio de personas en situacin de precariedad.
pg. 3

Multa: Alcanza un mximo de 10 UTM a beneficio fiscal, y considera la condicin y las facultades econmicas del infractor y de la persona a cuyo cuidado se encuentre. Amonestacin: Es la reprensin enrgica al adolescente hecha por el juez, en forma oral, clara y directa, en un acto nico.
(Fuente: Elaboracin propia)

Asimismo, los actores involucrados en este sistema son los fiscales, defensores, jueces de garanta, policas, vctimas e imputados. En la ejecucin de las condenas bajo esta ley, SENAME cumple un rol clave, pues debe asegurar la existencia en todas las regiones del pas de los programas necesarios para el cumplimiento y control de las medidas contempladas en la ley, ya sea de manera directa o mediante servicios prestados por colaboradores acreditados que hayan celebrado los convenios con dicha institucin.

1.3 Gasto en Sistema Penitenciario y en Centros de SENAME El gasto pblico en crceles en Chile difiere en demasa respecto a lo que se gasta en centros de SENAME. Esto es necesario presentar, de manera que el lector forme sus primeras impresiones, especialmente en cunto ms se podra invertir en prevencin a temprana edad por ejemplo, en centros de SENAME- para evitar gastos pblicos mayores en mantener reos en crceles. Luego del incendio ocurrido en la crcel de San Miguel donde fallecieron ms de 80 reos el 09 de diciembre del ao pasado7, se dio cuenta de un hecho conocido por la opinin pblica: el hacinamiento en las crceles pblicas y concesionadas de Chile, y el correspondiente gasto que se incurre en dichos establecimientos penitenciarios. A continuacin, se presentan antecedentes obtenidos de Gendarmera relacionados con la poblacin penal atendida por dicha institucin.

http://www.mer.cl/modulos/catalogo/Paginas/2010/12/09/MERSTPP001AA0912.htm 19/12/2010)

(Web

consultada

al

pg. 4

Ilustracin 1: Poblacin Penal atendida por Gendarmera (Fuente: http://www.gendarmeria.gob.cl/, consultada el 03/04/2011)

En el modelo de crceles concesionadas en adultos actualmente utilizado en Chile, el Estado a travs de Gendarmera- est a cargo de la administracin y vigilancia de los recintos penales y la concesionaria es quien disea, financia, construye y realiza la prestacin de los servicios penitenciarios. Por su parte, el Ministerio de Obras Pblica es quien administra el contrato de concesin y el Ministerio de Justicia se encarga de los pagos peridicos (subsidios) que establece el contrato. Actualmente existen dos grupos de crceles que estn siendo operadas por sociedades concesionarias en el pas: Grupo 1 (Alto Hospicio, La Serena, Rancagua) a cargo del consorcio BAS S.A. Grupo 3 (Valdivia, Puerto Montt y Santiago 1) a cargo de Compass Group. Los costos para el Estado se dividen en dos: los gastos de Gendarmera y los gastos en los que debe incurrir el Ministerio de Justicia a travs de subsidios. o Gastos de Gendarmera de Chile: i. Gastos en personal:
pg. 5

Oficiales y vigilantes penitenciarios Profesionales, tcnicos y administrativos

La mayor dotacin de personal corresponde al personal de vigilancia. ii. Bienes y servicios de consumo: Combustibles y lubricantes para vehculos Materiales de consumo (materiales de oficina, insumos, repuestos y accesorios computacionales) Servicios bsicos (electricidad, agua, gas, correo, telefona, telecomunicaciones y otros)

o Gastos del Ministerio de Justicia: Pago de dos tipos de subsidios a las concesionarias: Subsidio Fijo a la Operacin (SFO): pago por interno en el sistema. Pago Variable (PV): depende del nmero de internos (si el nmero de internos es mayor que la capacidad de diseo, el Estado debe pagar una multa, la cual es de 100 UTM por da en que se sobrepase el 20% de la capacidad de dicha crcel al da).8

Considerando las anteriores partidas de costos, a continuacin se presenta una tabla con los costos mensuales por interno para cada establecimiento actualmente concesionado.

Ilustracin 2: Costos mensuales por interno para cada establecimiento concesionado, ponderado por poblacin. (Fuente: Unidad de Concesiones de Gendarmera de Chile, a Enero del 2010)

En trminos generales, mantener un recluso en una institucin pblica le cuesta al Estado aproximadamente $242.520 al mes, esto es $8.084 diarios, mientras que en una crcel concesionada el monto asciende a $403.063 mensuales -$14.435 al da-, segn datos otorgados
8

Segn las bases de concesin de una crcel licitada (Fuente: Ministerio de Obras Pblicas)

pg. 6

por la fundacin Paz Ciudadana.9 Para el caso de las crceles concesionadas, dicho monto considera tanto la alimentacin, alojamiento, programas de reinsercin y rehabilitacin, entre otros servicios para cada interno, adems de los costos de operacin del recinto carcelario (casinos, funcionarios, sistemas tecnolgicos, entre otros) Por otro lado, para el caso de SENAME, los gastos en promedio por atendido bajo la LRPA son:

Ilustracin 3: Gasto Promedio PML versus Rgimen de PL por adolescente, al 2009 (Fuente: Evaluacin de las Medidas y Sanciones que se Ejecutan en el Medio Libre del Sistema de Justicia Juvenil, Institutos de Asuntos Pblicos, Centro de Estudios en Seguridad Ciudadana, Universidad de Chile, Abril 2010)

En la tabla anterior se rescata que el gasto promedio en rgimen Programa Privacin de Libertad (PL) es de $170.000.- por adolescente, monto que incluye alimentacin, alojamiento, programas de rehabilitacin y reinsercin.10 Adems, se puede apreciar que el tiempo de permanencia en SENAME en internacin para el caso PL- es 5,1 meses; en crceles, el tiempo de permanencia promedio es 42 meses (3,5 aos)11. Sin duda que esta comparacin se vuelve crtica cuando se compara el gasto total por atendido en SENAME versus el interno que cumpli su condena en una crcel concesionada, sin considerar la reincidencia en ambos casos: $867.000 para el primer caso y $16.928.646 para el segundo. Es alarmante.

1.4 Hacinamiento El sistema carcelario chileno, segn expertos12, est en colapso y es una bomba a punto de estallar. Bajo el mismo anlisis, el actual ministro de justicia, Felipe Bulnes, declara que el hacinamiento es infrahumano () existen dos formas de trancar la puerta giratoria: la primera es evitar el delito antes que se cometa y la segunda es la rehabilitacin de los delincuentes13.
9

http://www.economiaynegocios.cl/noticias/noticias.asp?id=79738, consultada el 03/04/2011 Estudio Evaluacin de las Medidas y Sanciones que se Ejecutan en el Medio Libre del Sistema de Justicia Juvenil, Institutos de Asuntos Pblicos, Centro de Estudios en Seguridad Ciudadana, Universidad de Chile, Abril/10 11 Revista de estudios: Criminolgico y penitenciarios; Ministerio de Justicia, Gendarmera de Chile; N 13; Diciembre 2008. 12 En promedio, la sobrepoblacin en las crceles chilenas alcanza un 64% y en algunos casos, como en el Centro Penitenciario de Concepcin, llega a 264% (Informe de Derechos Humanos, diciembre 2010) 13 http://www.lanacion.cl/noticias/site/artic/20101213/pags/20101213101328.html, consultada el 03/04/2011
10

pg. 7

Es por eso que, en el Presupuesto 2011, los programas de rehabilitacin y reinsercin de SENAME y Gendarmera aumentaron en un 30%. Un estudio realizado por el Instituto Libertad y Desarrollo (LyD)14, destac que () Lo cierto es que el mejoramiento de nuestro sistema carcelario no fue una prioridad durante los gobiernos anteriores. Por un lado, cierta vertiente ideolgica lo asociaba a polticas de represin y su discurso afirmaba que la solucin para el pas no era seguir metiendo gente a la crcel, enfrentndose as a quienes, desde la vereda del frente, denunciaban que muchos delincuentes estaban en las calles en lugar de estar en la crcel (). El estudio, realizado luego del accidente en la crcel de San Miguel, logr representar que durante aos se ha privilegiado el llenar de internos las crceles de Chile en vez de encontrar una solucin de fondo, la cual proviene de los programas de rehabilitacin y reinsercin. Una de las conclusiones del estudio en cuestin indica que () la crcel no puede ser la nica respuesta a la accin delictiva una vez cometido el delito. Las medidas alternativas deben transformarse derechamente en penas alternativas, donde la reclusin en recintos penitenciarios sea slo y exclusivamente- para quienes no es posible o razonable aplicar otro mecanismo de sancin o prevencin, dada la calidad del delito cometido, su reiteracin y la peligrosidad del delincuente. En esto la tecnologa puede constituirse en una gran aliada, pero los avances legislativos que permitiran implementar dichos sistemas no han ido a la par de este desarrollo. Invertir ms en rehabilitacin y reinsercin a temprana edad es la premisa que debiera darse, dado lo expuesto previamente, de manera de evitar que aquellos adolescentes que ya hayan incurrido en delitos vuelvan a reincidir y terminen en el sistema penitenciario. A continuacin, se presenta una tabla que muestra aquellos establecimientos carcelarios con mayor hacinamiento en Chile.

Ilustracin 4: Establecimientos carcelarios con mayor hacinamiento (Fuente: Instituto de DD.HH. en base a datos de Gendarmera a septiembre de 2010)
14

Incendio en Crcel de San Miguel: Crisis del Sistema Carcelario, LyD, Estudio n 995, Diciembre del 2010.

pg. 8

La sobrepoblacin carcelaria nacional asciende a 70%. Gran parte de estos nmeros se explica ya que el colectivo atendido por Gendarmera pas de 60.990 personas en 1998 a 106.877 en 2009, es decir un crecimiento del 75%. Llevado a tasas de presos por 100.000 habitantes, la situacin es an ms desalentadora. Si hace diez aos, sta alcanzaba a los 220, hoy ya llega a 318. En otras palabras, la poblacin penal recluida ha aumentado en mucho mayor medida que la poblacin general del pas. De esta forma, bien se podra decir que en Chile ya existe 1 reo por cada 334 habitantes, una tasa que no deja de sorprender si se considera que en pases con mayor tasa delictual las estadsticas son menores. Ese es el caso de Brasil con 1 por cada 450; Argentina, 1 por cada 660; o Colombia, 1 por cada 665. 15,16 Ligando el tema del hacinamiento con el proceso de rehabilitacin y reinsercin, estos ltimos que son procesos delicados y largos, y que requiere de muchos recursos de todo tipo (personal, espacio, tranquilidad para desarrollar programas, entre otros) en una prisin con 60% o 70% de hacinamiento, con personal insuficiente para controlar, con un nivel mnimo de seguridad y respeto, a una poblacin penal airada por la lentitud de los procesos y por las condiciones muchas veces inhumanas en que viven, la rehabilitacin pasa a segundo o tercer plano. Antes est la seguridad, entendida en su acepcin ms elemental (que los presos no se fuguen). Despus, la alimentacin, la salud, la higiene, la recreacin, para mantener ms o menos tranquilos a los reclusos y poder administrar la crisis permanente que constituye la gestin de una prisin en esas condiciones. Slo despus, si quedan tiempo, recursos y energas, los funcionarios y el sistema en general podrn empezar a pensar en la rehabilitacin. As, las crceles deben tener slo el nmero de reclusos que la administracin penitenciaria puede adecuadamente acoger en sus tres funciones: custodiarlos, proporcionarles las condiciones necesarias para vivir la reclusin con una mnima dignidad y contribuir a su rehabilitacin.

1.5 Rehabilitacin y reinsercin. Un estudio elaborado por la fundacin Paz Ciudadana17 menciona que el sistema de justicia juvenil en Chile ha sido elaborado considerando una serie de principios fundamentales que inspiran el modelo de responsabilidad, entre ellos, la orientacin a la reinsercin social del adolescente que promueve el desistimiento de la conducta infractora por medio del fortalecimiento de los procesos de integracin comunitaria, familiar y la reinsercin educativa y laboral. Todo esto, en un contexto en que este proceso debe ser conducido preferentemente en la comunidad, para evitar efectos crimingenos no deseados. En consecuencia, la reinsercin social describe un estado general del joven en el que ha logrado re-articular vnculos afectivos, sociales e institucionales, adems de desarrollar una conducta acorde con las normas legales y convencionales.
15 16

Informe Anual sobre Derechos Humanos en Chile, UDP, desde 2005 a 2008. http://www.eldinamo.cl/noticia/el-dramatico-mapa-del-hacinamiento-en-las-carceles-chilenas, al 08/05/2011 17 Informe final estudio Construccin de indicadores de reinsercin social de adolescentes infractores de la ley penal, Fundacin Paz Ciudadana, 04/05/2010.

pg. 9

La evidencia18 muestra que el proceso de intervencin en prctica est orientado primordialmente a la disminucin de la reincidencia criminal. De esta forma, determinados los factores de riesgo, las necesidades y capacidad de respuesta, esto debe constituir la base del diseo del programa de intervencin recomendada para el adolescente. De esta manera, las diferencias que se observen entre los resultados de las evaluaciones pre y post intervencin, permitirn conocer si el tratamiento ha generado un impacto real en el riesgo de reincidencia del joven. Es posible que, producto del programa de intervencin y de los progresos que haya experimentado el joven, se pueda observar un mejoramiento general en el nivel de insercin social conjuntamente con la disminucin del riesgo de reincidencia, pero si nicamente se evalan indicadores relacionados con la reinsercin, ello no permitira necesariamente concluir que su riesgo de cometer nuevos delitos ha disminuido. Podra suceder, por ejemplo, que un joven adecuadamente habilitado en aspecto laboral tenga una alta probabilidad de cometer nuevos delitos, si es que su intervencin no ha abordado de manera consistente aspectos como el pensamiento antisocial o la asociacin con pares antisociales, por nombrar algunos. En promedio, un 10,7% de internos de SENAME corresponden a personas capacitadas y colocadas laboralmente, un 21,6% corresponde a personas slo colocadas laboralmente, mientras que un 67,7% corresponde a personas slo capacitadas. Respecto de la distribucin por sexo, un 16% corresponde a mujeres, mientras que un 84% corresponde a hombres.19 El objetivo final de la reinsercin social debe ser alcanzado entonces, mediante programas que tengan como finalidad primaria o inicial la disminucin del riesgo de reincidencia. Esto se justifica, en primer lugar, porque es precisamente la comisin de nuevos delitos lo que vincula directamente al joven con el sistema de justicia penal, con el detrimento inmediato de cualquier avance que se haya logrado en su proceso de reinsercin. Adems, la reinsercin social puede comenzar de esta forma en el sistema de responsabilidad adolescente, pero continuar progresando por largo tiempo y en mltiples formas con el apoyo de variadas redes estatales. Sobre todo, considerando que las penas en el sistema juvenil son, en general, de duracin reducida respecto de las penas del sistema adulto, por lo que es perfectamente posible, en un gran porcentaje de casos, que el sistema no cuente con el tiempo suficiente para lograr una completa reinsercin.

18 19

Andrews y Bonta (2006) Informe final estudio Tasas de reincidencia cohorte egresados 2007 de los programas evaluados por la DIPRES, Gendarmera de Chile, diciembre 2010.

pg. 10

2. Marco terico
La descripcin y justificacin del tema de investigacin proviene de dos flancos: el primero, que tiene relacin con dar la relevancia al proceso de la rehabilitacin y reinsercin, y la segunda, que tiene relacin con la presentacin y aplicacin de una herramienta estadstica que permite predecir ciertos patrones. La relevancia de este estudio radica en que con l se cuenta con una nueva fuente de informacin que, junto con las ya existentes, proveer de una oportunidad de mejora en los centros de SENAME, respecto a justicia juvenil. Sin duda sera de alto impacto poder implementar una poltica cuyo objetivo est centrado ms en la prevencin que en penas basadas en privacin de libertad, en donde se pueda disear programas de rehabilitacin y reinsercin eficaces que impidan seguir colapsando las crceles chilenas. 2.1 Programas de rehabilitacin y reinsercin. Al SENAME, como ya se ha descrito, le corresponde disear y mantener una oferta de programas especializados destinados a la atencin de los nios, nias y adolescentes que han sido vulnerados en el ejercicio de sus derechos, y a la reinsercin social de adolescentes que han infringido la ley penal. Los programas del SENAME han sido evaluados por organismos externos e internos, tales como la Direccin de Presupuestos (DIPRES), Fondo de las Naciones Unidas para la Infancia (UNICEF), Fundacin Paz Ciudadana, entre otros. Lamentablemente, todas estas evaluaciones han dado cuenta que este servicio pblico funciona deficitariamente. La DIPRES en el ao 2007 realiz una evaluacin externa del Programa de Administracin Directa del SENAME, el cual que tiene por objeto la reinsercin social y familiar de los menores de 18 aos que llegan a los tribunales de justicia por haber sido vulnerados en sus derechos o por infringir la ley. El programa es ejecutado directamente por el SENAME o por entidades colaboradoras, las cuales reciben subvencin por nio atendido en su Centro.20 Esta evaluacin advirti que el programa necesitaba de un rediseo sustantivo, y dio a conocer sus mltiples deficiencias, entre las que destacan insuficiencia en la forma de asignacin de recursos, ausencia de objetivos claros y de calidad en la atencin y falta seguimiento luego del egreso que permita medir si realmente existe reinsercin social. Adems, seal que el programa presenta inconsistencias financieras, a pesar de contar con recursos humanos, fsicos y financieros adecuados y suficientes, para la provisin de servicios que le corresponde, no existe relacin directa entre dotacin de recursos humanos y niveles de produccin. Por otra parte, el mismo SENAME evalu los programas de rehabilitacin en materia juvenil con que cuenta, y que se reducen bsicamente a dos: educacin y tratamiento por consumo de drogas y alcohol, concluyendo en cuanto al primero, que no es compatible con los parmetros exigidos a nivel internacional, porque el SENAME no cuenta con un proyecto

20

Rodrigo Delaveau [2].

pg. 11

educativo institucional, y en cuanto al segundo, que cuenta con escasa cobertura y es ineficiente.21 A continuacin, a modo de ejemplificar lo anterior, se presenta una situacin cotidiana: un menor de edad, que recientemente se ha iniciado en el mundo delictual o de la drogadiccin, termina siendo detenido in-fraganti por Carabineros o Polica de Investigaciones. Luego de una sentencia de un juez, dicho joven es derivado en un centro del SENAME con la finalidad de que cumpla su condena. Esta condena suele ser una internacin provisoria del joven en dicho centro y all es inserto dentro de un programa de rehabilitacin y/o reinsercin. All ellos cumplen su condena, egresan del centro y vuelven a la calles. Se presenta un cuadro con los porcentajes de reincidentes de egresados del SENAME bajo la LRPA.22 En l se incluyen aquellos casos en que existen nuevas causas en cada uno de los delitos descritos, es decir, una reincidencia, con la salvedad de que quines cometen dichos ilcitos no son condenados.

Ilustracin 5: Tasas de reincidencia por delito bajo LRPA (Fuente: Fundacin Paz Ciudadana, abril 2010)

En el mismo estudio se ve que la tasa de reincidencia en adolescentes que tenan prontuario era ms elevada respecto al caso contrario. Al igual que en la tabla anterior, aqu tambin se presentan aquellos casos en que existen nuevas causas en cada uno de los delitos descritos, es decir, una reincidencia, con la salvedad de que quines cometen dichos ilcitos no son condenados:

Ilustracin 6: Tasas de reincidencia por antecedentes bajo LRPA (Fuente: Fundacin Paz Ciudadana, abril 2010)

21 22

DIPRES [3] Paz Ciudadana [4]

pg. 12

Respecto al fenmeno de la reincidencia, la mayor parte de la investigacin destinada a ello se ha desarrollado en un nmero limitado de pases, entre los cuales se encuentran principalmente Estados Unidos, Canad, Australia y el Reino Unido23. En la literatura relacionada, es posible observar dos tipos de estudios relacionados con la prediccin de la futura conducta criminal reincidente. Los primeros, son aquellos basados en la propia conducta individual de los infractores de ley a travs de instrumentos que estudian la personalidad y el entorno social del infractor, investigando los factores de riesgos estticos y dinmicos que pueden predecir la conducta criminal futura. 24Los segundos, se basan en un enfoque ms bien sociolgico de la prediccin de la conducta criminal futura.25 Tales estudios, a travs de metodologas estadsticas con mayor o menor sofisticacin, buscan conocer las variables que explican la reincidencia en grupos que puedan ser clasificados segn caractersticas similares, por ejemplo, caractersticas raciales, socioeconmicas, situacin de primerizo o reincidente o quienes han cumplido una determinada pena o cometido delitos similares (violencia, sexuales, relacionados con las drogas, etc.). Ambos tipos de estudios han buscado determinar tasas de reincidencia delictual y las variables que permiten explicar la reincidencia, para posteriormente predecir la conducta criminal futura, debiendo definir en primera instancia el concepto de reincidencia que ser utilizado en el curso de la investigacin. Con el objeto de definir la accin delictual realizada de forma repetitiva, es necesario establecer de forma previa qu evento ser utilizado como causa de referencia. La literatura y los estudios dedicados a la reincidencia en general definen, en primera instancia, el delito de referencia. ste se refiere a la causa inicial (que puede derivar o no en una condena) a partir de la cual ser observada la conducta de la persona y que servir de base para comprobar si el sujeto vuelve a cometer un delito en el periodo de tiempo a estudiar. En general, en la literatura revisada, se entiende como causa de referencia un delito e imputacin que derivan en una condena. Sin embargo, existen excepciones, como el estudio realizado para New South Wales26 en donde el delito de referencia puede valga de redundancia- referirse a una condena, una imputacin o una detencin. Por otra parte, desde el punto de vista legal, el concepto de reincidencia nace a partir de una repeticin de la conducta criminal, slo una vez que el Estado ya ha ejercido la accin condenatoria por el delito cometido. Si este requisito no se cumple, no sera factible referirse a un nuevo delito como reincidencia. 2.2 Uso de herramientas estadsticas. En la actualidad, existen variadas tcnicas estadsticas utilizadas: un ejemplo de ellas es la minera de datos. sta consiste en la extraccin no trivial de informacin que reside de manera implcita en los datos. Dicha informacin era previamente desconocida y puede resultar til para algn proceso. En otras palabras, la minera de datos prepara, sondea y explora los datos para sacar la informacin oculta en ellos. Bajo este nombre se engloba todo un conjunto de
23 24

ODonnell, 2008 Gendreau, 1996; Bechtel, 2007; Onifade, 2008; Gavazzi, 2008; Graa, 2008; Olver, 2009. 25 Weatherburn y Bartels, 2008; Trulson, 2005; Letourneau, 2009; Cottle, 2001; Cain, 1997; ODonnell, 2008; Lattimore, 1995. 26 Weatherburn y Bartels (2008)

pg. 13

tcnicas encaminadas a la extraccin de conocimiento procesable, implcito en las bases de datos.27 Esta tcnica forma parte del KDD (Knowledge Discovery in Data Bases), que es el proceso no trivial de identificar patrones previamente desconocidos, vlidos, nuevos, potencialmente tiles y comprensibles dentro de los datos. As, mediante los modelos extrados utilizando tcnicas de minera de datos se aborda la solucin a problemas de prediccin, clasificacin y segmentacin. La minera de datos se aplica principalmente cuando se han almacenado grandes cantidades de datos histricos con la expectativa de explotarlos, buscando el conocimiento implcito en esta informacin, o dicho en otras palabras, se busca determinar tendencias o patrones de comportamiento que permitan mejorar los procedimientos actuales, ya sean stos de mercadotecnia, produccin, operacin, mantenimiento o cobranza, entre otros. Para lograr aprovechar esta enorme cantidad de informacin se han desarrollado algoritmos y herramientas especializadas en el descubrimiento automtico del conocimiento oculto en dicha informacin; el proceso de la extraccin no trivial de informacin importante que est implcita en los datos se conoce como descubrimiento de conocimiento (Knowledge Discovery in Databases o KDD), en donde la etapa de minera de datos juega un papel central en dicho proceso.28

Ilustracin 7: Proceso KDD (Fuente: elaboracin propia)

29

Un proceso tpico de minera de datos consta de los siguientes pasos generales: 1. Seleccin del conjunto de datos, tanto en lo que se refiere a las variables objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables independientes (las que sirven para hacer el clculo o proceso), como posiblemente al muestreo de los registros disponibles.

27 28

http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos, al 05/05/2011. Meja-Lavalle, M; Sols, J; Garca, F. [5] 29 http://en.wikipedia.org/wiki/Knowledge_discovery, al 05/05/2011.

pg. 14

2. Anlisis de las propiedades de los datos, en especial los histogramas, diagramas de dispersin, presencia de valores atpicos y ausencia de datos (valores nulos). 3. Transformacin del conjunto de datos de entrada, se realizan de diversas formas en funcin del anlisis previo, con el objetivo de prepararlo para aplicar la tcnica de minera de datos que mejor se adapte a los datos y al problema. A este paso tambin se le conoce como pre-procesamiento de los datos. 4. Seleccionar y aplicar la tcnica de minera de datos, se construye el modelo predictivo, de clasificacin o segmentacin. 5. Extraccin de conocimiento, mediante una tcnica de minera de datos, se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados en los valores de las variables del problema o relaciones de asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez para generar distintos modelos, aunque generalmente cada tcnica obliga a un pre-procesado diferente de los datos. 6. Interpretacin y evaluacin de datos, una vez obtenido el modelo, se debe proceder a su validacin comprobando que las conclusiones que arroja son vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores para generar nuevos modelos. Como ya se mencion, la primera etapa del KDD es la transformacin y pre-procesamiento de datos, es decir, todo los pasos que involucran el manejo de los datos, desde la base de datos inicial, hasta encontrar los atributos ms representativos de ellos, desarrollando a su vez procesos intermedios, tales como el manejo de los datos nulos e imputacin de datos, tratamiento de los valores fuera de rango o outliers, y el pre-procesamiento y re-codificacin de variables. Esta etapa considera una o ms bases de datos suministrada y verifica la calidad de los datos: esto es, la aplicacin de variadas tcnicas, metodologas, algoritmos u otros en pos de mejorar los datos, en cuanto a la potencialidad de informacin que estos poseen intrnsecamente.30 Adems, comprende el tratamiento de valores perdidos, imputacin de datos, entre otros aspectos, como por ejemplo, plantear el tratamiento de los outliers o valores fuera de rango al momento de procesar la base de datos. En una etapa siguiente, se analiza todo el proceso de seleccin y extraccin de atributos: se aplican ciertas tcnicas tales como test chi-cuadrado, covarianza, entre otros. La finalidad de este proceso es encontrar, ciertamente, dichos atributos que expliquen el modelo que se pretende proponer, y comparar distintas tcnicas mostrando sus resultados de manera comparativa. Para este estudio fue necesario considerar los datos ms representativos de la totalidad de la base de datos suministrada. Esto implica, por ejemplo, que los datos menos importantes no fueron considerados o, en casos ms extremos, eliminados, de manera que no ensucien (provoquen un sesgo) en la confeccin de un modelo.

30

http://en.wikipedia.org/wiki/Data_quality, al 05/05/2011.

pg. 15

Luego sigue la etapa de transformacin de atributos: la correcta transformacin de ellos valga la redundancia- permite hacer los test necesarios para el siguiente paso, que es la seleccin de atributos. Es importante revisar, adems del tipo de variable al que se est enfrentando y las distintas alternativas de transformacin que se tienen en cada caso, la importancia de la variable en el contexto de la base de datos trabajada.31 Existen diferentes y bien documentadas tcnicas de seleccin de atributos. Se pueden diferenciar tres grandes tipos: Filtros, Wrapper y Embedded methods.32 Por ejemplo, si en la base de datos de SENAME estn ordenados los jvenes por RUT, conviene asignar (o no) un nmero de orden (1, 2 infinito) para identificarlos, por simplicidad. Luego de lo anterior, prosigue la etapa de transformacin de los datos. Aqu importa tener los datos ya limpios en etapas previas en distintos formatos, de manera de encontrar el ms conveniente. Por ejemplo, para ciertos casos conviene tener los nombres de las regiones del pas, pero para otros es ms conveniente si se encuentra como nmeros. Le sigue el proceso de data mining propiamente tal: se prueban distintos algoritmos de manera de encontrar el que represente un determinado fenmeno con alta eficacia33. Dentro de los algoritmos ms utilizados podemos encontrar los siguientes:34 Nave Bayes: es un clasificador probabilstico basado en el teorema de Bayes y algunas hiptesis simplificadoras adicionales. Es un mtodo de clasificacin supervisado, ampliamente usado en la deteccin de correo spam.35 Redes neuronales. Son un paradigma de aprendizaje y procesamiento automtico inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexin de neuronas en una red que colabora para producir un estmulo de salida. Algunos ejemplos de red neuronal son: El Perceptrn. El Perceptrn multicapa. Los Mapas Auto-organizados, tambin conocidos como redes de Kohonen.

En la etapa de seleccin de atributos se estima que este no es un proceso necesario para realizar Data Mining, pero es altamente recomendable ya que el costo computacional de trabajar con todos los atributos es muy alto y no se obtienen mejores patrones a cambio. Por otro lado, reducir la dimensionalidad del problema ayuda a facilitar el proceso. 32 http://en.wikipedia.org/wiki/Feature_selection 33 Puede ser tambin eficiencia, pero la eficacia es lo relevante pues se pretende determinar una prediccin. 34 El detalle de lo presentado a continuacin se encuentra en anexos. 35 An Evaluation of Naive Bayesian Anti-Spam Filtering, Ion Androutsopoulos, National Centre for Scientific Research Demokritos, 2000.

31

pg. 16

Ilustracin 3: Red Neuronal (Fuente: Elaboracin propia)

rboles de decisin. Un rbol de decisin es un modelo de prediccin utilizado en el mbito de la inteligencia artificial, dada una base de datos se construyen diagramas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolucin de un problema. Ejemplos:

Ilustracin 5: rbol de decisin (Fuente: Elaboracin propia)

Asimismo, segn el objetivo del anlisis de los datos, los algoritmos utilizados se clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998): Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de ellos) desconocido a priori, a partir de otros conocidos. Algoritmos no supervisados (o del descubrimiento del conocimiento): se descubren patrones y tendencias en los datos. Por ltimo, luego de la obtencin de suficientes modelos que expliquen de mejor manera un determinado fenmeno, se procede a realizar anlisis y conclusiones respecto a los mismos: aqu es donde se debe cruzar informacin, tanto de los propios modelos como del evento que se est modelando y es objeto de ste. Si el modelo final no superara esta evaluacin el proceso se podra repetir desde el principio o, si el experto lo considera oportuno, a partir de cualquiera de los pasos anteriores. Esta retroalimentacin se puede repetir cuantas veces se considere necesario hasta obtener un modelo vlido.

pg. 17

Una vez validado el modelo, si resulta ser aceptable (proporciona salidas adecuadas y/o con mrgenes de error admisibles) ste ya est listo para su explotacin. Los modelos obtenidos por tcnicas de minera de datos se aplican incorporndolos en los sistemas de anlisis de informacin de las organizaciones, e incluso, en los sistemas transaccionales. Para el caso de este estudio, lo que se persigue es la identificacin de factores crticos en los diversos programas de rehabilitacin y reinsercin del SENAME. Para ello, fue de importancia contar con el historial de los jvenes que asisten y/o asistieron a algn centro, de manera de poder contar con datos para obtener modelos preliminares (datos como sus antecedentes familiares, judiciales, sociales, etc.) Luego de lo anterior, es posible determinar que existe un punto crtico dentro del proceso de minera de datos: la o las bases de datos a emplear. Sin base de datos, no es posible hacer el proceso, pues ellos actan como input de todo ello. Por ltimo, si bien la minera de datos acta como un facilitador para este estudio en cuanto a los modelos que se pretenden obtener, la validacin en terreno de los resultados obtenidos es fundamental: entrevistas con personas vinculadas con SENAME, visita a centros, vincular y/o comparar con otros aspectos que pudieran ser relevantes de relacionar, como por ejemplo relacionar este estudio con lo que ocurre con crceles chilenas, o investigar lo que ocurre en otros pases, entre otros aspectos, de manera que desarrollo de esta investigacin sea el ptimo. Sin duda, esta tcnica es ideal para el problema propuesto: el SENAME posee un sistema de gestin llamado senainfo36 el cual contiene informacin de todos quienes han asistido o asisten a un programa de dicha institucin. Estos programas pueden ser: Programa Medio-Libre (LRPA), Programa de Libertad Asistida (PLA), Programa de Libertad Especial (PLE), Servicio en Beneficio a la Comunidad, Reparacin del Dao (SBC), y Medidas Cautelares Ambulatorias (MCA)

SENAME, adems de contar con esta herramienta de gestin con acceso de diferentes bases de datos, tales como la de Registro Civil, Poder Judicial, Fiscala, entre otras, cuenta con otras fuentes de datos, tales como planillas electrnicas en formato Excel con informacin de los distintos centros en todo Chile (informacin de los centros, de los jvenes/lactantes atendidos, antecedentes locales para cada centro, entre otros). Sin embargo, para el desarrollo de esta investigacin, solo se consider aquella informacin que entreg directamente SENAME al autor, sin que el mismo pudiese acceder a otras fuentes de informacin.37

36 37

http://www.senainfo.cl, al 05/05/2011. El autor solo uso una completa base de datos, cuya naturaleza se explicar en detalle posteriormente.

pg. 18

2.3 Una oportunidad: realizar un anlisis estadstico basado en reincidencia delictual. Considerando tanto el fenmeno de la reincidencia delictual como la tcnica estadstica llamada minera de datos, se aprecia la existencia de una oportunidad para realizar un estudio basado en las numerosas -y distintas- bases de datos con que cuenta SENAME, con la finalidad de poder generar modelos adecuados de prediccin de comportamientos y contar con una fuente complementaria para la toma de decisiones, el cual es el objetivo de esta investigacin. Lo anterior da curso a un anlisis basado en la problemtica tras cada joven recluido: conocer sus antecedentes -familiares, sociales, judiciales, econmicos, entre otros- de manera de poder predecir un determinado comportamiento o una probabilidad de que ello suceda. Por ejemplo, podramos predecir bajo qu circunstancias una persona volvera a delinquir, a qu edad es frecuente que esto suceda, en qu casos los jvenes son ms vulnerables a cometer actos delictuales, bajo qu circunstancias un plan de rehabilitacin de un joven es altamente probable de ser exitoso, etc. La importancia de todo esto, sin duda, es que se lograra identificar la o las variables crticas y/o sensibles que hacen que un joven pueda rehabilitarse o no, y saber dnde concentrar los esfuerzos preventivos talleres, apoyo psicolgico, inversiones etc.- de manera ms especfica, certera y eficaz. Sin embargo, a priori es difcil definir patrones exactos de comportamiento que permitan explicar una determinada conducta, pero s se pueden identificar ciertas tendencias -con alguna probabilidad de ocurrencia- conductuales; Para ello, la definicin y ejecucin de modelos estadsticos, podran complementar y ampliar la visin de esta problemtica, tratados generalmente en estudios psicolgicos, sociolgicos y antropolgicos, entre otros. Actualmente, existen variados estudios que han permitido predecir, con una cierta probabilidad de ocurrencia, un determinado comportamiento humano usando herramientas de minera de datos.38 Luego de presentar este proyecto al jefe de la unidad de estudios del SENAME, el Sr. Jorge Martnez, se mostr sumamente interesado en lo propuesto, de manera que garantiz que el autor pudiera tener las facilidades requeridas para el correcto desarrollo del mismo. Alineados con la misin y objetivos del SENAME, los beneficios previstos para dicha institucin seran: Estudio de eficacia de los programas de rehabilitacin y reinsercin. Cmo impacta un determinado programa o un conjunto de ellos- en un joven de determinadas caractersticas. Saber qu programa es el adecuado para un joven de determinadas caractersticas (sociales, econmicas, judiciales, etc.) Provee una fuente de toma de decisiones. Saber dnde centrar los esfuerzos preventivos: dnde invertir, qu programas se deben potenciar, etc.

38

http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos, al 03/04/2011

pg. 19

Respecto a aplicaciones similares, existe un estudio de la Universidad Griffith en cuanto a los beneficios de la aplicacin de tcnicas de minera de datos en aquellos relacionados con justicia juvenil39. En l, luego de realizar un anlisis de la situacin actual y definir las fuentes de datos a utilizar, los alcances y otros aspectos, destacan tres casos: primero, se presenta un modelo respecto de los datos de jvenes comunes; segundo, respecto a jvenes delincuentes; y tercero, jvenes delincuentes y reincidentes. En cada uno de estos casos se aplican distintos algoritmos redes neuronales, rboles de decisin, etc.- y se presentan resultados. Lo relevante de esta parte es que, para cada caso, se present el modelo ms representativo, los cuales llegaron a tener 76,5% de acierto en la probabilidad obtenida en la prediccin.40 Por ltimo, se entrega una serie de recomendaciones al gobierno australiano mandante de dicho estudio- de manera de proveerles una nueva fuente de informacin. Adems, existen numerosos artculos que hacen referencia a la aplicacin de la minera de datos en la prediccin (o estimacin de probabilidad de ocurrencia) de comportamientos humanos. Esta tcnica es ampliamente usada en la industria del retail41 lo que incluye hbitos de compras en supermercados y patrones de fuga de clientes; dicha tcnica tambin es utilizada en la deteccin de fraudes, especialmente los relacionados con e-banking o bancos online y tarjetas de crdito.42

39 40

Griffith University [6]. Griffith University [7]. 41 Jiawei Han,Micheline Kamber [8]. 42 Mara-Amparo Vila Miranda - Daniel Snchez Fernndez - Luis Cerda Leiva [9].

pg. 20

3. Objetivos
3.1 Objetivo general Identificacin y anlisis de variables crticas para los programas de rehabilitacin y reinsercin relacionados con la Ley de Responsabilidad Penal Adolescente del Servicio Nacional de Menores.

3.2 Objetivos especficos Determinar el porcentaje de atendidos en los programas de rehabilitacin y reinsercin, segmentados por regin y por reincidencia o no reincidencia Evaluar la eficacia de los distintos programas de SENAME, en cuanto a una probabilidad de xito en cada uno de ellos, segmentado por regin y centros (SENAME y externos) Obtencin de tasas de reincidencia del universo de atendidos en SENAME, tanto en los propios centros de SENAME como en los externos, desglosadas por regin. Segmentar tanto programas de rehabilitacin y de reinsercin- del SENAME, como jvenes que asisten a dichos centros en base a atributos ms representativos de cada uno de ellos. Validacin del uso de la minera de datos en este mbito de investigacin, constituido principalmente por ciencias sociales.

pg. 21

4. Plan de Trabajo
Para llevar a cabo este anlisis fue imprescindible realizar una serie de procesos, enunciados a continuacin: 4.1 SENAME Sin duda, lo primero fue conocer el SENAME en profundidad, pensando en que es una institucin pblica y que su lineamientos pudieran ser diferentes con respecto a una institucin privada: misin, objetivos, organigrama, presupuesto, dotacin, dependencias, entre otros, de manera de que el autor se interiorice del funcionamiento del mismo y comprenda de la mejor forma posible el porqu, qu y cmo de fenmenos que los afecte. Reuniones en el SENAME para definir primero los alcances del trabajo, como tambin los aspectos ms importantes. Aplicacin de encuestas u otro medio de captura de datos a personal del SENAME, ya sea para proveer una nueva fuente de informacin para el proceso de minera de datos como para apoyar alguna conclusin. Entrevistas y visitas a funcionarios y centros del SENAME, de manera de contrastar las conclusiones obtenidas de los modelos con lo que sucede en la realidad.

Luego de definir el tema y, a modo de conocer su factibilidad, se present el mismo a SENAME en octubre del 2010. En dicha oportunidad, gracias a la gestin del profesor gua, se logr presentar el mismo al Jefe de Estudios de SENAME, el Sr. Jorge Martnez, donde manifest su compromiso por apoyar el desarrollo de la investigacin. En el acto design al Sr. Hernn Medina, dependiente del rea de estudios de SENAME, como contraparte directa del alumno memorista en el desarrollo de esta investigacin. Dentro del plan de trabajo, se realizaron dos presentaciones del tema: ante un grupo de estadsticos del rea de estudios y ante un grupo de especialistas en justicia juvenil43. De este modo, y luego de las impresiones rescatadas en dichas presentaciones, se defini lo siguiente: El tema a desarrollar en esta investigacin abarcara todo lo relevante a justicia juvenil, es decir, todo lo relacionado con la LRPA. Esto, a modo de acotar los alcances de la presente en cuanto a que SENAME es una institucin que trabaja, adems de lo relacionado con justicia juvenil, adopcin, proteccin social, entre otros. El apoyo institucional provendra de la entrega de informacin y del apoyo de especialistas en el rea de estudios relacionados con justicia juvenil44.

De este modo, los especialistas entregaron la informacin comprometida, la cual se desglosa en los siguientes documentos:
43 44

Texto de la ley 20.084 (o LRPA).

La primera se efectu el 14/01/2011 y la segunda el 28/01/2011 en dependencias de SENAME Teresita Fuentealba, Soledad Arriagada y Felipe Arenas son algunos de ellos.

pg. 22

Estudio de Paz Ciudadana: Construccin de indicadores de reinsercin social de adolescentes infractores de la ley penal45. Estudio de SENAME: informe de diagnostico de la implementacin de la ley 20.084, junio 2007 a marzo 2010. Presentacin en Concepcin del ex-director de SENAME: a tres aos de la LRPA. Entrega de base de datos de adolescentes bajo LRPA entre junio 2007 y diciembre 2010.

En cada uno de estos textos fue posible encontrar variada informacin relevante relacionada con los temas ya planteados.

4.2 Minera de datos Aplicacin de tcnicas de minera de datos para la obtencin de modelos predictivos: Contar con una o ms bases de datos adecuadas para la generacin de modelos preliminares. Para ello fue necesario conocer todas las fuentes de informacin existentes en SENAME. Consolidar las bases de datos identificadas en una sola, sin datos redundantes ni datos sin importancia. Aplicacin de modelos y bsqueda de aquel que prediga un determinado fenmeno de la manera ms real posible. El software que permiti desarrollar esta etapa fue RapidMiner. Entrevistas a acadmicos u otros, adems de los profesores involucrados oficialmente en esta investigacin, para obtener datos de otras fuentes de manera de conocer el real estado de avance y precisin de esta investigacin. Validacin con el cliente, es decir, se present tanto a SENAME como a los docentes involucrados en esta investigacin, los resultados finales de la misma. La finalidad de esto es que ambas partes (adems del autor) confirmen y acepten la investigacin realizada.

45

Incluido dentro de la bibliografa consultada.

pg. 23

5. Aplicacin de modelos, resultados y anlisis


A continuacin, se explica en detalle el proceso de tratamiento de los datos suministrados por SENAME. Con esto, se pretende dar cumplimiento a los objetivos ya presentados en esta investigacin. Como ya se destac previamente, la minera de datos proviene de un flujo de procesos llamado KDD46 (Knowledge Discovery in Databases) el cual contiene las siguientes etapas: 1. 2. 3. 4. 5. 6. Seleccin del conjunto de datos. Anlisis de las propiedades de los datos. Transformacin del conjunto de datos de entrada. Seleccionar y aplicar la tcnica de minera de datos. Extraccin de conocimiento, mediante una tcnica de minera de datos. Interpretacin y evaluacin de datos.

Se explicar qu tareas, procesos u otros relacionados se efectuaron en cada una de estas etapas. 5.1 Seleccin del conjunto de datos. En esta etapa, es necesario mencionar en detalle el contenido de la base de datos suministrada por SENAME, ya descrita en el apartado 6.1 de esta investigacin.

Ilustracin 8: Detalle de campos de base de datos suministrada por SENAME (Fuente: elaboracin propia)

46

Meja-Lavalle, M; Sols, J; Garca, F. [10]

pg. 24

En esta etapa, se mantuvieron los siguientes atributos de la base en tratamiento:47 1. NombreInstitucion


Puede ser un centro propio de SENAME o externo que le preste el servicio

2. NombreProyecto
CIP Centro de Internacin Provisoria CRC Centro de Internacin en Rgimen Cerrado CSC Centro Semicerrado MCA Medida Cautelar Ambulatoria PLA Programa de Libertad Asistida PLE Programa de Libertad Asistida Especial PSA Programa de Salidas Alternativas SBC Servicios en Beneficio a la Comunidad y Reparacin de Dao

3. Region
Arica y Parinacota Tarapac Antofagasta Atacama Coquimbo Valparaso Metropolitana Libertador Bernardo O Higgins Maule Biobio Araucana Los Ros Los Lagos Aysn Magallanes y Antrtica chilena

4. Medio
Medio libre, privado de libertad o salidas alternativas

5. Icodieunico

Indica la existencia de reincidencia en registros

6. CodNino
Cdigo numrico de cada nio

7. Nacionalidad
Chilenos o extranjeros (se detalla listado de nacionalidades)

8. Etnia
Se destacan las distintas etnias presentes en Chile. Entre ellas mapuche, rapa nui, etc.

9. Rut
47

Se mantuvieron los mismos nombres de los atributos de la base de datos original. Se ruega no considerar faltas ortogrficas en ellos.

pg. 25

10. FechaNacimiento 11. Sexo 12. EdadAlIngreso


Edad al ingreso del sistema

13. Comuna_Origen 14. FechaIngreso 15. CalidadJuridica


E-Condenados F-Condenados solo para elaborar PII G-Ingreso temporal por traslado para comparecer a audiencia H-Medida cautelar privativa de libertad I-Medida cautelar no privativa de libertad J-Formalizado(a) K-Imputado(a) L-Ingreso a medida cautelar privativa de libertad (agenda corta) N-Ingreso temporal por incumplimiento O-Solo reclusin nocturna P-Condenado beneficio pro-reo Q-Ingreso por ampliacin de plazo de detencin S-Derivacin sin contacto con el adolescente

16. Tribunal
Puede ser tribunales de garanta, orales, de letras, etc.

17. Ruc 18. Rit 19. RegionTribunal


Las mismas regiones del punto 3

20. TribunalSeguimientoCausa
Se describen los mismos del punto 16

21. FechaInicio 22. FechaTermino 23. SancionAccesoria


Comiso, prohibicin de conducir vehculos motorizados, Tratamiento de rehabilitacin por adiccin a drogas y/o alcohol, etc.

24. Escolaridad_Alingreso
Enseanza bsica, media, etc.

25. AnoEscolaridad_AlIngreso 26. TipoAsistenciaEscolar_Alingreso


Asiste en forma interrumpida, regular, desertor, etc.

27. FechaElaboracionPII
PII: Informacin personalmente identificable (Personally Identifiable Information)

pg. 26

28. FechaPrimerEventoDirecto 29. FechaEgreso 30. CausalEgreso


Se enuncia todas las posibles causas de egreso: abandono, medidas decretadas por tribunales, fuga, etc.

31. Delito
Se enuncian todos los posibles delitos: amenazas, robo, violacin, drogas, etc.

32. Escolaridad_Posterior
1ero bsico a 4to medio, cientfico-humanista o tcnico-profesional

33. AnoEscolaridad_Posterior 34. TipoAsistenciaEscolar_Posterior


Las mismas opciones del punto 26.

35. Sitpadre (y Madre)


Variadas opciones de situacin del padre: abandono de nios, drogadiccin y/o alcoholismo, reclusin, etc.

36. Profesionpadre (y Madre)


Oficios y profesiones, tales como obrero, contador, ingeniero civil, etc. o sin oficio ni profesin

37. ActividadPadre (y Madre)


Opciones: trabajando, cesante, jubilado, etc.

38. EscolaridadPadre (y Madre)


Similar al punto 32.

39. TipoConsumoDroga
Consumo abusivo, experimental, etc.

40. SeAtiendeCONACE
1: s o 0: no

41. MedicionesDiagnosticas
Rendimiento intelectual, trastornos psicolgicos, discapacidad intelectual, etc.

42. FechaInicioCapacitacion 43. HorasCurso 44. TipoCapacitacion


Laboral, pre-laboral, etc.

45. AreaCapacitacion
Administracin, agrcola, computacin, comercio, etc.

46. OrganismoCapacitador
SOFOFA, SENCE, Universidades, etc.

47. EstadoCapacitacion
Cursando, egresado, abandono, etc.

48. Termino

pg. 27

49. FechaSituacionLaboral 50. AreaInsercionLaboral


Idem punto 45.

51. SituacionLaboral
Efectuando labores en mercado formal, informal, etc.

52. Permanencia 53. Ausencia 54. Permisos 55. GradoCumplimiento


Logrado, parcialmente logrado, etc.

De este modo, si obtenemos un grfico de correlacin de dichos atributos mediante el uso de la herramienta computacional RapidMiner48, tendremos lo siguiente:

Ilustracin 9: Matriz de correlacin (Fuente: elaboracin propia mediante el uso de RapidMiner)

Con la ilustracin anterior es posible mostrar la independencia de las variables con las que se trabaja en esta investigacin, pues se logra identificar la diagonal de la matriz de correlacin, lo que indica que la mayora de las variables son independientes.49 En etapas posteriores se
48 49

http://rapid-i.com/content/view/181/190/, consultada al 10/04/2011. La matriz de correlacin se elabor a partir de la seleccin definitiva de atributos a considerar en esta investigacin, y son los presentados en la seccin 6.1 de esta investigacin.

pg. 28

analiza si, combinaciones entre dichas variables dan origen a una que explique un atributo ya definido dentro de ellos. Por otro lado, la base de datos utilizada se divide en dos partes: primero, se realiza un estudio en base a lo que sucede en centros de SENAME, y segundo, un estudio realizado en base a los centros externos en base. Para cada uno de ellos se muestra si es que existen- diferencias substanciales entre ellos y su estudio, as como los resultados y conclusiones que pudieran ser relevantes en esta investigacin. Por ltimo, en esta etapa se seleccionan aquellos atributos que permitan desarrollar el objetivo principal de esta investigacin, la cual relaciona un cierto conjunto de atributos con una probabilidad de xito en un programa rehabilitacin y reinsercin de SENAME.

5.2 Anlisis de las propiedades de los datos. En esta etapa es necesario conocer la calidad de los datos, en cuanto a la presencia de valores nulos o null values, valores perdidos o missing values50, valores fuera de rango o outliers51, entre otros anlisis.

Ilustracin 10: Missing values del conjunto de atributos seleccionados, identificados en el valo. (Fuente: elaboracin propia mediante el uso de RapidMiner)

50 51

http://en.wikipedia.org/wiki/Missing_values, consultada al 10/04/2011. http://en.wikipedia.org/wiki/Outlier, consultada al 10/04/2011.

pg. 29

Dada la ilustracin anterior, lo que se debe realizar en esta etapa es corregir dichos datos de algn modo, ya sea mediante imputacin (rellenar el dato con el promedio), eliminacin del registro completo en caso de que su importancia relativa frente al resto sea muy pequea, entre otras acciones. 5.2.1 Missing values Los missing values forman parte de un conjunto de observaciones con caractersticas especiales que incluye a los datos agrupados, agregados, redondeados, censurados o truncados; es decir, a datos con informacin especial52. De esta manera, un aspecto crucial en el anlisis de datos se vincula al porcentaje mximo de omisiones que deben aceptarse. No existen criterios objetivos para dilucidar este tema, por lo que cada investigador debe hacerse cargo de sus propias decisiones. Por tanto, no se recomienda imputar datos en situaciones en que la omisin en una o ms variables alcance porcentajes superiores al 20%. En definitiva, podemos considerar que, si existe una cantidad considerable de valores nulos en una variable, se debe escoger la alternativa de eliminarlos o imputarlos, ya que los valores nulos afectan la calidad del modelo. Los mtodos de imputacin se clasifican como se muestra a continuacin53: Anlisis de datos completos (listwise): Consiste en no usar aquellos registros en que existan datos faltantes en cualquiera de las variables involucradas. Anlisis de datos disponibles (pairwise): Eliminacin de pares (tuplas) de datos. Imputacin por medias no condicionadas. Imputacin por medias condicionadas mediante mtodos de regresin. Mxima verosimilitud (MV): Las observaciones faltantes se asumen como variables aleatorias y los datos imputados se generan sin necesidad de ajustar modelos. Imputacin mltiple (IM): Cada dato faltante debe ser reemplazado a partir de m>1 simulaciones.

Un tema no tratado aun es el de la eliminacin de datos y algn criterio para aplicarlo. Es posible considerar la eliminacin de un registro en los siguientes casos54: Alto costo de conseguir el dato faltante. Poca importancia de la variable para el modelo estudiado. Poca o nula correlacin de la variable con otras y/o con funcin objetivo. Experto quien mandata el estudio- aclara que variable con datos faltantes no es relevante en el modelo. Otros casos.

52 53

Heitjan y Rubin, 1991. Little (1992) y Little y Rubin (1987). 54 Propuestas por el grupo de esta tarea, adems de los apuntes personales de ctedra.

pg. 30

Es importante destacar que la eliminacin de informacin en un estudio probabilstico altera la estructura del diseo muestral, las probabilidades de seleccin y genera sesgos que afectan la inferencia estadstica, y si no se corrigen los factores de expansin las observaciones que permanecen en la muestra no estimarn en forman correcta los modelos propuestos. Es por esto que es imprescindible tratar de imputar datos de alguna manera coherente y consistente, por sobre eliminar dichos registros con datos en blanco. Se acepta que, con o sin datos omitidos, el objetivo del anlisis estadstico es generar inferencia vlida. No se trata nicamente de obtener estimadores insesgados y de mnima varianza, ni tampoco ajustar modelos para sustituir de cualquier forma la informacin faltante. Si la variable analizada (digamos S) contiene datos faltantes, esta situacin debe tenerse en cuenta en el proceso de construccin del estimador55. Si la imputacin que se hace es adecuada, el estimador S ser cercano al verdadero valor del parmetro S en muestras repetidas. De esta forma, se lograr minimizar el sesgo (que corresponde a la diferencia promedio entre S y S), la varianza y la desviacin estndar de S. Esto es de suma relevancia tanto para las distintas variables independientes como la dependiente, que es lo que queremos estimar, en definitiva. Se advierte que la ausencia de datos debe analizarse como un fenmeno estocstico, por lo que Z una variable binaria con valor 1 si el dato existe y 0 en caso contrario- debe considerarse como variable aleatoria con distribucin de probabilidad conjunta, la cual da cuenta del porcentaje de omisin existente y de su relacin con las observaciones completas56. Los datos nulos en una base de datos de prueba responden a un problema de la toma de la muestra propiamente tal. Esto se evidencia en dos problemas de informacin: el primero, asociado a la falta de respuesta total, es decir, cuando el informante no complet todos los datos asociados a su registro57, o asociado a la no respuesta parcial, es decir cuando simplemente no se obtuvieron los datos para la correcta validacin del registro58. En el primer caso, se corrige eliminando las observaciones y ajustando los factores de expansin, y el segundo caso, se corrige mediante la aplicacin del mtodo de promedios, o tambin conocido como hot-deck. En la prctica es comn que se presenten situaciones en que los datos faltantes no siguen un patrn completamente aleatorio (MCAR, o Missing Completely at Random) y tampoco aleatorio (MAR, o Missing at Random). En el caso MCAR, significa que la probabilidad de que falte la funcin objetivo (digamos, Y, alguna funcin de X, con X perteneciente los atributos o variables) no depende de los valores de los atributos (X) ni de la misma funcin objetivo (Y). En tanto, MAR asume que la probabilidad de que falte Y puede depender de X, pero no de Y.

55 56

La mayora de estos mtodos de imputacin generan estimadores sesgados. Rubin, 1976. 57 Digamos, los mnimos datos ingresados para enunciar la solidez del registro. 58 La diferencia fundamental entre ambas visiones es que la falta de respuesta total proviene de la negativa del mismo usuario a no entregar sus datos; la visin de de respuesta parcial se debe a que el usuario simplemente desconoce algn dato que se le solicita, o la arquitectura que existe tras la validacin del registro no sea lo suficientemente robusta como para almacenar debidamente el dato.

pg. 31

5.2.2 Outliers Dentro de los mtodos ms usados para tratar los valores fuera de rango o outliers se encuentran los siguientes: Mtodo Dans: propuesto por Krarup (Krarup et al. 1980) y es puramente heurstico sin teora estadstica rigurosa. El mtodo funciona haciendo un ajuste de mnimos cuadrados ocupando una matriz de pesos previos. Luego el proceso es repetido alterando la matriz de pesos segn; 59

donde k es el nmero de iteraciones y c es una constante generalmente impuesta en 2 3. El proceso contina hasta que converge. Los outliers entonces tienen peso cero y el tamao de los residuos representa la magnitud del outlier. Los parmetros estimados son dejados tal cual o los outliers son descartados y se obtiene una nueva solucin para los mnimos cuadrados usando la matriz de pesos a priori. Mtodo del mnimo valor absoluto o norma-L1: fue propuesto por Edgeworth (1887). La norma-L1 se encuentra minimizando la suma de los residuos absolutos ponderados.

Al no cuadratizar los residuos, hay menor nfasis en los outliers que el que habra en el mtodo de mnimos cuadrados. Mtodo de la mnima mediana cuadrada fue desarrollado por Rousseeuw (1984). Est caracterizado por resolver el modelo lineal minimizando la mediana cuadrada de los residuos ponderados.

59

Caspary, 1987

pg. 32

5.3 Transformacin del conjunto de datos de entrada. En esta etapa, fue necesario transformar los datos de entrada previa a la aplicacin de modelos. El motivo de esto es obtener un nmero de datos que sigan una tendencia por ejemplo, una distribucin normal- y cuyo tratamiento permita obtener resultados con mayor informacin. Suelen darse ciertos tipos de datos, siendo los ms importantes los continuos y los discretos: en los primeros, es posible contar con una secuencia de nmeros asociados a algn atributo: por ejemplo, edad de individuo; en cambio, en los segundos, no existe una continuidad de dichos datos: por ejemplo, nombres y apellidos de una persona.60 Sin embargo, existen modos de llevar datos de un tipo a otro: por ejemplo, en las fechas, que en s es un dato discreto, es posible llevar a una distancia o dato continuo, mediante la fijacin de una fecha inicial y la posterior resta entre la actual y la inicial. De este modo, obtenemos datos continuos a partir de datos discretos. A continuacin se explican cules fueron aquellos registros que fueron transformados, ya sea en datos continuos, discretos u otro que aportara mayor informacin en los modelos generados. Nemotcnico: CIP se asigna nmero 1; CRC se asigna nmero 2 y CSC se asigna nmero 3. CodEtnia: se elimina dicho atributo. ConNacionalidad: se asigna 1 a chileno y 2 a extranjeros. Rut: se transforman en ids. FecNac, fechainicio, fechatermino, fechaelaboracionPII, fechaprimereventodirecto, fechainiciocapacitacion, termino y fecha situacin laboral: se borra acompaamiento de la fecha, que siempre es 00:00:00.000 Sexo: se asigna un 1 a masculino y un 2 a femenino. RUC y RIT: se eliminan dichos atributos. A las fechas ya mencionadas, se cambian a formato continuo mediante la resta con una fecha inicial, que corresponde a la menor de las fechas de la base de datos61. El resultado de esta resta es un nmero entero. El resto de los atributos no mencionados se mantuvo, pues ya estaban transformados en la propia base.62 Todos los datos nulos (campos vacos en la base de datos) o que indicara la frase sin informacin, fueron transformados en el nmero -1. Esta es una tcnica muy usada para rellenar campos vacos (imputacin de datos) cuando no existe un registro asociado al mismo.63 TerminoCapacitacion: A por 1, E por 2, I por 3 y R por 4.

60 61

http://www.bioingenieria.edu.ar/academica/catedras/introprob/descriptiva-teo.pdf, al 03/05/2011. Fecha relacionada con la edad el primer adolescente que bajo la LRPA en SENAME: 06/10/1983. 62 Eran datos que posean un atributo original acompaado de una codificacin del mismo: por ejemplo, Regin y CdigoRegin, donde el primero aparece el nombre de la regin y en el segundo el nmero de la regin. 63 Para mayor informacin, consultar apartado 6.2.2.1

pg. 33

5.4 Seleccin y aplicacin de tcnica de minera de datos. Las alternativas ms comunes para procesar variables cualitativas consisten en transformarlas a variables numricas para poder trabajar con ellas. Existen dos maneras de hacer esto: Dicotomizacin: Esta tcnica sirve tanto para variables cualitativas nominales como ordinales. Consiste crear una nueva variable para cada valor de la variable cualitativa. La nueva variable que corresponde al valor actual nominal toma el valor 1 y todas las otras variables toman el valor 0. En Rapidminer se utilizan las herramientas nominal to binominal, para lograr variables con valores true o false. Luego se utiliza nominal to numerical para dejar estas variables con valores 0 y 1. Finalmente, se utiliza select attributes para eliminar una variable (ya que esta puede ser representada por las anteriores). Para ciertas variables cualitativas ordinales puede funcionar considerar que la distancia entre los valores que toma son iguales, lo que permitira transformar cada valor directamente a un nmero real. Por ejemplo, las opiniones: muy malo, malo, regular, bueno, muy bueno, podran transformarse a una escala del 1 al 5. Esto tambin se puede aplicar para los das de la semana.

En esta etapa, se aplicaron los modelos de rbol de decisin, red neuronal y Nave Bayes para analizar el fenmeno de la reincidencia en los adolescentes, de modo de generar un perfil de ellos. En una primera etapa, la base de datos original suministrada por SENAME base ya tratada bajo lo expuesto en los puntos anteriores- se dividi en dos partes: la primera, que corresponde a solo centros operados directamente por SENAME, y la segunda a centros operados por centros externos. En la primera divisin, se aprecia que el medio donde los adolescentes cumplen su condena es solo bajo privacin de libertad, mientras que en el segundo opera los medios semicerrado y salidas alternativas, siendo estas ltimas, principalmente, asistir a programas de rehabilitacin, trabajos a beneficio de la comunidad, entre otros. As, en etapas posteriores se procede a realizar los anlisis para centros externos a SENAME, tanto para medios semicerrados como para salidas alternativas. A continuacin, se muestran los modelos generados a partir del uso de la herramienta RapidMiner64. Es importante aclarar que, en el caso de redes neuronales, el modelo se debe entrenar, por lo que se fueron incorporando poco a poco pequeas fracciones de la base de datos completa hasta llegar al 100% de la base original.65 Cada fraccin fue calculada mediante distribuciones aleatorias entre 0 y 1 para evitar sesgo estadstico en cada una de ellas. As, cada fraccin qued balanceada y se fue incorporando en grupos de 10% de la base total al modelo.

http://rapid-i.com/content/view/181/190/lang,en/, al 03/05/2011. R. Alejo, V. Garca y F. Garca, Redes Neuronales Artificiales y Distribuciones no Balanceadas. 26/06/2009, http://www.uaem.mx/editorial/continuum/Descargas/art2.pdf, al 02/05/2011
65

64

pg. 34

5.4.1 rbol de Decisin.

Ilustracin 11: En el centro, rbol de decisin; a la izquierda, bases de datos fraccionadas. (Fuente: elaboracin propia mediante el uso de RapidMiner)

5.4.2 Red Neuronal

Ilustracin 12: En el centro, red neuronal; a la izquierda, bases de datos fraccionadas. (Fuente: elaboracin propia mediante el uso de RapidMiner)

pg. 35

5.4.3 Nave Bayes

Ilustracin 13: En el centro, Nave Bayes; a la izquierda, bases de datos fraccionadas. (Fuente: elaboracin propia mediante el uso de RapidMiner)

5.5 Extraccin de conocimiento. En base a lo presentado en el punto anterior, se obtuvieron los siguientes resultados, diferenciados para caso SENAME y centros externos. 5.5.1 SENAME En centros administrados por SENAME, dados la base de datos suministrada por dicha entidad y el mbito de esta investigacin, los adolescentes que all residen pertenecen al medio privacin de libertad, es decir, dichos centros funcionan como lugares cerrados y semicerrados en donde se mantienen a dichos adolescentes cuando una sentencia lo determin as. SENAME se hace cargo de la reclusin de dichos imputados, a diferencia de GENDARMERA, quien se hace cargo de la privacin de libertad de los adultos o personas con mayora de edad, cuando un tribunal as lo ha determinado.

Resultados obtenidos mediante rbol de decisin.

pg. 36

Decision Tree SENAME 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ACCURACY ERROR PRECISION NO PRECISION SI RECALL NO RECALL SI MINIMAL GAIN CONFIDENCE 94,95% 5,05% 94,95% 0,00% 100,00% 0,00% 0,100 0,25 94,95% 5,05% 94,95% 0,00% 100,00% 0,00% 0,200 0,25 95,10% 4,90% 96,67% 52,17% 98,23% 36,36% 0,010 0,25 95,25% 4,75% 96,67% 54,55% 98,39% 36,36% 0,001 0,25 95,25% 4,75% 96,67% 54,55% 98,39% 36,36% 0,002 0,25 95,25% 4,75% 96,67% 54,55% 98,39% 36,36% 0,002 0,20 96,32% 3,68% 96,56% 84,62% 99,68% 33,33% 0,005 0,40 96,32% 3,68% 96,56% 84,62% 99,68% 33,33% 0,004 0,40 96,32% 3,68% 96,56% 84,62% 99,68% 33,33% 0,004 0,25 95,25% 4,75% 96,67% 54,55% 98,39% 36,36% 0,003 0,25 96,63% 3,37% 96,57% 100,00% 100,00% 33,33% 0,006 0,25 95,41% 4,59% 96,68% 57,14% 98,55% 36,36% 0,007 0,25 94,10% 5,90% 95,13% 50,00% 98,78% 19,48% 0,006 0,25 94,42% 5,58% 95,14% 60,00% 99,13% 20,51% 0,006 0,25 94,37% 5,63% 95,08% 58,00% 99,14% 18,71% 0,006 0,25 93,27% 6,73% 95,05% 32,26% 97,95% 16,04% 0,006 0,25 94,49% 5,51% 95,21% 64,52% 99,11% 24,59% 0,006 0,25 94,83% 5,17% 95,38% 61,33% 99,33% 18,11% 0,006 0,25 93,84% 6,16% 94,54% 64,46% 99,12% 21,85% 0,006 0,25 94,54% 5,46% 95,41% 60,54% 98,95% 25,21% 0,006 0,25 94,68% 5,32% 95,14% 70,73% 99,41% 21,80% 0,006 0,25

Ilustracin 14: Tabla de resultados de reincidencia en SENAME bajo modelo rbol de decisin (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

En la tabla anterior, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de rbol de decisin, se aprecia que predictibilidad del modelo, para el 100% de la base de datos, es de un 94,68% +/- 5,32%, lo que indica que el resultado es preciso: tanto la precisin (PRECISION, en ingls) como el muestreo (RECALL, en ingls) son cercanos al 100%, lo cual indica que la muestra en cada una de sus fracciones (10-100% de la base total) es de buena calidad.66,67 Los otros factores que aparecen en la tabla permiten ajustar el modelo, en su etapa inicial al 10% de la base, en cuanto a que cuando una determinada combinacin de como resultado un mayor accuracy, es elegido para la modelacin bajo mayores fracciones de la base original. En este caso, el mayor accuracy al 10% de la base se dio con un minimal gain de 0,006 y confidence de 0,25. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 21,80%.

66 67

Davis J., Goadrich M, The Relationship Between Precision-Recall and ROC Curves, 2008 RECALL: medida de la habilidad de un sistema para presentar todos los temes; PRECISION: medida de la habilidad de un sistema para presentar solo los temes relevantes. http://comminfo.rutgers.edu/~muresan/IR/TREC/Proceedings/t10_proceedings/appendices/measures.pdf, al 03/05/2011.

pg. 37


Neural Net SENAME 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Resultados obtenidos mediante red neuronal.

ACCURACY 91,88% 93,03% 94,18% 93,11% 94,79% 94,33% 94,03% 94,64% 94,79% 94,03% 94,79% 93,87% 94,03% 94,95% 94,03% 93,87% 93,70% 93,98% 94,03% 93,70% 94,59% 93,75% 93,60% 93,76%

ERROR 8,12% 6,97% 5,82% 6,89% 5,21% 5,67% 5,97% 5,36% 5,21% 5,97% 5,21% 6,13% 5,97% 5,05% 5,97% 6,13% 6,30% 6,02% 5,97% 6,30% 5,41% 6,25% 6,40% 6,24%

PRECISION NO PRECISION SI RECALL NO RECALL SI 94,87% 27,59% 98,57% 96,22% 30,16% 96,45% 95,75% 35,29% 98,23% 96,15% 30,00% 96,61% 95,64% 45,45% 99,03% 96,05% 40,00% 98,06% 95,89% 35,00% 97,90% 96,06% 44,44% 98,39% 95,78% 46,15% 98,87% 95,60% 31,25% 98,23% 95,50% 44,44% 99,19% 95,89% 33,33% 97,74% 95,60% 31,25% 98,23% 95,65% 50,00% 99,19% 95,75% 33,33% 98,06% 94,91% 44,44% 98,78% 95,29% 45,16% 98,15% 94,64% 47,22% 99,23% 95,09% 44,12% 98,77% 94,61% 47,37% 98,92% 95,45% 53,19% 98,98% 94,59% 61,36% 98,95% 95,00% 42,04% 98,36% 95,01% 47,37% 98,53%

20,00% 28,79% 18,18% 27,27% 15,15% 24,24% 27,27% 24,24% 18,18% 15,15% 12,12% 21,21% 15,15% 15,15% 18,18% 15,58% 23,93% 10,97% 16,04% 14,75% 19,69% 22,69% 18,70% 20,30%

TRAINING CYCLES LEARNING RATE MOMENTUM 500 0,30 0,40 500 0,20 0,10 500 0,10 0,10 500 0,40 0,10 100 0,30 0,30 100 0,40 0,40 100 0,40 0,20 100 0,30 0,10 100 0,30 0,20 100 0,10 0,30 100 0,10 0,60 100 0,50 0,20 100 0,50 0,70 100 0,10 0,50 100 0,60 0,30 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50

Ilustracin 15: Tabla de resultados de reincidencia en SENAME bajo modelo red neuronal (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

En esta tabla, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de red neuronal, se aprecia que predictibilidad del modelo, para el 100% de la base de datos, es de un 93,76% +/- 6,24%, lo que indica que el resultado es preciso: tanto la precisin (PRECISION, en ingls) como el muestreo (RECALL, en ingls) son cercanos al 100%, lo cual indica que la muestra en cada una de sus fracciones (10-100% de la base total) es de buena calidad. Los otros factores que aparecen en la tabla permiten ajustar el modelo, en su etapa inicial al 10% de la base, en cuanto a que cuando una determinada combinacin de como resultado un mayor accuracy, es elegido para la modelacin bajo mayores fracciones de la base original. En este caso, el mayor accuracy al 10% se dio con un training cycles de 100, learning rates de 0,1 y momentum de 0,50. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 20,30%.

Resultados obtenidos mediante Nave Bayes.

pg. 38

Nave Bayes SENAME 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ACCURACY ERROR PRECISION NO PRECISION SI RECALL NO RECALL SI 12,71% 87,29% 100,00% 5,47% 8,06% 100,00% 14,26% 85,74% 99,10% 6,37% 8,96% 98,70% 30,21% 69,79% 98,56% 7,50% 26,14% 94,02% 25,56% 74,44% 98,48% 7,06% 21,18% 94,84% 85,80% 14,20% 95,39% 14,03% 89,25% 28,88% 84,99% 15,01% 95,04% 14,81% 88,63% 29,92% 85,35% 14,65% 95,63% 13,74% 88,54% 31,10% 85,62% 14,38% 94,42% 16,58% 89,88% 27,45% 85,16% 14,84% 94,89% 12,48% 89,01% 24,65% 85,80% 14,20% 95,01% 14,67% 89,58% 27,57%

Ilustracin 16: Tabla de resultados de reincidencia en SENAME bajo modelo Nave Bayes (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

En esta tabla, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de Nave Bayes, se aprecia que predictibilidad del modelo, para el 100% de la base de datos, es de un 85,80% +/- 14,20%, lo que indica que el resultado es menos preciso que en los casos anteriores. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 27,57%. Es posible resumir los resultados de los tres modelos presentados en la siguiente tabla:
ACCURACY 94,68% 93,76% 85,80% ERROR 5,32% 6,24% 14,20%

Decision Tree Neural Net Nave Bayes

Ilustracin 17: Resultados comparativos modelos aplicados para caso reincidencia en SENAME

Dado lo anterior, el modelo seleccionado para continuar con el anlisis, para el caso de reincidencia en SENAME, es el de rbol de decisin, que presenta mejores resultados.

5.5.2 Centro externos En centros externos, quienes prestan un servicio a SENAME, los adolescentes pertenecen al medio media libertad (ML) y sanciones accesorias (SA), es decir, dichos centros funcionan como lugares semi-cerrados y abiertos en donde se mantienen a dichos adolescentes cuando una sentencia lo determin as. Generalmente, en estos centros llegan adolescentes a realizar programas de rehabilitacin y reinsercin, ya sea con apoyo psicolgico, enseanza de oficios, entre otros. Para esta etapa, se presentan tanto los resultados para el caso media libertad como de sanciones accesorias.
pg. 39


Decision Tree SENAME

Resultados obtenidos mediante rbol de decisin, ML.

10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

ACCURACY ERROR 88,82% 88,46% 89,92% 89,99% 89,73% 89,51% 89,55% 89,40% 89,27% 89,28%

11,18% 11,54% 10,08% 10,01% 10,27% 10,49% 10,45% 10,60% 10,73% 10,72%

PRECISION NO PRECISION SI RECALL NO RECALL SI MINIMAL GAIN CONFIDENCE 88,82% 88,89% 99,75% 13,87% 0,006 0,25 88,45% 88,71% 99,71% 15,11% 0,006 0,25 90,16% 83,77% 99,30% 25,10% 0,006 0,25 90,38% 80,19% 99,14% 24,78% 0,006 0,25 89,63% 93,26% 99,80% 19,42% 0,006 0,25 89,87% 79,79% 99,19% 22,32% 0,006 0,25 89,66% 86,05% 99,50% 21,07% 0,006 0,25 89,41% 89,08% 99,67% 18,51% 0,006 0,25 89,57% 81,45% 99,23% 22,74% 0,006 0,25 89,80% 74,27% 99,03% 19,92% 0,006 0,25

Ilustracin 18: Tabla de resultados de reincidencia en centros privados ML bajo modelo rbol de decisin (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

En la tabla anterior, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de rbol de decisin, se aprecia que predictibilidad del modelo, para el 100% de la base de datos, es de un 89,28% +/- 10,72%, lo que indica que el resultado est dentro de un rango de precisin aceptable: tanto la precisin (PRECISION, en ingls) como el muestreo (RECALL, en ingls) son cercanos al 100%, lo cual indica que la muestra en cada una de sus fracciones (10-100% de la base total) es calidad aceptable. Del mismo modo, el accuracy al 100% de la base se dio con un minimal gain de 0,006 y confidence de 0,25. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 19,92%.

Neural Net SENAME 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Resultados obtenidos mediante red neuronal, ML.

ACCURACY ERROR 85,96% 87,29% 88,05% 88,45% 87,90% 88,23% 88,31% 87,97% 88,32% 88,58%

14,04% 12,71% 11,95% 11,55% 12,10% 11,77% 11,69% 12,03% 11,68% 11,42%

PRECISION NO PRECISION SI RECALL NO RECALL SI TRAINING CYCLES LEARNING RATE MOMENTUM 89,34% 40,43% 95,28% 21,97% 100 0,10 0,50 89,17% 55,26% 97,14% 23,08% 100 0,10 0,50 89,29% 58,54% 98,09% 18,68% 100 0,10 0,50 90,70% 55,84% 96,75% 29,25% 100 0,10 0,50 90,30% 53,27% 96,53% 27,60% 100 0,10 0,50 89,73% 58,42% 97,71% 22,32% 100 0,10 0,50 89,69% 60,49% 97,86% 22,56% 100 0,10 0,50 90,71% 54,20% 96,07% 32,11% 100 0,10 0,50 90,19% 60,57% 97,15% 29,31% 100 0,10 0,50 90,77% 56,96% 96,82% 29,93% 100 0,10 0,50

Ilustracin 19: Tabla de resultados de reincidencia en centros privados ML bajo modelo red neuronal (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

pg. 40

En esta tabla, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de red neuronal, se aprecia que predictibilidad del modelo, para el 100% de la base de datos, es de un 88,58% +/- 11,42%, lo que indica que el resultado est dentro de un rango de precisin aceptable: tanto la precisin (PRECISION, en ingls) como el muestreo (RECALL, en ingls) son cercanos al 100%, lo cual indica que la muestra en cada una de sus fracciones (10-100% de la base total) es calidad aceptable. Del mismo modo, el accuracy al 100% de la base se dio con un training cycles de 100, learning rates de 0,1 y momentum de 0,50. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 29,93%.

Resultados obtenidos mediante Nave Bayes, ML.

Nave Bayes SENAME 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ACCURACY ERROR PRECISION NO PRECISION SI RECALL NO RECALL SI 19,26% 80,74% 92,38% 13,15% 8,17% 95,38% 51,28% 48,72% 90,75% 16,83% 48,78% 67,58% 20,78% 79,22% 92,99% 13,23% 10,08% 94,75% 33,77% 66,23% 92,88% 14,03% 26,51% 85,52% 19,40% 80,60% 92,71% 12,99% 8,53% 95,32% 20,47% 79,53% 92,14% 13,07% 9,86% 94,15% 21,03% 78,97% 93,60% 13,35% 10,26% 95,17% 20,19% 79,81% 93,02% 13,20% 9,33% 95,17% 21,50% 78,50% 93,15% 13,68% 10,53% 94,82% 21,27% 78,73% 93,41% 12,98% 10,98% 94,48%

Ilustracin 20: Tabla de resultados de reincidencia en centros privados ML bajo modelo Nave Bayes (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

En esta tabla, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de Nave Bayes, se aprecia que predictibilidad del modelo, para el 100% de la base de datos, es de un 21,27% +/- 78,73%, lo que indica que el resultado es menos preciso que en los casos anteriores. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 94,48%.

Resultados obtenidos mediante rbol de decisin, SA.

pg. 41

Decision Tree SENAME 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ACCURACY ERROR 92,11% 94,27% 95,90% 93,10% 93,74% 94,02% 94,16% 94,77% 96,56% 94,96% PRECISION NO PRECISION SI RECALL NO RECALL SI MINIMAL GAIN CONFIDENCE 92,51% 0,00% 99,53% 0,00% 0,006 0,25 95,94% 27,27% 98,15% 14,29% 0,006 0,25 96,45% 33,33% 99,39% 7,69% 0,006 0,25 95,85% 25,00% 96,94% 19,57% 0,006 0,25 96,71% 16,28% 96,79% 15,91% 0,006 0,25 95,50% 26,67% 98,33% 11,59% 0,006 0,25 96,02% 27,27% 97,94% 16,00% 0,006 0,25 96,04% 34,21% 98,59% 15,29% 0,006 0,25 97,29% 42,86% 99,21% 17,65% 0,006 0,25 95,80% 41,67% 99,05% 13,51% 0,006 0,25

7,89% 5,73% 4,10% 6,90% 6,26% 5,98% 5,84% 5,23% 3,44% 5,04%

Ilustracin 21: Tabla de resultados de reincidencia en centros privados SA bajo modelo rbol de decisin (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

En la tabla anterior, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de rbol de decisin, se aprecia que predictibilidad del modelo, para el 100% de la base de datos, es de un 94,96% +/- 5,04%, lo que indica que el resultado est dentro de un rango de precisin aceptable: tanto la precisin (PRECISION, en ingls) como el muestreo (RECALL, en ingls) son cercanos al 100%, lo cual indica que la muestra en cada una de sus fracciones (10-100% de la base total) es calidad aceptable. Del mismo modo, el accuracy al 100% de la base se dio con un minimal gain de 0,006 y confidence de 0,25. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 13,51%.

Neural Net SENAME 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Resultados obtenidos mediante red neuronal, SA.

ACCURACY ERROR 92,54% 94,93% 96,19% 94,83% 96,23% 95,03% 95,39% 95,42% 96,75% 95,22%

7,46% 5,07% 3,81% 5,17% 3,77% 4,97% 4,61% 4,58% 3,25% 4,78%

PRECISION NO PRECISION SI RECALL NO RECALL SI 92,54% 0,00% 100,00% 95,35% 0,00% 99,54% 96,19% 0,00% 100,00% 95,13% 25,00% 99,66% 96,23% 0,00% 100,00% 95,03% 0,00% 100,00% 95,39% 0,00% 100,00% 95,42% 0,00% 100,00% 96,79% 50,00% 99,95% 95,22% 0,00% 100,00%

0,00% 0,00% 0,00% 2,17% 0,00% 0,00% 0,00% 0,00% 1,47% 0,00%

TRAINING CYCLES LEARNING RATE MOMENTUM 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50 100 0,10 0,50

Ilustracin 22: Tabla de resultados de reincidencia en centros privados SA bajo modelo red neuronal (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

En esta tabla, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de red neuronal, se aprecia que

pg. 42

predictibilidad del modelo, para el 100% de la base de datos, es de un 95,22% +/- 4,78%, lo que indica que el resultado est dentro de un rango de precisin aceptable: tanto la precisin (PRECISION, en ingls) como el muestreo (RECALL, en ingls) son cercanos al 100%, lo cual indica que la muestra en cada una de sus fracciones (10-100% de la base total) es calidad aceptable. Del mismo modo, el accuracy al 100% de la base se dio con un training cycles de 100, learning rates de 0,1 y momentum de 0,50. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 0,00%.

Resultados obtenidos mediante Nave Bayes, SA.

Nave Bayes SENAME 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ACCURACY ERROR PRECISION NO PRECISION SI RECALL NO RECALL SI 42,54% 57,46% 96,51% 9,86% 39,34% 82,35% 13,22% 86,78% 97,56% 4,84% 9,24% 95,24% 14,93% 85,07% 97,50% 3,98% 11,87% 92,31% 22,31% 77,69% 97,63% 5,53% 18,71% 91,30% 22,98% 77,02% 97,86% 4,18% 20,41% 88,64% 10,81% 89,19% 95,51% 5,01% 6,45% 94,20% 20,79% 79,21% 98,52% 5,24% 17,21% 94,67% 18,02% 81,98% 96,28% 4,73% 14,64% 88,24% 60,93% 39,07% 97,18% 3,94% 61,39% 47,06% 45,30% 54,70% 96,63% 5,87% 44,09% 69,37%

Ilustracin 23: Tabla de resultados de reincidencia en centros privados SA bajo modelo Nave Bayes (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

En esta tabla, basado en la probabilidad de reincidencia de adolescentes en la base de datos suministrada por SENAME y bajo el modelo de Nave Bayes, se aprecia que predictibilidad del modelo, para el 100% de la base de datos, es de un 45,30% +/- 54,70%, lo que indica que el resultado es menos preciso que en los casos anteriores. De este modo, la probabilidad de reincidencia de los adolescentes para este caso es 69,37%. Es posible resumir los resultados de los tres modelos presentados en la siguiente tabla, tanto para medio ML como para SA:

pg. 43

Decision Tree Neural Net Nave Bayes

ACCURACY 89,28% 88,58% 21,27%

ERROR 10,72% 11,42% 78,73%

Ilustracin 24: Resultados comparativos modelos aplicados para caso reincidencia en centros privados ML. (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

Decision Tree Neural Net Nave Bayes

ACCURACY 94,96% 95,22% 45,30%

ERROR 5,04% 4,78% 54,70%

Ilustracin 25: Resultados comparativos modelos aplicados para caso reincidencia en centros privados SA. (Fuente: elaboracin propia mediante uso de RapidMiner y Microsoft Excel)

Dado lo anterior, el modelo seleccionado para continuar con el anlisis, para el caso de reincidencia en centros privados que prestan servicio a SENAME, tanto para ML como para SA, es el de rbol de decisin, que presenta mejores resultados, y coherentes con lo ya presentado en los resultados anteriores. Notar que, para el caso de SA, el accuracy de la red neuronal es mayor que el del rbol de decisin. Sin embargo, la probabilidad de reincidencia entregada es 0%, lo cual no es coherente con lo resultados previamente mostrados.

5.6 Interpretacin y anlisis de datos. Luego de realizar un exhaustivo anlisis, se logr realizar una comparacin de los dos grandes casos ya definidos: para aquellos adolescentes que estn en centros de SENAME y los que estn en centros externos que prestan servicios para SENAME, en donde para el primer caso se encuentran aquellos bajo el medio privacin de libertad, y en el segundo se encuentran tanto los de media libertad (ML) como los de sanciones alternativas (SA). Esta comparacin se realiz tanto en situaciones de reincidencia como en aquellas donde no exista reincidencia. 5.6.1 Anlisis de resultados basados en reincidencia i. Situacin jurdica.

En esta etapa, se analiz la situacin jurdica de los adolescentes, ya sea como condenados, medidas cautelares privativas o no privativas de libertad, imputados, incumplimiento de condenas, reclusin nocturna o condenas con beneficios. Previamente, se presentan los grficos referidos a este anlisis.

pg. 44

Ilustracin 26: Situacin jurdica de adolescentes bajo LRPA, tanto en centros de SENAME como externos (ML y SA) (Fuente: elaboracin propia)

Para el caso de condenados, en SENAME existe un mayor porcentaje de adolescentes bajo esta situacin, seguido de los centros externos ML y los SA. Una explicacin de ello es que precisamente en SENAME existe una situacin de condena bajo privacin de libertad, la cual es ejecutada por SENAME directamente. Para el caso de medidas cautelares privativas o no de libertad- en los centros externos ML existe un mayor porcentaje: esto se debe a que estos centros son semi-cerrados (semi-abiertos) en donde se cumplen penas con un grado intermedio de privacin de libertad, como por ejemplo, la reclusin nocturna.

ii.

Escolaridad

En esta etapa, se presenta el nivel de escolaridad alcanzado por la poblacin de SENAME: si tienen escolaridad bsica, media, superior o no posee escolaridad. A continuacin, se presentan los grficos referidos a este anlisis.

pg. 45

Ilustracin 27: Nivel de escolaridad de poblacin de imputados en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Es posible apreciar que la escolaridad de enseanza bsica se presenta en mayor proporcin en centros de SENAME y la de enseanza media en centros externos (principalmente en el medio SA). Tanto la escolaridad en enseanza superior como el analfabetismo representan menos del 1% de la proporcin final. A continuacin, se presenta un desglose en la escolaridad de enseanza bsica y media, aquellas que son ms representativas para el anlisis.

pg. 46

Ilustracin 28: Nivel de escolaridad de enseanza bsica en poblacin imputada de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Respecto a lo que sucede en enseanza bsica, es posible notar que, en centros externos SA, existe un mayor nmero de poblacin atendida que posee enseanza bsica completa. Adems, el mayor grado de desercin escolar, ya sea por voluntad propia o de los propios padres o responsables de dichos adolescentes, se da en centros externos ML y de SENAME. Asimismo, el grupo de mayor inasistencia a establecimientos educacionales de enseanza media se da en centros de SENAME y externos ML. La asistencia regular a establecimientos educacionales de enseanza bsica no supera del 6% de la poblacin total de SENAME. De manera de complementar ms este anlisis, se presentan a continuacin los niveles de escolaridad de enseanza media.

pg. 47

Ilustracin 29: Nivel de escolaridad de enseanza media en poblacin imputada de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Respecto a lo que sucede en enseanza media, es posible notar que, en centros externos SA, existe un mayor porcentaje de poblacin que interrumpe sus estudios. Este porcentaje disminuye en centros externos ML y de SENAME. Esto, dado el anlisis anterior, puede deberse a que en centros de SENAME existe un mayor porcentaje de la poblacin que aun no finalizan sus estudios de enseanza bsica. Por lo tanto, difcilmente podrn cursar enseanza media, que es la continuacin de la enseanza bsica. Adems, en centros donde existe privacin de libertad (total o parcial) el porcentaje de inasistencia es ms alto (cercano al 25% en cada caso) respecto al de los centros externos SA. Esto, pues un condenado a penas privativas de libertad difcilmente podr nivelar sus estudios68, a diferencia de quien recibe una pena o sancin ms flexible.

iii.

Delitos

En esta etapa, se presenta el tipo de delitos cometidos en la poblacin de SENAME, bajo LRPA, y por los cuales fueron sancionados: delitos de ndole sexual, estafas, robos, hurtos, entre otros.

68

Existen programas de re-escolarizacin, provistos por SENAME, que se encargan de los estudios de quienes tengan penas privativas de libertad y no hayan completado sus estudios obligatorios.

pg. 48

Ilustracin 30: Tipo de delitos en poblacin imputada de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Respecto a los delitos, el comn denominador se da, en los tres casos, en el delito de robo, hurto o asalto, con mayores porcentajes de la poblacin para quienes tienen penas privativas de libertad. Otros delitos, tales como maltrato de obra a carabineros, violencia en los estadios, desrdenes pblicos y faltas, entre otros, tambin poseen una gran fraccin entre los delitos ms habituales. Los delitos de ndole sexual violaciones, vejmenes, entre otros- y de drogas porte, consumo, elaboracin, entre otros- no tienen un alto impacto en las estadsticas. Sin duda, los delitos por los cuales son imputados la mayora de los jvenes son los relacionados con asaltos, robos y hurtos, los de mayor habitualidad en nuestra sociedad.

iv.

Drogas

En esta etapa, se presenta el nivel de consumo de drogas en la poblacin de SENAME, al momento de su ingreso: consumo habitual, ocasional, sin consumo o sin informacin.

pg. 49

Ilustracin 31: Nivel de consumo de drogas en poblacin imputada de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

En aquella poblacin donde existen penas con privacin de libertad total o parcial- existe un mayor porcentaje de ellos que consume drogas de manera habitual (47% en centros de SENAME, 33% en centros externos ML y 15% en centros externos SA) Por el contrario, el porcentaje de no consumidores de drogas es mayor para centros externos SA y menor para centros de SENAME.

v.

Capacitacin y Reinsercin

En esta etapa, se presentan las diversas reas de capacitacin, as como su importancia en cada centro: existen aquellas asociadas a la construccin, minera, turismo, hotelera, agrcola, forestal, comercio, entre otras.

pg. 50

Ilustracin 32: reas de capacitacin y reinsercin de poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Se da un comn denominador en este anlisis: existe un mayor porcentaje de capacitacin basado en programas de construccin y minera (ms bien industriales) que en otros programas. Esto puede deberse a que efectivamente en esta industria existe mayor probabilidad de empleabilidad futura, y donde constantemente se requieren nuevas contrataciones.

vi.

Organismos a cargo de capacitacin

En esta etapa, se presentan cules son los organismos encargados de la capacitacin: SENCE69, universidades o CFT70, u otros organismos.

Ilustracin 33: Organismos a cargo de capacitacin en poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)
69 70

SENCE: Servicio Nacional de Capacitacin y Empleo, http://www.sence.cl/sence/, consultada al 08/05/2011 CFT: Centros de Formacin Tcnica.

pg. 51

Se da la tendencia que otros centros aportan con un mayor porcentaje de quin se hace cargo de la capacitacin, independiente a cul tipo de centro pertenezca (SENAME o externo). El SENCE y establecimientos de educacin superior le siguen a esta fraccin.

vii.

Situacin actual de capacitacin

En esta etapa, se presenta en qu etapa de la capacitacin se encuentran quines son objeto de la misma: si es que estn cursando la capacitacin, estn egresados o abandonaron dicho programa.

Ilustracin 34: Nivel de capacitacin en poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Una diferencia que se dan en el caso donde existe privacin de libertad (total o parcial) versus la del medio libre es que existe un mayor nmero de egresados en este ltimo, y un mayor nmero para quines estn cursando un programa de capacitacin en el primer caso. El nivel de abandono es similar, tanto para centros de SENAME como para externos.

viii.

Situacin final de rehabilitacin

En esta etapa, se muestra la situacin final de quienes fueron objeto de alguna capacitacin en SENAME, en todos sus centros: si sta fue lograda completamente, parcialmente o definitivamente no lograda.

pg. 52

Ilustracin 35: Situacin final de capacitacin en poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

A modo de complementar los resultados anteriores, se presenta una tabla que indica cuntos das en promedio dura una capacitacin, tanto en centros de SENAME como externos (ML o SA).
Rehabilitacin y Reinsercin Promedio capacitacin (rehabilitacin y/o reinsercin) Centros SENAME 113,54 das Centros Externos ML SA 75,34 das 116,43 das

Ilustracin 36: Promedio de capacitacin en poblacin imputada en SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Reuniendo todos los antecedentes relacionados con la capacitacin de los internos de distintos centros, se puede ver que el porcentaje de logro exitoso es mayor en centros SENAME, y va decayendo hacia centros con mayor flexibilidad en penas privativas de libertad. Asimismo, las capacitaciones parcialmente logradas son mayores en centros de mayor flexibilidad ante penas privativas de libertad. Esto puede deberse, en parte, a la misma libertad que poseen quienes son objeto de estos programas y en la misma flexibilidad para dar cumplimiento de los mismos. Es muy probable que, en centros privativos de libertad, esta obligacin aumente.
pg. 53

ix.

Relacin del padre con adolescente

En esta etapa, se muestra la relacin que sostiene el padre del adolescente interno en SENAME, en cualquiera de sus centros: si es que existe una situacin de abandono, de maltrato u otros casos.

Ilustracin 37: Relacin padre-adolescente imputado de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Es posible notar que, a partir de los grficos, los padres de aquellos internos que actualmente estn en centros privativos de libertad representan en mayor nmero en cuanto al abandono de los mismos, ya sea por voluntad propia, por problemas fsicos, psicolgicos u otros que lo imposibilitan de ejercer su rol, entre otros aspectos. Padres que ejercen violencia intrafamiliar, si bien no representan una gran fraccin en los grficos presentados, va disminuyendo desde centros de ms a menos privacin de libertad. Otros casos estn representados por aquellos donde, por ejemplo, existen sospecha o evidencia de padres que usan a sus hijos para realizar delitos relacionados con robos, drogas, entre otros; padres que estn en centros de SENAME cumpliendo alguna pena o recluidos en crceles; padres fallecidos, entre otros casos.

pg. 54

x.

Situacin educacional del padre de adolescente

En esta etapa, se muestra el nivel de escolaridad alcanzado por los padres de los internos de SENAME: enseanza bsica, media o superior, tanto para casos de escolaridad completa como incompleta. Tambin se consideran los analfabetos.

Ilustracin 38: Nivel de escolaridad alcanzado por el padre del imputado de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

La tendencia seguida en estos tres grficos es similar: existe un gran nmero de padres con escolaridad bsica completa, pero tambin incompleta. Juntos, representan ms del 50% de la proporcin total. Para el caso de enseanza media, las tendencias son similares, pero este grupo enseanza media completa e incompleta- representa menos del 40% de la proporcin total. Los estudios superiores, as como el nivel de analfabetismo, no es relevante de destacar.

xi.

Relacin de la madre con adolescente

pg. 55

En esta etapa, se muestra la relacin que sostiene el padre del adolescente interno en SENAME, en cualquiera de sus centros: si es que existe una situacin de abandono, de maltrato u otros casos.

Ilustracin 39: Relacin madre-adolescente imputado de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

Los resultados son similares al de los padres. Sin embargo, es posible notar que, a partir de los grficos, aquellas madres de aquellos internos que actualmente estn en centros privativos de libertad representan en mayor nmero en cuanto al abandono de los mismos, pero menor que al porcentaje de los padres, ya sea por voluntad propia, por problemas fsicos, psicolgicos u otros que lo imposibilitan de ejercer su rol, entre otros aspectos. Madres que ejercen violencia intrafamiliar, si bien no representan una gran fraccin en los grficos presentados, va disminuyendo desde centros de ms a menos privacin de libertad. Otros casos estn representados por aquellos donde, por ejemplo, existen sospecha o evidencia de madres que usan a sus hijos para realizar delitos relacionados con robos, drogas, entre otros; madres que estn en centros de SENAME cumpliendo alguna pena o recluidos en crceles; madres fallecidos, entre otros casos.

pg. 56

xii.

Situacin educacional de la madre de adolescente

En esta etapa, se muestra el nivel de escolaridad alcanzado por las madres de los internos de SENAME: enseanza bsica, media o superior, tanto para casos de escolaridad completa como incompleta. Tambin se consideran las analfabetas.

Ilustracin 40: Nivel de escolaridad alcanzado por la madre del imputado de SENAME bajo LRPA, tanto en centros de SENAME como centros externos (ML y SA) (Fuente: elaboracin propia)

La tendencia seguida en estos tres grficos es similar, tanto entre ellos como en el caso de los padres: existe un gran nmero de madres con escolaridad bsica completa, pero tambin incompleta. Juntos, representan ms del 50% de la proporcin total. Para el caso de enseanza media, las tendencias son similares, pero este grupo enseanza media completa e incompletarepresenta menos del 40% de la proporcin total. Los estudios superiores, as como el nivel de analfabetismo, no es relevante de destacar.

pg. 57

5.6.2 Anlisis de resultados basados en programas de rehabilitacin y reinsercin A continuacin, se entregan resultados relacionados a los programas de rehabilitacin y reinsercin de SENAME. En esta oportunidad, el anlisis se centra en las probabilidades de xito de cada programa en funcin de los fenmenos de reincidencia, segmentados por regin del pas. Por simplicidad, las regiones fueron numeradas y se refieren a ellas por sus nmeros: esto, aunque en el 2007 la ley 19.09771 fue modificada para incorporar dos nuevas regiones y dejar de llamarlas por su nmeros sino ms bien por sus nombres72.

Ilustracin 41: % atendidos en programas de rehabilitacin y reinsercin en centros SENAME, desglosado por regin, tanto para reincidentes como para no reincidentes. (Fuente: elaboracin propia)

En los grficos anteriores se puede apreciar que el porcentaje de poblacin atendida en programas de rehabilitacin y reinsercin difiere entre el caso reincidente o no: existe una mayor nmero de atendidos reincidentes en las regiones V, IX y XIII (grfico del lado derecho) versus un mayor nmero de atendidos no reincidentes principalmente en la regin XIII o Metropolitana. En este caso, los reincidentes en estos programas se encuentran distribuidos en las grandes regiones, seguidas de la Metropolitana, tales como la V, IX, VIII, entre otras.

Ilustracin 42: atendidos en programas de rehabilitacin y reinsercin en centros externos medio ML, desglosado por regin, tanto para reincidentes como para no reincidentes. (Fuente: elaboracin propia)
71

Ley 19.027, que modifica la Constitucin Poltica de la Repblica en materia de Gobiernos Regionales y Administracin Comunal. http://www.bcn.cl/histley/lfs/hdl-19097/HL19097.pdf, al 10/05/2011. 72 http://es.wikipedia.org/wiki/Plantilla:Mapa_de_las_Regiones_de_Chile, al 10/05/2011.

pg. 58

En los grficos anteriores se puede apreciar una distribucin parecida entre los atendidos en los programas en centros SENAME, en especial en aquellos no reincidentes: sin duda que en la regin XIII o Metropolitana existe un gran nmero de atendidos (cercano al 40%), seguido muy por detrs de las regiones V y VIII (cercanas al 10%).

Ilustracin 43: atendidos en programas de rehabilitacin y reinsercin en centros externos medio SA, desglosado por regin, tanto para reincidentes como para no reincidentes. (Fuente: elaboracin propia)

En los grficos anteriores se puede apreciar una distribucin heterognea entre el porcentaje de atendidos en centros externos SA: en el caso de no reincidentes, el porcentaje es mayor dentro para la regin Metropolitana o XIII (cercano al 20%), seguido por las regiones X y V a IX. Distinto es el caso de reincidentes, donde el mayor nmero de atendidos se da en las regiones VIII (cercana al 19%), V (cercana al 18%) y X (cercana al 17%). La regin Metropolitana no figura como una regin de alto porcentaje de atendidos reincidentes.
Programa Reinsercin Administracin Agrcola y ganadero Educacin Forestal Comercio Confecciones Computacin Construccin Artstico-cultural Alimentos Artesana Hotelera y turismo Mecnica Minera Pesca Salud Servicios Electricidad Industrial Otras Probabilidad Reincidencia Centros SENAME Centros externos - ML Centros externos - SA 0,00% 11,53% S/I 0,00% 9,09% S/I 0,00% 0,00% 0,00% S/I 0,00% S/I 0,00% 0,00% S/I 10,11% 0,00% 0,00% 4,20% 3,85% 0,00% 14,29% 7,98% 0,00% 3,23% S/I 0,00% 16,77% 3,06% 8,33% 6,06% 29,64% 0,00% 0,00% 40,00% 0,00% 11,86% 10,19% 9,52% 33,33% 7,41% S/I S/I S/I 0,00% S/I S/I S/I 8,51% 6,12% 0,00% 15,17% 10,08% 7,69% 7,69% 13,33% 0,00% 11,28% 10,39% 10,00%

Ilustracin 44: Cuadro de probabilidades de reincidencia, dados los programas de reinsercin de SENAME. (Fuente: elaboracin propia)

pg. 59

En la tabla anterior se describen las probabilidades de reincidencia en centros, tanto de SENAME como externos, desglosado por programa de reinsercin. En algunos datos, no fue posible calcular la probabilidad de reincidencia, pues la cantidad de datos con la que se contaba no era significativa ni sera representativa en el clculo de dicho dato. Es posible apreciar que existen programas que van desde la probabilidad 0% de reincidencia (por ejemplo, en programas de educacin, para todos los centros) hasta el 40% para el caso del programa de hotelera y turismo en centros externos ML. En los centros externos SA no hay mayores tasas de reincidencia en sus programas (mximo, 10%); en los centros con privacin de libertad, ya sea total o parcial (SENAME o externo ML) se dieron probabilidades ms distribuidas para cada programa.
Probabilidad Reincidencia Centros SENAME Centros externos - ML Centros externos - SA Administracin, servicios y comercio 5,20% 5,71% 0,00% Agricola, ganadero y forestal 0,00% 9,09% S/I Educacin 0,00% 0,00% 0,00% Artesana y confecciones 7,48% 0,00% 0,00% Hotelera y turismo 0,00% 40,00% 0,00% Salud S/I S/I S/I Construccin 14,29% 7,98% 0,00% Pesca S/I S/I 0,00% Minera 33,33% 7,41% S/I Alimentos 16,77% 3,06% 8,33% Artstico y cultural 3,23% S/I 0,00% Mecnica y electricidad 13,85% 10,13% 8,82% Otros 11,28% 10,39% 10,00% Total Registros Bases de Datos 21805 45106 7734 Probabilidad Reincidencia Promedio 9,58% 9,38% 2,72% Probabilidad Reincidencia Ponderado 8,75% Programa Reinsercin
Ilustracin 45: Cuadro con probabilidades de reincidencia agrupados, promedios y ponderados, por tipo de centro. (Fuente: elaboracin propia)

En la tabla anterior se presenta un agrupamiento de los programas, as como una probabilidad de reincidencia promedio en cada uno de ellos, segmentado para cada centro. Adems, se calcul un ndice de probabilidad de reincidencia promedio (promedio simple de los nmeros) y una ponderada (promedio de probabilidades ponderadas por su peso relativo, dado por el nmero de registros en cada base de datos, segn cada centro de SENAME). stas son menores que las obtenidas en los apartados 5.5.1 y 5.5.2 de esta investigacin: una explicacin de ello es que en los modelos obtenidos previamente consideraba a toda la poblacin atendida, tuviera o no un programa de rehabilitacin o reinsercin asociado. Esto es coherente con la realidad, pues quienes no realizan un programa de rehabilitacin y/o reinsercin tienen mayor probabilidad de reincidir en el mismo u otro delito pues no se est corrigiendo de ningn modo su problema. De este modo, que el resultado en la tabla anterior indique una probabilidad menor de reincidencia cuando un condenado realiza una capacitacin versus quien no la realiza, es un hecho importante de destacar.
pg. 60

5.6.3 Desglose de programas de rehabilitacin y reinsercin por regin. En esta etapa, se presentan y analizan los programas de reinsercin en cuanto a sus probabilidades de xito en ellos. Una probabilidad de xito involucra dos aspectos: el primero, que considera aquellos atendidos que completaron satisfactoriamente sus programas respectivos, y un segundo aspecto considera a aquellos atendidos que finalmente encuentran un empleo posterior al cumplimiento de su condena73. A continuacin, se presentan los resultados de aquellos programas de reinsercin con una mayor probabilidad de xito, segmentados por regin y tipo de centros.

i.

Programa administracin, comercio y servicios.

73

Para el caso de sujetos con privacin de libertad, se consideran aquellos que cumplieron sus programas exitosamente; para aquellos sin privacin de libertad, se les hizo un seguimiento hasta que encontraron un empleo.

pg. 61

Ilustracin 46: Programa de administracin, servicios y comercio con mayor probabilidad de xito, segn regiones descritas y centros SENAME o externos ML y SA. (Fuente: elaboracin propia)

La probabilidad en los programas es dispar entre centros: son similares en centros con privacin de libertad, pero divergentes entre stas ltimas y la de centros externos SA. Suelen ser ms exitosas, en medios cerrados, en la regin XIII o Metropolitana (probabilidad cercana al 35%); en cambio, en medios externos SA, suelen ser ms exitosas en las regiones VI y IX, con probabilidades cercanas al 50% y 35%, respectivamente. Esto puede explicarse debido a que en las capitales regionales ms importantes del pas digamos Santiago, Valparaso, Concepcin, entre otros- existe un amplio desarrollo de la industria de servicios, por lo que la rehabilitacin y posterior rehabilitacin en esta capacitacin tiene una mayor probabilidad de xito.

ii.

Programa agrcola, ganadero y forestal.

Ilustracin 47: Programa agrcola, ganadero y forestal con mayor probabilidad de xito, segn regiones descritas y centros SENAME. (Fuente: elaboracin propia)

pg. 62

En este caso, la probabilidad es alta slo en una regin: la XIV. En sta, existe un mercado muy desarrollado en la industria ganadera, agrcola y forestal, lo que explicara en parte el xito de este programa. Este programa es ejecutado por un centro de SENAME.

iii.

Programa educacin.

pg. 63

Ilustracin 48: Programa educacin con mayor probabilidad de xito, segn regiones descritas y centros SENAME o externos ML o SA. (Fuente: elaboracin propia)

Respecto a programas basados en educacin, es decir, programas que buscan ensear a aquellos atendidos una nueva rea de conocimiento para que ellos puedan replicarlo de la misma manera, mantienen probabilidades de xito altas de manera muy heterognea en las regiones, independiente del tipo de recinto al que pertenezcan dichos atendidos (privacin de libertad total, parcial o libertad condicional) Para centros privativos de libertad (SENAME y externos ML), las regiones con mayor probabilidad de xito en dicho programa fueron: V, VI, VII, VIII, IX y XIII (RM); por otro lado, para centros abiertos (externos SA), la regin con mayor probabilidad de xito en dicho programa fue la VI.

iv.

Programa artesana y confecciones.

pg. 64

Ilustracin 49: Programa artesana y confecciones con mayor probabilidad de xito, segn regiones descritas y centros SENAME. (Fuente: elaboracin propia)

El anlisis es similar al realizado en el punto anterior: respecto a programas basados en artesana y confecciones, mantienen probabilidades de xito altas de manera muy heterognea en las regiones, independiente del tipo de recinto al que pertenezcan dichos atendidos (privacin de libertad total, parcial o libertad condicional) A excepcin de las regiones II, VII, XI y XV, el resto de ellas son caracterizadas con alta probabilidad de xito en el cumplimiento de los objetivos de dicho programa.

v.

Programa hotelera y turismo.

pg. 65

Ilustracin 50: Programa hotelera y turismo con mayor probabilidad de xito, segn regiones descritas y centros SENAME. (Fuente: elaboracin propia)

El turismo en esta regin, sealada con alta probabilidad de xito, est muy desarrollado, a modo de que la dcima regin es una de las regiones con mayor oferta turstica de Chile74. Este puede ser uno de los motivos del xito de este programa en esta regin, cuyo ejecutante es un centro de SENAME.

vi.

Programa artes y cultura.

Ilustracin 51: Programa artes y cultura con mayor probabilidad de xito, segn regiones descritas y centros SENAME. (Fuente: elaboracin propia)

74

http://www.sernatur.cl/documentos/Comparativo+Bar%C3%B3metro+Mensual+Abril+2011-2010, al 10/04/2011

pg. 66

El motivo del por qu en las regiones sealadas existe una gran probabilidad de xito en el programa artstico y cultural no es intuitivo. Es posible que exista un apoyo focalizado en el desarrollo de este programa en estas regiones u otros motivos, desconocidos por el autor al momento de realizar este anlisis.

vii.

Programa construccin.

Ilustracin 52: Programa construccin con mayor probabilidad de xito, segn regiones descritas y centros externos ML y SA. (Fuente: elaboracin propia)

Este mbito de la industria es de suma importancia a nivel general: la construccin. Regularmente se requiere mano de obra para ejecutar obras de diversa ndole. Se aprecia que en las regiones V, VI, X, XIII (RM) y XV existe una mayor probabilidad de xito en dichos programas, los cuales son ejecutados por centros externos (ML y SA).

pg. 67

viii.

Programa minera.

Ilustracin 53: Programa minera con mayor probabilidad de xito, segn regiones descritas y centros externos ML. (Fuente: elaboracin propia)

Existe un amplio desarrollo de la industria minera, principalmente en las regiones del norte de Chile (I, II y III): por lo tanto, en ellas existe una amplia probabilidad de xito de los atendidos por SENAME para poder rehabilitarse y desempearse en el sector, ms aun cuando Chile es reconocido mundialmente como una potencia minera de clase mundial, con un crecimiento anual del sector del 6%.75

ix.

Programa alimentos.

75

http://www.indap.gob.cl/content/view/5131/358/, al 11/05/2011

pg. 68

Ilustracin 54: Programa alimentos con mayor probabilidad de xito, segn regiones descritas y centros externos ML y SA. (Fuente: elaboracin propia)

Segn el INDAP, la industria de los alimentos representan el segundo sueldo de Chile (seguido del cobre), con crecimientos anuales del orden del 12% en los ltimos 8 aos76. A su vez, esta industria est desarrollada en las regiones donde precisamente existe mayor probabilidad de xito en aquellos programas relacionados con dicha industria: V, VI, X y XIII. En estas zonas existe amplio desarrollo de la industria de frutas y hortalizas, ganadera, vitivincola, entre otros. A continuacin se presentan los resultados de aquellos programas de reinsercin con una menor probabilidad de xito, segmentados por regin y tipo de centros.

i.

Programa construccin.

76

http://www.indap.gob.cl/content/view/5131/358/, al 11/05/2011

pg. 69

Ilustracin 55: Programa construccin con menor probabilidad de xito, segn regiones descritas y centros SENAME. (Fuente: elaboracin propia)

En el programa de construccin ejecutado por centros de SENAME en el modo de privacin de libertad tienen menos probabilidad de xito respecto al mismo programa ejecutado en centros externos (ML y SA). Un motivo aparente de ello dentro de otros que puedan surgir- es que un atendido con privacin de libertad difcilmente podr ejecutar lo aprendido en la capacitacin de manera inmediata, dada su condicin actual.

ii.

Programas alimentos.

Ilustracin 56: Programa alimentos con menor probabilidad de xito, segn regiones descritas y centros SENAME. (Fuente: elaboracin propia)

pg. 70

En este caso, al igual que el caso anterior, la probabilidad de no xito de este programa de alimentos ejecutado por centros de SENAME es mucho mayor. El motivo tampoco parece ser intuitivo a priori; sin embargo, al igual que en el caso anterior, un atendido con privacin de libertad difcilmente podr ejecutar lo aprendido en la capacitacin de manera inmediata, dada su condicin actual.

iii.

Programa mecnica y electricidad.

pg. 71

Ilustracin 57: Programa mecnica y electricidad con menor probabilidad de xito, segn regiones descritas y centros SENAME y externos ML o SA. (Fuente: elaboracin propia)

En este programa, llamado mecnica y electricidad, los atendidos tanto en regmenes cerrados como abiertos, tienen menores probabilidades de xito. La explicacin de los casos anteriores solo puede ser vlida para atendidos con privacin de libertad total; sin embargo, no existe una explicacin clara menos intuitiva- del por qu se da este fenmeno en centros donde existe un mayor grado de privacin de libertad menor o nulo.

iv.

Programa agrcola, ganadero y forestal.

Ilustracin 58: Programa agrcola, ganadero y forestal con menor probabilidad de xito, segn regiones descritas y centros externos ML. (Fuente: elaboracin propia)

pg. 72

El programa agrcola, ganadero y forestal, ejecutado en centros externos SA, tiene menos probabilidad de xito versus los ejecutados, segn el anlisis de los mismos en centros SENAME y externos ML. No existe una explicacin a priori de dicho resultado.

v.

Programa hotelera y turismo.

Ilustracin 59: Programa hotelera y turismo con menor probabilidad de xito, segn regiones descritas y centros externos ML. (Fuente: elaboracin propia)

El programa de hotelera y turismo tiene una baja probabilidad de xito en las regiones mencionadas (I, VI, IX y XIII o RM). Tampoco existe una explicacin de ello.

pg. 73

6. Conclusiones y recomendaciones
Tal como se propuso dentro de los objetivos de este estudio, se logr establecer una tasa de reincidencia global del 18,57%. Dicha tasa es diferente dependiendo de los tipos de centros: 21,80% en centros de SENAME, 19,92% en centros externos de modalidad medio-libre y 13,51% en centros externos de modalidad abierto. Respecto a lo anterior, la bibliografa consultada entrega valores ms altos de reincidencia que los obtenidos en este estudio: entre el 25% y 35%. Una posible explicacin para esta diferencia puede ser que la implementacin de la Ley de Responsabilidad Penal Adolescente an est en plena fase inicial, pues entr en rgimen a mediados del 2007, por lo que, los datos disponibles para este estudio pueden no ser representativos mientras la ley no se encuentre en un mayor nivel de madurez. Se logr caracterizar los programas de rehabilitacin y reinsercin con menor y mayor reincidencia asociada, cuyos resultados fueron presentados en el desarrollo de este estudio. En general, los programas desarrollados por centros SENAME tienen probabilidades de xito y fracaso similares, dependiendo del programa y la regin donde se desarrolla; sin embargo, para el caso de centros externos, los resultados tienden a mejorar. Una explicacin de ello, posible pero no revisada en este trabajo, es que en estos centros existen menos restricciones a la libertad de la poblacin atendida, lo que conlleva que sea ms fcil de aplicar lo aprendido fuera del centro versus alguien que est privado de libertad. Adems, el perfil -psicolgico, educacional, social, entre otros- de quienes estn bajo privacin de libertad es muy diferente de quienes estn bajo medidas menos restrictivas, lo que puede influir en la eficacia de estos programas. Respecto a los factores socio-educacionales de los atendidos por SENAME, el estudio entreg una caracterizacin, segmentada por tipo de centro. Se presentan a continuacin:
Dimensiones socio-educacionales % enseanza bsica % enseanza media % desertores enseanza bsica % desertores enseanza media % delito de robo, asalto o hurto % consumo de drogas % padre que los abandon % madre que los abandon Atendidos en centros: Externo - ML Externo - Abierto 48% 75% 24% 52% 85% 41% 80% 96% 60% 42% 80% 40% 36% 11% 30% 7%

SENAME

Destacan notoriamente algunos resultados obtenidos, basados en las dimensiones socioeducacionales sealadas: Impacta el porcentaje de madres de atendidos en centros abiertos que abandonan a sus hijos frente a los de centros cerrados (7% versus 30%), as como el de padres (36% versus 11%).
pg. 74

El nmero de consumidores de drogas en centros con privacin de libertad (SENAME o externo medio-libre) duplica a los de centros abiertos. El porcentaje de atendidos con continuidad en sus estudios de enseanza bsica y media tambin difiere entre los distintos centros, siendo de alta relevancia el mayor nmero de aquellos que provienen de centros abiertos que cursan o ya finalizaron la enseanza media, as como el nmero de desertores de enseanza bsica en centros con privacin de libertad. En general, los atendidos en centros con privacin de libertad poseen un perfil muy diferente a aquellos atendidos en centros abiertos, lo que conlleva a que, en la prctica, en el primer caso exista una mayor tasa de reincidencia, o que los programas a los cuales se someten tengan menor probabilidad de xito en la rehabilitacin y posterior reinsercin. En virtud de las conclusiones ya mencionadas, el autor recomienda lo siguiente: i. Mayor inversin en aquellos programas con alta probabilidad de xito: un aumento en su presupuesto permitir ampliar la capacidad de atencin (que es equivalente a tener un mayor nmero de personas en rehabilitacin), mejorar la calidad de dichos programas, ya sea en contenidos, duracin, infraestructura, entre otros, lo que impactar en mejores ndices de reinsertados exitosamente. Estos mejores ndices se obtendrn siempre y cuando se mantenga el perfil de ingreso a dichos programas, y que el aumento en la capacidad de atencin no impacte negativamente en el xito de ellos. Algunos de ellos estn basados en administracin y servicios, que suponen un mayor desarrollo en capitales regionales de gran tamao como Santiago, Valparaso, Via del Mar, Concepcin, Temuco, entre otros ya mencionados. Asimismo, se recomienda realizar un estudio acabado de aquellos programas que tengan una baja probabilidad de xito. Es posible que se estn destinando recursos a programas con un bajo nivel de eficacia, lo cual no es ptimo bajo ningn punto de vista. En este caso, ser necesario evaluar la continuidad de los mismos. Realizar un estudio que considere la reincidencia en aquellos casos en que el atendido en SENAME cumple la mayora de edad e ingresa por primera vez a un centro penitenciario, de manera de obtener una probabilidad aun ms certera de la reincidencia en dichos casos, adems de su perfil psicolgico y social. Para ello se debern considerar bases de datos tanto de SENAME como de Gendarmera.77 Replicar este estudio y su metodologa- cuando la Ley de Responsabilidad Penal Adolescente cuente con un mayor grado de madurez y/o cuando exista una base de datos con mayor historial. Esto permitir obtener resultados ms acordes con la realidad, puesto que en la visita realizada al CIP de San Joaqun, los propios trabajadores indicaron que el sistema an est en proceso de adaptacin y madurez.

ii.

iii.

iv.

Si bien el autor de este estudio solicit dicha informacin, no estaba disponible debido a que SENAME deba realizar un convenio para acceder a dichos datos, el cual no estuvo finalizado dentro del perodo contemplado en el desarrollo y trmino de este estudio

77

pg. 75

7. Referencias
[1] SENAME y UNICEF, 2010; Antecedentes recopilados en seminario Anlisis del perfil del sujeto de atencin en residencias de proteccin. [2] DELAVEAU R. 2009; Seminario Jvenes Infractores. Instituto Libertad y Desarrollo. [3] DIPRES 2007; Minuta Ejecutiva, Programa de Administracin Directa. [4] PAZ CIUDADANA 2010; Construccin de indicadores de reinsercin social de adolescentes infractores de la ley penal. [5] MEJA-LAVALLE, M; SOLS, J; GARCA, F.; Seleccin de Atributos en una Base de Datos de Facturacin Elctrica aplicando Programacin Cncava; Instituto de Investigaciones Elctricas, ITSFM. [6] GRIFFITH UNIVERSITY 2008; Exploring the benefits of data mining on juvenile justice data. [7] GRIFFITH UNIVERSITY 2008; Exploring the benefits of data mining on juvenile justice data; p. 26. [8] JIAWEI HAN, MICHELINE 2006; Data mining: concepts and techniques; Elsevier, Cap. 8, p. 498. [9] VILA, MARA - SNCHEZ, DANIEL CERDA, LUIS 2002; reglas de asociacin aplicadas a la deteccin de fraude con tarjetas de crditos; p. 491-496.

Otras fuentes y referencias bibliogrficas. GRAY B., BIRKS D., ALLARD T., OGILVIE J., STEWART A. Y LEWIS A. 2008; Exploring the Benefits of Data Mining on Juvenile Justice Data QCIF Final Report; Griffith University. FRIAS-MARTINEZ E., MAGOULAS G., CHEN S., MACREDIEA R. 2005; Modeling human behavior in user-adaptive systems: Recent advances using soft computing techniques; pp. 320-329. HSIANG-YANG CHEN, TING-WEI HOU, CHAO-HUA CHUANG, TBPS RESEARCH GROUP 2009; Applying data mining to explore the risk factors of parenting stress; pp. 598-601. UNICEF 2007; Seminario Ley de Responsabilidad Penal en cifras. http://www.ist.temple.edu/ist/people/zoran/research/nijaward.htm (al 29/11/2010)

pg. 76

8. Anexos
Modelos y algoritmos ms comunes en la minera de datos. Redes neuronales. Son un paradigma de aprendizaje y procesamiento automtico inspirado en la forma en que funciona el sistema nervioso de los animales. Se trata de un sistema de interconexin de neuronas en una red que colabora para producir un estmulo de salida. Consisten en una onas simulacin de las propiedades observadas en los sistemas neuronales biolgicos a travs de modelos matemticos recreados mediante mecanismos artificiales (como un circuito i integrado, un ordenador o un conjunto de vlvulas). El objetivo es conseguir que las mquinas den respuestas similares a las que es capaz de dar el cerebro que se caracterizan por su generalizacin y su robustez.

Ilustracin 7: Perceptrn con dos entradas (Fuente: elaboracin propia)

Una red neuronal se compone de unidades llamadas neuronas. Cada neurona recibe una serie de entradas a travs de interconexiones y emite una salida. Esta salida viene dada por tres funciones: Una funcin de pr propagacin (tambin conocida como funcin de excitacin), que por lo general consiste en el sumatorio de cada entrada multiplicada por el peso de su interconexin (valor neto). Si el peso es positivo, la conexin se denomina excitatoria; si es negativo, se denomina inhibitoria. Una funcin de activacin, que modifica a la anterior. Puede no existir, siendo en activacin, este caso la salida la misma funcin de propagacin. Una funcin de transferencia, que se aplica al valor devuelto por la funcin de transferencia, activacin. Se utiliza para acotar la salida de la neurona y generalmente viene dada por la interpretacin que queramos darle a dichas salidas. Algunas de las ms

pg. 77

utilizadas son la funcin sigmoidea (para obtener valores en el intervalo [0,1]) y la tangente hiperblica (para obtener valores en el intervalo [-1,1]). Algunos ejemplos de red neuronal son: El Perceptrn. El perceptrn usa una matriz para representar las redes neuronales y es un discriminador terciario que traza su entrada x (un vector binario) a un nico valor de salida f(x) (un solo valor binario) a travs de dicha matriz.

Donde w es un vector de pesos reales y es el producto punto (que computa una suma ponderada). es el 'umbral', el cual representa el grado de inhibicin de la neurona, es un trmino constante que no depende del valor que tome la entrada. El valor de f(x) (0 1) se usa para clasificar x como un caso positivo o un caso negativo, en el caso de un problema de clasificacin binario. El umbral puede pensarse en cmo compensar la funcin de activacin, o dando un nivel bajo de actividad a la neurona del rendimiento. La suma ponderada de las entradas debe producir un valor mayor que u para cambiar la neurona de estado 0 a 1. El Perceptrn multicapa. El perceptrn multicapa es una red neuronal artificial (RNA) formada por mltiples capas, esto le permite resolver problemas que no son linealmente separables, lo cual es la principal limitacin del perceptrn (tambin llamado perceptrn simple). El perceptrn multicapa puede ser totalmente o localmente conectado. En el primer caso cada salida de una neurona de la capa "i" es entrada de todas las neuronas de la capa "i+1", mientras que en el segundo cada neurona de la capa "i" es entrada de una serie de neuronas (regin) de la capa "i+1". Las capas pueden clasificarse en tres tipos: Capa de entrada: Constituida por aquellas neuronas que introducen los patrones de entrada en la red. En estas neuronas no se produce procesamiento. Capas ocultas: Formada por aquellas neuronas cuyas entradas provienen de capas anteriores y cuyas salidas pasan a neuronas de capas posteriores.

pg. 78

Capa de salida: Neuronas cuyos valores de salida se corresponden con las salidas de toda la red. Los Mapas Autoorganizados, tambin conocidos como redes de Kohonen. Los mapas autoorganizados o SOM (Self-Organizing Map), tambin llamados redes de Kohonen, son un tipo de red neuronal no supervisada, competitiva, distribuida de forma regular en una rejilla de, normalmente, dos dimensiones, cuyo fin es descubrir la estructura subyacente de los datos introducidos en ella. A lo largo del entrenamiento de la red, los vectores de datos son introducidos en cada neurona y se comparan con el vector de peso caracterstico de cada neurona. La neurona que presenta menor diferencia entre su vector de peso y el vector de datos es la neurona ganador y ella y sus vecinas vern modificados sus vectores de pesos.

Regresin lineal. Es la ms utilizada para formar relaciones entre datos. Rpida y eficaz pero insuficiente en espacios multidimensionales donde puedan relacionarse ms de dos variables. Es un mtodo matemtico que modela la relacin entre una variable dependiente Y, las variables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:

Donde 0 es la interseccin o trmino "constante", las i (i>0) son los parmetros respectivos a cada variable independiente, y p es el nmero de parmetros independientes a tener en cuenta en la regresin. rboles de decisin. Un rbol de decisin es un modelo de prediccin utilizado en el mbito de la inteligencia artificial, dada una base de datos se construyen estos diagramas de construcciones lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una serie de condiciones que suceden de forma sucesiva, para la resolucin de un problema. Un rbol de decisin tiene unas entradas las cuales pueden ser un objeto o una situacin descrita por medio de un conjunto de atributos y a partir de esto devuelve una respuesta la cual en ltimas es una decisin que es tomada a partir de las entradas. Los valores que pueden tomar las entradas y las salidas pueden ser valores discretos o continuos. Se utilizan ms los valores discretos por simplicidad, cuando se utilizan valores discretos en las funciones de una aplicacin se denomina clasificacin y cuando se utilizan los continuos se denomina regresin.

pg. 79

Un rbol de decisin lleva a cabo un test a medida que este se recorre hacia las hojas para alcanzar as una decisin. El rbol de decisin suele contener nodos internos, nodos de probabilidad, nodos hojas y arcos. Un nodo interno contiene un test sobre algn valor de una de las propiedades. Un nodo de probabilidad indica que debe ocurrir un evento aleatorio de acuerdo a la naturaleza del problema, este tipo de nodos es redondo, los dems son cuadrados. Un nodo hoja representa el valor que devolver el rbol de decisin y finalmente las ramas brindan los posibles caminos que se tienen de acuerdo a la decisin tomada. Ejemplos: Algoritmo ID3. El algoritmo es utilizado dentro del mbito de la inteligencia artificial. Su uso se engloba en la bsqueda de hiptesis o reglas en l, dado un conjunto de ejemplos. El conjunto de ejemplos deber estar conformado por una serie de tuplas de valores, cada uno de ellos denominados atributos, en el que uno de ellos, (el atributo a clasificar) es el objetivo, el cual es de tipo binario (positivo o negativo, si o no, vlido o invlido, etc.). De esta forma, el algoritmo trata de obtener las hiptesis que clasifiquen ante nuevas instancias, si dicho ejemplo va a ser positivo o negativo. Modelos estadsticos. Es una expresin simblica en forma de igualdad o ecuacin que se emplea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que modifican la variable de respuesta. Un modelo estadstico es una expresin simblica en forma de igualdad o ecuacin que se emplea en todos los diseos experimentales y en la regresin para indicar los diferentes factores que modifican la variable de respuesta. El modelo estadstico ms simple es el usado en los diseos completos aleatorios (DCA). Su modelo es:

Donde, Y = es la variable de respuesta de inters. = promedio general de la poblacin sobre la cual se est trabajando. t = es la variacin que se atribuye a los niveles del factor que se est evaluando (efecto de los tratamientos). = es la variacin de los factores no controlados (error experimental). i = i -simo tratamiento.

pg. 80

j = j -sima repeticin de cada tratamientos. j(i) = es la variacin de las unidades experimentales anidado en los tratamientos.

Agrupamiento o Clustering. Es un procedimiento de agrupacin de una serie de vectores segn criterios habitualmente de distancia; se tratar de disponer los vectores de entrada de forma que estn ms cercanos aquellos que tengan caractersticas comunes. Generalmente, los vectores de un mismo grupo (o clusters) comparten propiedades comunes. El conocimiento de los grupos puede permitir una descripcin sinttica de un conjunto de datos multidimensional complejo. De ah su uso en minera de datos. Esta descripcin sinttica se consigue sustituyendo la descripcin de todos los elementos de un grupo por la de un representante caracterstico del mismo. En algunos contextos, como el de la minera de datos, se lo considera una tcnica de aprendizaje no supervisada puesto que busca encontrar relaciones entre variables descriptivas pero no la que guardan con respecto a una variable objetivo. Ejemplos: Algoritmo K-means. En estadstica, k-means es un mtodo de anlisis de conglomerados que tiene por objeto la particin de n observaciones en k clusters en los que cada observacin pertenece al grupo con la media ms cercana. Es similar al algoritmo de maximizacin de expectativas para las mezclas gaussianas en que ambos intentan encontrar los centros de agrupaciones naturales en los datos, as como en el enfoque de refinamiento iterativo empleado por ambos algoritmos. El algoritmo est descrito como sigue:

Donde, VQ es una funcin que asigna un conjunto infinito de valores, pertenecientes a un espacio de entrada, a un conjunto finito de K valores discretos o vectores prototipos {wi, i=1,, K}. Este conjunto de vectores son utilizados de la siguiente manera en un cuantificador vectorial euclidiano:

pg. 81

w es el peso que garantiza que el cuantificador resultante aproxime el vector de entrada minimizando el error cuadrtico medio. A continuacin, se presenta una imagen con una aplicacin del algoritmo ya descrito.

Ilustracin 60: Algoritmo k-means (Fuente: elaboracin propia)

pg. 82

You might also like