You are on page 1of 4

Un Ejemplo de Motivacin para Ensear Mtodos Robustos

Como estrategia para mostrar a los estudiantes la importancia del uso de los Mtodos Robustos en la Estadstica, lo mejor es presentar un ejemplo sencillo que se origine en una situacin propia del quehacer profesional sobre el cual el estudiante se est formando. Vamos a suponer que un ingeniero catastral y geodesta, cuenta con un altmetro y toma la altura con respecto al nivel del mar en diferentes puntos de una ciudad, todo con el propsito de encontrar la altura promedio con respecto al nivel del mar. El ingeniero obtuvo las siguientes medidas en metros: 2300, 1551, 1800, 1554,1559, 1545, 2500, 1546, 1543, 2300, 1648, 1570, 1561,1548, 540, 190, 1720, 1546, 1699 y 1575. Sobre los datos, se calcula el promedio usual, la varianza usual (lo que se llama varianza poblacional), y la desviacin estndar usual, el error estndar y la mediana; resultados que se encuentran en la siguiente tabla:

Medida Promedio Varianza Desviacin Estndar Error Estndar Mediana

Resultado 1615,88 215175,87 463,87 94,69 1561,00

Como puede apreciarse, el promedio con respecto a la mediana es ligeramente diferente; las medidas de varianza, desviacin estndar y error estndar indican alta variabilidad de los datos. Luego, se sospecha que hay datos que estn muy alejados del valor promedio 1615,88. En efecto, los datos 190, 540, 2300 difieren bastante del valor promedio. Por consiguiente, hay evidencia para decir que 1615,88 no es la altura promedio de la ciudad. Qu hacer? Se usa el promedio truncado como Mtodo Robusto, se determina un nivel de truncamiento (en este caso se hizo al 20% del total de los datos). As, al calcular el promedio truncado en lugar del promedio usual, y calculando la varianza de los datos truncados, su desviacin estndar y el error estndar para promedios truncados, se tienen los siguientes resultados:

Medida Promedio Truncado Varianza Truncada Desviacin Estndar Error Estndar Mediana

Resultado 1596,33 4877,96 69,84 18,67 1561,00

El lector puede apreciar, que al aplicar promedio truncado, las estadsticas toman valores ms consistentes y si se desea construir un intervalo a dos errores estndar, se obtiene el intervalo (1559.00, 1633.67) que sera mucho ms confiable que el construido con los mismos parmetros sobre los datos originales (caso en el cual el intervalo sera (1456.21, 1805.25)). Esto hace pensar que los Mtodos Robustos, a travs del promedio truncado, eliminan el efecto de los datos outliers. Tal vez el lector, por medio de este ejemplo, puede pensar que la mediana tambin es una medida robusta, lo cual es cierto. Pero esto no es suficiente, porque al aplicar el promedio truncado, aunque la situacin haya mejorado, la realidad es que existe una razn por el cual se aplicaron frmulas que no son convenientes. Por qu? Si el lector ha seguido en detalle esta exposicin, se habr dado cuenta que no se verificaron los supuestos de normalidad y que si los mismos fallan, los intervalos arriba citados quedan sin respaldo.

Hablando de Boostrapping

Una vez se haya introducido el ejemplo de motivacin, se recomienda hablar sobre el Bootstrapping. En la medida de lo posible, mostrar ejemplos e identificar las conexiones existentes con los Mtodos Robustos. Pero, qu tiene que ver el Bootstrapping con los Mtodos Robustos? El Bootstraping se convierte en el mecanismo para acercarse a la normalidad por remuestreo del estimador robusto de inters. En el ejemplo de motivacin presentado, el lector puede usar pruebas de hiptesis o bondad de ajuste, como por ejemplo la Prueba Chi-Cuadrado, la de Kolmogorov-Smirnov o la de Shapiro-Wilk para verificar estadsticamente hablando que los datos no son normales. En el ejemplo, el objetivo es encontrar una estimacin confiable de la altura promedio; debemos buscar una alternativa que
2

tenga en cuenta los outliers y la falta de normalidad. Teniendo en cuenta los datos y al considerar al promedio truncado como estimador, se aplica Bootstrapping para alcanzar la normalidad sobre los datos y encontrar una estimacin apropiada de la altura promedio. Al desarrollar este procedimiento en una hoja de clculo, se obtiene la siguiente grfica:

Como se aprecia en la grfica, se alcanz la normalidad y de all es posible inferir que la altura promedio est alrededor de 1550 metros y con un intervalo de confianza del 95%, se tiene que indica que la altura promedio est entre 1549 y 1552 metros aproximadamente. Esto por lo general llama mucho la atencin del estudiante porque deja de lado las engorrosas frmulas de los intervalos de confianza, convirtindose en un ejercicio ms dinmico e interpretativo con ayuda de grficos.

Presentando Aplicaciones Sencillas

En este momento el estudiante se empieza a motivar y busca alternativas de uso dentro de su formacin. Se pueden presentar ejemplos de aplicacin,

preferiblemente sencillos para que afiance ms este conocimiento, tal como se ilustra enseguida.

Basado en un ejemplo tomado de las notas de clase de la asignatura Ajustes Geodsicos, Proyecto Curricular de Ingeniera Catastral y Geodesia de la Universidad Distrital Francisco Jos de Caldas, se quiere mostrar una aplicacin de la correlacin para estimar el error del volumen de un silo de forma cilndrica al obtener el nmero de mediciones del radio menor r y radio mayor R del silo. Un dato adicional es que la altura del silo es 5 veces la del radio mayor. Como es usual en ajustes, para estimar el error de una medicin, se establece si hay dependencia entre las variables relacionadas en su medicin, y se calcula el error usando lo que se conoce como la Linealizacin de Taylor. Los datos son los siguientes: Radio Menor (r): 15145, 15135, 15141, 15134 y 15142 Radio Mayor (R): 18153, 18152, 18155, 18153 y 18155 En este orden de ideas, el volumen del silo est relacionado con los radios R y r, esto indica que hay dependencia, luego al calcular las varianzas usuales, desviaciones estndar usuales y el coeficiente de correlacin entre R y r, se obtiene un volumen estimado de 28612.21 unidades cbicas y un error estimado de 41.57. Ahora, al realizar un clculo similar usando varianzas truncadas, desviaciones estndar truncadas y el coeficiente de correlacin truncado, se obtiene un volumen estimado de 28362.14 unidades cbicas y un error estimado de 33.68. Como puede observarse, al aplicar esta medida robusta se redujo el error, lo cual resulta muy til para hacer inferencia sobre el valor de verdad del volumen del silo.

You might also like