You are on page 1of 6

Estadstica inferencial

La inferencia estadstica o estadstica inferencial es una parte de la Estadstica que comprende los mtodos y procedimientos para deducir propiedades (hacer inferencias) de una poblacin, a partir de una pequea parte de la misma (muestra). La Teora de muestras. La estimacin de parmetros. El Contraste de hiptesis. El Diseo experimental. La Inferencia bayesiana. Los mtodos no paramtricos

Inferencia Estadstica
La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga del estudio de los mtodos para la obtencin del modelo de probabilidad (forma funcional y parmetros que determinan la funcin de distribucin) que sigue una variable aleatoria de una determinada poblacin, a travs de una muestra (parte de la poblacin) obtenida de la misma.

Los dos problemas fundamentales que estudia la inferencia estadstica son el "Problema de la estimacin" y el "Problema del contraste de hiptesis" Cuando se conoce la forma funcional de la funcin de distribucin que sigue la variable aleatoria objeto de estudio y slo tenemos que estimar los parametros que la determinan, estamos en un problema de inferencia estadstica paramtrica ; por el contrario cuando no se conoce la forma funcional de la distribucin que sigue la variable aleatoria objeto de estudio, estamos ante un problema de inferencia estadstica no paramtrica. En lo que sigue nos vamos a limitar a problemas de inferencia estadstica paramtrica, donde la variable aleatoria objeto de estudio sigue una distribucin normal, y slo tendremos que tratar de estimar los parmetros que la determinan, la media y la desviacin tpica. Esta situacin se presenta con frecuencia debido a que es posible a menudo conocer la forma funcional de la distribucin de probabilidad, por consideraciones tericas, quedando nicamente indeterminados los parmetros que determinan la funcin de distribucin. Como las poblaciones en las que se pretende estudiar una determinada variable aleatoria, son grandes, es muy caro o imposible, estudiar a todos sus individuos; lo que se hace, es estudiar una muestra ( una parte) de la poblacin En todos estos problemas que estudia la inferencia estadstica juega un papel fundamental la "Teora de la Probabilidad" (distintas formas funcionales de las distribuciones de probabilidad) y la "Teora de Muestras" (procedimientos para tomar muestras de manera apropiada).

Teora de Muestras
Consideremos la poblacin compuesta por los nios espaoles al nacer. Una caractetrstica medible de los individuos de esta poblacin es su peso; esta caracterstica depende de mltiples factores y se puede considerar una variable aleatoria. La distribucin que sigue esta variable aleatoria es normal, pero, cul es su media? y cul es su desviacin tpica?.

Como es imposible estudiar el peso de todos los nios recin nacidos, tenemos que recurrir a la toma de muestras Pues bien, la teora de muestras estudia las tcnicas y procedimientos que debemos emplear para que las muestras sean representativas de la poblacin que pretendemos estudiar, de forma que los errores en la determinacin de los parmetros de la poblacin objeto de estudio sean mnimos. Para conseguirlo, la muestra tiene que ser representativa de la poblacin. Para que la extraccin de la muestra sea representativa se deben cumplir dos principios bsicos:

Que haya independencia en la seleccin de los individuos que forman la muestra Que todos los individuos tengan la misma probabilidad de ser incluidos en la muestra

Para conseguir estos objetivos se emplean distintas tcnicas de muestreo. Vamos a describir dos de las ms utilizadas. Muestreo Aleatorio Simple Para efectuar este tipo de muestreo en una poblacin con N individuos:

Numeramos de 1 a N los N individuos de la poblacin. Mediante un programa de ordenador o una tabla de generacin de nmeros aleatorios, seleccionamos a los n individuos que formarn la muestra. Despus de cada extraccin el individuo seleccionado se devuelve a la poblacin para que pueda volver a ser elegido.

Muestreo Aleatorio Estratificado Cuando la poblacin no es homogenea respecto a la variable aleatoria objeto de estudio, para mejorar las estimaciones, conviene distinguir en ella, clases o estratos, y proceder a lo que se llama un muestreo aleatorio estratificado.

En este tipo de muestreo los estratos se deben elegir de manera que sean lo ms homogeneos posible respecto a la variable aleatoria a estudiar y que entre ellos exista la mayor diferencia posible. Afijacin: Es el reparto del tamao de la muestra entre los diferentes estratos en que hemos dividido la poblacin. Afijacin Uniforne : Consiste en tomar para la muestra el mismo nmero de individuos por cada estrato.

Afijacin Proporcional : Consiste en distribuir los individuos que forman la muestra proporcionalmente al nmero de individuos de cada estrato. Una vez determinado el nmero de individuos que deben pertenecer a cada estrato, se procede a la seleccin de individuos de cada estrato por muestreo aleatorio simple.
Ejemplo prctico. En un isntituto de enseanza secundaria en que se ofertan los siguientes tipos de enseanza :

Ciclos de grado superior : 110 alumnos. Bachillerato : 162 alumnos. Ciclos de grado medio : 210 alumnos 2 ciclo de enseanza secundaria obligatoria : 338 alumnos.

Se pretende valorar las faltas de ortografa que cometen los alumnos del centro mediante una prueba-dictado de un texto de 20 lneas; la prueba se pasar a una muestra de 50 alumnos, para minimizar el costo en tiempo y medios.

En esta situacin parece conveniente utilizar para la extracin de la muestra el muestreo aleatorio estratificado con afijacin proporcional. Dividimos la poblacin en cuatro estratos : ciclos de grado superior, ciclos de grado medio, bachillerato y 2 ciclo de enseanza secundaria obligatoria. Como el nmero total de alumnos son 820 y la muestra debe estar formada por 50 alumnos, el clculo del nmero de alumnos que se han de tomar de cada estrato es: Ciclos de grado superior :

Bachillerato :

Ciclos de grado medio :

2 ciclo de Enseanza Secundaria Obligatoria

Estimacin de parmetros

La estimacin de parmetros consiste en el clculo aproximado del valor de un parmetro en la poblacin, utilizando la inferencia estadstica, a partir de los valores observados en la muestra estudiada. Para el clculo del tamao de la muestra en una estimacin de parmetros son necesarios los conceptos de Intervalo de confianza, variabilidad del parmetro, error, nivel de confianza, valor crtico y valor
Contraste de hiptesis

Para conocer el tamao de la muestra en un estudio de investigacin en el que queremos conocer las diferencias existentes entre dos hiptesis, debemos conocer previamente:

error tipo I y tipo II: Hay que establecer el riesgo de cometer un error de tipo I que se est dispuesto a aceptar. Normalmente de forma arbitraria se acepta un riesgo del 5%. Adems hay que establecer el riesgo que se acepta de cometer un error tipo II, que suele ser entre el 5 y el 20%. Si la hiptesis es unilateral o bilateral: El planteamiento de una hiptesis bilateral o "de dos colas" requiere mayor tamao muestral. Definir la Magnitud de la diferencia efecto o asociacin que se desea detectar: A mayores diferencias preestablecidas en el planteamiento de la hiptesis, menor tamao muestral, y a menor diferencia, mayor espacio muestral. Conocer la variabilidad del criterio de evaluacin en la poblacin.

Diseo experimental
El diseo experimental es una tcnica estadstica que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental. En un diseo experimental se manipulan deliberadamente una o ms variables, vinculadas a las causas, para medir el efecto que tienen en otra variable de inters. El diseo experimental prescribe una serie de pautas relativas qu variables hay manipular, de qu manera, cuntas veces hay que repetir el experimento y en qu orden para poder establecer con un grado de confianza predefinido la necesidad de una presunta relacin de causa-efecto.

Inferencia bayesiana
La inferencia bayesiana es un tipo de inferencia estadstica en la que las evidencias u observaciones se emplean para actualizar o inferir la probabilidad de que una hiptesis pueda ser cierta. El nombre bayesiana proviene de uso frecuente que se hace del teorema de Bayes durante el proceso de inferencia. El teorema de Bayes se ha derivado del trabajo realizado por el reverendo Thomas Bayes. Hoy en da, uno de los campos de aplicacin es en la teora de la decisin, visin artificial (simulacin de la percepcin en general) y reconocimiento de patrones por ordenador. Evidencia y creencias cambiantes

La inferencia bayesiana utiliza aspectos del mtodo cientfico, que implica recolectar evidencia que se considera consistente o inconsistente con una hiptesis dada. A medida que la evidencia se acumula, el grado de creencia en una hiptesis se va modificando. Con evidencia suficiente, a menudo podr hacerse muy alto o muy bajo. As, los que sostienen la inferencia bayesiana dicen que puede ser utilizada para discriminar entre hiptesis en conflicto: las hiptesis con un grado de creencia muy alto deben ser aceptadas como verdaderas y las que tienen un grado de creencia muy bajo deben ser rechazadas como falsas. Sin embargo, los detractores dicen que este mtodo de inferencia puede estar afectado por un prejuicio debido a las creencias iniciales que se deben sostener antes de comenzar a recolectar cualquier evidencia.
Qu es lo atractivo de la Estadstica Bayesiana?

i) Construccin axiomtica ii) Una sola regla de decisin iii) La nica que ofrece solucin para ciertos problemas
Axiomas de coherencia

i) Comparacin ii) Transitividad iii) Dominancia-Sustitucin iv) Referencia


Ejemplos de inferencia

Un ejemplo de inferencia bayesiana es el siguiente:

Durante miles de millones de aos, el sol ha salido despus de haberse puesto. El sol se ha puesto esta noche. Hay una probabilidad muy alta (o 'Yo creo firmemente que' o 'es verdad que') el sol va a volver a salir maana. Existe una probabilidad muy baja (o 'yo no creo de ningn modo que' o 'es falso que') el sol no salga maana.

La inferencia bayesiana usa un estimador numrico del grado de creencia en una hiptesis an antes de observar la evidencia y calcula un estimador numrico del grado de creencia en la hiptesis despus de haber observado la evidencia. La inferencia bayesiana generalmente se basa en grados de creencia, o probabilidades subjetivas, en el proceso de induccin y no necesariamente declara proveer un mtodo objetivo de induccin.
Definiciones formales

A pesar de todo, algunos estadsticos bayesianos creen que las probabilidades pueden tener un valor objetivo y por lo tanto la inferencia bayesiana puede proveer un mtodo objetivo de induccin. (Ver mtodo cientfico.) El teorema de Bayes ajusta las probabilidades, dada una nueva evidencia, de la siguiente manera:

donde

H0 representa una hiptesis, llamada hiptesis nula, que ha sido inferida antes de que la nueva evidencia, E, resultara disponible. P(H0) se llama la probabilidad a priori de H0. P(E | H0) se llama la probabilidad condicional de que se cumpla la evidencia E dado que la hiptesis H0 es verdadera. Se llama tambin la funcin de verosimilitud cuando se expresa como una funcin de E dado H0. P(E) se llama la probabilidad marginal de E: la probabilidad de observar la nueva evidencia E bajo todas las hiptesis mutuamente excluyentes. Se la puede calcular como la suma del producto de todas las hiptesis mutuamente excluyentes por las correspondientes probabilidades condicionales: . P(H0 | E) se llama la probabilidad a posteriori de H0 dado E.

El factor P(E | H0) / P(E) representa el impacto que la evidencia tiene en la creencia en la hiptesis. Si es posible que se observe la evidencia cuando la hiptesis considerada es verdadera, entonces este factor va a ser grande. Multiplicando la probabilidad a priori de la hiptesis por este factor va a resultar en una gran probabilidad a posteriori dada la evidencia. En la inferencia bayesiana, por lo tanto, el teorema de Bayes mide cunto la nueva evidencia es capaz de alterar la creencia en la hiptesis.

You might also like