You are on page 1of 17

3.

1 CONCEPTOS FUNDAMENTALES DE LA INDIFERENCIA Generalmente, es comn que se de entre la gente que cuando una persona quiera castigar a otro por alguna actitud que no le gust y que por supuesto le molest muchsimo, en vez de gritar, pelear o discutir por la misma, opte por asumir ese estado de nimo que no muestra ningn tipo de sensacin o emocin para con el otro que le provoc ese dao, es decir, lo que popularmente se dice y conoce como matar con la indiferencia. Este dicho o frase muy popular en el mundo, lo que promueve es que ante una situacin como la descripta, la mejor venganza o la mejor respuesta ante una persona que nos lastim ser justamente ignorarlo, hacer como que sus dichos y actitudes no existen para nosotros. Hay una creencia general en que la indiferencia es una de las mejores terapias para aquellas personalidades que gustan o disfrutan de someter a otros a situaciones ridculas, difciles, peligrosas o indignas. Porque quienes asumen una actitud de indiferencia suponen y no muy alejadamente de la verdad realmente estn, que cuando se relega a la nada misma a una persona, reducindola a cero a la insignificancia misma, casi como dicindole en la cara sos nada, entonces, ser la mejor respuesta antes que el grito, porque para este tipo de personas omnipotentes, soberbias y pagadas de si mismas no habr nada peor en el mundo que otro los ignore y los reduzca prcticamente a la no existencia. En tanto, esta razn seguramente se encuentra en que como la naturaleza del hombre es social, generalmente, no soportamos justamente esa falta de mirada del otro sobre nosotros, sobre lo que hacemos o sobre lo que decimos, ya que la misma es algo as como un aliciente para nuestras autoestimas.

3.2 DISTRIBUCIONES MUESTRALES La comprensin del concepto de la distribucin de muestreo es fundamental para el correcto entendimiento de la inferencia estadstica. Una distribucin de la poblacin es la distribucin de la totalidad de las medidas individuales de una poblacin, en tanto que una distribucin muestral es la distribucin de los valores individuales incluidos en una muestra. En contraste con estas distribuciones de medidas individuales, una distribucin de muestreo se refiere a la distribucin de los diferentes valores que una estadstica muestral, o estimador, podra adoptar en muchas muestras del mismo tamao. As, aunque por lo general disponemos nicamente de una muestra aleatoria o subgrupo racional, reconocemos que la estadstica muestral particular que determinamos, como la media o mediana de la muestra, no es exactamente igual al respectivo parmetro de la poblacin. Ms an, el valor de una estadstica muestral variar de una muestra a otra, a causa de la variabilidad del muestreo aleatorio, o error de muestreo. sta es la idea en la que se apoya el concepto de que toda estadstica muestral es de hecho un tipo de variable cuya distribucin de valores est representada por una distribucin de muestreo.

Distribucin muestral de medias Una distribucin muestral de medias o una distribucin en el muestreo de la media se define como el conjunto de todas las medias que se pueden calcular en todas las muestras posibles que se pueden extraer, con o sin reemplazo, de una determinada poblacin. Para detectar las relaciones a que nos hemos referido, partiremos de un ejemplo con una poblacin pequea.

Media Es el promedio aritmtico de las medias del conjunto de datos; ya sea de la poblacin o de la muestra.

Tambin habremos de referirnos a la media como el valor esperado de X, y se denotar con E (X). Varianza Es el promedio de la suma de los cuadrados de las desviaciones. Se entiende por desviacin la diferencia de una media respecto a la media

Como puede verse, la varianza es una medida de dispersin. Indica, en promedio, qu tan alejados estn los datos respecto de la media. Desviacin tpica o estndar Es la raz cuadrada de la varianza. Por simplicidad, en las expresiones anteriores se acostumbra suprimir el subndice i, as como los lmites de las sumatorias:

Objetivo: Obtener por medio de los estadgrafos (media y varianza) los parmetros poblacionales para poder determinarla distribucin que presentan los aos de las monedas de 10 centavos Hiptesis: Haciendo un muestro en la poblacin de monedas de 10C, decimos que la medias poblacionales del ao de fabricacin se distribuirn de manera normal Mtodo: Se tomaron muestras de los aos de una poblacin de monedas de 10 centavos, el muestreo se hizo con reemplazo el tamao de las muestras fue de 20 de las cuales se tomaron 8 en cada una de las muestras n = 8. La otra muestra de 20 de las cuales se

tomaron 30 en cada una n = 30, de cada una de estas 20 muestras tanto de 8 como de 30 se obtuvo la media, mediana, varianza, desviacin estndar y posteriormente se analizaron los datos 3.3. INTERVALOS DE CONFIANZA En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales se estima que estar cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parmetro poblacional. La probabilidad de xito en la estimacin se representa con 1 - y se denomina nivel de confianza. En estas circunstancias, es el llamado error aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar en la estimacin mediante tal intervalo.1 El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que un intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo ms pequeo, que ofrece una estimacin ms precisa, aumentan sus posibilidades de error. Para la construccin de un determinado intervalo de confianza es necesario conocer la distribucin terica que sigue el parmetro a estimar,. Es habitual que el parmetro presente una distribucin normal. Tambin pueden construirse intervalos de confianza con la desigualdad de Chebyshov. En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un parmetro poblacional que sigue una determinadadistribucin de probabilidad, es una expresin del tipo [1, 2] tal que P[1 2] = 1 - , donde P es la funcin de distribucin de probabilidad de . Intervalo de confianza para la media de una poblacin De una poblacin de media y desviacin tpica se pueden tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional: 2 Pero adems, si el tamao de las muestras es lo suficientemente grande, 3 la distribucin de medias muestrales es, prcticamente, unadistribucin normal (o gaussiana) con media y una desviacin tpica dada por la siguiente expresin: . Esto se representa como

sigue:

. Si estandarizamos, se sigue que:

En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 z z2] = 1 - , donde (1 - )100 es el porcentaje deseado (vase el uso de las tablas en una distribucin normal). Se desea obtener una expresin tal que

En esta distribucin normal de medias se puede calcular el intervalo de confianza donde se encontrar la media poblacional si slo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamar (debido a que es el error que se cometer, un trmino opuesto). Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que: As:

Haciendo operaciones es posible despejar

para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Obsrvese que el intervalo de confianza viene dado por la media muestral del valor crtico Si no se conoce por el error estndar .

el producto

y n es grande (habitualmente se toma n 30):4 , donde s es la desviacin tpica de una muestra.

Aproximaciones para el valor para y 2,576 para

para los niveles de confianza estndar son 1,96 .5

Intervalo de confianza para una proporcin El intervalo de confianza para estimar una proporcin p, conocida una proporcin muestral pn de una muestra de tamao n, a un nivel de confianza del (1-)100% es:

En la demostracin de estas frmulas estn involucrados el Teorema Central del Lmite y la aproximacin de una binomial por una normal. 3.3.1 LA ESTIMACIN En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un valor aproximado de un parmetro de una poblacin a partir de los datos proporcionados por una muestra. Por ejemplo, una estimacin de la media de una determinada caracterstica de una poblacin de tamao N podra ser la media de esa misma caracterstica para una muestra de tamao n.1 La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos mtodos que se usan en funcin de las caractersticas y propsitos del estudio:

Estimacin puntual:2

Mtodo de los momentos; Mtodo de la mxima verosimilitud;

Mtodo de los mnimos cuadrados; Estimacin por intervalos. Estimacin bayesiana.

Un estimador de un parmetro poblacional es una funcin de los datos muestrales, tambin llamado estadstico. En pocas palabras, es una frmula que depende de los valores obtenidos de una muestra, para realizar estimaciones.3

Formalmente, si es un parmetro poblacional, se dice que

es un estimador

puntual de si , donde son las variables aleatorias que integran una muestra aleatoria de tamao n de la poblacin en cuestin. Por ejemplo, un estimador de la media poblacional, , puede ser la media muestral, , segn la siguiente frmula:

donde (x1, x2, ..., xn) sera el conjunto de de datos de la muestra. -- xXx ---

El estimador es una variable aleatoria que asigna a cada posible valor de la muestra un valor numrico. Como tal, tiene sentido calcular su esperanza, su varianza y otras caractersticas propias de las variables aleatorias. 3.3.2. INTERVALOS DE CONFIANZA PARA LA MEDIA Si partimos de una poblacin que sigue una distribucin Z ~ N(0,1) bastar con encontrar el punto crtico z/2 para tener un intervalo que contenga la media poblacional con probabilidad c.

p(-z/2 < Z < z/2) = c Si en el caso general tomamos:

bastar con hacer unas sencillas operaciones para llegar a que el intervalo de confianza para la media de una poblacin normal con desviacin tpica conocida es:

3.3.3. INTERVALOS DE CONFIANZA PARA LA VARIANZA Para estimar un intervalo de confianza para la varianza, nos ayudaremos de la siguiente propiedad de la distribucin :

Entonces un intervalo de confianza al nivel para la varianza de una distribucin gaussiana (cuyos parmetros desconocemos) lo obtenemos teniendo en cuenta que existe una probabilidad de que:

Por tanto el intervalo que buscamos es

3.4. PRUEBAS DE HIPTESIS En el caso de proporciones se mostrara mediante un ejemplo como realizar pruebas de hiptesis para muestras grandes (mayores a 30 elementos). Ejemplo 1. El dueo de un caf desea saber si la proporcin de mujeres que entran a su negocio es igual al 60%. Para hacer lo anterior se realiza un muestreo aleatorio de 40 personas, dando un promedio de la muestra de 58%. Paso 1. Determinar la hiptesis Nula Ho y Alternativa Ha. Ho: La cantidad de mujeres que entra al negocio es del 60%. Ha: La cantidad de mujeres que entran al negocio NO ES del 60% (El estudiante debe describir la Ha) Ntese que la hiptesis nula considera IGUAL al 60% por lo tanto es una prueba de hiptesis de dos colas. 3.4.1. LAS HIPTESIS ESTADSTICAS Una hiptesis puede definirse como una solucin provisional (tentativa) para un problema dado. El nivel de verdad que se le asigne a tal hiptesis depender de la medida en que los datos empricos recogidos apoyen lo afirmado en la hiptesis. Esto es lo que se conoce como contrastacin emprica de la hiptesis o bien proceso de validacin de la hiptesis. Este proceso puede realizarse de uno o dos modos: mediante confirmacin (para las hiptesis universales) o mediante verificacin (para las hiptesis existenciales). En general, en un trabajo de investigacin se plantean dos hiptesis mutuamente excluyentes: la hiptesis nula o hiptesis de nulidad ( ) y la hiptesis de investigacin ( ). Adems, es posible plantear hiptesis alternas o hiptesis alternativas. El anlisis estadstico de los datos servir para determinar si se puede o no aceptar Ho. Cuando se rechaza Ho, significa que el factor estudiado ha influido significativamente en los resultados y es informacin relevante para apoyar la hiptesis de investigacin planteada. Es muy importante tener presente que la hiptesis de investigacin debe coincidir con la hiptesis alternativa. Plantear hiptesis de investigacin que coincidan con Ho supondra una aplicacin incorrecta del razonamiento estadstico. 3.4.2. PRUEBAS DE HIPTESIS PARA LA MEDIA Las pruebas de hiptesis para la media se basan en el estadstico dado por la media muestral cuya distribucin tiende a la distribucin normal (m, s /n) para muestras grandes. Debido a la dificultad de explicar este tema se enfocar un problema basado en un estudio en una fbrica de llantas. En este problema la fbrica de llantas tiene dos turnos de operarios, turno de da y turno mixto. Se selecciona una muestra aleatoria de 100 llantas producidas por cada turno para ayudar al gerente a sacar conclusiones de cada una de las siguientes preguntas:

1.- Es la duracin promedio de las llantas producidas en el turno de da igual a 25 000 millas? 2.- Es la duracin promedio de las llantas producidas en el turno mixto menor de 25 000 millas? 3.- Se revienta ms de un 8% de las llantas producidas por el turno de da antes de las 10 000 millas? Prueba De Hiptesis Para La Media En la fbrica de llantas la hiptesis nula y alternativa para el problema se plantearon como sigue: Ho: = 25 000 H1: 25 000

3.4.3. PRUEBAS DE HIPTESIS PARA LA VARIANZA Es frecuente que se desee comprobar si la variacin o dispersin de una variable ha tenido alguna modificacin, lo cual se hace con la prueba de hiptesis para la varianza. Hiptesis Se puede plantear uno de los siguientes tres tipos de hiptesis: - Prueba de hiptesis a dos colas H0 : H1 : =k k

- Prueba de hiptesis a una cola superior H0 : H1 : =k >k H0 : H1 : k >k

- Prueba de hiptesis a una cola inferior H0 : =k H1 : k

H1 :

<k

H1 :

<k

En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida. Si se utiliza la varianza sin corregir ( ) la estadstica de trabajo es la expresin (1.4):

(3.6) Si se utiliza la varianza corregida, la estadstica de trabajo es la expresin (1.5):

(3.7) REGLA DE DECISIN - Si se ha planteado la hiptesis alternativa como: H1 : k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin como se aprecia en la figura 3.8

Figura 3.8 Regla de decisin para una prueba de hiptesis a dos colas y pertenecen a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica de trabajo (T) est entre y no se rechaza la hiptesis nula, en caso contrario se rechaza H0lo cual implica aceptar H1 . Es decir, si <T< no se rechaza H0. - Si se ha planteado la hiptesis alternativa como:

H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de significancia ( ) en la parte superior de la distribucin, vease figura 3.9

Figura 3.9 Regla de decisin para una prueba de hiptesis a una cola superior Z1- pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica de trabajo (T) es menor que no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T < no se rechaza H0 . 3.4.4. PRUEBAS DE HIPTESIS PARA PROPORCIONES. Las pruebas de hiptesis a partir de proporciones se realizan casi en la misma forma utilizada cuando nos referimos a las medias, cuando se cumplen las suposiciones necesarias para cada caso. Pueden utilizarse pruebas unilaterales o bilaterales dependiendo de la situacin particular. La proporcin de una poblacin Las hiptesis se enuncian de manera similar al caso de la media. Ho: p = p0 H1: p p0 En caso de que la muestra sea grande n>30, el estadgrafo de prueba es: Se distribuye normal estndar. En el caso de muestras pequeas se utiliza la distribucin Binomial. No lo abordaremos por ser complicado y poco frecuente su uso. Diferencia entre las proporciones de dos poblaciones

La situacin ms frecuente es suponer que existen diferencias entre las proporciones de dos poblaciones, para ello suelen enunciarse las hiptesis de forma similar al caso de las medias: Ho: p1 = p2 p1 - p2 = 0 H1: p1 p2 Puede la hiptesis alternativa enunciarse unilateralmente. El estadgrafo de prueba para el caso de muestras independientes: Siendo a1 y a2, el nmero de sujetos con la caracterstica objeto de estudio en las muestras 1 y 2 respectivamente, es decir, en vez de calcular la varianza para cada muestra, se calcula una p conjunta para ambas muestras bajo el supuesto que no hay diferencias entre ambas proporciones y as se obtiene la varianza conjunta. Recuerda que q = 1-p. 4.1 CONCEPTOS FUNDAMENTALES 4.2. REGRESIN GEOMTRICA Las tcnicas de regresin permiten hacer predicciones sobre los valores de cierta variable Y (dependiente), a partir de los de otra X (independiente), entre las que intuimos que existe una relacin. Para ilustrarlo retomemos los ejemplos mencionados al principio del captulo. Si sobre un grupo de personas observamos los valores que toman las variables

no es necesario hacer grandes esfuerzos para intuir que la relacin que hay entre ambas es:

Obtener esta relacin es menos evidente cuando lo que medimos sobre el mismo grupo de personas es

La razn es que no es cierto que conocida la altura xi de un individuo, podamos determinar de modo exacto su peso yi (v.g. dos personas que miden 1,70 mpueden tener pesos de 60 y 65 kilos). Sin embargo, alguna relacin entre ellas debe existir, pues parece mucho ms probable que un individuo de 2 m pese ms que otro que mida 1,20 m. Es ms, nos puede parecer ms o menos aproximada una relacin entre ambas variables como la siguiente

A la deduccin, a partir de una serie de datos, de este tipo de relaciones entre variables, es lo que denominamos regresin.

4.3. EL MTODO DE MNIMOS CUADRADOS Mnimos cuadrados es una tcnica de anlisis numrico encuadrada dentro de la optimizacin matemtica, en la que, dados un conjunto de pares ordenados: (variable independiente, variable dependiente) y una familia de funciones, se intenta encontrar la funcin, dentro de dicha familia, que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mnimo error cuadrtico. En su forma ms simple, intenta minimizar la suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre los puntos generados por la funcin y los correspondientes en los datos. Especficamente, se llama mnimos cuadrados promedio (LMS) cuando el nmero de datos medidos es 1 y se usa el mtodo de descenso por gradiente para minimizar el residuo cuadrado. Se puede demostrar que LMS minimiza el residuo cuadrado esperado, con el mnimo de operaciones (por iteracin), pero requiere un gran nmero de iteraciones para converger. Desde un punto de vista estadstico, un requisito implcito para que funcione el mtodo de mnimos cuadrados es que los errores de cada medida estn distribuidos de forma aleatoria. Elteorema de Gauss-Mrkov prueba que los estimadores mnimos cuadrticos carecen de sesgo y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribucin normal. Tambin es importante que los datos recogidos estn bien escogidos, para que permitan visibilidad en las variables que han de ser resueltas (para dar ms peso a un dato en particular, vase mnimos cuadrados ponderados). La tcnica de mnimos cuadrados se usa comnmente en el ajuste de curvas. Muchos otros problemas de optimizacin pueden expresarse tambin en forma de mnimos cuadrados, minimizando la energa o maximizando la entropa. 4.4. REGRESIN LINEAL SIMPLE En estadstica la regresin lineal o ajuste lineal es un mtodomatemtico que modeliza la relacin entre una variable dependiente Y, lasvariables independientes Xi y un trmino aleatorio . Este modelo puede ser expresado como:

: variable dependiente, explicada o regresando.

: variables explicativas, independientes o regresores. : parmetros, miden la influencia que las variables explicativas tienen sobre el regresando. donde es la interseccin o trmino "constante", las son los parmetros respectivos a cada variable independiente, y es el nmero de parmetros independientes a tener en cuenta en la regresin. La regresin lineal puede ser contrastada con la regresin no lineal. 4.5. REGRESIN CUADRTICA es el proceso por el cul encontramos los parmetros de una parbola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo. Bueno, pero por que habramos de querer ajustar nuestros datos precisamente a una parbola y no a otra funcin. Una funcin cuadrtica o de segundo grado se puede representar de manera genrica como: Y= a+bx+cx^ 4.6. REGRESIN EXPONENCIAL Y LOGARTMICA Otro tipo de Funcin que tiene aplicacin en el anlisis de Regresin, es la funcin exponencial que esta por la expresin: Y = ABX En todo caso, al igual que la Funcin Potencial, la Regresin Exponencial puede tambin ser linealizada aplicando logaritmos a ambos miembros, resultado de ello se tiene la relacin siguiente: LogY = LogA + LogB(X) Sustituyendo valores: Y = Log Y A = Log A X = Log X

Recordemos que la ecuacin exponencial logartmica puede resolverse tambin a travs de ecuaciones normales:

REGRESION LOGARITMICA: Este modelo de regresin es una alternativa cuando el modelo lineal no logra un coeficiente de determinacin apropiado, o cuando el fenmeno en estudio tiene un comportamiento que puede considerarse potencial o logartmico. La forma

ms simple de tratar de establecer la tendencia es a travs de un diagrama de dispersin o nube de puntos, tal como la siguiente:

Este modelo tambin es conocido como potencial, Cobb-Douglas de primer grado o exponencial inverso. 2. Ecuacin caracterstica La funcin que define el modelo es la siguiente: Yi=A*XBi* E En la cual: Yi : Variable dependiente, isima observacin A, B: Parmetros de la ecuacin, que generalmente son desconocidos E: Error asociado al modelo Xi : Valor de la -esima observacin de la variable independiente Al sustituir los parmetros por estimadores, el modelo adopta la siguiente forma: yi=a*xbi la ecuacin se transforma aplicando logaritmos de ambos lados, con lo cual se convierte a una forma lineal: Ln yi= Ln a +b*Ln xi 4.7. CORRELACIN LINEAL El coeficiente la covarianza y el variables. de correlacin lineal es el cociente entre producto de las desviaciones tpicas de ambas

El coeficiente de correlacin lineal se expresa mediante la letra r.

Propiedades del coeficiente de correlacin 1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara. 2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin. 3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1. 1 r 1 4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin esfuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil. 7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional. Ejemplos Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas Fsica 2 1 3 3 4 2 4 4 5 4 6 4 6 6 7 4 7 6 8 7 10 9 10 10

Hallar el coeficiente de correlacin de la distribucin e interpretarlo. xi 2 3 4 4 5 6 6 7 7 8 10 yi 1 3 2 4 4 4 6 4 6 7 9 x i y i 2 9 8 16 20 24 36 28 42 56 90 100 431 xi2 4 9 16 16 25 36 36 49 49 64 100 yi 2 1 9 4 16 16 16 36 16 36 49 81

10 10 72 60

100 100 504 380

1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las desviaciones tpicas.

You might also like