Professional Documents
Culture Documents
De Wikipedia, la enciclopedia libre Saltar a: navegacin, bsqueda Este artculo o seccin necesita referencias que aparezcan en una publicacin acreditada, como revistas especializadas, monografas, prensa diaria o pginas de Internet fidedignas.
Puedes aadirlas as o avisar al autor principal del artculo en su pgina de discusin pegando: {{subst:Aviso referencias|Medidas de dispersin}} ~~~~
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).
Contenido
[ocultar]
1 Rango estadstico o 1.1 Requisitos del rango 1.1.1 Ejemplo 2 Medio rango o 2.1 Ejemplo 3 Varianza o 3.1 Propiedades 4 Desviacin tpica o 4.1 Desviacin tpica muestral o 4.2 Desviacin tpica poblacional 5 Covarianza 6 Coeficiente de Correlacin de Pearson o 6.1 Propiedades 6.1.1 Ejemplo 7 Vase tambin
Ordenamos los nmeros segn su tamao. Restamos el valor mnimo del valor mximo
[editar] Ejemplo
Para una muestra (8,7,6,9,4,5), el dato menor es 4 y el dato mayor es 9 (Valor unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se encuentran en un rango de: Rango = 5
[editar] Ejemplo Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de mayor valor Max= 8. El medio rango resolviendolo mediante la correspondiente frmula sera:
[editar] Varianza
La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones:
[editar] Propiedades
La varianza es siempre positiva o 0: Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se modifica. c
Si a los dato de la distribucin les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.
Propiedad distributiva:
cov
Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la serie. Luego con el comando stdev se hallar la desviacin tpica.
[editar] Covarianza
La covarianza entre dos variables es un estadstico resumen indicador de si las puntuaciones estn relacionadas entre s. La formulacin clsica, se simboliza por la letra griega sigma () cuando ha sido calculada en la poblacin. Si se obtiene sobre una muestra, se designa por la letra " ". La formula suele aparecer expresada como:
Este tipo de estadstico puede utilizarse para medir el grado de relacin de dos variables si ambas utilizan una escala de medida a nivel de intervalo/razn (variables cuantitativas). La expresin se resuelve promediando el producto de las puntuaciones diferenciales por su tamao muestral (n pares de puntuaciones, n-1 en su forma insesgada). Este estadstico, refleja la relacin lineal que existe entre dos variables. El resultado numrico fluctua entre los rangos de +infinito a -infinito. Al no tener unos lmites establecidos no puede determinarse el grado de relacin lineal que existe entre las dos variables, solo es posible ver la tendencia.
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante cualquiera de las dos expresiones siguientes:
[editar] Propiedades
El coeficiente de correlacin, r, presenta valores entre 1 y +1. Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La nube de puntos est muy dispersa o bien no forma una lnea recta. No se puede trazar una recta de regresin. Cuando r es cercano a +1, hay una buena correlacin positiva entre las variables segn un modelo lineal y la recta de regresin que se determine tendr pendiente positiva, ser creciente. Cuando r es cercano a -1, hay una buena correlacin negativa entre las variables segn un modelo lineal y la recta de regresin que se determine tendr pendiente negativa: es decreciente.
[editar] Ejemplo Tenemos una tabla con dos datos (x y h), elaboramos su tabla de frecuencias (fre) -->x=[2.5 7.5 12.5 17.5] Vector de datos X
x = 2.5 7.5 12.5 17.5
-->fre=[.03 .12 .07;.02 .13 .11;.01 .13 .14;.01 .09 .14] Matriz de frecuencias
fre = 0.03 0.02 0.01 0.01 0.12 0.13 0.13 0.09 0.07 0.11 0.14 0.14
1- PLANTEAMIENTO TORICO-CONCEPTUAL:
El conocimiento de la forma de la distribucin y del respectivo promedio de una coleccin de valores de una variable, puede servir para tener una idea bastante clara de la conformacin, pero no de de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada. En el caso de las variables con valores que pueden definirse en trminos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersin o variabilidad existente en el grupo de variantes en estudio. A estos indicadores les llamamos medidas de dispersin, por cuanto que estn referidos a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersin en los datos inters, entonces no habra necesidad de la gran mayora de las medidas de la estadstica descriptiva. Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distinguimos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras.
LA DISPERSIN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo nos revelan una parte de la informacin que necesitamos acerca de las caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir tambin su dispersin, extensin o variabilidad. La dispersin es importante porque:
Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos representativa de los datos. Ya que existen problemas caractersticos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersin antes de abordar esos problemas. Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersin de valores con respecto al centro de distribucin o esto presenta
riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones ms grandes. Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad de describirla. Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es importante, cmo medimos la variabilidad de una distribucin emprica?. Vamos a considerar slo algunas medidas de dispersin absolutas: el rango, la varianza, la desviacin estndar y el coeficiente de variacin.
21.835 36.250 29.043 4 36.250 50.665 43.458 5 50.665 65.080 57.873 3 65.080 79.495 72.288 3 79.495 93.910 86.703 5
Total
XXX
El rango de la distribucin de frecuencias se calcula as: R= (lim. Sup. de la clase n lim. Inf. De la clase 1) = (93.910 7.420) = 86.49
Propiedades del Rango o Recorrido: El recorrido es la medida de dispersin ms sencilla de calcular e interpretar puesto que simplemente es la distancia entre los valores extremos (mximo y mnimo) en una distribucin Puesto que el recorrido se basa en los valores extremos ste tiende s ser errtico. No es extrao que en una distribucin de datos econmicos o comerciales incluya a unos pocos valores en extremo pequeos o grandes. Cuando tal cosa sucede, entonces el recorrido solamente mide la dispersin con respecto a esos valores anormales, ignorando a los dems valores de la variable. La principal desventaja del recorrido es que slo esta influenciado por los valores extremos,, puesto que no cuenta con los dems valores de la variable. Por tal razn, siempre existe el peligro de que el recorrido ofrezca una descripcin distorsionada de la dispersin. En el control de la calidad se hace un uso extenso del recorrido cuando la distribucin a utilizarse no la distorsionan y cuando el ahorro del tiempo al hacer los clculos es un factor de importancia.
Dado un conjunto de observaciones, tales como X1, X2, , Xn, la varianza denotada usualmente por la letra minscula griega (sigma) elevada al cuadrado (2)y en otros casos S2 segn otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su media aritmtica" Matemticamente, se expresa como:
Ejemplo: Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23, 25, 27, y 34. Al calcular la media aritmtica (promedio de las edades, se obtuvo 25.4 aos, encontrar la varianza de las edades de estos estudiantes: Para calcular se utiliza una tabla estadstica de trabajo de la siguiente manera:
Xi 18 23 25 27 34 Total ( Xi ) ( Xi )2
(18 25.5)=-7.4 (23 25.5)=-2.4 (25 25.5)=-0.4 (27 25.5)= 1.6 (34 25.5)= 8.6 xxxx
(-7.4)2=54.76 (-2.4)2= 5.76 (-0.4)2= 0.16 ( 1.64)2= 2.16 ( 8.6)2 =73.96 137.20
La varianza para datos agrupados Si en una tabla de distribucin de frecuencias. Los puntos medios de las clases son X1, X2, , Xn; y las frecuencias de las clases f1, f2, , fn; la varianza se calcula as: (Xi- )2f1 2 = ---------------fi Sin embargo la formula anterior tiene algn inconveniente para su uso en la practica, sobre todo cuando se trabaja con nmeros decimales o cuando la media aritmtica es un nmero entero. Asimismo cuando se trabaja con mquinas calculadoras, La tarea de computar la varianza se simplifica utilizando la formula de computacin que se da a continuacin: Xi2fi - [(Xifi)2/N] 2 = ---------------------------N donde N=fi Ejemplo: Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabreras y Asociados dispuestos en una tabla de distribucin de frecuencias, a partir de los cuales se deber calcular la varianza, para lo cual se construye la siguiente tabla estadstica de trabajo, si se calcul anteriormente la media aritmtica y se fij en 43.458 (ver ejemplo del calculo en "media aritmtica para datos agrupados) de la siguiente manera
clases Punto medios Xi 7.420 21.835 21.835 36.250 36.250 50.665 50.665 65.080 65.080 79.495 79.495 93.910 Total 14.628 29.043 43.458 57.873 72.288 86.703 XXX 10 4 5 3 3 5 30 213.978 843,496 1,888.598 3,349.284 5,225.555 7,533.025 19,053.936 146.280 116.172 217.270 173.619 216.864 433.965 1,304.190 2,139.780 3,373.984 9,442.990 10,047.852 15,676.665 37,665.125 78,346.396 fi Xi2 Xifi X2fi
= 21,649.344 / 30 = 721.645 Respuesta: la varianza de las cuentas por cobrar es igual B/.721.645
Propiedades de la varianza : s siempre un valor no negativo, que puede ser igual o distinta de 0. Ser 0 solamente cuando Xi= La varianza es la medida de dispersin cuadrtica optima por ser la menor de todas. Si a todos los valores de la variable se le suma una constante la varianza no se modifica. Vemoslo:
Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por el cuadrado de dicha constante. Vemoslo: )
Si en una distribucin obtenemos una serie de subconjuntos disjuntos, la varianza de la distribucin inicial se relaciona con la varianza de cada uno de los subconjuntos mediante la expresin
Siendo Ni el n de elementos del subconjunto (i) S2i la varianza del subconjunto (i)
Ejemplo: Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer ao se obtuvo 2=27.44, como la desviacin estndar es la raz cuadrada positiva, entonces = 27.44 = 5.29 aos. Igual procedimiento se aplica para encontrar le desviacin estndar de las cuentas por cobrar de la Tienda Cabreras y Asociados, recordemos que la varianza obtenida fue de 721.645, luego entonces la desviacin estndar es igual a =721.645 = 26.86 balboas.
A su vez la desviacin estndar, tambin tiene una serie de propiedades que se deducen fcilmente de las de la varianza (ya que la desviacin tpica es la raz cuadrada positiva de la varianza):
La desviacin estndar es siempre un valor no negativo S ser siempre 0 por definicin. Cuando S = 0 X = xi (para todo i). Es la medida de dispersin ptima por ser la ms pequea. La desviacin estndar toma en cuenta las desviaciones de todos los valores de la variable Si a todos los valores de la variable se le suma una misma constante la desviacin estndar no vara. Si a todos los valores de la variable se multiplican por una misma constante, la desviacin estndar queda multiplicada por el valor absoluto de dicha constante.
Donde: C.V. representa el nmero de veces que la desviacin tpica contiene a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la dispersin y menor la representatividad de la media.
Propiedades del Coeficiente de Variacin : Si a todos los valores de la variable se le suma una misma constante el coeficiente de variacin queda alterado .
Ejemplo: Suponga que Usted trabaja en una compaa de ventas, que ofrece como premio de incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la serie final de bisbol de las grandes ligas en los Estados Unidos (E,E,U,A,). De los registros de ventas se tienen los siguientes datos de ventas, expresados en porcentajes de cumplimiento de las metas fijadas mensualmente: Vendedor A 95 105 100 Vendedor B 100 90 110 El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es igual y equivale al 100%, pero Ud. Slo le puede dar el premio de incentivo a uno de ellos. Cul usted escogera?. En base a que criterio. Explique. Este problema se resuelve utilizando el coeficiente de variacin, para estos efectos es necesario encontrar la desviacin estndar trimestral de las ventas de cada uno de la siguiente manera: Vendedor A
Xi ( Xi ) ( Xi )2
La desviacin estndar es =(50/3) = 16.667 = 4.08, luego entonces el coeficiente de variacin es igual a: 4.08 C.VA= --------- = ----------- = 0.0408 100
Vendedor B
Xi 100 90 ( Xi ) ( Xi )2
110
110 100 = 10
Total
XXX
La desviacin estndar es =(200/3) = 66.667 = 8.16, luego entonces el coeficiente de variacin es igual a:
Respuesta: Dado que el vendedor A tiene menor coeficiente de variacin, A l le corresponde recibir el premio de incentivo.
LABORATORIO
(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial) Problema #1:Datos no agrupados Calcule el rango, la varianza y la desviacin estndar de las observaciones que se presentan a continuacin. 63 45 39 55 69 21 50 25 33 25 Problema #2: Un profesor hace un examen a tres estudiantes y las puntuaciones resultantes (Xi) son: 73, 75 y 77. I. II. Hallar la media, la varianza y la desviacin estndar de esta poblacin de valores En la clase hacia un calor terrible, y hubo alarma por la amenaza de incendio durante el examen. El profesor quisiera aumentar las puntuaciones para tener en cuenta estas condiciones desafortunadas de ambientacin. Un primer aumento suma 10 puntos a cada puntuacin. Sea Yi = Xi+10. Halle , 2 y . Un segundo aumento incrementa cada puntuacin en un 10%. Sea Pi =1.1(Xi). Halle , 2 y . El ltimo aumento es una combinacin de los dos primeros. Est es, cada puntuacin se incrementa en un 10% y luego se suman 10 puntos ms. Sea Zi = 1.1(Xi)+10. Halle . 2 y ..
III. IV.
Problema #3:Datos Agrupados La distribucin de frecuencias que se presenta a continuacin muestra el tiempo que se necesita para envolver 130 paquetes que fueron enviados por correo en Macondo.
Calcule el rango, la varianza y la desviacin estndar de la siguiente distribucin de frecuencias de los datos:
Tiempo (en minutos) 0.5 a menos de 1.0 1.0 a menos de 1.5 1.5 a menos de 2.0 2.0 a menos de 2.5 2.5 a menos de 3.0 3.0 a menos de 3.5 Total No.de paquetes envueltos 6 12 30 42 28 12 130
Problema #4:Coeficiente de Variacin Los datos a continuacin describen las distribuciones de puntuaciones en determinados grupos ocupacionales sometidos a la prueba general de clasificaciones del ejercito durante el ltimo ao.
Ocupaciones Contador Abogado Periodista Vendedor Plomero Camionero Campesino Carpintero N 172 94 45 492 128 817 817 77 128.1 127.1 124.5 109.2 102.7 96.2 91.4 89.0 S 11.7 10.9 11.7 16.3 16.0 19.7 20.7 19.6 Rango 94-157 96-157 100-157 42-149 56-139 16-149 24-141 45-145
Compare los resultados obtenidos para cada grupo ocupacional utilizando el coeficiente de variacin y el rango o recorrido. Comente los resultados. Problema #5: Coeficiente de Variacin
La tabla a continuacin indica los salarios bsicos por hora (en unidades monetarias) en abril 200X para ciertas categoras ocupacionales de obreros sindicalizados en cierto sector de la construccin. Determine cul es la ocupacin en la que existe la mayor variacin en los salarios bsicos y cul es la que muestra la menor variacin. Para hacer estas comparaciones deber utilizar el coeficiente de variacin. Salarios bsicos por hora, segn tipo de trabajo y lugares encuestados
Ocupacin Albailes Carpinteros Electricistas Pintores Enyesadotes Plomeros Ayudantes A 6.290 5.900 7.500 7.170 5.920 8.000 4.020 B 7.375 7.020 7.600 6.735 7.045 4.450 4.780 C 5.750 5.370 6.700 4.750 5.940 6.250 3.180 D 7.500 6.660 7.335 6.110 6.825 7.080 4.700