You are on page 1of 31

DESCRIPCIÓN DE DATOS

MEDIDAS DE DISPERSION

ANALISIS DE DATOS EDUCATIVOS

UNIVERSIDAD AUTONOMA DE SANTO DOMINGO

MAESTRIA EN MATEMATICA PARA EDUCADORES


INTRODUCCIÓN

 Una medida de ubicación, como la media o la mediana,


solamente describe el centro de los datos. Desde este punto de
vista resulta valiosa, pero no dice nada sobre la dispersión de
los datos. Un valor pequeño en una medida de dispersión indica
que los datos se acumulan con proximidad alrededor de la
media aritmética. Por consiguiente, la media se considera
representativa de los datos. Por lo contrario, una medida grande
de dispersión indica que la media no es confiable.
MEDIDAS DE DISPERSIÓN

 Consideraremos diversas medidas de dispersión. El


rango se sustenta en los valores máximo y mínimo del
conjunto de datos. La desviación media, la varianza y la
desviación estandar se basan en desviaciones de la media
aritmética.
 Rango
La medida mas simple de dispersión es el rango.
Representa la diferencia entre los valores máximo y
mínimo de un conjunto de datos. En forma de ecuación:
DESVIACIÓN MEDIA

 Un problema que presenta el rango estriba en que parte de dos


valores, el mas alto y
 el mas bajo; no toma en cuenta todos los valores. La desviación
media si lo hace; mide la
 cantidad media respecto de la cual los valores de una poblacion
o muestra varian.
 Expresado esto en forma de definicion:

 DESVIACIÓN MEDIA: Media aritmetica de los valores


absolutos de las desviaciones con respecto a la media aritmetica.
 En el caso de una muestra, la desviacion media, designada DM,
se calcula mediante la formula:
La desviación media posee dos ventajas. Primero, incluye todos los valores de
los cálculos. Recuerde que el rango solo incluye los valores máximo y mínimo.
Segundo, es fácil de definir: es la cantidad promedio que los valores se desvian
de la media. Sin embargo, su inconveniente es el empleo de valores absolutos.
Por lo general, es difícil trabajar con valores absolutos, así que la desviación
media no se emplea con tanta frecuencia como otras medidas de dispersión,
como la desviación estandar.
VARIANZA Y DESVIACIÓN ESTÁNDAR

La varianza y la desviación estándar también se fundamentan en las


desviaciones de la media. Sin embargo, en lugar de trabajar con el valor
absoluto de las desviaciones, la varianza y la desviación estandar lo hacen con
el cuadrado de las desviaciones.

VARIANZA: Media aritmética de las desviaciones de la


media elevadas al cuadrado. La varianza es no negativa y
es cero solo si todas las observaciones son las mismas.

DESVIACIÓN ESTÁNDAR: Raíz cuadrada de la varianza.


 Varianza de la población: Las formulas de la varianza
poblacional y la varianza de la muestra son ligeramente
diferentes. La varianza de la población se estudia primero.
(Recuerde que una población es la totalidad de las
observaciones estudiadas.) La varianza de la población se
determina de la siguiente manera:
 Desviación estándar de la población Tanto el rango como la
desviación media resultan faciles de interpretar. El rango es la
diferencia entre los valores alto y bajo de un conjunto de datos,
y la desviación media es la media de las desviaciones de la
media. Sin embargo, la varianza resulta difícil de interpretar en
el caso de un solo conjunto de observaciones. Existe una
forma de salir del problema. Si extrae la raíz cuadrada de la
varianza de la población, puede convertirla a las mismas
unidades de medición empleadas en los datos originales.
VARIANZA MUESTRAL
Varianza muestral: La formula para la media poblacional es μ = ΣX/N .
Sencillamente cambie los símbolos para la media de la muestra; es decir, por la
formula , la conversión de una varianza poblacional en una varianza
muestral no es tan directa. Requiere un cambio en el denominador. En lugar de
sustituir n (el numero en la muestra) por N (el numero en la población), el
denominador es n – 1. Asi, la formula de la varianza muestral es:
 Desviación estándar de la muestra La desviación estandar
de la muestra se utiliza como estimador de la desviación
estandar de la población. Como se hizo notar, la desviación
estandar de la población es la raíz cuadrada de la varianza de la
población. Asimismo, la desviación estándar de la muestra es
la raíz cuadrada de la varianza de la muestra. La desviación
estandar de la muestra se calcula con mayor facilidad de la
siguiente manera:
INTERPRETACIÓN Y USOS
DE LA DESVIACIÓN ESTÁNDAR

 Teorema de Chebyshev
 Ya se ha insistido en el hecho de que una desviación estándar
pequeña para un conjunto de valores, indica que estos valores se
localizan cerca de la media. Por lo contrario, una desviación
grande revela que las observaciones se encuentran muy dispersas
con respecto a la media. El matemático ruso P. L. Chebyshev
(1821-1894) estableció un teorema que nos permite determinar la
mínima porción de valores que se encuentran a cierta cantidad de
desviaciones estandares de la media.
 Por ejemplo, de acuerdo con el teorema de Chebyshev, por lo
menos tres de cuatro valores, o 75%, deben encontrarse entre
la media mas dos desviaciones estándares y la media menos dos
desviaciones estándares. Esta relación se cumple con
independencia de la forma de la distribución. Además, por lo
menos ocho de los nueve valores, 88.9%, se encontraran mas de
tres desviaciones estándares y menos tres desviaciones
estándares de la media. Por lo menos 24 de 25 valores, o 96%,
se encontrará entre más y menos cinco desviaciones estándares
de la media.
LA REGLA EMPÍRICA
 El teorema de Chebyshev tiene que ver con cualquier conjunto
de valores; es decir, que la distribución de valores puede tener
cierta forma. Sin embargo, en cualquier distribución simétrica
con forma de campana, como muestra la grafica 3.7, es posible
ser mas precisos en la explicación de la dispersión en torno a la
media. Estas relaciones que implican la desviación estándar y
la media se encuentran descritas en la regla empírica, a veces
denominada regla normal.
DIAGRAMA DE TALLOS Y HOJAS
 El diagrama "tallo y hojas" (Stem-and-Leaf Diagram)
permite obtener simultáneamente una distribución de
frecuencias de la variable y su representación gráfica.
Para construirlo basta separar en cada dato el último
dígito de la derecha (que constituye la hoja) del bloque
de cifras restantes (que formará el tallo).
 Esta representación de los datos es semejante a la de un
histograma pero además de ser fáciles de elaborar,
presentan más información que estos.
 Un diagrama donde cada valor de datos es dividido en una
"hoja" (normalmente el último dígito) y un "tallo" (los otros
dígitos). Por ejemplo "32" sería dividido en "3" (tallo) y "2"
(hoja).

Los valores del "tallo" se escriben hacia abajo y los valores


"hoja" van a la derecha (o izquierda) del los valores tallo.

El "tallo" es usado para agrupar los puntajes y cada "hoja"


indica los puntajes individuales dentro de cada grupo.
 El diagrama de tallo y hojas (Stem-and-Leaf Diagram) es un
semigráfico que permite presentar la distribución de
una variable cuantitativa. Consiste en separar cada dato en el
último dígito (que se denominahoja) y las cifras delanteras
restantes (que for
 Es especialmente útil para conjuntos de datos de tamaño medio
(entre 20 y 50 elementos) y que sus datos no se agrupan
alrededor de un único tallo. Con él podemos hacernos la idea de
qué distribución tienen los datos, la asimetría, etc.man el tallo).
 El nombre de tallo y hojas hace referencia a la ramificación
de una planta, siendo los dígitos delanteros marcan el tallo
donde se encuentra el número y el dígito final la hoja.
 Este diagrama se utilizaba más en los años 80 y 90, cuando los
ordenadores no dibujaban gráficosaunque si que escribían
dígitos.
CONSTRUCCIÓN DEL DIAGRAMA DE TALLO Y HOJAS
 Para construir el diagrama de tallo y hojas, debemos seguir los
siguientes pasos:
 Ordenar los datos.

 Redondear los números (en el caso de que no lo estén) hasta


tengan las cifran que queramos. Por ejemplo, si tenemos el
número 3,62856 y queremos que tenga 2 dígitos, lo redondeamos
a 3,63.
 Dibujar una tabla con dos columnas, la primera columna para el
tallo y la segunda para las hojas. Disponer todos los tallos en la
primera columna en orden descendente. Cada tallo solo se
escribe una vez.
 Registrar en la segunda columna todas las hojas, en orden
creciente, junto al tallo correspondiente.
DIAGRAMA DE PUNTOS

 Un diagrama de puntos es una gráfica utilizada para ilustrar un


número reducido de datos, la cual permite identificar con
facilidad dos características:
 1. La localización de los datos.
 2. La dispersión o variabilidad de los datos.
 Este diagrama muestra cada uno de los elementos de un
conjunto de datos numéricos por encima de una recta numérica
(eje horizontal), facilita la ubicación de los espacios vacíos y
los agrupamientos en un conjunto de datos, así como la manera
en que estos datos se distribuyen a los largo del eje horizontal.
 Los pasos para construir el diagrama son:
 Paso # 1: Trazar una línea horizontal con el valor mínimo
colocado en el extremo izquierdo, seleccionar una escala y
utilizando intervalos regulares, marcar la escala hasta que el
valor máximo sea alcanzado.
 Paso # 2: Para cada valor numérico presente en la tabla de
datos, colocar un punto sobre la escala de valores en la recta
numérica, cuando el valor numérico aparece más de una vez,
apilar los puntos.
 Ejemplo:
 La tabla siguiente muestra los datos de longitud en milímetros
de un conjunto de cables que serán utilizados en un estudio de
resistencia a la tensión:
Cable Longitud Cable Longitud Cable Longitud Cable Longitud

1 20 6 110 11 20 16 150

2 40 7 200 12 100 17 40

3 40 8 110 13 90 18 150

4 40 9 120 14 80 19 10

5 80 10 20 15 100 20 20
 Construir un diagrama de puntos

You might also like