You are on page 1of 39

Estadística

Capítulo 3
3.1
1

Medidas numéricas
descriptivas

2-2008 1
Medidas

 Tendencia
d Centrall
 Variación

 Forma

2-2008
2
Medidas de Tendencia Central

La mayoría de los levantamientos de


encuestas mantienen una tendencia bien
definida a agruparse o aglomerarse
alrededor de cierto punto central.

Siempre se puede obtener un valor típico


que representa o describe a todos los
demás datos de la muestra.

2-2008
3
Medidas de Tendencia Central

 Media Aritmética
 Mediana
 Moda
 Rango Medio
 Eje medio

2-2008
4
M di A
Media Aritmética
it éti

2-2008 5
Media Aritmética

Es la medida de tendencia central más


utilizada, también se le conoce con el
nombre de Promedio.

Para calcular la media aritmética,


aritmética se
suman todos los datos de la muestra y el
resultado se divide entre el total de datos
datos.
2-2008
6
Media Aritmética
El símbolo que representa a la media aritmética
es una letra X con una barra sobre ella
ella.
n

x i
X 1
n
La letra x significa uno de los datos de la muestra y la i es el
conteo de los datos específicos
2-2008
7
Media
d Aritmética
é

La fórmula en su esquema de desarrollo


se presenta de la siguiente manera:

x1  x2  x3  x4  ...  xn
X
n

2-2008
8
Se define en minutos el tiempo que le lleva
arreglarse, desde que se levanta hasta que sale
de casa. A lo largo
g de 10 días hábiles
consecutivos, Usted recaba los tiempos
(redondeados a minutos) que se muestra a
continuación

39 29 43 52 39
44 40 31 44 35

2-2008
9
39 29 43 52 39
DATOS
44 40 31 44 35
10

x i
X i 1
10
39  29  43  52  39  44  40  31  44  35
X
10
396 El tiempo que tarda
X para arreglarse es
10 aproximadamente 40
X  39.6 min minutos cada día
2-2008
10
Mediana

~
X
2-2008 11
Mediana

Es el valor medio de un arreglo ordenado de


datos éi
d t numérico, sii no h
hay empates,
t lla primera
i
mitad de las observaciones será menor que la
mediana
di y lla segundad mitad á mayor.
it d será

Si un valor extremo se presenta en una


secuencia de datos, es mejor utilizar la
mediana
mediana.
2-2008
12
Mediana

La mediana es el valor tal que el 50% de los


datos so
son menores
e o es y eel ot
otro
o 50% so
son mayores
ayo es

~ n 1
X  ValorPosic
V l P i iónió ( )
2
Ojo: se muestra una pequeña diferencia cuando
el total de datos de la muestra es par o impar
2-2008
13
Mediana

Regla 1
Si el número de datos es impar, la mediana
es el dato que queda exactamente en el
medio del arreglo ordenado

Datos Menores , , Datos Mayores

2-2008
14
Calcular la mediana de una muestra de
ti
tiempos que se ttarda
d una persona en
arreglarse durante 9 días.

39 29 43 52 39
44 40 31 44

2-2008
15
Datos de la muestra ordenados
29 31 39 39 40 43 44 44 52

Tamaño de la muestra
N=9
Formulación
~ n 1
X  ValorPosic ión ( )
2-2008
2
16
~ 9 1
X  ValorPosic
V l P i iónió ( )
2
~ 10
X  ValorPosic ión ( )
2
~
X  ValorPosic ión (5)
2-2008
17
Ubicar la posición 5.
29 31 39 39 40 43 44 44 52
1 2 3 4 5 6 7 8 9

Mediana
~
X  40
El 50% del tiempo
tiempo, una persona tarda menos de 40
minutos en arreglarse
2-2008
18
Mediana

Regla 2
Si el número de datos es par
par, la mediana es el
promedio de los dos datos medios del arreglo
ordenado
Datos Menores , a , b , Datos Mayores
~ a b
X ( )
2

2-2008
19
Se define
S d fi en minutos
i t ell titiempo que lle lllleva
arreglarse, desde que se levanta hasta que sale de
casa A lo largo de 10 días hábiles consecutivos
casa. consecutivos,
Usted recaba los tiempos (redondeados a minutos)
que se muestras a continuación

39 29 43 52 39
44 40 31 44 35

2-2008
20
Se ordenan los datos
29 31 35 39 39 40 43 44 44 52
Ubicar la posición
p del valor de la mediana
~ 10  1
X  valorposición( )
2
Posición
~ 11
X  valorposición( ) impar
2
~
X  valorposición(5.5)
2-2008
21
Para el resultado 5.5, buscar la posición 5
Y la p
posición 6.
29 31 35 39 39 40 43 44 44 52
1 2 3 4 5 6 7 8 9 10

Mediana

~ 39  40
X
2
~
X  39.5 El 50% del tiempo me tardo menos de
39.5 minutos.
2-2008
22
Moda

X
2-2008 23
Moda

Es el valor que aparece con mayor


frecuencia en un conjunto de datos.

La ocurrencia de un dato extremo no afecta


el resultado de la moda. De igual manera
puede darse lo siguiente:

2-2008
24
Moda

 La moda esté en los extremos


 Exista más de una moda

 La
L modad no existe
i t

Recordar siempre que la moda es el dato


que más
á veces se repite
it en una muestra
t
2-2008
25
Moda
Observaciones
 E útil sólo
Es ól como d
descripción
i ió generall

 S utiliza
Se tili con ell arreglo
l ordenado
d d

2-2008
26
Se define
S d fi en minutos
i t ell titiempo que lle lllleva
arreglarse, desde que se levanta hasta que sale de
casa A lo largo de 10 días hábiles consecutivos
casa. consecutivos,
Usted recaba los tiempos (redondeados a minutos)
que se muestras a continuación

39 29 43 52 39
44 40 31 44 35

2-2008
27
 Los datos de ordenan de menor a mayor

29 31 35 39 39 40 43 44 44 52
1 2 3 4 5 6 7 8 9 10

 Buscar el número que más se repite


 De 39 minutos hay 2 días
 De 44 minutos hay 2 días

2-2008
28
29 31 35 39 39 40 43 44 44 52
1 2 3 4 5 6 7 8 9 10

 La mayoría
L í ddell ti
tiempo se ttarda
d 39 ó 44 minutos
i t en
arreglarse.

2-2008
29
Cuantiles

Los cuantiles son medidas de posición “no


central” q
que se utilizan con mayor
y frecuencia y
se emplean sobre todo para resumir o describir
las propiedades de conjuntos grandes de datos
numéricos.

 Cuartiles

 Deciles

 Percentiles
2-2008
30
Cuartiles

De la misma manera que la mediana divide un


conjunto de datos en dos grupos iguales, los
cuartiles lo dividen en cuatro grupos iguales.
Cada grupo está formado por 25% de los datos
de la muestra y se denotan por Q1, Q2 y Q3
respectivamente

25% 25% 25% 25%

2-2008 Q1 Q2 Q3
31
Cuartiles

La obtención de los cuartiles depende del número de datos


de la muestra; se utilizan los mismo conceptos del cálculo
de la mediana. Las fórmulas para cada los cuartiles 1 y al
vienen a ser:
n 1
Q1  ValorPosición( )
4
2(n  1)
Q2  ValorPosición( )
4
3(n  1)
Q3  ValorPosición( )
2-2008 4
32
Se define
S d fi en minutos
i t ell titiempo que lle lllleva arreglarse,
l d
desde
d que se
levanta hasta que sale de casa. A lo largo de 10 días hábiles
consecutivos, Usted recaba los tiempos (redondeados a minutos) que
se muestras a continuación

39 29 43 52 39
44 40 31 44 35

2-2008
33
Cuartil 1

Tamaño de la muestra N=10

29
n 1
31 Q1  VP ( )
3 35 4
39 10  1
39 Q1  VP ( )
40 4
43 Q1  VP ( 2 .75 )
44
44
Q1  VP (3)
2-2008
52 Q1  35
34
Cuartil 2
Tamaño de la muestra N=10

29
n 1
31 Q 1  VP ( )
35 4
39 2 (10  1 )
Q 2  VP ( )
39 4
5.5 40
Q 2  VP ( 5 . 5 )
43
39  40
44 Q2 
44 2
52 Q 2  39 . 5
2-2008
35
Cuartil 3
Tamaño de la muestra N=10

29
31 n 1
35
Q 1  VP ( )
4
39
3 (10  1 )
39 Q 3  VP ( )
40
4
43 Q 3  VP ( 8 . 25 )
8 44 Q 3  VP ( 8 )
44
52
Q 3  44
2-2008
36
Deciles

Los deciles dividen una muestra en 10 grupos


iguales
g y cada decil acumula el 10%
0% de los
datos.

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

Se trabajan igual que los cuartiles

2-2008
37
Percentiles

Los percentiles dividen una muestra en 100


grupos iguales
g g y cada percentil acumula el 1%
de los datos.

1% 1% 1% 1% 1% 1% 1%

Se trabajan igual que los cuartiles y deciles

2-2008
38
Fin del capítulo 3
3.1
1
C ti ú ell capítulo
Continúa ít l 33.2
2

2-2008 39

You might also like