Professional Documents
Culture Documents
Universidad
Santander
Rodolfo Gallardo-Rosales
gallardo33@gmail.com
01 02 03 04 05 06
Conceptos fundamentales
E t d ti descriptiva
Estadstica
d
i ti
Probabilidad
Estimacin
Prueba de hiptesis sobre poblaciones
Prueba de hiptesis
p
sobre proporciones
p p
Estadstica descriptiva
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
TABLA DE DATOS
14 a 15
16 a 17
18 a 19
20 o ms
99
142
Estadstica descriptiva
01 02 03 04 05 06
GRAFICO DE CIRCULO
EDAD DE LOS
ENCUESTADOS
2
6
14 a 15
99
16 a 17
18 a 19
20 o ms
142
Estadstica descriptiva
01 02 03 04 05 06
HISTOGRAMA
((GRAFICO DE BARRAS))
EDAD DE LOS
ENCUESTADOS
160
142
140
120
100
99
80
60
40
20
18 a 19
20 o ms
0
14 a 15
16 a 17
Estadstica descriptiva
01 02 03 04 05 06
OJIVA
(Distribucin acumulativa de frecuencia)
frecuencia
frecuencia
Numerode Fronterasde
frecuencia acumulativ
grupo
grupo
a
frecuencia
frecuencia
acumulativa
relativa
35X<45
(2)
2/50
2/50
0,04
45X<55
(2+2)
4/50
0,08
55X<65
11
(7+4)
11/50
0,22
65X<75
13
24
(13+11)
24/50
24/50
0 48
0,48
75X<85
11
35
(11+24)
35/50
0,70
85X<95
11
46
(11+35)
46/50
0,92
95X<105
50
(4+46)
50/50
50/50
1 00
1,00
50
Estadstica descriptiva
01 02 03 04 05 06
OJIVA
(Distribucin acumulativa de frecuencia)
20
40
Estadstica descriptiva
60
80
100
120
01 02 03 04 05 06
MEDIDAS DE TENDENCIA
CENTRAL
Son valores numricos que
localizan, en algn sentido, el
centro de un conjunto de datos.
Es frecuente que el trmino
promedio se asocie con todas
las medidas de tendencia
central.
Estadstica descriptiva
01 02 03 04 05 06
Media (Media aritmtica):
Es el promedio con el que probablemente estemos ms
familiarizados. La media muestral se representa por x
(lase x barra o media muestral). La media se
encuentra
t all sumar todos
t d los
l valores
l
de
d la
l variable
i bl x ((esta
t
suma de valores se simboliza como x ) y dividir la suma
entre el nmero de estos valores , n (el tamao muestral).
Expresamos esto mediante frmula como
suma de todas las x
Media muestral: x barra = ---------------------------nmero de las x
x=
n
Estadstica descriptiva
01 02 03 04 05 06
EJEMPLO
Un conjunto de datos consta de cinco valores:
6 3,
6,
3 8
8, 6
6, y 4
4. E
Encuentre
t lla media.
di
SOLUCION:
Con la frmula anterior, encontramos:
x =
6+ 3+8+ 6+ 4
27
=
= 5 .4
=
5
5
Estadstica descriptiva
01 02 03 04 05 06
Mediana:
Es el valor de los datos que ocupa la
posicin media cuando los datos estn
clasificados
l ifi d en orden
d de
d acuerdo
d con
su tamao. La mediana muestral se
representa por ~
x (lase x tilde o
mediana muestral).
muestral)
Estadstica descriptiva
01 02 03 04 05 06
Procedimiento para determinar la mediana:
PASO 1: Clasifique los datos
PASO 2: Determine la profundidad de la mediana. La profundidad,
o posicin (nmero de posiciones desde cualquiera de los
extremos), se determina con la frmula
nmero + 1
Profundidad de mediana:
2
n +1
~
d (x ) =
2
PASO 3
3: D
Determine
t
i ell valor
l d
de lla mediana.
di
C
Cuente
t llos d
datos
t
~
clasificados, localizando los datos en la posicin d (x )
La mediana ser la misma cualquiera que sea el extremo de los
datos clasificados (alto o bajo) desde el que se cuente.
cuente De hecho
hecho,
contar desde ambos extremos servir como excelente prueba.
Estadstica descriptiva
01 02 03 04 05 06
EJEMPLO DE MEDIANA PARA n IMPAR
Encuentre la mediana para el conjunto de datos
{6, 3, 8, 5, 3}
SOLUCION
PASO 1: Los datos, clasificados en orden de tamao, son:
3, 3, 5, 6 y 8
n +1 5 +1
PASO 2: Profundidad de la mediana: d ( ~
x) =
=
=3
(L 3.
(La
3 P
Posicin)
i i )
PASO 3: La mediana es el tercer nmero desde cualquier extremo
~
de los datos clasificados,
clasificados es decir: x = 5
Estadstica descriptiva
01 02 03 04 05 06
EJEMPLO DE MEDIANA PARA n PAR
Encuentre la mediana para el conjunto de datos
{9, 6, 7, 9, 10, 8}
SOLUCION
PASO 1: Los datos, clasificados en orden de tamao, son:
6, 7, 8, 9, 9 Y 10
~ n +1 = 6 +1
PASO 2: Profundidad de la mediana: d ( x ) =
= 3.5
8+9
~
x=
= 8.5
2
Estadstica descriptiva
01 02 03 04 05 06
MEDIDAS DE DISPERSION
Una vez que se ha localizado el medio mediante
la aplicacin de las medidas de tendencia central,
nuestra
t b
bsqueda
d d
de iinformacin
f
i a partir
ti d
de
conjuntos de datos se dirige ahora a las medidas
de dispersin. Las medidas de dispersin incluyen
el rango,
rango varianza y desviacin estndar
estndar.
Estos valores numricos describen la cantidad de
dispersin o variabilidad que se encuentra entre los
datos: los datos agrupados de manera estrecha
tienen valores relativamente pequeos y aquellos
datos que estn ms dispersos tienen valores ms
grandes.
Estadstica descriptiva
01 02 03 04 05 06
Rango:
Es la diferencia de valor entre los datos de valor ms
alto, H, y los de valor ms bajo, L.
rango = valor alto valor bajo
rango = H L
Por ejemplo:
La muestra
L
t 3,
3 4
4, 5,
5 6,
6 8 ti
tiene un rango d
de
H L = 8 3 = 5.
El rango de 5 nos dice que estos datos caen todos
ellos dentro de un intervalo de 5 unidades.
Estadstica descriptiva
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
Ejemplo:
Considere la muestra {6, 3, 8, 5, 3}, de la cual encontramos
su media:
x=
n
Estadstica descriptiva
01 02 03 04 05 06
Estadstica descriptiva
| x x |
n
01 02 03 04 05 06
| xx| 8
= = 1.6
Desviacin media absoluta =
n
Estadstica descriptiva
01 02 03 04 05 06
Varianza muestral:
La varianza muestral, s2, es la media del cuadrado de las
desviaciones, calculada usando n-1 como divisor:
suma de (cuadrado de desviaciones)
Varianza muestral: s2 = -----------------------------------------------------nmero 1
s2 =
2
(
x
x
)
n 1
Estadstica descriptiva
01 02 03 04 05 06
EJEMPLO:
Para encontrar la varianza de la muestra 6, 3, 8, 5, 3 se calcula:
---------------------------------------------------------------------------------------------------------------------P
Paso
1
Paso
P
2
P
Paso 3
P
Paso 4
P
Paso 5
2
Hallar x
Hallar
Hallar toda x Hallar ( x x )
Hallar s2
---------------------------------------------------------------------------------------------------------------------6
65= 1
(1)2 = 1
x
( x x )2
2
s =
x=
3
3 5 = -2
(-2)2 = 4
n 1
n
8
85= 3
(3)2 = 9
18
5
55= 0
(0)2 = 0
25
2
s
=
2
x
=
3
3 5 = -2
2
( 2) = 4
(-2)
4
5
----------------------------------------2
x = 25
x =5
(x x) = 0 (x x)
= 18
s = 4.5
----------------------------------------------------------------------------------------------------------------------
Estadstica descriptiva
01 02 03 04 05 06
D
Desviacin
i i muestral
t l estndar:
t d
s = raz
cuadrada
d d de
d varianza
i
muestral
t l
s = s2
Estadstica descriptiva
01 02 03 04 05 06
MEDIDAS DE POSICION
Las medidas de posicin se utilizan
para describir la posicin que un
dato especfico posee en relacin
con ell resto
t d
de los
l datos
d t cuando
d
estn en orden por categoras.
Cuartiles y percentiles son dos de
las medidas de posicin ms
populares.
Estadstica descriptiva
01 02 03 04 05 06
Cuartiles
Son valores de la variable que dividen los datos ordenados en
cuartos; cada conjunto de datos tiene tres cuartiles. El primer
cuqrtil Q1, es un nmero tal que a lo sumo 25% de datos son
cuqrtil,
menores en valor que Q1, y a lo sumo 75% son mayores. El segundo
cuartil es la mediana. El tercer cuartil, Q3, es un nmero tal que a lo
sumo 75% de los datos son menores en valor que Q3 y a lo sumo
25% son mayores.
Datos clasificados,, orden creciente
25%
25%
25%
Q1
Estadstica descriptiva
Q2
25%
Q3
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
Percentiles
Son los valores de la variable que dividen un conjunto de datos clasificados
en 100 subconjuntos iguales; cada conjunto de datos tiene 99 percentiles. El
k-simo percentil Pk es un valor tal que a lo sumo k% de los datos son
menores en valor q
que Pk y a lo sumo ((100 k)%
)% de los datos son mayores.
y
Percentiles
Datos clasificados, orden creciente
1% 1% 1% 1% 1%
L P1 P2 P3 P4
1% 1% 1% 1%
K-simo percentil
Datos clasificados, orden creciente
a lo
l sumo (100 k) %
a lo
l sumo k%
Pk
Estadstica descriptiva
01 02 03 04 05 06
Notas:
1. El primer cuartil y el 25avo percentil, son lo
mismo, es decir, Q1 = P25 Tambin Q3 = P75.
2 L
2.
La mediana,
di
ell segundo
d cuartil
til y ell 50avo
50
percentil son todos lo mismo: Med = Q2 =
P50. Por tanto, cuando se nos pida hallar P50
o Q2, usamos el procedimiento para hallar la
mediana
Estadstica descriptiva
01 02 03 04 05 06
INTERPRETACION Y COMPRENSION DE LA
DESVIACION ESTANDAR
Las desviacin estndar es una medida de
variacin (dispersin) en los datos. Se ha definido
como un valor calculado con el uso de frmulas.
An as, podemos preguntarnos qu es realmente
y cmo se relaciona con los datos. Es una clase de
medidor por el que podemos comparar la
variabilidad de un conjunto de datos con la de otro.
Esta
E
t medida
did particular
ti l puede
d comprenderse
d
mejor al examinar dos enunciados que nos dicen
cmo se relaciona la desviacin estndar con los
datos: la regla emprica y el teorema de
Chebyshev.
Estadstica descriptiva
01 02 03 04 05 06
Regla emprica
Si una variable est normalmente distribuida, entonces :
1. Dentro de una desviacin estndar de la media habr
aproximadamente 68% de los datos
2. Dentro de dos desviaciones estndar de la media, habr
aproximadamente 95% de los datos; y
3. Dentro de tres desviaciones estndar de la media, habr
aproximadamente 99.7% de los datos
Esta regla aplica de manera especfica a una distribucin
normal [en forma de campana], pero con frecuencia se
aplica como gua interpretativa a cualquier distribucin
agrupada.
Estadstica descriptiva
01 02 03 04 05 06
99.7%
95%
68%
x 3s
x 2s
Estadstica descriptiva
xs
x+s
x + 2 s x + 3s
01 02 03 04 05 06
Estadstica descriptiva
01 02 03 04 05 06
34% 34%
13.5%
13.5%
2.5%
Calificaciones z
2.5%
x 3s
x 2s
xs
x+s
x + 2s
x + 3s
-3
-2
-1
Estadstica descriptiva
01 02 03 04 05 06
Teorema de Chebyshev
La proporcin de cualquier distribucin que se
encuentre dentro de k desviaciones estndar de la
media es al menos
1
11 2
k
Donde k es cualquier
q
nmero positivo
p
mayor
y a 1.
Este teorema aplica a todas las distribuciones de
datos.
Estadstica descriptiva
01 02 03 04 05 06
1
1
1 3
=
1
=
1
= = 0.75
2
2
k
2
4 4
Estadstica descriptiva
01 02 03 04 05 06
Teorema de Chebyshev k=2
s
Al menos 3/4
x 2s
Estadstica descriptiva
x + 2s
01 02 03 04 05 06
1
1
1 8
1 2 = 1 2 = 1 = = 0.89
k
3
9 9
Estadstica descriptiva
01 02 03 04 05 06
Teorema de Chebyshev k=3
s
Al menos 8/9
x 3s
Estadstica descriptiva
x + 3s