You are on page 1of 10

Estadstica 4 ao 2012 - 1 -

Estadstica


Definiciones bsicas:

+ Estadstica: disciplina cientfica que crea, desarrolla y aplica los
adecuados mtodos de recopilacin de datos, y su evaluacin para
transformarlos en informaciones con las cuales se describan objetivamente
las situaciones investigadas, se analice el comportamiento de determinadas
caractersticas y se tomen decisiones en condicin de incertidumbre
1


+ Experimento: observacin planeada de un fenmeno de cualquier ndole con
el objetivo de conocer su comportamiento, poder describirlo y/ tomar una
decisin.

+ Unidad experimental: cada uno de los entes que son observados en el
experimento.

+ Medicin: asignacin de smbolos, numerales o nmeros a ciertas
caractersticas de las unidades experimentales conforme a escalas o reglas
pre-establecidas.

+ Dato estadstico: valuacin cualitativa o cuantitativa de un evento, es el
resultado de una medicin. En dichas mediciones se usan escalas nominales
y ordinales cuando la variable es cualitativa, y escalas de intervalo y de
razn para variables cuantitativas. La diferencia esencial entre las dos
ltimas es que en la de intervalo, el cero no necesariamente indica
ausencia de la caracterstica que se mide, mientras que en la de razn s.

+ Universo o poblacin: conjunto de Unidades Experimentales que presentan
caractersticas comunes observables, para obtener informacin sobre un
hecho puntual. Pueden ser universos finitos o infinitos.

+ Muestra: subconjunto del universo.

+ Variable: caracterstica cualitativa o cuantitativa de las unidades
experimentales.

+ Recorrido de una variable: conjunto de los posibles valores que puede
asumir una variable.

+ Cantidades absolutas: datos cualitativos que son presentados y/o
analizados expresados en la unidad de medida correspondiente a la magnitud
que estn midiendo.

+ Cantidades relativas: datos cuantitativos igual al cociente entre dos
cantidades absolutas. Son nmeros puros.

Etapas del trabajo estadstico.

Enunciacin del problema, identificacin de la variable y delimitacin del
Universo.
Seleccin de los instrumentos de medicin.
Recopilacin de datos
Presentacin de datos
Anlisis de datos.
Interpretacin de datos.


1
Estadstica: nociones bsicas (4 edicin) M.G. Sotello 3C Editores, Argentina 1996.
Estadstica 4 ao 2012 - 2 -
En cuanto a la presentacin de datos, puede hacerse mediante dos tcnicas:

Cuadro o Tabla estadstica: arreglo de fila y columnas que sirve para la
presentacin y organizacin de los datos.
Hay dos tipos:
~ Cuadros de referencia: habitualmente usados como fuente de
publicacin.
~ Cuadros de anlisis: se usan para facilitar los clculos
necesarios para el anlisis de los datos.

Grfico estadstico: grficos que por su simpleza permiten una rpida
comprensin de su contenido. P. ej: sistema de ejes cartesianos
ortogonales, mapas, figuras geomtricas, etc.

En cuanto al anlisis de datos, existen tres mtodos:
~ Anlisis estadstico descriptivo.
~ Anlisis estadstico inferencial.
~ Anlisis probabilstico.



Anlisis descriptivo:

Fila de datos: conjunto de datos dispuestos tal cual se presentan sin ser
organizados numricamente.

Ordenaciones: datos que han sido ordenados en forma creciente o
decreciente. Se llama rango o amplitud de ese conjunto a la diferencia
entre el mayor y el menor de los datos.

Datos agrupados en clases: datos dispuestos ordenadamente en grupos
llamados clases.



Variables cuantitativas discretas (VCD)

Frecuencia absoluta simple: cantidad de veces que se repite un valor de la
VCD
Generalmente:
x:variable
f
i
: frecuencia absoluta simple correspondiente al i-simo valor
de la variable
n: cantidad de observaciones

Verificndose que:



Representacin grfica: grfico de bastones

Frecuencia absoluta acumulada (F
i
): es la cantidad de unidades
experimentales con valor observado menor o igual a cierto valor dado de la
VCD.
Representacin grfica: grfico escalonado o en escalera.


= =
=
=
n f n f
i
n i
1 i
i

Estadstica 4 ao 2012 - 3 -



Variables cuantitativas continuas (VCC)

Intervalo de clase: para estudiar adecuadamente las VCC es necesario agrupar
los datos en intervalos de clase.
Generalmente se sugiere trabajar con entre 6 y 15 intervalos.

Amplitud total observada (A): es la diferencia entre los valores mximo y
mnimo de la VCC. Es decir: A= x
M
-x
m


Amplitud de cada intervalo (a): es el cociente entre la amplitud total
observada y la cantidad de intervalos (h). Es decir a=A:h.

Lmites, o fronteras, de un intervalo: son los valores mnimo (L
i
) y mximo
(L
s
) de la VCC en el intervalo.

Marca de clase: es el valor medio de cada intervalo.

Ejemplo 2:
x
1
=0, x
2
=200. Dividir los valores en 5 intervalos. Indicar la amplitud total, la
amplitud de cada intervalo, las marcas de clase y los lmites superior e inferir del
3 intervalo.



Ejemplo 1:

Se censaron 20 familias y, entre otros datos, se registraron los siguientes:
2 familias tienen 5 hijos c/u
4 familias tienen 4 hijos c/u
7 familias tienen 3 hijos c/u
4 familias tienen 2 hijos c/u
3 familias tienen 1 hijos c/u

a) Indicar y clasificar la variable en estudio.
b) Construir un cuadro de frecuencias simples y simples acumuladas.
c) Graficar ambas frecuencias
d) Cuntas familias tienen 3 hijos?
e) Cuntas familias tienen hasta 3 hijos?
f) Cuntas familias tienen menos de 3 hijos?
g) Cuntas familias tienen ms de 3 hijos?

x
1
f
i
F
i









Grfico escalonado
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1 2 3 4 5 6 7
x
F
i
Grfico de bastones
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
x
f
i
Estadstica 4 ao 2012 - 4 -
Frecuencia absoluta simple: cantidad de observaciones cuyo valor de
variable pertenece a una misma clase o intervalo de clase. (f
i
)
Se representan grficamente con un histograma.

Frecuencia absoluta acumulada: cantidad de observaciones que tienen un
valor de la variable menor al lmite superior de cada intervalo.
Se representan grficamente con una ojiva.

Ejemplo 3:
Se miden las alturas correspondientes a los 25 alumnos de 4 grado obtenindose los
siguientes resultados (en centmetros):

110 118 124 104 106 111 103 111 114 111 122 117 114
119 101 105 113 116 108 128 112 107 116 110 115


a) Halle la amplitud total
b) Organice los datos en seis intervalos.
c) Indique la amplitud de intervalo.
d) Construya una tabla con las frecuencias absolutas simples y acumuladas. Qu
relacin observa entre ellas y el total de observaciones?
e) Grafique ambas frecuencias.


x (Alturas) f
i
F
i






















Frecuencia relativa simple o acumulada: es el cociente entre la frecuencia
absoluta, simple o acumulada, y la cantidad total de observaciones.
Nos permite medir la importancia que tiene cada valor de la variable, o cada
intervalo de clase, en el conjunto de datos observados.
Generalmente se expresa en porcentajes.






Ejemplo 4:
a) Utilizando la distribucin de frecuencia del
ejemplo 1 construir una tabla de frecuencias
relativas simples y acumuladas.
b) Qu porcentaje de familias tiene 4 hijos?
c) Qu porcentaje tiene menos de cuatro hijos?
d) Qu porcentaje de familias tiene al menos 4
hijos?


x
i
f
i
F
i
f
ri
F
r
1 2
2 4
3 7
4 4
5 3

Histograma
0
1
2
3
4
5
6
7
8
9
10
95 100 105 110 115 120 125 130 135
//
F
r
e
c
u
e
n
c
i
a
s

a
b
s
o
l
u
t
a
s

s
i
m
p
l
e
s
Ojiva
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
95 100 105 110 115 120 125 130 135
//
F
r
e
c
u
e
n
c
i
a
s

a
b
s
o
l
u
t
a
s

a
c
u
m
u
l
a
d
a
s
1 f 0
n
f
f
i i
r
i
r
s s = con
1 F 0
n
F
F
i
r
i
i
r
s s = con
Estadstica 4 ao 2012 - 5 -



Ejemplo 5:
a) Utilizando la distribucin de frecuencia del
ejemplo 3 construir una tabla de frecuencias
relativas simples y acumuladas.
b) Qu porcentaje chicos mide entre 115 y 120cm?
c) Qu porcentaje mide menos de 115cm?
d) Qu porcentaje mide ms de 120cm?


x
i
f
i
F
i
f
ri
F
r
100-105 3
105-110 4
110-115 9
115-120 6
120-125 2
125-130 1




Medidas que resumen informacin

Son nombradas y tratadas segn como hayan sido recopilados los datos:
Parmetros: son medidas poblacionales, es decir, sobre datos de una
poblacin.
Estimadores: son medidas muestrales, es decir, sobre datos de una muestra.

Segn qu se quiera describir o medir, las medidas pueden ser:
De concentracin
De tendencia central o posicin
De variabilidad o dispersin
De forma


Medidas de concentracin

Son medidas que permiten establecer la frecuencia, absoluta o relativa, que
se concentra dentro de un intervalo dado o viceversa.

Frecuencia acumulada hasta un valor dado de la variable: mide la
concentracin de datos existente entre el mnimo valor de la variable en
una distribucin de frecuencias y un valor dado de ella.




x
0
: valor de la variable cuya FAA se quiere interpolar
s: orden del intervalo que contiene a x
0

F
(s-1)
: FAA hasta el intervalo anterior al que contiene a x
0


Ejemplo 6:
A partir de la distribucin de frecuencias del ejemplo 3 calcule:
a) El porcentaje de alumnos cuya altura es inferior a los 118cm.
b) El porcentaje de alumnos cuyas alturas varan entre los 112 y los 127 cm.

Percentiles:

De manera inversa a la anterior, es posible hallar el valor de la variable, o
fractil, hasta donde se acumula una frecuencia relativa determinada. Si la FR
est dada en porcentaje, dicho valor de la variable se llama percentil.

Segn se desee ordenar las variables
observadas en grupos, se necesitarn
calcular cuartiles, deciles, etc.



( ) ( ) s
s
s x
f
a
Li x
F F

+ =

0
1
0
Estadstica 4 ao 2012 - 6 -
ORP: En el percentil de orden k, k representa la FRA hasta el valor de la
variable que se quiere calcular, en porcentaje, y se la denomina Orden
relativo del percentil ORP

OAP: Orden absoluto del percentil, es la FAA correspondiente al valor k y se
obtiene calculando el k% del total de las observaciones n




~ Para variables discretas:
Hallamos el OAP
Buscamos el primer valor de la FAA que lo supera. El valor de la variable
correspondiente es el percentil deseado.
Si el OAP coincide con la FAA, entonces el percentil es la semisuma del
valor de la variable correspondiente y el siguiente.

~ Para variables continuas:




Ejemplo 7:
A partir de la distribucin de frecuencias del ejemplo 1 calcule los
percentiles 50 y 80


Ejemplo 8:
A partir de la distribucin de frecuencias del ejemplo 3 calcule las alturas
superadas slo por el 10% y las no superadas por slo el 20%.

Ejemplo 9:
Halle grficamente la FA hasta el valor 118 ya calculada en forma analtica.


Medidas de tendencia central o de posicin

Modo o moda Mo
(x)
: es el valor de la variable que se presenta con mayor
frecuencia. Para VCD es suficiente con observar las frecuencias simples.
Para VCC el intervalo de mayor frecuencia, si existe, es el intervalo
modal siendo el modo un valor de la variable perteneciente a dicho
intervalo que puede hallarse por interpolacin:



Con:
o: orden del intervalo modal
Li
o
: lmite inferior del intervalo modal
d
1
: diferencia entre la frecuencia simple del intervalo modal y la frecuencia
simple del intervalo anterior [f
o
f
(o-1)
]
d
2
: diferencia entre la frecuencia simple del intervalo modal y la frecuencia
simple del intervalo posterior [f
o
f
(o+1)
]
a: amplitud del intervalo

Ejemplo 10:
A partir de las distribuciones de frecuencias de los ejemplos 1 y 3, calcular
el modo.

Determinacin grfica del modo:

Ejemplo 11:
Hallar el modo en los grficos de los ejemplos 1 y 3
( )
a
d d
d
Li Mo
o x

+
+ =
2 1
1
100
n k
OAP

=
( )
a
f
F
n k
Li x
p
p
p k

+ =
1
100
Estadstica 4 ao 2012 - 7 -

El siguiente es un ejemplo de distribucin bimodal













Mediana Me
(x)
: es el valor de la variable que supera y es superado, a lo
sumo, por igual cantidad de observaciones.
Una vez ordenados los datos en magnitud, la mediana es el valor que ocupa
el orden medio.

Cuando la cantidad de datos n es impar, la mediana es el valor que est
ubicado en el medio, cuando n es par, la mediana es igual a la semisuma
de los valores centrales.


Ejemplo 12:
Las siguientes son las edades de los miembros de dos familias:
Familia A: 13; 6; 7; 45; 49
Familia B: 16; 48; 46; 18
Halle la mediana de cada una.


Si los datos estn ordenados en una distribucin de frecuencias, la mediana
es el valor hasta donde se acumula, a lo sumo, la mitad de los datos
observados, de manera que la mediana ocupar el orden para
cualquier cantidad de datos. A este orden se lo llama Orden Absoluto de la
mediana OAM.

Si la variable es continua, y est ordenada en intervalos de clase, la
mediana pertenece a uno de ellos m, para calcular la mediana debe hacerse:
~
~ La primera FA que supere al OAM determina el intervalo mediano m
~ Luego:


Ejemplo 13:
Segn la distribucin de frecuencias del ejemplo 3, halle la mediana.


Determinacin grfica para VCC

Ejemplo 14:
Segn la distribucin de frecuencias del ejemplo 3, halle grficamente la
mediana ya calculada en forma analtica.



simo
n

2
2
n
OAM =
( )
a
f
F
n
Li Me
m
m
m

+ =
1
2
Estadstica 4 ao 2012 - 8 -
Promedios simples:

Media aritmtica:





Si se trata de una VCC agrupada en intervalos de clase de igual anchura, el
valor X de la variable estar representado por el punto medio de cada
intervalo.

Ejemplo 15:
Halle la media correspondiente a los ejemplos 1 y 3.


Promedio o Media geomtrica:



Promedio o Media armnica:



Promedio aritmtico ponderado:
Cuando a los valores de la variable, por alguna razn, se le asigna
un determinado peso o relevancia w, la media aritmtica simple
pasa a ser ponderada:

Ejemplo 16:
Un coleccionista tiene un cuadrito de estampillas cuyo precio es de $2,5 c/u,
sin embargo la cuarta vale el triple pues tiene un error de impresin. Halle
cunto vale en promedio cada estampilla.




Medidas de variabilidad o dispersin

Estas medidas nos permiten observar cun dispersos estn los datos.
Si bien hay varias medidas posibles, nos limitaremos a estudiar el rango, la
desviacin media, la desviacin tpica y la varianza.

Rango: es la diferencia entre el mayor y el menor valor de un conjunto
dado.

Desviacin media: tambin llamada desviacin promedio se define como:






Desviacin tpica:







Varianza: es el cuadrado de la desviacin tpica

n
X f
X
k
i
i i

=
=
1
: l poblaciona o Muestral
n
n
i
i
G
x X
[
=
=
1
0
1
= =

x
x
n
X
i
A
n
wX
X
k
i
i

=
=
1
n
X X f
MD
n
i
i i

=

=
1
( )
n
x f
k
i
i i

= o
=1
2
: l Poblaciona
2
: Muestral S
2
: l Poblaciona o
Estadstica 4 ao 2012 - 9 -

Variable normal estandarizada o tipificada: mide la desviacin de la
medida en unidades de la desviacin tpica, es independiente de las
unidades usadas.




Ejemplo 17:
En los ltimos exmenes generales de Lengua, Historia, Matemtica, Geografa,
Arte e Ingls, cada uno con un mximo de 250 puntos, Anbal y Belisario
obtuvieron las calificaciones que se indican:

=
=
=

=
=
=
da mo
mediana
mtica media arit

Belisario
da mo
mediana
mtica media arit

Anbal
190 188 185 185 182 180 250 200 185 185 155 135




a) Qu puede decir a partir de las calificaciones individuales?
b) Y teniendo en cuenta las medidas de tendencia central halladas?
c) Sin embargo, qu sensacin tiene respecto al desempeo de cada alumno?
d) Calcule las desviaciones respecto a la media aritmtica.
e) Calcule la varianza.
f) Calcule la desviacin estndar.
g) A qu conclusiones llega despus de los clculos anteriores?

















Medidas de forma

Teniendo una distribucin de frecuencias puede resultar til, para prever
aproximadamente el modelo matemtico ms ajustado para describir el
comportamiento de la variable, observar la forma que presenta.
Dentro de esas formas, analizaremos la Simetra y la Curtosis.

Simetra:

Una distribucin de frecuencias es simtrica si:

Para VD: las observaciones que equidistan de la Media Aritmtica, tienen
la misma frecuencia.
Para VC: las marcas de clase que equidistan de la Media Aritmtica, tiejne
la misma frecuencia.

En cualquier caso, frente a una distribucin de frecuencias simtrica se
verifica que:

o

=
x
z
( ) ( ) 9 e + = S S S X S X / f f
Estadstica 4 ao 2012 - 10 -












Simtrica Asimtrica a la izquierda Asimtrica a la derecha
o en forma de campana o de sesgo negativo o de sesgo positivo


Curtosis o apuntamiento:
Mide, comparativamente con la normal, cun puntiaguda es una distribucin de
frecuencias.








Leptocrtica Platicrtica Mesocrtica

You might also like