Professional Documents
Culture Documents
ESTADISTICA
DESCRIPTIVA
ESTADISTICA
CLASICA
INFERENCIAL
ANALISIS
BAYESIANO DE
DESICIONES
ESTADSTICA DESCRIPTIVA
ESTADSTICA INFERENCIAL
Observacin Indirecta:
es aquella donde la persona que investiga hace uso
de datos estadsticos ya conocidos en una investigacin anterior, o de datos
observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o
fenmenos.
Ejemplo;
si un investigador pretende estudiar la produccin por
aos de una granja avcola, en sus ltimos cinco aos de produccin,
tendra que hacer un seguimiento, a tal fin recurrira a las observaciones
que posee la oficina administrativa de la granja durante estos cinco
aos, o dirigirse a la oficina de estadstica, llevada en el ministerio de
produccin y comercio (M.P.C) de la localidad donde est registrada
dicha granja. Es de notar que el investigador se vale de observaciones
realizadas por terceros.
Atendiendo a la periodicidad, puede ser continua, peridica o circunstancial.
Una observacin continua; como su nombre lo indica es aquella que se lleva
acabo de un modo permanente.
Ejemplo:
la contabilidad comercial, llevada en cuanto a
compras, ventas y otras operaciones que se van registrando a medida
que van producindose.
Una observacin peridica; es aqulla que se lleva a cabo a travs de perodos
de tiempo constantes. Estos perodos de tiempos pueden ser semanas, trimestres,
semestres, aos, etc. Lo que debemos destacar es que los perodos de tiempo
tomados como unidad deben tomarse constantes en los posible.
Ejemplo;
el registro llevado por la Oficinas de Control de
Estudios de la UNESR, en cuanto a la inscripcin de los estudiantes por
semestre.
METODOS DE MUESTREO
Muestreo: es el proceso por medio del cual se seleccionan los individuos de una
poblacin para formar una muestra
MUESTREO
SISTEMATICO
Se
utiliza
cuando
el
universo o poblacin es de
gran tamao, o ha de extenderse en el tiempo. Primero hay que identificar las
unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular
una constante, que se denomina coeficiente de elevacin K= N/n; donde N es el
tamao del universo y n el tamao de la muestra. Determinar en qu fecha se
producir la primera extraccin, para ello hay que elegir al azar un nmero entre 1
y K; de ah en adelante tomar uno de cada K a intervalos regulares. Esto quiere
decir que si tenemos un determinado nmero de personas que es la poblacin y
queremos escoger de esa poblacin un nmero ms pequeo el cual es la muestra,
dividimos el nmero de la poblacin por el nmero de la muestra que queremos
tomar y el resultado de esta operacin ser el intervalo, entonces escogemos un
nmero al azar desde uno hasta el nmero del intervalo, y a partir de este nmero
MUESTREO ESTRATIFICADO
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se
suponen homogneos respecto de la caracterstica a estudiar. En cada uno de estos
estratos se le asignara una cuota que determinar el nmero de miembros del
mismo que compondrn la muestra. Dentro de cada estrato la seleccin se realiza
mediante el muestreo aleatorio simple, o bien otra tcnica que resulte apropiada
para elegir la proporcin de la muestra en cada estrato
Existen dos tcnicas del muestro estratificado
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. As, si la poblacin est
compuesta de un 55% de mujeres y un 45% de hombres, se tomara una muestra
que contenga tambin esos mismos porcentajes de hombres y mujeres, es decir,
suponiendo que el tamao de la muestra sea de 100 individuos, entonces el
nmero de mujeres seleccionadas es de 55 (0.55 X 100 = 55) y 45 hombres (0.45 X
100). La muestra incluye 55 mujeres y 45 hombres, a esto se le denominan
asignacin proporcional:
CARACTERISTICAS
VENTAJAS
INCONVENIENTES
Aleatorio simple
Sistemtico
Estratificado
Conglomerados
Fcil de aplicar.
No siempre es necesario tener un
listado de toda la poblacin.
Cuando la poblacin est ordenada
siguiendo una tendencia conocida,
asegura una cobertura de unidades de
todos los tipos.
Tiende a asegurar que la muestra
represente adecuadamente a la
poblacin en funcin de unas variables
seleccionadas.
Se obtienen estimaciones ms precisa
Se ha de conocer la distribucin en
la poblacin de las variables
utilizadas para la estratificacin.
El muestro, implica algo de incertidumbre que debe ser aceptada para poder
realizar el trabajo, pues aparte de que estudiar una poblacin resulta ser un trabajo
en ocasiones demasiado grande, existen otras razones extras:
Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el estudio
paleontolgico de los dinosaurios (el T. Rex por ejemplo) sera muy bueno contar con, al
menos, muchos restos fsiles y as realizar tales investigaciones; sin embargo, se cuenta slo
con una docena de esqueletos fosilizados (casi todos incompletos) de esas criaturas en todo
el mundo.
N M
Lmites
nominales
Lmites reales
Marca de clase
MC
Frecuencia
f
Frecuencia
relativa fr
k = n
2.
3.
4.
Construir la tabla
R
k
EJEMPLO
En la tabla de abajo se resume el tiempo en minutos que requieren 40
empleados para terminar una labor tpica de ensamblaje y que han solicitado una
transferencia promocional a otro puesto que requiere ensamblaje de precisin. A
partir de estos datos construya una tabla de distribucin de frecuencias donde se
pueda analizar este evento.
10
14
15
13
17
16
12
14
11
13
15
18
14
14
15
11
13
11
12
10
17
16
12
10
18
12
16
17
11
16
12
14
15
13
12
15
14
17
SOLUCIN
REPRESENTACIONES GRAFICAS
EJEMPLO 2
Los datos que se describen en la tabla de abajo, indican la vida til de 40 bateras para
automvil expresada su duracin en aos. Con esta informacin construir una tabla de
distribucin de frecuencias y posteriormente explique mediante un resumen la
interpretacin que usted hace de la tabla elaborada
Una medida de posicin es un valor que se calcula para un grupo de datos y que se
utilizan para describirlos de alguna manera. Normalmente se desea que el valor sea
representativo de todos los valores incluidos en el grupo y, por ello, se desea alguna
clase de promedio. En sentido estadstico, un promedio es una medida de
tendencia central para un conjunto de valores
LA MEDIA ARITMTICA
X
n
LA MEDIA PONDERADA
( pX )
p
En trminos de operaciones, cada uno de los valores del grupo (X) se multiplica por
el factor de ponderacin apropiado (p) y despus se suma estos productos y la
suma se divide entre los pesos (o ponderaciones)
LA MEDIANA
La mediana de un grupo de datos es el valor del dato que ocupa un lugar cuando
se les agrupa a todos en un orden ascendente o descendente. Para un grupo con un
nmero par de elementos, se supone que la mediana se encuentra a la mitad entre
los dos valores adyacentes al centro. Cuando el conjunto de datos contiene un
nmero grande de valores, resulta til la siguiente frmula para determinar la
posicin de la mediana en el conjunto ordenado
Med= X [ ( n/ 2) +(1 /2 )]
LA MODA
Los cuartiles, deciles y percentiles son muy parecidos a la mediana porque tambin
subdividen una distribucin de mediciones de acuerdo con la proporcin de
frecuencias observadas. Mientras que la mediana divide a la distribucin en dos
mitades, los cuartiles la dividen en cuartos, los deciles en diez dcimos y los puntos
percentiles la dividen en cien partes. La frmula de la mediana, modificada de
acuerdo con el punto fraccionario de inters es, por ejemplo.
Q2 (segundo cuartil)=X
2n 1
+
4 2
D3 (tercer decil)=X
3n 1
+
10 2
P4 ( cuarto percentil)= X
]
[
4n 1
+
100 2
EL RANGO
El rango representado por R es la diferencia entre los valores mayor y menor del
conjunto de datos
R=V y V n
RANGOS MODIFICADOS
R 50 central=P75P25
X
No.
R 80 central=P90P 10
R 90 central=P95 P 5
| X i X |
DM= i=1
|X X |
10
10
10
11
11
11
11
10
12
11
12
12
12
13
12
14
12
15
12
16
13
17
13
18
13
19
13
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
14
14
14
14
14
14
15
15
15
15
15
16
16
16
16
DESVIACION MEDIA
La desviacin media se
entre el valor absoluto
elementos del conjunto
grupo.
Despus
se
esas desviaciones. Si
calculara por la suma
positivas y negativas
media aritmtica, la
siempre igual a cero.
valores absolutos de
se suman.
X-
4.575
4.575
3.575
3.575
3.575
2.575
2.575
2.575
2.575
1.575
1.575
1.575
1.575
1.575
1.575
0.575
0.575
0.575
0.575
0.425
0.425
0.425
0.425
0.425
0.425
1.425
1.425
1.425
1.425
1.425
2.425
2.425
2.425
2.425
4.575
4.575
3.575
3.575
3.575
2.575
2.575
2.575
2.575
1.575
1.575
1.575
1.575
1.575
1.575
0.575
0.575
0.575
0.575
0.425
0.425
0.425
0.425
0.425
0.425
1.425
1.425
1.425
1.425
1.425
2.425
2.425
2.425
2.425
DM=
83.85
=2.09
40
X
No.
varianza
de
la
caso, el denominador
varianza muestral es
En esencia, lo que se
es
un
factor
de
varianza muestral sea
insesgado
para
la
poblacin. Su frmula
X
n
( i X )2
i=1
n1
S 2=
X-
(X X )2
-4.575
-4.575
10
-3.575
10
-3.575
10
-3.575
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
11
11
11
11
12
12
12
12
12
12
13
13
13
13
14
14
14
14
14
14
15
15
15
15
15
16
16
16
16
17
-2.575
-2.575
-2.575
-2.575
-1.575
-1.575
-1.575
-1.575
-1.575
-1.575
-0.575
-0.575
-0.575
-0.575
0.425
0.425
0.425
0.425
0.425
0.425
1.425
1.425
1.425
1.425
1.425
2.425
2.425
2.425
2.425
3.425
36
17
3.425
37
17
3.425
38
17
3.425
39
18
4.425
40
18
4.425
20.93062
5
20.93062
5
12.78062
5
12.78062
5
12.78062
5
6.630625
6.630625
6.630625
6.630625
2.480625
2.480625
2.480625
2.480625
2.480625
2.480625
0.330625
0.330625
0.330625
0.330625
0.180625
0.180625
0.180625
0.180625
0.180625
0.180625
2.030625
2.030625
2.030625
2.030625
2.030625
5.880625
5.880625
5.880625
5.880625
11.73062
5
11.73062
5
11.73062
5
11.73062
5
19.58062
5
19.58062
5
243.775
S 2=
243.775 243.775
=
=6.25t 2
401
39
( i X )2
i=1
n1
S=
243.775
= 6.25=2.5
39
243.775
=
401
S=
Varianza
X 2n X 2
S 2= i=1
Desviacin estndar
n1
S=
X 2n X 2
i=1
n1
No.
X2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
9
9
10
10
10
11
11
11
11
12
12
12
12
12
12
13
13
13
13
14
14
14
14
14
14
15
15
15
15
15
16
16
16
16
17
17
81
81
100
100
100
121
121
121
121
144
144
144
144
144
144
169
169
169
169
196
196
196
196
196
196
225
225
225
225
225
256
256
256
256
289
289
es
X =
Xi
543
=13.57
X =
40
i =1
n X 2
= 40(13.75)2 = 40(184.28) =
76157321.20
2
S
=
7321.20
Varianza
401
Y
S 2=
243.80
=6.25 t 2
39
Desviacin estndar
S=
76157321.20
401
S= 6.25 t 2=2.5
37
38
39
40
17
17
18
18
543
289
289
324
324
7615
f xi
x = i=1n
f
i=1
LA MEDIANA
[ ]
n
fa A
2
Med=L I +
i
fc
Donde:
LI
LA MODA
Moda=LI +
d1
i
d1 +d 2
Donde:
d1
precedente
d1
siguiente
[ ]
n
fa A
4
Q1=LI +
i
fc
[ ]
3n
fa A
10
D3=L I +
i
fc
70 n
fa A
100
P70=LI +
i
fc
Varianza muestral:
X X
f
s 2=
X X
f
s=
Las diferencias entre los valores de la media, la mediana y la moda permiten saber
la forma de la curva de frecuencias en trminos de asimetra. Para una distribucin
unimodal asimtrica, el valor de la media, la mediana y la moda son iguales. Para
una distribucin asimtrica positiva, la media es el mayor valor de los tres y la
mediana es mayor que la moda pero menor que la media. Para una distribucin
asimtrica negativa, la media es el menor valor de los tres y la mediana es inferior
a la moda pero mayor que la media. El coeficiente de asimetra de Pearson, es una
medida conocida de asimetra que utiliza la diferencia observada entre la media y la
mediana de un grupo de valores.
MEDIA, MEDIANA Y
MEDIAN
A
MOD
A
MEDIAN
A
MEDI
A
MEDI
A
MOD
A
asimetria poblacional=
3 ( Med )
asimetria de lamuestra=
)
3 ( XMed
s
1 3
= ,
2
2 4
1
2
k
o 75% de los
valores de cualquier conjunto de datos deben caer dentro de las dos desviaciones
estndar de cualquier lado de la media; por lo menos
1 8
= ,
32 9 o 88.9% debe caer
dentro de las tres desviaciones estndar de cualquier lado de la media; y que como
mnimo
1 24
= ,
52 25
k =2,3 y 5
Figura ilustrativa
Ejemplo: si todas las latas de una libra de caf llenadas por un procesador de
alimentos tienen un peso medio de 16.00 onzas con una desviacin estndar de
0.02 onzas, qu porcentaje de las latas, como mnimo, deben contener entre
15.80 y 16.20 onzas de caf?
Solucin: ya que
desviaciones estndar o
k (0.02) equivale a
k ( 0.02 )=0.20 y k =
deriva
0.20
=10. De acuerdo con el teorema de Chebyshev,
0.02
que
por
lo
menos
1
=0.99, o 99 de las latas debe contener entre 15.80 y 16.20 onzas de cafe
102
El teorema de Chebyshev se aplica a cualquier tipo de datos, pero solo nos indica
por lo menos que porcentaje debe caer entre ciertos lmites. Para casi todos los
datos, el porcentaje real de los datos que cae entre los limites es bastante mayor
que el que esperamos del teorema de Chebyshev
Para las distribuciones que tienen la forma general de la seccin de corte
de una campana (vase la figura 4.1), podemos hacer la siguiente
aseveracin que es que mucho ms que un firme:
(1)
(2)
(3)
68%
UNA DESVIACION
ESTANDAR DE LA
MEDIA
95%
UNA DESVIACION
ESTANDAR DE LA
MEDIA
TRES DESVIACIONES
ESTANDAR DE LA
MEDIA
99.7%
X
x y s
puesto
que
x =18.896 y s=5.6565,
primero
tendremos
que
52
80 . 100% =
65% de los datos cae entre los dos limites. De modo similar, encontramos que
78
.100 =97.5
80
media y que
estndar de la media.
COEFICIENTE DE VARIACION
El coeficiente de variacin, CV, indica la magnitud relativa de la deviastacin estndar con
respecto a la media de la distribucin, as, las formulas son:
As
Poblacin:
Muestra:
CV =
CV =
s
X
500
300
CV ( A ) = =
=0.033 y CV ( B )=
=0.060
1500
5000
Por ello, puede concluirse que el precio de la accin B ha sido casi 2 veces ms variable de
la accin A (con respecto al precio promedio para cada una de las dos)