You are on page 1of 49

UNIVERSIDAD TECNOLGICA

AMRICA


INSTITUTO DE INVESTIGACIN
Y POSTGRADOS

MDULO:

MTODOS CUANTITATIVOS EN
LA INVESTIGACIN EDUCATIVA






ING. PATRICIO PEREZ R. MBA

2

OBJETIVO.
El objetivo del curso es el de proporcionar los conocimientos necesarios en la utilizacin de
las tcnicas estadsticas como parte esencial del mtodo cientfico para poder llevar a cabo
una investigacin, as como demostrar la relacin de estas herramientas elementales, con la
toma de decisiones en la elaboracin de proyectos de inversin.

Contenidos
1. Nociones bsicas de Estadstica Descriptiva
1.1 Medidas de tendencia central
1.2 Medidas de forma
1.3 Medidas de dispersin
2. Nociones Bsicas de Estadstica Inferencial
2.1 Definiciones de probabilidad
2.2 La distribucin normal de probabilidad
2.3 Niveles de confianza
2.4 Estimadores
2.5 Intervalos de confianza
2.6 Pruebas de hiptesis
2.7 Tcnicas de proyeccin de mercados
3. Tcnicas de Muestreo
3.1 Introduccin
3.2 Procedimientos del muestreo
3.3 Muestreo no aleatorio o no probabilstico
3.3.1 Muestreo por conveniencia
3.3.2 Muestreo por juicio
3.3.3 Muestreo por cuotas
3.4 Muestreo aleatorio o probabilstico
3.4.1 Muestreo aleatorio simple
3.4.2 Muestreo estratificado
3.4.3 Muestreo por reas
3.4.4 Muestreo sistemtico

3
1. Nociones bsicas de Estadstica Descriptiva
Estadstica es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos con el
propsito de ayudar a una toma de decisiones ms efectiva.

1.1 Medidas de tendencia central.
Las Medidas de tendencia central o medidas de posicin central, son aquellos valores
promedios hacia los cuales tienden a acercarse o alejarse los dems valores que integran una
serie de datos. En otras palabras, es un valor que seala el centro de una distribucin ordenada
de datos.
Las medidas de tendencia central ms conocidas son: La media aritmtica, la mediana, la
moda, la media geomtrica, entre otras.

La media aritmtica
La media aritmtica es una medida de tendencia central, que al igual que la Mediana Y la
Moda constituye un valor de concentracin, siendo el valor ms representativo de una serie de
datos.

Frmulas para calcular la media aritmtica.

1) Para una serie simple de datos:

E xi
U = --------
N
Donde:

U = Media aritmtica de una poblacin
Xi = Valores que toma la variable de estudio
N = Poblacin o universo

Datos correspondientes a los ingresos mensuales de los trabajadores de la empresa Agromar
SA.

158, 179, 168,185, 205, 215, 190, 245, 250
4
2) Para una serie de frecuencias

E xi . fi
U = -------------
N
Donde :
fi = Nmero de veces que se repite la variable de estudio (frecuencia absoluta)

Ejemplo:
Datos correspondientes a los precios de los hoteles de la ciudad de Otavalo.

Serie de frecuencias:

Precios N de Hoteles
Xi. f i
--------- -----------------

20 2
30 4
35 5
45 7
50 5
60 4
75 2
80 2





3) Para una serie de datos agrupados o intervalos

E (fi . xm)
U = ----------------
5
N


Donde:
Xm = Puntos medios o marca de clase

Ejemplo: datos correspondientes a los salarios de los trabajadores de la empresa Alfa

242 225 370 342 252 212 228 285
289 185 282 288 276 407 209 256
390 253 322 252 320 264 332 295
296 290 258 208 274 415 266 263
252 275 355 254 300 350 321 315
221 330 340 295 339 380 385 318
299 345 275 360 280 272 410 220
323 281 273 370 276 310 375 262
323 274 230 318 268 255 420 278
314 234 326 360 205 279 213 308
299 340 244 325 287 387 217 415

Agrupar los datos en una tabla de intervalos,
Para agrupar los datos utilice la siguiente frmula:
2
c
N
Donde:

2 = valor constante
c = exponente al cual debe elevarse el nmero dos para que cumpla la condicin
N = Nmero total de observaciones





Datos correspondientes a las ventas diarias realizadas con tarjetas de crdito por el restaurante
Dely Food

50,30 57,55 48,11 72,46 77,90
6
33,76 27,66 52,87 37,94 65,10
60,57 44,53 78,16 42,69 63,25
46,24 65,91 25,96 41,10 29,40
46,13 55,21 66,07 40,51 57,80
14,44 22,59 35,38 37,20 53,30
43,79 53,32 58,11 54,84 47,90
19,78 26,57 49,21 58,75 31,77
52,35 27,89 50,58 17,87 38,90
52,63 69,77 59,78 69,22 37,35

La mediana
La mediana es otra medida de tendencia central, que ocupa el centro de una distribucin
ordenada de datos. Es decir, la mitad de los valores estn por arriba de ella y la otra mitad por
debajo.
1) Para una serie simple de datos:

Ejemplo:
Datos correspondientes a los ingresos mensuales de los trabajadores de la empresa Agromar
S.A.

158, 179, 168,185, 205, 215, 190, 245, 250

2) Para una serie de frecuencias:
N / 2

Ejemplo:

Datos correspondientes a los precios de los hoteles de la ciudad de Otavalo.

Precios N de Hoteles
Xi. f i
--------- -----------------

7
20 2
30 4
35 5
45 7
50 5
60 4
75 2
80 2


3) Para una serie de datos agrupados o intervalos

(N / 2 - Fm)
Liv + ------------------ . i
f i

Donde:
Liv = Lmite inferior verdadero del intervalo localizado
N / 2 = Nmero total de datos u observaciones dividido para dos
Fm = Frecuencia acumulada menor, en relacin al intervalo localizado
f i = Frecuencia absoluta del intervalo localizado
i = Ancho del intervalo


La moda
La moda es el valor que corresponde a la mayor frecuencia, en otras palabras es el valor que
ms veces se repite en una serie ordenada de datos.
Frmulas:

1) Para una serie de frecuencias:


Precios N de Hoteles
Xi. f i
--------- -----------------
8
20 2
30 4
35 5
Mo. 45 7
50 5
60 4
75 2
80 2


2) Para una serie de datos agrupados o intervalos

d
1

Mo. = Liv + ------------- . i
d
1 +
d
2

Donde:

Liv = Lmite inferior verdadero del intervalo localizado
d
1
=

Diferencia entre la frecuencia de la clase modal y la frecuencia del intervalo
inmediato anterior.
d
2
= Diferencia entre la frecuencia de la clase modal y la frecuencia del intervalo
inmediato posterior.
i = Ancho del intervalo

Comparacin entre la media, la mediana y la moda

Cuando trabajamos en un problema estadstico, se debe decidir si vamos a utilizar la media, la
mediana ola moda como medidas de tendencia central. Las distribuciones simtricas tienen el
mismo valor para las tres medidas. En ese caso, no es necesario escoger la medida.

En una distribucin sesgada, que puede ser a la izquierda o a la derecha, la mediana con
frecuencia resulta ser la mejor medida de posicin, debido a que se encuentra entre la moda y
9
la media. Sin embargo, no existen guas universales para la aplicacin de estas tres medidas.
La seleccin depender en ocasiones de la prctica comn de una industria.

Ejemplos:
1- Grfico correspondiente a las ventas diarias realizadas con tarjetas de crdito por el
restaurante Fast Food
4
6
8
9
12
6
3
2
0
2
4
6
8
10
12
14
1
8
,
9
4
2
7
,
9
4
3
6
,
9
4
4
5
,
9
4
5
4
,
9
4
6
3
,
9
4
7
2
,
9
4
8
1
,
9
4
N


d
e

v
e
n
t
a
s

Distribucin asimtrica negativa : U< Md < Mo 47,56 < 48,44 < 53,44

1.2 Medidas de posicin

Tambin conocidas como fractiles, se utilizan para describir la posicin que tiene un valor de
datos especficos (segmento) en relacin con el resto de los datos. Dependiendo del nmero
de partes en se divida al conjunto de datos, se llaman: cuartiles, deciles, quintiles o
percentiles.

Frmulas para los cuartiles

(N / 4 - Fm) (2N/4 - Fm)
Q1= Liv + ------------------ . i Q2 = Liv + -------------- . i
fi fi

Frmulas para los deciles

(3N / 10 - Fm) (7N/10 - Fm)
D3 = Liv + ------------------ . i D7 = Liv + --------------- . i
fi fi

10

Frmulas para los percentiles

(25N / 100 - Fm) (8N/100 - Fm)
P25 = Liv + --------------------- . i P88 = Liv + ------------------- . i
fi fi
1.3 Medidas de dispersin
Las medidas de dispersin se utilizan para determinar el grado de separacin de los datos, con
relacin a la media aritmtica. Si los datos se encuentran ampliamente dispersos, la medida de
posicin central es menos representativa de los datos observados, a diferencia de cuando se
agrupan ms estrechamente alrededor de la media. Las medidas de dispersin conocidas son:
(1) la amplitud, o rango, (2) la desviacin media, (3) la variancia y (4) la desviacin tpica.

La amplitud
La amplitud conocida tambin como recorrido o rango, es la diferencia entre el valor mayor y
valor menor de una serie de datos. Se representa por la letra a
a = valor mayor valor menor

La varianza
La varianza es una medida til para comparar el grado de dispersin de dos o ms conjuntos
de datos. Esto significa que al comparar conjuntos de datos, el que tiene mayor variancia tiene
la mayor dispersin o variabilidad. En trminos matemticos, la variancia se define como la
media aritmtica de los cuadrados de las desviaciones. La varianza se representa por la letra
griega sigma minscula al cuadrado ( o
2
).

Frmulas:

E (x i u )
2

o
2 =
---------------- para una serie simple de datos
N



E fi (x i u )
2

o
2 =
---------------- para una serie de
N frecuencias

11


E fi (x m u )
2

o
2 =
-------------------- para una serie de datos agrupados
N o de intervalos
Resulta difcil interpretar la variancia para un solo conjunto de datos, por cuanto su valor est
expresado en unidades al cuadrado. La solucin a este dilema es entonces obtener la raz
cuadrada de la varianza. De esta forma, el valor calculado se transforma en las mismas
unidades de medicin de la variable de estudio. Estamos hablando entonces, de la desviacin
tpica.
Ejemplo:
Datos correspondientes a las edades de un grupo de estudiantes:
Curso A: 16, 17, 19, 18, 15, 17, 16, 18, 20, 17
Curso B: 14, 19, 18, 17, 26, 15, 16, 14, 19, 15

La desviacin tpica
Conocida tambin como desviacin estndar. Mide la dispersin de los valores (datos) que
toma una variable de estudio respecto de su media aritmtica. La desviacin tpica en
resumen, es la raz cuadrada de la variancia, est representada por la letra griega sigma
minscula ( o ).
Ejemplos:
1) Datos correspondientes a las edades de dos grupos de estudiantes

Curso A: 16, 17, 19, 18, 15, 17, 16, 18, 20, 17
Curso B: 14, 19, 18, 17, 26, 15, 16, 14, 19, 15

Frmulas:

Para una serie simple de datos

N
u xi


=
2
) (
o
12

Para datos agrupados
1.4 Medidas de forma
Las medidas de forma, nos dan una idea de la manera en la que estn distribuidos los datos.
Dentro de las medidas de forma estn: la Curtosis y el Coeficiente de Asimetra.

Curtosis
La curtosis (K) mide el grado de agudeza, o indica qu tan puntiaguda es la distribucin de
probabilidades de los datos observados. La Curtosis se la compara con la de una distribucin
llamada normal.
Si K > 0 , la distribucin de probabilidades presenta un pico alto y se llama leptocrtica.
Si K < 0 , la distribucin de probabilidades es plana, y se llama platicrtica.
Si K = 0 , la distribucin de probabilidades no presenta ningn pico ni es plana, se llama
mesocrtica.
El grado de Curtosis de una distribucin, est basado en los cuartiles y percentiles y est dado
por:
Donde :
Q = (Q
3
Q
1
)
P
90
= Percentil 90
P
10
= Percentil 10

Coeficiente de Asimetra
El coeficiente de asimetra analiza si la curva que forman los datos, presenta la misma forma a
la izquierda y a la derecha de la Media Aritmtica. Estas curvas pueden ser simtricas o
sesgadas a la izquierda o a la derecha.
Si CA > 0 , la curva presenta una asimetra positiva
Si CA < 0 , la curva presenta una asimetra negativa
Si CA = 0 , la curva es simtrica
N
u xm fi


=
2
) (
o
10 90
P P
Q
K

=
13
El coeficiente de asimetra est dado por:

2. Nociones Bsicas de Estadstica Inferencial

2.1 Definicin de probabilidad

La probabilidad se determina con base a la proporcin de veces en las que ocurre un resultado
favorable en cierto nmero de observaciones o experimentos.
En el estudio de las probabilidades se emplean los siguientes trminos:

- Experimento.- es el proceso mediante el cual se obtiene una observacin o medicin de
un fenmeno y que puede tener dos o ms resultados, llamados eventos o sucesos.
Ejemplos: (1) el lanzamiento de una moneda, (2) el lanzamiento de un par de dados, (3) el
revisar un producto, entre otros.

- Evento o suceso.- es el conjunto de uno o ms resultados producto de un experimento.
Ejemplos: (1) en el lanzamiento de una moneda, los eventos posibles son: cara o sello, (2)
en el lanzamiento de un dado, los eventos posibles son: 1,2,3,4,5 o 6.

Un evento o suceso es tambin cualquier subconjunto del espacio muestral, mismos que
pueden ser representados por letras maysculas del alfabeto.

Evento conjunto o espacio muestral
Es el conjunto de todos los resultados posibles de un experimento en particular. A sus
elementos se los denomina muestra.

Ejemplo, al lanzar dos monedas por una sola vez, el evento conjunto sera:


Eventos moneda 1 moneda 2
o
) ( 3 Me U
CA

=
14
E1 cara cara
E2 cara sello
E3 sello cara
E4 sello sello

Probabilidad de un evento
Si al evento A se observa n veces en un gran nmero de N repeticiones de un
experimento, entonces la probabilidad del evento A est dado por la siguiente frmula:
P(A) = n / N
Donde:
P = Probabilidad
A = Evento esperado
n = Nmero de observaciones del evento esperado
N = Nmero total de eventos en un experimento

Ejemplos:
1) Si se lanza dos monedas por una sola vez, cul es la probabilidad de obtener dos caras ?
P (A) =
n =
N =

2) Cul es la probabilidad de no obtener dos caras ?
P (A) =
n =
N =


En un experimento dado, un evento o suceso debe ocurrir o no ocurrir. En consecuencia, la
suma de la probabilidad de la ocurrencia ms la no ocurrencia ser siempre igual a 1 en
valores relativos 100% en valores porcentuales.
Lo expuesto, se indica en la siguiente ecuacin:
P + Q = 1
P + Q = 100 %
15
Donde:
P = Probabilidad de ocurrencia o xito
Q = Probabilidad de no ocurrencia o fracaso


2.2 La distribucin normal de probabilidad



Nomenclatura:
x
= Media aritmtica de una muestra
U = Media aritmtica de una poblacin
S = desviacin tpica de una muestra
o = desviacin tpica de una poblacin
X = Valor indicado
Z = Valor que est en funcin de un nivel de confianza y que a su vez est expresado en
desviaciones tpicas
S
x
= Estimador del error estndar de la media aritmtica de una poblacin.

La distribucin normal de probabilidad, conocida tambin como curva normal o campana de
Gauss, tiene una importancia fundamental en estadstica, por el elevado nmero de fenmenos
que se explican con esta distribucin.
n=20
0
0,05
0,1
0,15
0,2
2 4 6 8 10 12 14 16 18 20
n m e r o d e e v e n t o s
P
(
x
)
16

La curva normal no es otra cosa que la expresin grfica de una distribucin de Frecuencias,
misma que tiene muchas observaciones cercanas al centro de la distribucin y luego
disminuyen gradual y simtricamente. La curva normal tiene las siguientes propiedades:
1) Es simtrica y tiene forma de campana
2) La media aritmtica est en el centro y divide el rea en dos partes iguales. Por
consiguiente, la mediana y la moda tienen el mismo valor.
3) Tericamente la curva normal se extiende hacia el infinito en ambas direcciones y
tiende gradualmente a unirse con el eje de la abscisa (X), sin llegar a tocar el eje.

El objetivo de la curva normal es el de encontrar la proporcin o probabilidad de un evento, a
travs de la utilizacin de la siguiente frmula y las tablas de reas bajo la curva normal.

X U
Z = -----------
o

X = Valor indicado de la variable de estudio
U = Media aritmtica de la poblacin
o = Desviacin tpica de la poblacin

Ejemplos:
Conociendo que las ventas diarias del supermercado La Ganga siguen una distribucin
normal, con una media igual a $ 163,70 y una desviacin tpica igual a $ 32,98. Determinar el
porcentaje de ventas, cuyos montos estn comprendidos entre $ 120 y la media aritmtica.

Puntos percentiles bajo la curva normal

El clculo de los puntos percentiles bajo la curva normal sirven para determinar valores de la
variable de estudio en el eje de la abscisa.

Ejemplos:
En relacin al problema anterior, determinar el valor en dlares del punto percentil 25, 30, 65
y 78
17

2.3 Niveles de confianza
Se entiende por nivel de confianza a la proporcin del total de las medias aritmticas
muestrales que forman el rea de la distribucin normal de la poblacin que se piensa
abarcar. Es decir, significa que las medias de todas las muestras, consideramos como
probables que el 95 % de estos valores se acerquen al valor verdadero (u) , dejando el 5 %
restante como improbable su obtencin, es decir, es el riesgo a equivocarnos.

Un nivel de confianza est representado por la letra Z. A su vez, los valores de Z estn
expresados en unidades de desviaciones tpicas. Estos valores se pueden determinar por
medio de la grfica de la curva normal y las tablas de reas.















Ejemplo:
Determinar el valor de Z para un nivel de confianza del 90%, 95%, 97% y 99%

2.4 Estimadores

x
r a l i t r b u i o n : = 0 , o
2
= 1
o 2 o +2 o 3 o 1 + o +3 o 1
reas bajo la curva normal

18
Debido a factores de tiempo y costo, los parmetros de una poblacin o proceso
frecuentemente se estiman sobre la base de estadsticas muestrales. Un parmetro es un valor
de resumen para una poblacin, mientras que una estadstica es un valor de resumen de una
muestra.


Nomenclatura:
x
= Media aritmtica de una muestra
U = Media aritmtica de una poblacin
S = desviacin tpica de una muestra
o = desviacin tpica de una poblacin

P = proporcin de una poblacin
p
= Proporcin de una muestra

Previa a la estimacin de un parmetro es necesario determinar el error estndar o la
variabilidad de la estimacin.

El error muestral
El error muestral conocido tambin como error de estimacin, no es otra cosa que la
diferencia entre la media aritmtica muestral (
x
) y la media aritmtica poblacional (U). En
trminos matemticos, esto significa que el error muestral es la desviacin tpica de las
distintas medias aritmticas muestrales en relacin a la media aritmtica poblacional. Por
consiguiente, se designa a la desviacin tpica de una distribucin de muestreo como error
estndar

En el clculo de una muestra podemos seguir dos caminos: (1) calcular el tamao de la
muestra aplicando la frmula, previa la fijacin del error que queremos admitir; y (2)
establecer el tamao de la muestra y luego calcular el error aplicando la frmula de ste.
En el segundo caso, las frmulas para determinar el error son las siguientes:

1 ) Estimadores del error de la media aritmtica de una poblacin

a)
n
s
s
x
=
19

Cuando El tamao da la muestra es menor al 5 % de la poblacin, es decir para
poblaciones infinitas.
b)


Cuando el tamao de la muestra es mayor al 5 % de la poblacin,
es decir, para poblaciones finitas.
Donde:

x S = Estimador del error estandar de la media aritmtica poblacional
S = Desviacin tpica de la media aritmtica muestral
N = Poblacin o universo
n = Tamao de la muestra

2) Estimadores del error de la proporcin de una poblacin
a)


Cuando El tamao da la muestra es menor al 5 % de la poblacin, es decir para
poblaciones infinitas


b)

Cuando el tamao de la muestra es mayor al 5 % de la poblacin,
es decir, para poblaciones finitas.

Donde:
1
) 1 (
= S

N
n N
n
p p
p
n
p p
S
p
) 1 (
=
1

=
N
n N
n
S
S
x
20
p
S
= Estimador del error estndar de la proporcin de una poblacin
P = Proporcin de una poblacin
p
= Proporcin de una muestra

N = Poblacin
n = Muestra


2.5 Intervalos de confianza

Intervalos de confianza para estimar la media aritmtica de una poblacin
En trminos matemticos, la probabilidad de que la media aritmtica muestral sea
exactamente igual a la media aritmtica poblacional es cero.
P (
x
= U ) = O.
Por esta razn, es necesario fijar un intervalo dentro del cual deber estar el valor paramtrico
(U). Estos rangos o intervalos se conocen como intervalos de confianza, mismos que se
determinan en base a la estimacin de un error y a un nivel de confianza dado.
Frmulas:
a)


. Z X
o
x

Cuando se conoce la desviacin tpica poblacional

b)

Cuando se conoce la desviacin tpica muestral

Ejemplos:

x S Z X .
21
1) La empresa Light desea estimar el ingreso promedio de los habitantes de un sector de la
ciudad de Cuenca. Esta informacin le servir para establecer una nueva sucursal en la venta
de electrodomsticos. Para lo cual toma una muestra de 158 familias de una poblacin
compuesta por 3.300 familias. De la muestra obtenida se determin que el ingreso promedio
de los encuestados es igual a USD 185 por semana, con una desviacin tpica de USD 35.
Estimar el ingreso promedio de la totalidad de las familias del sector, con un nivel de
confianza del 90 %.

2 ) En relacin al problema anterior, suponga ahora que la empresa Light se dirigi a otro
sector de la ciudad para realizar su investigacin de mercados. Tom una muestra de 125
familias, de un total de 1. 350 familias. De la muestra obtenida se determin que el ingreso
promedio fue de USD 310 por semana, con una desviacin tpica de USD 45.
Estimar el ingreso promedio semanal de la totalidad de familias del sector.


3) La empresa de taxis Correcaminos desea actualizar sus datos para determinar el
kilometraje recorrido diariamente por sus socios. Esta informacin servir para obtener un
cupn de descuento en el consumo de combustible. Para este propsito, la empresa precede a
medir el kilometraje a 35 vehculos de un total de 150. De la medicin realizada se determin
que en promedio los taxis recorren 48 km. Por da. Estimar, con un nivel de confianza del 98
%, el recorrido promedio de la totalidad de taxis, conociendo adems que de una
investigacin realizada 15 meses atrs a todas la unidades, se determin una desviacin tpica
de 12 km.


Distribucin t de Student e intervalos de confianza para estimar la media aritmtica
de una poblacin

En este caso nos ocuparemos del caso en el que el tamao de la muestra es menor o igual a 30
elementos, se conoce la desviacin tpica muestral (S) y la poblacin tiene una distribucin
normal.
Esta distribucin est asociada con los grados de libertad (gl), mismos que indican el nmero
de valores libres de variar en la muestra.
La frmula para establecer un intervalo de confianza en este caso es la siguiente:
22

X tgl .
x S

tgl = n - 1

La distribucin t tiene las siguientes propiedades:
- Es continua, tiene forma de campana y es simtrica respecto al cero como la
distribucin z.
- Existe una familia de distribuciones t que comparten una media de cero pero con
desviaciones estndar diferentes.
- La distribucin t est ms dispersa y es ms plana en el centro que la distribucin z,
pero se acerca a ella cuando el tamao de la muestra crece.




















Ejemplos:

1) En una muestra tomada a 18 restaurantes de primera categora en la ciudad de Quito, de
una poblacin compuesta por 450 restaurantes, se determin que el consumo promedio de los
clientes es de $ 45 por persona, con una desviacin estndar de $ 15. estimar el consumo
promedio por persona de la totalidad de restaurantes de la ciudad de Quito, con un nivel de
confianza del 95%.
Distribucin z
Distribucin t
23


2) En relacin al problema anterior, suponga ahora que se tom una muestra de 25
restaurantes, de un total de 450 restaurantes. Estimar el consumo promedio por persona de la
totalidad de restaurantes, con un nivel de confianza del 99 %.

Intervalos de confianza para estimar la proporcin de una poblacin

El intervalo de confianza para una relacin proporcional de una poblacin se estima de la
siguiente forma:
p
. Z
p
S


Donde:

p
= proporcin de una muestra
Z = Valor expresado en desviaciones tpicas y que est en funcin de un nivel de
confianza dado.
p
S
= Estimador del error de la proporcin de una poblacin

Ejemplos:

1) Una empresa de investigacin de mercados toma una muestra de 80 hombres mayores de
18 aos, de un segmento compuesto por 4500 hombres y determina que el 40% de los
encuestados prefiere las hojas de afeitar fabricadas por la empresa Gelitt sobre todas las
dems marcas. Estimar la proporcin de la totalidad de hombres del segmento que prefiere las
hojas de afeitar de la empresa mencionada, con un nivel de confianza del 97%.

2) En una muestra tomada a 125 vehculos de una poblacin muy grande que circulan
diariamente por la autopista Rumiahui, se determin que 87 de los encuestados poseen un
seguro particular contra accidentes. Estimar, con un nivel de confianza del 96 % , el
porcentaje de la totalidad de propietarios de vehculos que circulan por la zona, que no poseen
un seguro contra accidentes.
24


3) En la provincia de Pichincha existe un total de 800 gasolineras, de una muestra aleatoria de
55 gasolineras, se determin que 31 de ellas expenden el aceite para automotores fabricados
por la empresa Gocar . Con un nivel de confianza del 94 %, estimar:
a) El porcentaje de la totalidad de gasolineras de la provincia de Pichincha que expenden
dicho producto.
b) El nmero total de gasolineras de la zona que lo expenden.

2.6 Pruebas de Hiptesis

Una hiptesis es un enunciado acerca del valor de una poblacin, mismo que tiene que ser
verificado para determinar si es verdadero o falso.
El propsito de una prueba de hiptesis es determinar si el valor supuesto o hipottico de un
parmetro poblacional (como la media poblacional) debe aceptarse como cierto con base a
evidencias muestrales. La pruebas de hiptesis principian con una afirmacin, o supuesto
acerca de un valor paramtrico.
Procedimiento.
Existen dos mtodos para una prueba de hiptesis:
a) Mtodo del valor crtico
b) Mtodo en trminos de valores de Z


Mtodo del valor crtico
En este mtodo se determinan los valores crticos de la estadstica de prueba (media aritmtica
muestral), tras lo cual se compara con los valores crticos. Existen cinco pasos bsicos para
determinar una prueba de hiptesis.
1) plantear la hiptesis nula y alternativa.- La hiptesis nula (H
o
) es el valor paramtrico
supuesto o hipottico. La hiptesis alternativa (H
1
) es el planteamiento contrario a la hiptesis
nula y ser aceptada solo si los datos muestrales proporcionan evidencia de que la hiptesis
nula es falsa.
2) Especificar el nivel de significacin.- Es el riesgo que existe al rechazar la hiptesis nula
cuando en realidad es verdadera. El nivel de significacin se representa por la letra griega .
25
3) Seleccionar la estadstica de prueba.- Este valor se obtiene de la informacin muestral y
se utiliza para determinar si se rechaza la hiptesis nula.
4) Establecer los valores crticos de la estadstica de prueba.- Son los intervalos dentro de
los cuales deber estar la estadstica de prueba para que sea aceptada la hiptesis nula.
5) Tomar la decisin.- Es decir se acepta o se rechaza la hiptesis nula.

2.6.1 Pruebas de hiptesis respecto a una media poblacional

Frmulas:
1)
=U cr X
Z .
x S

Cuando el tamao de la muestra es mayor a 30 elementos y se conoce la desviacin tpica
muestral.

2)
=U cr X
tgl .
x S

Cuando el tamao de la muestra es menor o igual a 30 elementos y se conoce la desviacin
tpica muestral

Pruebas bilaterales o de dos extremos
Estas pruebas se aplican cuando es necesario determinar posibles desviaciones en los dos
extremos de la curva, con relacin al valor supuesto o hipottico. Es decir, existen en este
caso dos regiones de rechazo de la hiptesis nula.

Ejemplos:
1) El gerente del banco Omega afirma que el promedio de la totalidad de cuentas vencidas
en todo el pas es de USD 260. Para comprobar esta afirmacin, el auditor toma una muestra
de 43 cuentas vencidas en todas las sucursales, de un total de 980 cuentas. De la muestra
obtenida se determin una media de USD 270, con una desviacin estndar de USD 52.
Probar si el gerente del banco est en la razn, con un nivel de significacin del 5 %.

2) Los accionistas de la cadena de supermercados Fallabela desean instalar una nueva
sucursal en un sector de la ciudad, considerando que el ingreso promedio de las familias del
sector es de USD 750 mensuales. La empresa encargada de la investigacin de mercados,
26
toma una muestra de 75 familias de un total de 1200. De la muestra obtenida se determin una
media de USD 720 mensuales, con una desviacin estndar de USD 125. Probar la
afirmacin realizada por los accionistas, con un nivel de significacin del 1 %.

Pruebas unilaterales o de un extremo
Una prueba unilateral resulta apropiada cuando es importante conocer posibles desviaciones
en un extremo de la curva, con relacin al valor hipottico o supuesto.
Ejemplos:

1) Una cadena de comida rpida construir un local en un sector de gran afluencia de
vehculos, slo si durante ciertas horas pasan ms de 200 vehculos por hora. Se toma
aleatoriamente una muestra de 25 horas y se determina que el nmero promedio de autos que
pasan por un el sector es de 187 vehculos por hora, con una desviacin estndar de 30
vehculos.
Cree usted que es conveniente para la cadena de comidas rpidas instalar un local comercial ?.
Realice la prueba, con un nivel de significacin del 5 %.

2) El gerente de la empresa de turismo Correcaminos afirma que sus paquetes tursticos
hacia la amazona no sobrepasan los USD 250 en promedio por persona. Se toma una muestra
de 43 facturas pagadas por los clientes en los ltimos 6 meses, de un total de 560 y se
determina un promedio de pagos de USD 263, con una desviacin estndar de USD 38.
Probar la afirmacin hecha por el gerente de la empresa, con un nivel de significacin del 3
%.

Mtodo de valores estandarizados de Z

En este caso, en lugar de establecer los valores crticos en trminos de la media muestral, se
determinan los valores crticos , en valores de Z, es decir, en desviaciones tpicas.
Frmula:


x
U
Z = -----------

x S


27
Z = Valor tipificado que est expresado en desviaciones tpicas
x
= media aritmtica muestral
U = media aritmtica poblacional.
x S
= Estimador del error estndar de la media aritmtica poblacional

Ejemplos:
1) El gerente del banco Omega afirma que el promedio de la totalidad de cuentas vencidas
en todo el pas es de USD 260. Para comprobar esta afirmacin, el auditor toma una muestra
de 43 cuentas vencidas en todas las sucursales, de un total de 980 cuentas. De la muestra
obtenida se determin una media de USD 270, con una desviacin estndar de USD 52.
Probar si el gerente del banco est en la razn, con un nivel de significacin del 5 %.


2) Una cadena de comida rpida construir un local en un sector de gran afluencia de
vehculos, slo si durante ciertas horas pasan ms de 200 vehculos por hora. Se toma
aleatoriamente una muestra de 25 horas y se determina que el nmero promedio de autos que
pasan por un el sector es de 187 vehculos por hora, con una desviacin estndar de 30
vehculos.
Cree usted que es conveniente para la cadena de comidas rpidas instalar un local comercial ?.
Realice la prueba, con un nivel de significacin del 5 %.

2.6.2 Pruebas de hiptesis para proporciones
Frmulas:
1)
= P cr P
Z .
p S

Cuando la muestra es mayor a 30 elementos

2)
= P cr P
tgl .
p S

Cuando la muestra es menor o igual a 30 elementos

Ejemplos:
28
1) Las autoridades de la universidad Los Andes, afirman que aproximadamente el 40 % de
los recin graduados haban obtenido empleo en empresas privadas. Se toma una muestra de
45 graduados de un total de 180 y se determina que 15 de los encuestados obtuvieron trabajo
en empresas privadas. Puede aceptarse la afirmacin hecha por las autoridades ?.
Realice la prueba con un nivel de significacin del 10 %

2) Una cadena de restaurantes planea instalar un bar-cafetera en un sector turstico de la
ciudad, cuyo mercado meta son los extranjeros que visitan la zona. Para que tenga xito esta
empresa, es necesario que los visitantes sean al menos el 55 % extranjeros. Se tom una
muestra aleatoria durante un mes de 128 personas, de las cuales 63 fueron extranjeros. Cree
usted que es conveniente para esta cadena, instalar un bar-cafetera ?.
Pruebe la hiptesis con un nivel de significacin del 3 %.


2.7 Tcnicas de proyeccin de mercado

Para elaborar un proyecto es necesario realizar proyecciones del mercado, con el propsito de
estimar el comportamiento futuro del mismo. Existen varias formas de pronostico:
- Mtodos de carcter cualitativo
- Modelos de series de tiempo
- Modelos causales

Los mtodos de carcter cualitativo se basan principalmente en opiniones de expertos. Su uso
se justifica cuando el tiempo para elaborar el pronstico es escaso, cuando no se dispone de
todos los antecedentes mnimos necesarios o cuando los datos disponibles no son confiables.
Dentro del mtodo cualitativo se encuentra la investigacin de mercados, el cual se utiliza en
la recoleccin de informacin para ayudar en la toma de decisiones o para probar o rechazar
hiptesis sobre un mercado especfico, a travs de encuestas, experimentos o mercados de
prueba.

Los modelos de series de tiempo se refieren a la medicin de valores de una variable en el
tiempo. El objetivo del anlisis de la informacin histrica es determinar un patrn de
comportamiento, que posibilite la proyeccin futura de la variable deseada. Existen diversos
mtodos que permiten estimar el comportamiento de una variable. Estos mtodos son: el
29
mtodo de los promedios mviles, el de afinamiento exponencial y el de ajuste lineal por el
criterio de los mnimos cuadrados.
Los modelos causales basan su proyeccin en antecedentes cuantitativos histricos; para ello,
suponen que los factores que inciden en este comportamiento histrico de alguna o todas las
variables del mercado permanecern estables.
Los modelos de uso ms frecuente son:
- El modelo de regresin
- El modelo economtrico
- El modelo de insumo producto o mtodo de los coeficientes tcnicos

En este caso, se estudiar el modelo de regresin.

2.7.1 Modelo de regresin
La demanda de un bien o servicio depende de muchos factores que explicaran su
comportamiento a travs del tiempo en un momento especfico del mismo. El anlisis de
regresin permite elaborar un modelo de pronstico basado en dos variables: (1) la variable
independiente, la cual se define como la variable conocida o cuyo origen se puede explicar, y
(2) la variable dependiente, misma que se define como la variable que tratamos de predecir o
proyectar.
Existen dos modelos bsicos de regresin: (1) el modelo de regresin simple o de dos
variables, donde la variable dependiente se predice sobre la base de la variable independiente,
y (2) el modelo de regresin mltiple donde la proyeccin se realiza sobre la base de dos o
ms variables independientes.
En el modelo de regresin simple o de dos variables se debe aplicar una ecuacin lineal que
mejor se ajusta a la relacin de las dos variables. Para ello, se utiliza el mtodo de los
mnimos cuadrados.
La ecuacin de regresin lineal es:
b a Y + =

. x
Donde:
= Y

Es el valor estimado de la variable dependiente o valor a predecir


a = Es la constante o interseccin de la recta con el eje vertical.
b = Es la pendiente de la recta
30
x = Es el valor codificado de la variable independiente.
X = Variable independiente
Y = Variable dependiente
a = Y
b =

2
x
xY


Ejemplos:

1) La siguiente informacin corresponde a la produccin y ventas de lmparas para escritorio,
fabricadas por la empresa Luminar, durante el perodo 1995-2003.

Ao Unidades
producidas
(En miles)
X Y
------ ------------
1995 10
1996 20
1997 30
1998 45
1999 70
2000 90
2001 125
2002 150
2003 180



2) Informacin correspondiente a las ventas anuales de computadoras, realizadas por la
empresa Compufacil, durante el perodo 1996 - 2003


Ao Unidades
vendidas
X Y
------ -----------
1996 98
1997 105
1998 116
1999 119
2000 135
2001 156
2002 177
2003 208

31
(espacio para el clculo)

Coeficiente de determinacin
El siguiente paso que necesitamos aprender en el anlisis de regresin es como medir el grado
hasta el cual una variable est linealmente relacionada con otra. Es decir, que tan asociadas
estn la variable independiente (X) con la variable dependiente(Y). Existen dos tcnicas que
sirven para medir la correlacin entre estas dos variables: (1) el coeficiente de correlacin y
(2) el coeficiente de determinacin, siendo el ms utilizado el coeficiente de determinacin.
Frmula:


| |
| || |




=
2 2 2 2
2
2
) ( . ) (
) )( (
Y Y n x x n
Y x xY n
r

Mientras ms alto sea el valor de r
2
, ms confianza se tendr en la estimacin, pudiendo
tomar valores entre 0 y 1.
Ejemplo:
Calcular el coeficiente de determinacin para el caso de la empresa luminar

Error estndar de estimacin
Para medir la confiabilidad de la ecuacin de estimacin, es necesario determinar el error
estndar de la estimacin, misma que mide la variabilidad o dispersin de los valores
observados alrededor de la lnea de regresin.
Frmula:

Se=
2
2



n
xY b Y a Y



Predicciones basadas en nmeros ndices

Un nmero ndice expresa el cambio relativo de un lapso de tiempo a otro. Los nmeros
ndices se utilizan para determinar cunto ha aumentado el valor de una variable en un
perodo de tiempo.
32

Se analizarn dos formas de realizar un pronostico a travs de los nmeros ndices.

1) Tasa de crecimiento global


i = 100 * 1
1
|
|
.
|

\
|

n
C
M


Donde:
i= Tasa de crecimiento en un perodo
n = Nmero de perodos
M = Valor al final del perodo
C = Valor al inicio del perodo
2) Tasa de crecimiento promedio
Para determinar el aumento porcentual promedio en un perodo dado, se utiliza la media
geomtrica.

MG =
n
n X X X X ..... . . 3 2 1

Donde:
n = Nmero de perodos
Xi = Tasas de crecimiento por perodo

Ejemplos:
Proyectar la produccin y ventas para los siguientes cuatro aos de la empresa Luminar, a
travs de los mtodos: tasa de crecimiento global y tasa de crecimiento promedio.
Ao Unidades
producidas
(En miles)
X Y
------ ------------
1995 10
1996 20
1997 30
33
1998 45
1999 70
2000 90
2001 125
2002 150
2003 180


3. Tcnicas de muestreo
3.1 Fundamentos del muestreo
El muestreo es una parte esencial del mtodo cientfico para poder llevar a cabo una
investigacin. El muestreo es el conjunto de operaciones que se realizan para estudiar la
distribucin de determinadas caractersticas en la totalidad de la poblacin, a partir de la
observacin de una parte o subconjunto de la poblacin, denominada muestra. La
representatividad de la muestra implica que sta refleje las caractersticas, similitudes y
diferencias encontradas en la poblacin. Lograr esta representatividad de la muestra slo es
posible en un muestreo aleatorio o al azar.
Beneficios del muestreo
- Una muestra ahorra dinero
- Una muestra ahorra tiempo
- Una muestra puede ser ms precisa
- Una muestra resulta mejor si el estudio conlleva la destruccin o contaminacin del
elemento muestreado.

Algunos conceptos necesarios del muestreo
Elemento.- Un elemento es la unidad acerca de la cual se solicita informacin, misma que
puede ser personas, productos, almacenes, empresas, familias, etc. En cualquier muestra
especfica, los elementos dependern de los objetivos del estudio.
Poblacin.- O universo, es el conjunto de todos los elementos, mismos que estn definidos
antes de seleccionar la muestra. Una poblacin se debe definir en trminos de, a) elementos,
b) unidades de muestreo c) alcance y d) tiempo.
Ejemplo,
1 )Una investigacin a consumidores de vino podra especificar la poblacin, como:
a) Elementos: Hombres
b) Unidades de muestreo: Hombres de 18 a 50 aos
c) Alcance: Ciudad de Quito
d) Tiempo: Abril del 2004
34

2) La poblacin para un estudio diseado con el propsito de medir la reaccin del usuario
hacia un nuevo producto utilizado en el sector de la construccin podra ser:
a) Elementos: Ingenieros y arquitectos
b) Unidades de muestreo: Colegios profesionales de ingenieros y arquitectos, luego
vendran los ingenieros y arquitectos.
c) Alcance: Provincia de Pichincha.
d) Tiempo: Mayo del 2004.

Unidad de muestreo.- Es el elemento o los elementos disponibles para su seleccin en alguna
etapa del proceso de muestreo. Un proceso de muestreo puede tener el nmero de etapas que
el investigador desee. Por ejemplo, una muestra de 4 etapas podra ser:
Etapa 1: Barrios con ms de 1000 familias (unidades primarias de muestreo)
Etapa 2: Manzanas de los barrios (Unidades secundarias de muestreo)
Etapa 3: Unidades familiares (unidades terciarias de muestreo)
Etapa 4: Jefes de hogar (unidades finales de muestreo)

Marco muestral.- Es la lista de todas las unidades de muestreo disponibles para su seleccin
en una etapa del proceso del muestreo. Cada etapa en el proceso de muestreo requiere de su
propio marco muestral. Por lo tanto, un proceso en 4 etapas requiere de cuatro marcos
muestrales, as en el ejemplo mencionado sera: 1) un registro de los barrios con ms de 1000
familias, 2) una lista de manzanas de los barrios seleccionados, 3) Una lista de hogares dentro
de las manzanas de los barrios seleccionados y 4) un registro de los jefes de hogar dentro de
los hogares seleccionados.

3.2 El proceso de muestreo
Los pasos para seleccionar una muestra son:
1) Definir la poblacin. Esto incluye: a) elementos, b) unidades de muestreo, c) alcance y d)
tiempo.
2) Identificar el marco muestral del cual se seleccionar la muestra.
3) Determinar el tamao de muestra
4) Seleccionar un procedimiento especfico mediante el cual se determinar la muestra. Es
decir, el tipo de muestreo.
5) Seleccionar la fsicamente la muestra, basndose en el procedimiento en el paso 4
35

El Proceso de muestreo

















3.3 Procedimientos del muestreo
Existen dos tipos de muestreo mediante los cuales los investigadores pueden seleccionar una
muestra , el probabilstico y el no probabilstico










3.3.1 Muestreo no probabilstico
Procedimientos de muestreo
Muestreo no probabilstico
1. Muestreo por conveniencia
2. Muestreo por juicio
3. Muestreo por cuotas
Muestreo probabilstico
1. Muestreo aleatorio simple
2. Muestreo estratificado
3. Muestreo sistemtico
4. Muestreo por reas
Definir la poblacin
1. Elementos
2. Unidades
3. Alcance
4. Tiempo
Identificar el
marco muestral
Determinar el
tamao de la
muestra
Seleccionar un
procedimiento
muestral
Seleccionar la
muestra
36
La seleccin de la muestra se basa en parte en el criterio del investigador. En este caso, no
existe la oportunidad de que cualquier otro elemento de la poblacin sea seleccionado. Por
consiguiente, no podemos calcular el error muestral, tampoco se conoce si las estimaciones
realizadas a partir de una muestra son exactas.

Muestreo por conveniencia
Como su nombre lo indica, las muestras se seleccionan de acuerdo a la conveniencia del
investigador. Ejemplos:
1) Solicitar a algunas personas que colaboren voluntariamente para probar los productos y
luego utilizar estas mismas personas para la encuesta.
2) Solicitar la opinin de personas que transitan por un centro comercial.
3) Realizar entrevistas a personas en la calle para un canal de TV.
En cada caso, no se especifica la poblacin de donde se ha tomado la muestra, sino, se ha
seleccionado las muestras por su fcil disponibilidad.
Las muestras por conveniencia se justifican en la etapa exploratoria de una investigacin

Muestreo de juicio
Las muestras de juicio o a propsito se seleccionan con base a lo que un experto piensa
acerca de la contribucin que harn las unidades de muestreo en particular para responder a la
pregunta de investigacin. Ejemplos:
1) En una prueba de mercado se hace un juicio con respecto a qu ciudades podran
considerarse como mejores para poner a prueba la posible comercializacin de un producto.
2) En la investigacin de mercadeo industrial, la decisin de entrevistar a un agente de
compras con relacin a un determinado producto.
3) La seleccin de almacenes en un rea, para probar un nuevo exhibidor de productos.

Muestreo por cuotas
Las muestras por cuotas son un tipo especial de muestras a propsito. En este caso el
investigador toma una muestra que es similar a la poblacin en algunas caractersticas de
control especificadas. Por tanto, para seleccionar una muestra por cuotas se debe tomar en
cuenta lo siguiente:
a) Especificar la lista de caractersticas de control ms importantes.
b) Conocer la distribucin de esas caractersticas en toda la poblacin.

37
Ejemplos:
1) En un estudio de intenciones de compra realizado por una empresa de investigacin de
mercado, se seleccion una muestra de 125 mujeres quienes eran cabezas de hogar y que
tenan gran influencia en las decisiones de compra del hogar.
2) En un estudio sobre el uso de las tarjetas de crdito, compaas de alquiler de vehculos y
alojamientos de hotel, la empresa de investigacin de mercados seleccion una muestra con
base a las caractersticas de control de las millas voladas por ao, nacionalidad y gnero. Esta
seleccin se realiz a aquellos que hayan volado ms de 50.000 millas al ao, de nacionalidad
japoneses y de gnero masculino.

3.3.2 Muestreo probabilstico
Parte de la suposicin de que cada elemento de la poblacin tiene la misma probabilidad para
ser seleccionado en la muestra. Este tipo de muestreo es el ms adecuado ya que sus
procedimientos son ms cientficos, adems de que no permite la discrecin del investigador.
No existe ninguna garanta de que los resultados obtenidos con una muestra probabilstica
sean ms exactos que aquellos obtenidos con una muestra no probabilstica; lo que el primer
tipo de muestreo permite, es medir el error muestral, es decir, mide la exactitud del resultado
de la muestra.

Muestreo aleatorio simple
Es un mtodo de seleccin en la cual las unidades se eligen individual y directamente por
medio de un proceso aleatorio, donde cada unidad tiene la misma oportunidad de ser
seleccionada. El muestreo aleatorio simple es til cuando se dispone de una lista del total de
los elementos que conforman una poblacin.
Frmulas:

1) Para poblaciones infinitas ( mayores a 30.000 elementos)

Z
2
. p . q
n = ---------------
e
2

2) Para poblaciones finitas ( Menores o iguales a 30.000 elementos)


Z
2
. p . q . N
n = -----------------------------
38
e
2
(N 1) + Z
2
. p .q

Donde:

n = Tamao de la muestra
N = Poblacin
Z = Valor expresado en desviaciones tpicas y que est en funcin de un nivel de
Confianza dado.
P = Probabilidad de ocurrencia (xito)
Q = Probabilidad de no ocurrencia ( fracaso)
e = Error de estimacin


Muestreo estratificado
El mtodo del muestreo estratificado consiste en dividir a la poblacin en subgrupos o estratos
mutuamente excluyentes y seleccionar una muestra aleatoria dentro de cada estrato. Tiene las
siguientes ventajas en relacin al muestreo aleatorio simple:
a) El costo de recoleccin de datos y anlisis de datos se reduce al dividir los grupos con
elementos similares dentro de cada grupo pero diferentes entre grupos.
b) La varianza se reduce debido a que la variabilidad de los estratos es menor que la
variabilidad de la poblacin.
c) Se obtienen estimadores separados para cada subgrupo o estrato sin necesidad de
seleccionar otra muestra.
La estratificacin es til cuando existen claras diferencias en la poblacin que se va a estudiar,
por ejemplo: religin, gnero, nivel socioeconmico, educacin, entre otros.
Frmulas:

|
.
|

\
|
=
N
Ni
n ni
Donde:
ni = Tamao de la muestra del estrato i
n = Tamao de la muestra total
Ni = Poblacin del estrato i
N = Poblacin total

39
Ejemplo:
Se desea determinar entre otras cosas de inters, el salario promedio de los ejecutivos de las
empresas pertenecientes a los diferentes sectores productivos del pas. Calcular el tamao de
muestra con la siguiente informacin:

Nivel de confianza: 90 %
Error de estimacin: 6 %
p =
q =













Muestreo estratificado con afijacin ptima

Una distribucin ptima de un tamao muestral fijo entre los estratos es aquella que genera el
mnimo error estndar en el clculo global.
Para poder obtener esta distribucin ptima debe conocerse la variabilidad (desviacin
estndar) entre los estratos, antes de hacer el muestreo. La experiencia y las investigaciones
anteriores pueden suministrar esa informacin.

Sector Nmero de empresas
Agroindustrial 534
Pesquero 345
Industrial 258
Servicios 173
Turstico 189
Petrolero 17
Florcola 253
Total 1.769
40

( )
N
S W
Z
e
S W
n
N
i
h h
N
i
h h

=
=
+
=
1
2 2
2
2
2
1
( Poblaciones infinitas)


( )
2
1
2 2
2
1
2
) 1 (
h
N
i
h
N
i
h h
S W Z N e
S W N Z
n

=
=
+
=
(Poblaciones finitas)

Donde:
n = Tamao de la muestra
W
h
= Peso relativo del estrato h (N
h
/ N)
Z = Nivel de confianza
N = Poblacin o universo
e = Error de estimacin
N 1 = Factor de correccin por finitud
S
h
= Desviacin estndar del estrato h


Muestreo sistemtico
Una muestra sistemtica puede proporcionar mayor informacin acerca de la poblacin en
relacin al muestreo aleatorio, ya que sta se expande en forma ms uniforme sobre el total de
la poblacin. Entre las principales ventajas estn:
a) Es ms simple obtener una muestra y minimizar el margen de error
b) El muestreo sistemtico es ms preciso que el aleatorio simple porque agrupa la
poblacin en n estratos, de donde se obtienen las muestras de K en K unidades,
repartindose ms uniformemente sobre la poblacin.

La frmula para determinar el intervalo muestral es la siguiente:

41
N
K = -------
n

Donde:
K = Intervalo de la muestra
N = Poblacin
n = Tamao de muestra

Procedimiento:
1) Se obtiene un nmero aleatorio entre 1 y K, para el arranque.
2 ) Se suma a ste nmero aleatorio el valor de K, el cual ser el segundo elemento
de la muestra, se suma nuevamente el valor de K al ltimo valor para seleccionar el tercer
elemento de la muestra.














TABLA 1
reas bajo la curva normal

Ejemplo


o

=
X
Z



| |
| | 0250 . 0 96 . 1
1587 . 0 1
= >
= >
Z p
Z P



Desv.
Normal
Z

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09
0.0
0.1
0.2
0.3
0.4

0.5
0.6
0.7
0.8
0.9

1.0
1.1
1.2
1.3
1.4

1.5
1.6
1.7
1.8
1.9

2.0
2.1
2.2
2.3
2.4

2.5
2.6
2.7
2.8
2.9
3.0
0.5000
0.4602
0.4207
0.3821
0.3446

0.3085
0.2743
0.2420
0.2119
0.1841

0.1587
0.1357
0.1151
0.0968
0.0808

0.0668
0.0548
0.0446
0.0359
0.0287

0.0228
0.0179
0.0139
0.0107
0.0082

0.0062
0.0047
0.0035
0.0026
0.0019
0.0013

0.4960
0.4562
0.4168
0.3783
0.3409

0.3050
0.2709
0.2389
0.2090
0.1814

0.1562
0.1335
0.1131
0.0951
0.0793

0.0655
0.0537
0.0436
0.0351
0.0281

0.0222
0.0174
0.0136
0.0104
0.0080

0.0060
0.0045
0.0034
0.0025
0.0018
0.0013
0.4920
0.4522
0.4129
0.3745
0.3372

0.3015
0.2676
0.2358
0.2061
0.1788

0.1539
0.1314
0.1112
0.0934
0.0778

0.0643
0.0526
0.0427
0.0344
0.0274

0.0217
0.0170
0.0132
0.0102
0.0078

0.0059
0.0044
0.0033
0.0024
0.0018
0.0013

0.4880
0.4483
0.4090
0.3707
0.3336

0.2981
0.2643
0.2327
0.2033
0.1762

0.1515
0.1292
0.1093
0.0918
0.0764

0.0630
0.0516
0.0419
0.0336
0.0268

0.0212
0.0166
0.0129
0.0099
0.0075

0.0057
0.0043
0.0032
0.0023
0.0017
0.0012
0.4840
0.4443
0.4052
0.3669
0.3300

0.2946
0.2611
0.2296
0.2005
0.1736

0.1492
0.1271
0.1075
0.0901
0.0749

0.0618
0.0505
0.0409
0.0329
0.0262

0.0207
0.0162
0.0125
0.0096
0.0073

0.0055
0.0041
0.0031
0.0023
0.0016
0.0012
0.4801
0.4404
0.4013
0.3632
0.3264

0.2912
0.2578
0.2266
0.1977
0.1711

0.1469
0.1251
0.1056
0.0885
0.0735

0.0606
0.0495
0.0401
0.0322
0.0256

0.0202
0.0158
0.0122
0.0094
0.0071

0.0054
0.0040
0.0030
0.0022
0.0016
0.0011
0.4761
0.4364
0.3974
0.3594
0.3228

0.2877
0.2546
0.2236
0.1949
0.1685

0.1446
0.1230
0.1038
0.0869
0.0721

0.0594
0.0485
0.0392
0.0314
0.0250

0.0197
0.0154
0.0119
0.0091
0.0069

0.0052
0.0039
0.0029
0.0021
0.0015
0.0011
0.4721
0.4325
0.3936
0.3557
0.3192

0.2843
0.2514
0.2206
0.1922
0.1660

0.1423
0.1210
0.1020
0.0853
0.0708

0.0582
0.0475
0.0384
0.0307
0.0244

0.0192
0.0150
0.0116
0.0089
0.0068

0.0051
0.0038
0.0028
0.0021
0.0015
0.0011
0.4681
0.4286
0.3897
0.3520
0.3156

0.2810
0.2483
0.2177
0.1894
0.1635

0.1401
0.1190
0.1003
0.0838
0.0694

0.0571
0.0465
0.0375
0.0301
0.0239

0.0188
0.0146
0.0113
0.0087
0.0066

0.0049
0.0037
0.0027
0.0020
0.0014
0.0010
0.4641
0.4247
0.3859
0.3483
0.3121

0.2776
0.2451
0.2148
0.1867
0.1611

0.1379
0.1170
0.0985
0.0823
0.0681

0.0559
0.0455
0.0367
0.0294
0.0233

0.0183
0.0143
0.0110
0.0084
0.0064

0.0048
0.0036
0.0026
0.0019
0.0014
0.0010

43















44
Proporciones de rea para
la distribucin normal estndar

reas reportadas a continuacin
TABLA 2


2
2
1
*
2
1
) (
|
.
|

\
|

=
o

t o
x
e x F


Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0
0.1
0.2
0.3
0.4

0.5
0.6
0.7
0.8
0.9

1.0
1.1
1.2
1.3
1.4

1.5
1.6
1.7
1.8
1.9

2.0
2.1
2.2
2.3
2.4

2.5
2.6
2.7
2.8
2.9

0.0000
0.0398
0.0793
0.1179
0.1554

0.1915
0.2257
0.2580
0.2881
0.3159

0.3413
0.3643
0.3849
0.4032
0.4192

0.4332
0.4452
0.4554
0.4641
0.4713

0.4772
0.4821
0.4861
0.4893
0.4918

0.4938
0.4953
0.4965
0.4974
0.4981

0.0040
0.0438
0.0832
0.1217
0.1591

0.1950
0.2291
0.2612
0.2910
0.3186

0.3438
0.3665
0.3869
0.4049
0.4207

0.4345
0.4463
0.4564
0.4649
0.4719

0.4778
0.4826
0.4864
0.4896
0.4920

0.4940
0.4955
0.4966
0.4975
0.4982

0.0080
0.0478
0.0871
0.1255
0.1628

0.1985
0.2324
0.2642
0.2939
0.3112

0.3461
0.3686
0.3888
0.4066
0.4222

0.4357
0.4474
0.4573
0.4656
0.4725

0.4783
0.4830
0.4868
0.4898
0.4922

0.4941
0.4956
0.4967
0.4976
0.4983

0.0120
0.0517
0.0910
0.1293
0.1664

0.2019
0.2357
0.2673
0.2967
0.3238

0.3485
0.3708
0.3907
0.4082
0.4236

0.4370
0.4484
0.4582
0.4664
0.4732

0.4788
0.4834
0.4871
0.4901
0.4925

0.4923
0.4957
0.4968
0.4977
0.4983

0.0160
0.0557
0.0948
0.1331
0.1700

0.2054
0.2389
0.2704
0.2995
0.3264

0.3508
0.3729
0.3925
0.4099
0.4251

0.4382
0.4495
0.4591
0.4671
0.4738

0.4793
0.4838
0.4875
0.4904
0.4927

0.4945
0.4959
0.4969
0.4977
0.4984

0.0199
0.0596
0.0987
0.1368
0.1736

0.2088
0.2422
0.2734
0.3023
0.3289

0.3531
0.3749
0.3944
0.4115
0.4265

0.4394
0.4505
0.4599
0.4678
0.4744

0.4798
0.4842
0.4878
0.4906
0.4929

0.4946
0.4960
0.4970
0.4978
0.4984

0.0239
0.0636
0.1026
0.1406
0.1772

0.2123
0.2454
0.2764
0.3051
0.3315

0.3554
0.3770
0.3962
0.4131
0.4279

0.4406
0.4515
0.4608
0.4686
0.4750

0.4803
0.4846
0.4881
0.4909
0.4931

0.4948
0.4961
0.4971
0.4979
0.4985

0.0279
0.0675
0.1064
0.1443
0.1808

0.2157
0.2486
0.2794
0.3078
0.3440

0.3577
0.3790
0.3980
0.4147
0.4292

0.4418
0.4525
0.4616
0.4693
0.4756

0.4808
0.4850
0.4884
0.4911
0.4932

0.4949
0.4962
0.4972
0.4979
0.4985

0.0319
0.0714
0.1103
0.1480
0.1844

0.2190
0.2518
0.2823
0.3106
0.3365

0.3599
0.3810
0.3997
0.4162
0.4306

0.4429
0.4535
0.4525
0.4699
0.4761

0.4812
0.4854
0.4887
0.4913
0.4934

0.4951
0.4963
0.4963
0.4980
0.4986

0.0353
0.05753
0.1141
0.1517
0.1879

0.2224
0.2549
0.28552
0.3133
0.3389

0.3621
0.3830
0.4014
0.4177
0.4319

0.4441
0.4545
0.4633
0.4706
0.4767

0.4817
0.4857
0.4890
0.4916
0.4936

0.4952
0.4964
0.4964
0.4981
0.4986
45

3.0

3.5

4.0

0.4987

0.4997

0.4999



Proporciones del rea para la distribucin t












80% 90% 95% 98% 99% 80% 90% 95% 98% 99%
gl 0.10 0.05 0.025 0.01 0.005 gl 0.10 0.05 0.025 0.01 0.005

1 3.078 6.314 12.706 31.821 63.657
2 1.886 2.920 4.303 6.965 9.925
3 1.638 2.353 3.182 4.541 5.841
4 1.533 2.132 2.776 3.747 4.604
5 1.476 2.015 2.571 3.365 4.032
6 1.440 1.943 2.447 3.143 3.707
7 1.415 1.895 2.365 2.998 3.499
8 1.397 1.860 2.306 2.896 2.355
9 1.383 1.833 2.262 2.821 3.250
10 1.372 1.812 2.228 2.764 3.169

11 1.363 1.796 2.201 2.718 3.106
12 1.356 1.782 2.179 2.681 3.055
13 1.350 1.771 2.160 2.650 3.012
14 1.345 1.761 2.145 2.624 2.977
15 1.341 1.753 2.131 2.602 2.947

16 1.337 1.746 2.120 2.583 2.921
17 1.333 1.740 2.110 2.567 2.898

18 1.330 1.734 2.101 2.552 2.878
19 1.328 1.729 2.093 2.539 2.861
20 1.325 1.725 2.086 2.528 2.845
21 1.323 1.721 2.080 2.518 2.831
22 1.321 1.717 2.074 2.508 2.819
23 1.319 1.714 2.069 2.500 2.807
24 1.318 1.711 2.064 2.492 2.797
25 1.316 1.708 2.060 2.485 2.787

26 1.315 1.706 2.056 2.479 2.779
27 1.314 1.703 2.052 2.473 2.771
28 1.313 1.701 2.048 2.467 2.763
29 1.311 1.699 2.045 2.462 2.756
30 1.310 1.697 2.042 2.457 2.750

40 1.303 1.684 2.021 2.423 2.704
60 1.296 1.671 2.000 2.390 2.660
120 1.289 1.658 1.980 2.358 2.617
1.282 1.645 1.960 2.326 2.576




- Ejemplo: para que el rea sombreada represente 0.05 del rea total de 1.0, el valor de t con 10
grados de libertad es de 1.812.
46


Fuente: tomado de la tabla III de Fisher y Yates, Statistical Tables for Biological, Agricultural and Medical
Research, 6. Ed., publicado por Longman Ltd., Londres (y anteriormente por Oliver & Boyd, Edimburgo), con
autorizacin de la editorial.




CASO 1


Gnero Edad E. Civil Peso N. Hijos Ingresos N. Instruccin Ocupacin Gastos
M 20 CASADO 130 0 1500 SEC PUB 1100
F 21 SOLTERO 169 0 900 SUP PUB 650
F 22 SOLTERO 150 0 1250 SUP PUB 890
M 20 CASADO 170 0 580 SEC PUB 320
M 18 SOLTERO 140 0 480 PRI PUB 320
M 19 SOLTERO 140 0 480 PRI PRIV 320
F 26 SOLTERO 140 0 760 SUP PRIV 500
F 40 U.LIBRE 150 3 1000 SUP PRIV 810
F 46 U.LIBRE 190 1 540 PRI PUB 460
F 46 U.LIBRE 178 1 540 PRI PUB 460
M 32 SOLTERO 169 0 840 PRI PUB 600
M 32 SOLTERO 156 0 840 PRI PUB 600
M 28 SOLTERO 145 0 840 PRI PUB 630
M 32 SOLTERO 139 0 840 PRI PUB 600
M 32 SOLTERO 137 0 840 PRI PUB 640
M 30 SOLTERO 147 0 900 SUP PRIV 840
M 27 SOLTERO 167 1 900 SUP PRIV 840
F 28 CASADO 167 1 920 SEC PUB 760
F 31 CASADO 170 1 900 SUP PUB 500
F 32 U.LIBRE 147 1 800 SEC PRIV 600
M 26 CASADO 156 2 960 SEC PUB 700
M 26 CASADO 178 2 960 SEC PUB 590
F 26 U.LIBRE 157 2 1250 SUP PUB 1000
M 27 CASADO 168 2 960 SEC PUB 700
F 27 U.LIBRE 146 2 1430 PRI PRIV 980
F 29 CASADO 130 2 1152 SUP PUB 800
M 30 VIUDO 149 2 1400 PRI PRIV 950
M 32 CASADO 187 2 960 SEC PUB 700
M 33 CASADO 178 2 1140 SUP PRIV 750
F 34 U.LIBRE 150 2 1350 PRI PRIV 940
M 34 VIUDO 167 2 960 SUP PUB 840
F 35 CASADO 156 3 900 SEC PUB 700
M 34 CASADO 155 4 960 SUP PRIV 520
M 34 CASADO 159 4 960 SUP PRIV 510
M 34 CASADO 170 4 960 SUP PRIV 500
M 34 CASADO 180 4 960 SUP PRIV 600
F 34 CASADO 140 4 960 SUP PRIV 580
F 28 SOLTERO 138 0 540 SUP PRIV 430
F 28 U.LIBRE 145 0 500 SUP PUB 400
M 30 VIUDO 150 3 560 SEC PUB 440
F 45 CASADO 160 0 1000 SEC PRIV 860
F 45 SOLTERO 145 0 1000 SEC PRIV 860
F 45 SOLTERO 150 0 1000 SEC PRIV 730
47
F 37 SOLTERO 129 0 900 SUP PUB 600
F 36 SOLTERO 150 0 1400 SUP PUB 1100
M 41 SOLTERO 156 1 1116 SUP PUB 770
M 40 U.LIBRE 135 1 1000 SUP PRIV 710
F 46 U.LIBRE 167 1 1300 PRI PUB 970
M 39 SOLTERO 139 2 1000 SEC PRIV 860
M 45 VIUDO 146 2 960 SUP PUB 740
M 45 VIUDO 155 2 960 SUP PUB 670
M 45 VIUDO 157 2 960 SUP PUB 500
M 38 CASADO 156 3 1500 SUP PRIV 1150
F 40 CASADO 176 3 900 SEC PUB 690
M 40 U.LIBRE 157 3 1000 SUP PRIV 840
M 40 U.LIBRE 148 3 1000 SUP PRIV 790
M 40 U.LIBRE 138 3 1000 SUP PRIV 690
F 40 U.LIBRE 167 2 500 PRI PRIV 320
M 24 SOLTERO 132 0 900 SUP PRIV 670
F 24 CASADO 160 1 920 SEC PUB 760
F 24 CASADO 187 1 920 SED PUB 760
M 24 SOLTERO 130 1 900 SUP PRIV 640
F 23 U.LIBRE 130 2 500 PRI PRIV 320
F 23 U.LIBRE 160 2 500 PRI PRIV 320
F 23 U.LIBRE 129 2 500 PRI PRIV 320
F 22 SOLTERO 149 0 520 SUP PUB 240
F 22 SOLTERO 139 0 520 SUP PUB 240
F 22 SOLTERO 140 0 520 SUP PUB 240
M 18 SOLTERO 170 0 540 PRI PUB 300
M 18 SOLTERO 125 0 540 PRI PUB 300
M 20 SOLTERO 145 0 580 SEC PUB 240
F 31 SOLTERO 140 0 1000 SEC PRIV 800












48



Ca
so
2

Datos
corresp
ondient
es a
una
muestra de 10 bancos que operan en el Ecuador



















a) Crear un archivo que contenga la informacin de la tabla. Asignar a cada variable su etiqueta correspondiente
(Labels).

b) Generar las siguientes variables:

Nombre: Operacin:

Vardep Variacin de los depsitos del 2004 con relacin al 2003.
Vardepr Variacin relativa entre los depsitos del 2004 y 2003.
Varcred Variacin de los crditos del 2004 con relacin al 2003.
Varcredr Variacin relativa entre los crditos del 2004 y 2003.
Depofic Depsitos por oficina durante el ao 2004.
Empofic Nmero de empleados por oficina.
Benefemp Beneficios por empleado.

c) generar una variable (tamao) para clasificar los bancos en tres categoras en funcin del nmero de empleados.
Definir las tres categoras como sigue:
1. Hasta 60 empleados
2. De 61 hasta 100 empleados
3. Ms de 101 empleados
Banco Dep. 2004 Dep. 2003 Cred. 2004 Cred. 2003 Beneficios
Nmero de
empleados
Nmero de
Oficinas
Machala 444 402 310 294 3.7 136 34
Fomento 1632 1476 1143 1004 14.7 364 68
Bolvar 193 178 110 98 1.6 57 13
Pacfico 229 203 116 103 2.6 60 13
Agrcola 96 87 53 48 1.1 34 6
Londres 165 149 91 85 1.6 50 10
Amazonas 275 238 189 156 3.1 79 15
Loja 357 316 186 166 2.7 96 18
Guayaquil 317 297 224 195 3.7 98 18
Pichincha 6438 5854 3363 3118 41.2 1221 259
49

Definir la etiqueta correspondiente a cada categora (1 = pequeo, 2 = mediano, 3 = grande).

d) Determine los bancos que han obtenido respectivamente mayores y menores beneficios

e) Determine los bancos que han obtenido los mayores y menores beneficios por nmero de empleados.

f) Calcular el total de depsitos y el total de crditos del ao 2004 por tamao de banco y los principales
estadsticos

g) Calcular el total de beneficios, pero slo de aquellos bancos que hayan tenido un crecimiento en sus crditos de
al menos el 12 % con respecto al ao anterior, independientemente de su tamao.

h) Repetir el anlisis del literal anterior, pero ahora para aquellos bancos que hayan tenido un crecimiento
en sus crditos de a lo ms el 10 %.

You might also like