Professional Documents
Culture Documents
aplicada a la investigacin
de mercados
Unidades temticas
TEMA 1
Ordenamiento o
arreglo de datos
Los datos no procesados, son
grandes cantidades de nmeros
y tienden a confundir en lugar
de aclarar
El procesamiento de datos
disminuye la cantidad de
detalles pero facilita la tarea de
establecer relaciones
Tipos de datos
nominales: Definen
categoras
cualitativos
jerarquizados:Denotan
orden.
Ejemplos
continuos Discretos Nominales Jerarquizados
Carne
kg
cajas
Res puerco
pollo
Auto
Kph
kpl
#
defectos
colores
Buena
superior
excelente
Ms sucio
Distribucin de
frecuencia
Es un agrupamiento de
datos en clases, que
muestra el nmero o
porcentaje de
observaciones de cada
una de ellas
Elaboracin de una
distribucin de
frecuencia
Decidir el nmero de intervalos
de clase que se vayan a usar
Utilizar entre 5 y 15
Calcular la raz cuadrada de n y
ajustarla a los lmites de 5 a 15
Ejemplos
para 400 = 20 se ajusta a 15
para 40 = 6.32 se ajusta a 6 o 7
Amplitud de
Intervalos de clase
Distribucin de
frecuencias para datos
continuos
Ejemplo:
kg. De duraznos vendidos/da
11.1 12.5 32.4 7.8
4.4 6.1
23.5
9.2
26.2
8.1
0.0
Marca
de
Intervalos Frecuencia clase
xi
de clase kg
ni
0
< 5.5
5
2.75
5.5 < 11
7
8.25
11 < 16.5
15
13.75
16.5 < 22
5
19.25
22 < 27.5
5
24.75
27.5 < 33
3
30.25
xi = (lim inf + lim sup)/2
Medidas de tendencia
central
Medidas que se ubican en el
centro de la muestra o
poblacin.
Moda = mayor frecuencia
Media = = ((xi)(ni))/N
Mediana = M = L+C(j/fm)
L=Limite inferior de la clase donde se
encuentra n/2 sumando frecuencias.
C=Longitud de la clase.
j=Complemento de la suma de las
frecuencias anteriores para completar n/2.
fm=Frecuencia de la clase.
Aplicacin de la media
al problema anterior
Intervalo Frecuencia Marca de (xi)(ni)
de clase
clase xi
ni
0<5.5
5
2.75
13.75
5.5<11
8.25
57.75
11<16.5
15
13.75
206.25
16.5<22
19.25
96.25
22<27.5
24.75
123.75
27.5<33
30.25
90.75
= 40
= 588.5/40
= 14.7125 Kg
= 588.5
Aplicacin de la
mediana y moda
Intervalo Frecuencia Marca de (xi)(ni)
de clase
clase xi
ni
0<5.5
5
2.75
13.75
5.5<11
8.25
57.75
11<16.5
15
13.75
206.25
16.5<22
19.25
96.25
22<27.5
24.75
123.75
27.5<33
30.25
90.75
M = L+C(j/fm)
M = 11 + 5.5(8/15)
M =13.93 Kg
Mediana =13.93
Medidas de dispersin
Medidas que indican que tan
dispersos o alejados de la media
estn los datos de la muestra o
poblacin.
Varianza = 2 = (xi - )2 ni/N
Desviacin estndar o tpica =
= V (xi - )2 ni/N
Rango = Lim sup - Lim inf
de los intervalos de clase
Aplicacin de varianza
del problema en
cuestin
Intervalo Frecuencia Marca de (xi-) 2ni
de clase
clase xi
ni
0<5.5
5
2.75
715.2
5.5<11
8.25
292.12
11<16.5
15
13.75
13.82
16.5<22
19.25
103.06
22<27.5
24.75
504
27.5<33
30.25
724.47
= 2352.67
2 = 2352.67/40
2 = 58.81
Aplicacin de
desviacin estndar y
rango
= V 58.81
= 7.67 Kg
Rango = 33 - 0
Rango = 33 Kg
Tcnicas de
muestreo
Inferencia estadstica:
Establecer juicios de una
poblacin, despus de
examinar una muestra
Censo:
Examen de toda la poblacin
Muestreo:
Examen de una pequea parte
de la poblacin.
Muestra aleatoria
simple
Para poblaciones discretas es
aquella en que todos los
elementos de la poblacin
tienen la misma oportunidad de
ser incluidos en la muestra.
Para continuas es aquella en
que la probabilidad de incluir
cualquier intervalo de valores
en la muestra, es igual al
porcentaje de la poblacin que
est comprendida en dicho
intervalo.
Tablas de nmeros
aleatorios
Pasos para utilizar las tablas de
nmeros aleatorios
1- Hacer una lista de elementos
2- Numere la lista
3- Tome los nmeros de una tabla
de nmeros aleatorios
4- omita los que no correspondan
5- Estos nmeros se habrn de
incluir en la muestra.
Muestreo de juicio
Para muestras muy pequeas
Ejemplo:
En una cadena de restaurantes se
desea introducir una nueva tcnica
de servicio, y por costos solo se
implementar en 2 restaurantes en
este caso en lugar de hacer
pruebas resulta ms prudente
basarse en el conocimiento de sus
administradores,
Muestreos
probabilisticos
Muestreo sistemtico
Si los elementos de la lista no estn
en orden se puede muestrear cada
Kesimo elemento.
K = N/n
n= Tamao de la muestra
N= Tamao de la poblacin
Muestreo estratificado
Dividir la poblacin en subgrupos de
elementos semejantes.
Muestreo de acumulacin o
conglomerados.
Ordenar en subgrupos heterogneos
que sean representativos de la
poblacin como una mini poblacin.
Distribuciones de
probabilidad
Distribucin de Poisson
P(x) = (e- t ( t ) x) / x!
X = nmero de ocurrencias
e = base de logaritmos naturales
t = nmero de unidades (tiempo,
distancia etc.)
t = cantidad media de ocurrencias
respecto a t, de esta manera = t
P(x) = (e- ( ) x) / x!
Ejemplo
Suponga que los clientes llegan a un
negocio a razn de 2 por minuto y que
esta proporcin est bien aproximada
mediante el proceso de Poisson, si se
observa este proceso durente 30
segundos encuentre la probabilidad de
que:
a) no llegue nadie
b) lleguen 3
c) al menos lleguen 2
a) = t = 2(.5) = 1
P(x=0)= (e-1 (1 )0 ) / 0! = .3678
b) P(x=3)= (e-1 (1 )3 ) / 3! = .061
c) P(x=0)= (e-1 (1 )0 ) / 0! = .3678
P(x=1)= (e-1 (1 )1 ) / 1! = .3678
1 - (P(x=0)+ P(x=1)) = .2664
Distribucin
exponencial
Para tiempo y distancia
P(T >t) = e- t
P(T <t) = 1- e- t
El tiempo que tardan en recibir una orden
despus de hacerla en un restaurante
promedia 10 min.
a) Probabilidad de que espere ms de 10
minutos?
= 1/10 = 0.1 por minuto
P(T >10) = e-0.1 (10) = e-1 = 0.368
TEMA II Introduccin a la
estadstica
TCNICAS DE CONTEO T I
Probabilidad =
Resultados
deseados /
Resultados
posibles
Las tcnicas
de conteo son
frmulas
matemticas
para obtener
los resultados
posibles.
Principio de multiplicacin
V
V
F
V
F
F
V
V
F
V
F
F
Pregunta
No. 1 No. 2 No.3
De haber n
decisiones
secuenciales,
cada una con
m opciones el
nmero total
de resultados
posibles es mn
EJEMPLO
EWM359
COAHUILA
Ejemplo
6 x 2 x 2 x 3 = 72 opciones para
escoger su auto
Ejemplo
Una empresa capacita a cinco
equipos de promocin de ventas
sobre una tcnica distinta de
promocin a cada equipo, A, B,C, D
y E. Diga cuantas opciones posibles
hay para completar la promocin en
tres zonas de la ciudad.
5 x 5 x 5 = 125 opciones
PERMUTACIONES
Es un arreglo en un orden
particular de los objetos que
forman un conjunto
P(n,r) = n!/(n- r)!
P(N,R) = permutaciones de n objetos si
se toman r a la vez
n = nmero de objetos
r = objetos a la vez
FACTORIAL
El producto de
un entero
positivo por
todos los que le
preceden se
denota como n!
Y se lee n
factorial
n(n-1)! = n!
despejando
(n-1)!= n!/n
De esta manera
cuando n=1, se
define 0!=1
EJEMPLO
EWM359
COAHUILA
Si ninguna letra se
puede repetir
Ejemplo
Una empresa capacita a cinco
equipos de promocin de ventas
sobre una tcnica distinta de
promocin a cada equipo, A, B,C, D
y E. Diga cuantas formas distintas
puede iniciar la capacitacin en tres
zonas distintas de la ciudad.
P(n,r) = n!/(n- r)!
P(5, 3) = 5!/ (5 - 3)! = 60
permutaciones
COMBINACIN
Es una seleccin
de objetos sin
importar el orden.
(n/r)=n!/(n-r)! r!
(n/r)=combinaci
n de r objetos
tomados de un
conjunto n de
estos.
n= nmero de
objetos
r= objetos a la
vez
EJEMPLO
Una empresa capacita a cinco equipos
de promocin de ventas sobre una
tcnica distinta de promocin a cada
equipo, A, B,C, D y E. Diga en
cuantas combinaciones distintas
puede iniciar la capacitacin en tres
zonas de la ciudad.
(n/r)=n!/(n-r)! r!
(5/3) = 5! /(5 - 3)! 3! = 10
combinaciones
Teoras de probabilidades
P = Resultados deseados /
Resultados posibles
Muestreo con reemplazo
Al obtener muestras aleatorias de un
espacio muestral, y al reemplazar dichas
muestras antes de las siguiente muestra, se
llama muestreo con reemplazo, y en cada
muestreo la probabilidad ser la misma.
P(
) = 4/7
Ejemplo
Una concesionaria tiene
a la venta por sorteo el
siguiente lote de autos,
reemplazando siempre
el auto que sea sorteado
por otro del mismo
color.
Cual es la probabilidad
que en el segundo sorteo
salga un auto
Cual es la probabilidad
que en el 5o sorteo salga
un auto
R = 1/4 y 1/6
Teoras de probabilidades T II
P = Resultados deseados /
Resultados posibles
Muestreo sin reemplazo
Al obtener muestras aleatorias de
un espacio muestral, y al no
reemplazar dichas muestras antes
de la siguiente muestra, se llama
muestreo sin reemplazo, y en cada
muestreo la probabilidad ser en
aumento.
P1 (
P2 (
P3 (
) = 4/7
Ejemplo
Una concesionaria tiene
a la venta por sorteo el
siguiente lote de autos, y
si no son reemplazados
Cual es la probabilidad
que en el segundo sorteo
salga un auto
R = 9/12 x 3/11 = 27/132
Cual es la probabilidad
que en el 3er sorteo salga
un auto
R = 10/12 X 9/11 X 2/10 = 180/1320
Probabilidad compuesta
En una ciudad se editan dos peridicos A y
B. El peridico A lo leen 40 de 100 personas,
mientras que el B lo leen 25 de cada 100.
Los lectores de ambos peridicos son 15 de
cada 100. Que probabilidad hay de que una
persona en esta ciudad lea alguno de estos
dos peridicos?
P = (A U B ) = 40 + 25 - 15 = 50 %
A
25
15
10
P = (A U B ) = 25 + 15 + 10 = 50 %
Ejemplo
R = 10%
Probabilidad condicional
La distribucin de 125 autos de una empresa
segn su modelo y su motor es la siguiente:
AUTOS
6 Cilindros
8 Cilindros
SUMA
Austero
40
30
70
Clsico
15
25
40
Lujo
10
5
15
SUMA
65
60
125
0.56
S
E
N
D
O
A
I
D
C
I
U
L
I
B
I
B
R
A
T
B
I
S
I
O
I
I
R
D P
T
E
D
Distribucin Binomial
(n/x) = combinacin
n = nmero de ensayos
x = nmero de xitos
P = probabilidad
Ejemplo
Un vendedor de autos nuevos observa que
el 80% de los autos vendidos son
regresados al departamento de servicios
para corregir diversos defectos de
fabricacin en los primeros 25 das despus
de su compra. De los 11 autos que se
vendieron en un perodo de 5 das cual es
la probabilidad de que:
(11/11) = 1
Combinaciones
(11/10) = 11
Ejemplo
El 8% de los emparedados se piden sin
mayonesa, si 7 personas piden
emparedados encuentre la probabilidad
que:
a) Todos lo quieran con mayonesa
P(X) = (7/7) (0.92)7 (0.08)0 = 0.5578
b) Solo uno lo quiera con mayonesa
P(X) = (7/1) (0.92)1 (0.08)6 = 0.00000168
Distribucin Normal
Distribucin normal
Frmula de Transformacin
z=X-/
Ejemplo
Pizza Rpida tiene registrados los
tiempos de entrega a clientes en la
siguiente tabla, y piensa regalar la
pizza que sea entregada despus de
los primeros 30 min. de que fue
cocinada, encuentre la probabilidad
de que una pizza sea regalada a un
cliente.
= media
10
15
25
20
30
10
10
25
35
15
20
30
15
10
10
20
15
20
15
25
10
15
10
= promedio
=420/25
=16.8
Desviacin estndar
= desviacin estndar o
tpica
= V (xi - )2 / N
= 1544
= V1544/25 = 7.85
Intervalos
Marcas de clase
xi
Frecuencias
ni
(xi)(ni)
(x-) ni
5 < 15
10
90
761.76
15 < 25
25 < 35
20
30
10
5
200
150
6.4
583.2
35 < 45
40
40
432.64
= 480 = 1784
= (xi ni) / N
= 480 / 25 = 19.2
= desviacin estndar o
tpica
= V (xi - )2 ni/ N
= V1784 / 25
= 8.44748
Diferencia
Existe una diferencia entre los mtodos
anteriores utilizados para encontrar la media
y la desviacin estndar, aunque el primero
es ms exacto el segundo es el ms utilizado
porque simplifica los clculos, por lo que
debemos practicar el trabajar con datos
agrupados.
Una vez calculados la media y la desviacin
estndar podremos calcular cualquier
probabilidad utilizando la tabla de la
distribucin normal.
Siempre recuerda que la probabilidad
encontrada en la tabla es la probabilidad de
la media al valor estandarizado, es el rea
bajo la curva entre estos dos puntos.
Uso de la tabla
Como nos preguntan la probabilidad de
que se regale la pizza, entonces
tendremos que estandarizar el 30 porque
debemos encontrar la probabilidad de que
sean entregadas en un tiempo mayor de
los 30 minutos
z = (X - ) /
z = (30 - 19.2 / 8.44) = 1.278
19. 30
buscamos este valor en la tabla de la
2
normal y encontramos una probabilidad de
0.3996, esa es la probabilidad de la media
al 30, por lo que la probabilidad mayor de
30 ser 0.5 - .3996 = 0.1004 = 10%
Criterios para
seleccionar un buen
estimador
IMPARCIALIDAD:
La media de la distribucin de muestreo de las
medias de muestras tomadas de una misma
poblacin es igual a la media de la poblacin
EFICIENCIA:
De dos estadsticas de muestras del mismo
tamao de una misma poblacin, ser ms
eficiente la que tenga menor error estndar o
menor desviacin estndar.
COHERENCIA:
El tamao de la muestra debe ser el adecuado
para que la estadstica sea un estimador
coherente.
SUFICIENCIA:
Cantidad suficiente de informacin en la
muestra sobre el parmetro de la poblacin
EJEMPLO: Estimacin
puntual
98
97
93
105 100
93
94
97
97
97
107
1 0 0 1 10 1 0 6 1 1 0 1 0 3
99
93
98
1 06 1 0 0 1 1 2 1 0 5 1 0 0
114
97
1 10 1 0 2
98
112
99
Estimacin de
intervalo
El director de investigaciones de mercado
de una fbrica necesita hacer una
estimacin de la vida promedio de
bateras, se registra el nombre y el
telfono del propietario.
Se encuentra la media para una
estimacin puntual, si es de 36 meses
podramos estimar la duracin media de
la poblacin de 36 meses, pero el director
pide que se de una afirmacin acerca del
intervalo dentro del cual es probable que
est la media de la poblacin, y para esto
debemos encontrar el error estndar de la
media
= / Vn
para poblacin infinita
Estimacin de
intervalo de la media a
partir de muestras
grandes.
Un gran distribuidor de refacciones
automotrices necesita una estimacin de
la vida media que cabe esperar de los
limpiabrisas en condiciones normales de
manejo. La gerencia ya ha determinado
que la desviacin estndar de la
poblacin es de 6 meses, cuando
seleccionamos una muestra aleatoria
simple de 100 limpiabrisas y reunimos los
datos referentes a su vida til, y
obtenemos estos resultados.
N = 100
tamao de la muestra
desv estndar
47.5
= 95%
21
47.5 en la tabla = 1.96 = z
+ 1.96 =lmite de confianza sup.
- 1.96 =lmite de confianza inf.
Estimacin de
intervalo de la porcin
a partir de muestras
grandes
p = porcin de xitos en una muestra
p = media de la porcin de xitos
p = P
P = probabilidad de obtener un xito
Error estndar de la porcin
p= Vpq/n
q = porcin de no xito
Ejemplo
En una muestra de 75 personas el 40%
toman cocacola y el director de
investigaciones de mercados necesita un
99% de confianza para encontrar un
intervalo de la verdadera porcin de la
poblacin.
n = 75 tamao de la muestra
p = 0.4 xitos
q = 0.6 no xitos
p = V P q / n = V (0.4)(0.6)/75
p = 0.057 error estndar de la porcin.
45.9
Tamao de la muestra
para estimar una
media
Una tienda est interesada en obtener
una estimacin de intervalo para el
nmero medio de clientes que entran a la
tienda diariamente, los dueos saben que
existe una diferencia de 90 clientes entre
el ndice ms bajo y el ms alto.
Determine el tamao de la muestra que
se deber utilizar con el fin de desarrollar
un intervalo de confianza de 96% para el
nmero medio real de clientes con un
ancho de solamente +8 personas.
Una estimacin burda de la desviacin
estndar sera
6 = 90 clientes (3 a la izq. Y 3 a la der)
= 90 / 60 = 15 clientes
Z=8
para encontrar z debemos utilizar el
nivel de confianza en la tabla
96%
48
48
tenemos que = / V n
3.9 = 15 / V n
n = 14.79 = 15
Tamao de la muestra
para estimar una
porcin
Tenemos indicios que el 60 % de la
poblacin (>100 000) consumen un
producto. Encuentre el tamao adecuado
de la muestra para estimar un intervalo de
ancho + 5%para encontrar la verdadera
porcin con un 90 % de confianza.
p= VPq/n
Despejando
n = p q / ( p )2
sabemos que 90% en tabla z = 1.65
p = 0.6 q = 0.4
Y como z p =.05
p= 0.05/1.65 = 0.03
p= 0.03
sustituimos en la frmula
n = (0.6)(0.4)/(0.03)2 = 266.66 =267
NOTA:
Para poblaciones infinitas > 100 000
podemos considerar el error E entre
0.02 y 0.06 y utilizamos las sig
frmulas:
E=p
n = pxq/E2 para 90% de confianza
n = 3.84pxq/E2 95% de confianza
n = 7.52 pxq/E2 99% de confianza
el factor 3.84 se obtiene encontrando z de la tabla
de acuerdo al nivel de confianza y elevando al
cuadrado.
Y si no conocemos la p q se les da el valor de 0.5
3.84 N p x q
E2(N - 1) + 3.84 p x q
para un 95 % de confianza
Prueba de hiptesis
de la media
En una muestra de 100 ejes traseros de
camin que deben soportar 80 000 libras
por pulgada cuadrada se encontraron los
siguientes resultados, despus de
someterlos a pruebas de esfuerzos.
= 79,600
= 4,000
n = 100
HO = 80 000
Si el fabricante usa un nivel de
significancia de 0.05 en las pruebas
Cumplirn los ejes con el requisito?
= / Vn = 4000/ V 100 = 400
como el nivel de significancia es de 0.05
se divide entre 2, porque la resistencia de
los ejes no puede ser muy baja pero
tampoco muy alta por los costos
.475
.475
Z = 1.96
0.025
0.025b
Correlacin y
regresin
OBSERVACIN DE VARIABLES
RELACIONADAS
La correlacin mide la fuerza de una
relacin entre dos variables; y la regresin
da lugar a una ecuacin y = a + bx
EJEMPLOS
Un T S U en comer puede explicar los
cambios de la demanda de un producto,
en trminos del nivel de empleo, el precio
de un producto usado en trminos del
tiempo del uso etc.
EJEMPLO
Se indaga si el precio de un auto
usado depende del kilometraje
y es la variable dependiente (precio)
x es la variable independiente (km)
n es nmero de observaciones
Al parecer los autos muestran una
relacin lineal en el kilometraje y el
precio.
Mtodo de mnimos cuadrados
b=
a=
n ( x y ) - ( x ) ( y )
n ( x2 ) - ( x )2
y- bx
n
y sustituimos en y = a + bx para
encontrar los costos
BIBLIOGRAFA