Professional Documents
Culture Documents
INVESTIGACIN DE MERCADO Y
SATISFACIN DEL CLIENTE
rea Tcnico-Instrumental
Actualizada por:
M.G.C. Minerva Reyes Flix
CONTENIDO
Pg.
Introduccin
Objetivos
1
3
4
4
6
10
13
15
17
18
51
51
52
52
55
57
59
62
63
63
64
65
67
68
18
18
19
21
21
22
22
30
34
34
50
69
69
69
70
71
72
74
78
80
81
82
87
91
93
100
REFERENCIAS
101
ANEXO
103
Introduccin
La investigacin de mercados, hoy en da, se ha constituido como la
herramienta ms poderosa del mundo empresarial. Su fin esencial, est
enmarcado en la bsqueda de los niveles de aceptacin de un producto y de los
aspectos que se deben considerar a futuro en su diseo y fabricacin. Si tomamos
en cuenta que vivimos en una sociedad rodeada de productos, podremos
comprender la importancia que tiene investigar cul es el mercado para dichos
productos, y cmo este mercado se comporta.
Por esto, se requiere de todo un instrumental tcnico y del manejo de una teora
que habilite al estudioso en tal disciplina. Significa entonces que la investigacin
de mercados no es slo un desarrollo cuantitativo, sino que requiere de un
tratamiento especial en la ciencia Estadstica para el manejo de informacin.
Ciertamente, la Estadstica ha provisto a sus seguidores dentro de la investigacin
de mercados, de elementos necesarios que sustentan la base de la Mercadotecnia
en su esfera cuantitativa. Cada necesidad de la Mercadotecnia es respondida por
un cuantioso nmero de alternativas (tcnicas y mtodos) que le corresponden a
la Estadstica. Tales alternativas van desde la elaboracin de una encuesta,
pasando por su diseo, aplicacin y valoracin, muestreo, pruebas de hiptesis,
tabulacin cruzada, hasta el anlisis de regresin y el uso de tcnicas
multivariadas.
De esta manera, para la investigacin de mercados el Estadstico es el profesional
que la lleva a sus fines ulteriores; y para este significa desarrollarse como tal y
ampliar el campo de trabajo junto con las perspectivas de desarrollo de la misma
ciencia, ya que ante todo, existe una retroalimentacin entre la ciencia y la
investigacin, aun cuando esta ltima no sea pura. Cuando hablamos de
desarrollo, nos referimos a un gran reto, no significa solamente extenderse y
abarcar indistintamente cualquier aspecto de la Mercadotecnia (entendida esta
como el conjunto de tcnicas, procedimientos y teoras para el estudio del
mercado), sino ms bien debemos referirnos al desarrollo como un mejoramiento
en todos los sentidos de las tcnicas estadsticas que optimicen los fines de la
Mercadotecnia. Es decir, debemos ampliar el horizonte de la Estadstica y
adecuarlo a la expansin del mercado conforme este va desarrollndose.
Este desarrollo slo puede tener un indicativo tanto para investigadores como para
aquellos que requieren de estos ltimos; es decir, los empresarios: motivar la
bsqueda de actualizacin y aportacin en la Investigacin de Mercados. Estudiar
al mercado, encierra en s mismo un sin nmero de implicaciones que deben
culminar en la puesta en prctica de recomendaciones y acciones especficas.
Si se orienta la investigacin de mercados hacia campos de lucro, y si se hace
persiguiendo un fin social, en ambas formas tendramos que aceptar la
generalizacin del uso de la Estadstica. Cada da la extensin geogrfica y
1
Objetivos
Objetivo General
Que los estudiantes adquieran las competencias bsicas para el diseo y
desarrollo de la investigacin de mercado y de estudios de satisfaccin del cliente
en el marco de la gestin de la calidad.
Objetivos particulares
1. Que el estudiante conozca los diferentes mtodos para la obtencin de
informacin en la investigacin de mercado y la satisfaccin del cliente.
2. Que el estudiante aprenda a construir y validar instrumentos para evaluar la
satisfaccin del cliente.
3. Que el estudiante sepa como establecer la forma y el tamao de la muestra a
tomar en la investigacin de mercado y la evaluacin de la satisfaccin del
cliente.
4. Que el estudiante conozca mtodos estadsticos para el anlisis de la
informacin obtenida en la investigacin de mercado y evaluacin de la
satisfaccin del cliente.
5. Que el estudiante aprenda a elaborar reportes de estudios de mercado y
satisfaccin del cliente.
Investigacin de mercados.
La investigacin de mercados contribuye a la planificacin, ejecucin y control de
las funciones del marketing. En la fase de planificacin debe aportar la informacin
necesaria sobre el mercado, para establecer la estrategia a ejecutar. En la fase de
ejecucin debe definir las acciones a llevar a cabo para lograr las estrategias
comerciales establecidas. Y por ltimo, en la fase de control realizar el
seguimiento de las acciones comerciales realizadas y la determinacin del grado
de cumplimiento de los objetivos comerciales prefijados.
INFLUYEN
Situacin econmica
Tecnologa
Aspectos legales y polticos
Publicidad
Aspectos sociolgicos
Competencia
Ventas
Etc.
ELEMENTOS DEL
MIX
Precio
Producto
Promocin
Distribucin
11
estadsticas vitales sobre los clientes. Por ejemplo, cuando salimos a comprar
ropa, aunque el vendedor rene cierta informacin demogrfica sobre nosotros,
como estatura, peso, medidas, etc., el vendedor an no sabe cules son nuestros
gustos, colores preferidos; slo tiene datos generales sobre nosotros. Los datos
demogrficos son datos sobre perfiles reales de los diferentes segmentos de
clientes a quienes se pretende llegar con algn producto o servicio; incluyen
informacin sobre caractersticas fundamentales de los clientes, tales como edad,
sexo, estado civil, ingresos, etc. Permiten conocer el tamao, densidad y
distribucin de diferentes grupos de clientes. Debido a que los factores
demogrficos suministran el perfil de los clientes, stos constituyen la primera
fuente de informacin. Estos datos son el medio ms comn para identificar
nuevos objetivos para algn producto o servicio; es decir, ayudan a conocer
quines son los clientes. Los datos demogrficos se pueden obtener de censos
estatales y locales, si es que se necesitan datos generales. Muchas
organizaciones cuentan con departamentos que se encargan de recoger perfiles
demogrficos de clientes. Si algn negocio no lo tiene, puede recurrir a una fuente
externa para que le proporcione esta informacin.
Sin embargo, los datos demogrficos no dirn por qu compran los clientes, cmo
lo hacen, ni acerca de qu los motiva, irrita, los hace venir o alejarse. Para esta
informacin se necesitan datos psicogrficos. Con estos datos se responde a
preguntas que le inquietan al gerente, como: qu les viene a la mente a los
clientes cuando piensan en su negocio?, qu les motiva?, qu pasa por su
cabeza en el momento de la verdad?, etc. Es decir, estos datos son tiles cuando
nos queremos meter en la cabeza del cliente para saber qu es lo que piensa o
siente acerca de algn producto o servicio. Los datos psicogrficos explican en
gran parte los factores crticos en las evaluaciones hechas por los clientes; y
permiten conocer los acontecimientos significativos asociados a la satisfaccin con
algn producto o servicio. Estos datos son importantes porque nos dan un
conocimiento y una idea sobre qu motiva e influye en los clientes en sus
relaciones con el negocio. Muchos negocios pueden cometer errores en este
punto. Creer que saben de antemano lo que motiva a los clientes hace que se
diseen sistemas y mtodos que pueden no ser apropiados para elevar la
satisfaccin.
Existen diferentes tipos de clientes, dependiendo de lo que ellos quieren y cmo
salen a conseguir lo que quieren. Algunos clientes estn ms orientados hacia el
proceso que hacia el contacto con la gente; es decir, hacia los empleados
encargados del servicio. Generalmente se interesan ms por cmo funcionan las
cosas que por el componente relaciones humanas. Otros le dan ms importancia a
la relacin humana.
Dependiendo de cmo salen los clientes a conseguir lo que quieren, algunos
operan con un nivel alto de exigencia y otros se conforman con niveles bajos de
atencin. Los clientes exigentes generalmente quieren lo mejor, piden que las
cosas funcionen bien desde la primera vez y tienen poca tolerancia para las fallas
14
17
2.4.1 La observacin
En la recopilacin de datos por medio de observacin, como su nombre lo
indica, los investigadores sin establecer comunicacin con los sujetos de estudio,
se limitan a observar las acciones y hechos que les interesan. En algunas
ocasiones son personas las que se encargan de hacer las observaciones y en
otras se utilizan dispositivos mecnicos para observar y registrar la informacin
deseada.
Un ejemplo de observacin con personal son las que realizan dentro de un
almacn para saber si la gente compra por impulso o se fija en el producto, si
verifica los precios. Algunos ejemplos de observacin mecnica son: el audmetro,
que registra el nmero de receptores de radio y televisin que estn sintonizados
en determinada estacin. Algunos dispositivos ms especializados son el
psicogalvanmetro, que mide las reacciones emotivas de las personas a travs de
los cambios en la sudoracin, y la cmara ocular, qu ltimamente ha tenido gran
xito pues registra cambios o movimientos de los ojos que pueden interpretarse,
por ejemplo, como agrado o desagrado por un producto.
21
2.4.2 La encuesta
La encuesta es uno de los mtodos ms utilizados en la investigacin
comercial. Es un mtodo que sirve para obtener informacin especfica de una
muestra de la poblacin por medio de preguntas que pueden ser de forma oral o
escrita.
22
2.4.2.1 Cuestionario
A la lista formal de preguntas se le llama cuestionario. La funcin del cuestionario
es la medicin: puede medir el comportamiento pasado (a menos que existan
registros, los eventos pasados no podran ser analizados ms que por el mtodo
de cuestionario); puede medir las actitudes, esto es, las actitudes, que no se
pueden medir de otra manera ms que por este mtodo; tambin puede medir las
caractersticas del perfil del encuestado, como edad, sexo, nivel socioeconmico,
etc.
El contenido de las preguntas tiene que ver con la habilidad o buena voluntad del
encuestado para responder con precisin. El investigador debe de estar
consciente de la capacidad del encuestado para proporcionar informacin. Mucha
informacin no se puede recopilar con exactitud, ya sea porque el encuestado no
est bien informado o porque sea olvidadizo, como se explic anteriormente. Una
vez que se han analizado los problemas que trae consigo el contenido de las
respuestas, se debe de analizar el tipo de preguntas que van a utilizarse. Estas
preguntas se basan en formatos de respuesta estructurados y no estructurados.
Las preguntas pueden ser de respuesta abierta, de eleccin mltiple o dicotoma.
En las preguntas de respuesta abierta, los encuestados tienen la libertad de
contestar lo que ellos piensen que es lo correcto, con sus propias palabras. En la
entrevista por correo se debe dejar un espacio para la respuesta, y en entrevistas
personales el investigador debe de apuntar en el cuestionario lo que el encuestado
conteste verbalmente. La ventaja de este tipo de preguntas es que permiten que
se expresen las actitudes generales y pueden ser de gran ayuda para interpretar
las preguntas ms estructuradas. Adems establecen una armona y logran
obtener la cooperacin del encuestado para que conteste preguntas ms
especficas estructuradas; estas preguntas son muy importantes como
introduccin en una entrevista por correo. Otra de las ventajas es que puede
proporcionar al investigador ideas, comentarios y razones tiles para darse una
idea de los resultados de la investigacin.
Una desventaja de las preguntas abiertas, es que muchas veces el entrevistador
no toma la respuesta tal y como se la da el encuestado, si no que escribe los
puntos que considera ms importantes; esto se debe a que los entrevistadores no
escriben rpido o estn limitados de tiempo y mientras ms resuman la respuesta
registrada menos se parecer a la respuesta real. Cuando los entrevistadores
utilicen este tipo de preguntas es conveniente utilizar una grabadora; otra
desventaja es el tiempo y el costo asociado con la codificacin de las respuestas,
ya que en una encuesta grande se necesitan procedimientos exhaustivos de
codificacin, para resumir las respuestas en un formato til para el anlisis y
presentacin de la informacin. El tiempo y costo del proceso de codificacin
puede ser muy significativo en el costo total de la investigacin. Las preguntas de
respuestas abiertas son apropiadas para el anlisis exploratorio de un problema.
Algunas veces se utilizan preguntas precodificadas con el fin de aprovechar las
ventajas de las preguntas abiertas y disminuir las desventajas en tiempo y costo.
Una pregunta precodificada es una pregunta de eleccin mltiple. En las
preguntas de eleccin mltiple el encuestado debe de elegir una respuesta de una
lista suministrada en la pregunta. El entrevistado puede elegir una o ms
alternativas que se le presenten. Estas preguntas superan muchas de las
desventajas de las preguntas abiertas; la ms importantes es que reducen el costo
y tiempo asociado con el procedimiento de la informacin. Pero tambin tiene sus
desventajas, una de ellas es que el diseo de preguntas efectivas de la seleccin
mltiple requiere de una cantidad considerable de tiempo y costo. Por lo general
se requiere un estudio exploratorio con base a preguntas abiertas, para poder
26
28
2.4.2.2 La entrevista
La entrevista se utiliza para recabar informacin en forma verbal, a travs
de preguntas que propone el entrevistador a un entrevistado. La entrevista es un
intercambio de informacin.
30
Entrevista personal
Consiste en realizar una entrevista por una persona denominada
encuestador a otra denominada encuestado.
Existen varios tipos:
Entrevistas estructuradas. Las cuales se realizan utilizando un cuestionario
elaborado previamente. El entrevistador por tanto se limita a pasar
secuencialmente el cuestionario a la persona que proceda.
Entrevistas semiestructuradas. El entrevistador utiliza como herramienta un
cuestionario no muy extenso y tiene cierta libertad en la confeccin del mismo
en funcin del entrevistado.
Entrevista libre o en profundidad. No existe un cuestionario previo aunque s un
guin para evitar perderse y no alcanzar los objetivos buscados cuando los
temas de debate se hayan alejado en exceso de los deseados. El entrevistado
puede libremente expresarse sobre los temas que se plantean.
31
El alto grado de respuestas. Son pocas las personas que declinan responder al
ser un contacto tan directo y muchas menos las que lo abandonan una vez
iniciado.
Se puede realizar a cualquier persona independientemente de su status social,
cultural, etc.
En las respuestas del entrevistado se evita la influencia de terceras personas.
Mediante las explicaciones de las preguntas y de las posibles respuestas del
entrevistador se eliminan las respuestas evasivas No sabe (NS)/ No contest
(NC).
Se puede mostrar o entregar cosas al entrevistado, tales como anuncios,
paquetes, productos, etc., Por lo que si se requiere hacer alguna demostracin
en el estudio se debe usar la encuesta personal.
Se puede obtener informacin adicional del entrevistado a travs de la
observacin por el encuestador, por ejemplo forma de vestir, nivel cultural,
social, etc.
La rapidez, dividiendo la muestra en distintos mercados y realizando entrevistas
en varios mercados es factible determinar estudios grandes en un perodo de
tiempo relativamente corto. Si bien sera ms largo que realizar encuestas por
telfono.
Las desventajas que surgen son:
En primer lugar est el costo por entrevista, especialmente las entrevistas
puerta a puerta tienen un coste por entrevista varias veces superior a las
investigaciones realizadas por correo o telfono. De manera que slo en
aquellas ocasiones que sea estrictamente necesario el contacto personal se
utilizarn las mismas dado que los fuertes costes suponen un elemento en
contra.
Es una metodologa lenta en obtener la informacin puesto que depende del
nmero de entrevistas que se realicen y de su duracin.
Existe la posibilidad de que el entrevistador incorpore distorsiones en la
obtencin de la informacin debido a las explicaciones, la forma de preguntar,
etc. Lo que puede originar que las respuestas no sean las que libremente dara
el entrevistado por lo que esto representa una importante dispersin en el
proceso de obtencin de informacin.
Los entrevistadores deben ser controlados para que la informacin que
presentan sea veraz y comprobar que realmente procede de las personas
entrevistadas que conforman la muestra. Para comprobar todo ello es necesario
incorporar muchos controles de seguridad.
En cuanto a las tendencias sobre las entrevistas personales a pesar de los
inconvenientes anteriormente mencionados debemos decir que existen algunos
tipos de investigaciones comerciales: publicidad, packaging, por mencionar
algunas, en las que es necesario contactar personalmente con los entrevistados,
de ah que han surgido un nuevo tipo de entrevistas, que son las entrevistas por
detencin, que consiste en detener a los entrevistados en zonas de gran afluencia
32
2.5.1 Confiabilidad
Sinnimos de confiabilidad son estabilidad, fiabilidad, consistencia,
reproducibilidad, predictibilidad o falta de distorsin. Por ejemplo, las personas
confiables son aquellas cuyo comportamiento es consistente, predecible y fiable
(aspecto importante en un estudio de mercado); lo que hacen maana y la
siguiente semana ser consistente con lo que hacen hoy y con lo que hicieron la
semana pasada; se dice que son estables. Por otro lado, las personas poco
confiables son aquellas cuyo comportamiento es mucho ms variable; son
impredeciblemente variables. En algunas ocasiones hacen algo; y en otras, algo
distinto; carecen de estabilidad. Se dice que son inconsistentes.
Lo mismo sucede con las mediciones en investigacin de mercado: las personas o
consumidores son ms o menos variables de una ocasin a otra. O son estables o
relativamente predecibles, o son inestables y relativamente impredecibles; son
consistentes o no lo son. Si son confiables, entonces se puede depender de ellas;
si no son confiables, no se puede depender de ellas.
La definicin de confiabilidad se enfoca de tres maneras:
Un enfoque se sintetiza con la pregunta: si se mide el mismo conjunto de objetos
una y otra vez, con el mismo instrumento de medicin o uno comparable, se
obtendrn iguales o similares resultados? La pregunta implica una definicin de
confiabilidad en trminos de estabilidad, fiabilidad y predictibilidad. Es la definicin
que se ofrece en discusiones elementales del tema.
Un segundo enfoque se sintetiza con la pregunta: las medidas obtenidas a partir
de un instrumento de medicin son las medidas verdaderas de la propiedad que
34
Donde:
k es el nmero de tems
i2 es la suma de las varianzas de todos los tems
0.60 a 0.70 poco aceptable, 0.70 a 0.80 respetable, 0.80 a 0.90 muy bueno y
valores >0.90 se debe considerar una reduccin del nmero de tems en la escala.
Ejemplo, suponga, que tenemos 5 tems y que estos son altamente consistentes
con un coeficiente alfa observado de 0.80. Donde cada tem tiene respuestas de 1
hasta 5 (Respuesta tipo Likert). La suma de la escala es la suma de las cinco
respuestas a los tems. Tericamente los valores mnimo y mximo son 5 y 25
respectivamente. La suma de la escala no debera ser hecha cuando los tems no
son internamente consistentes es decir, si hay tems con coeficientes alfa bajos, o
si son muy pocos los tems o tienen muy poco en comn.
Un coeficiente de confiabilidad de 0.85 significa que 85% de la varianza en las
puntuaciones de la prueba depende de la varianza verdadera en el rasgo medido y
que el 15% depende de la varianza del error.
La interpretacin ms clara sigue siendo la que se limita a expresar lo que dice la
misma frmula: es la proporcin de co-variacin, que si es grande implica
relaciones claras entre los tems. Consistencia interna parece un trmino
adecuado en este caso.
Sobre el valor mnimo que debe tener el coeficiente no hay normas especficas,
ni tampoco puede hablarse de una prctica comn; es un valor que est entre 0 y
1 y hay que evaluar teniendo en cuenta ms datos y el uso previsible del
instrumento. Algunos autores proponen un mnimo de 0.70 para investigaciones
bsicas, algunos otros ponen el lmite en 0.85 si van a tomar decisiones sobre
individuos y de 0.60 para otros usos. Se trata, por supuesto, de valoraciones
orientadoras.
2.5.2 Validez
La definicin de validez en un sentido general menciona que un cuestionario
es vlido si mide lo que se pretende medir con l. Por lo tanto, la validez de los
instrumentos de medicin tiene que ver con lo que miden y con qu tan bien lo
hacen; nos indica qu se puede inferir a partir de sus resultados, es decir, un test
es vlido cuando est demostrado que mide aquello que se presupona o se
pretenda midiese.
El anlisis factorial es esencialmente un mtodo para encontrar aquellas variables
que tienen algo en comn. Si algunos reactivos de una prueba de personalidad
estn diseados para medir satisfaccin, entonces en un anlisis factorial, dichos
reactivos deben cargarse mucho hacia un factor y poco hacia los otros, por lo
tanto el anlisis factorial constituye un mtodo que indica en qu medida miden la
misma cosa y en qu grado miden aquello que miden.
El anlisis factorial es particularmente relevante para los procedimientos de
validacin del cuestionario dicho anlisis contribuye directamente a aclarar dos
puntos fundamentales en la explicacin de los cuestionarios o constructos 1) su
38
39
Donde:
n es el nmero de individuos u objetos.
p es el nmero de variables.
X ij es la observacin sobre el i-simo individuo u objeto en la j-sima variable
que esas variables sean casi independientes entre s y, por tanto, no tenga sentido
buscar otras dimensiones ortogonales (independientes) que nos definan
elementos o aspectos independientes.
A partir de la matriz de datos n p se obtiene la matriz de correlaciones entre
todas las variables, de dimensiones p p , y simbolizada como R (matriz de
correlaciones de todas las variables entre s).
Despus de que se ha calculado la matriz de correlaciones R (s es que existen
correlaciones altas), el paso siguiente en el anlisis factorial consiste en elegir la
matriz factorial que resuelva el problema de la explicacin de la informacin de la
matriz de correlaciones R, es decir, determinar el menor nmero de variables
hipotticas, constructos o factores comunes de tal manera que reproduzcan
satisfactoriamente las correlaciones entre las variables. Esto se hace a travs de
un proceso llamado extraccin de factores.
En la literatura existe una gran variedad de mtodos para la extraccin de factores
a partir de una matriz de correlacin: componentes principales, mxima
verosimilitud, centroide, alfa, entre otros. No es posible analizar aqu todos estos
mtodos, por lo que la explicacin se limitar a uno de los mtodos. El mtodo
ms utilizado actualmente y que est fcilmente disponible en las instalaciones
computacionales es el mtodo de componentes principales, sin que esta
valoracin excluya otros tipos de anlisis factorial.
A continuacin se presenta una breve descripcin de los principales mtodos de
factorizacin:
Componentes principales: sigue un principio de extraccin que supone maximizar
la varianza explicada, es decir, conseguir que la contribucin del factor a alguna
de las comunalidades de las variables del estudio sea mxima. De ah que el
factor que mejor explique una dimensin analizada (el que represente mayor
variabilidad) se convierta en el primer componente principal, el que mejor explique
la segunda dimensin (el que represente mayor variabilidad en la matriz de
residuales) ser el segundo componente principal y as sucesivamente. Su
aplicacin supone transformar directamente un conjunto de variables
correlacionadas en otro conjunto de variables no correlacionadas.
Mxima verosimilitud: considera la mejor estimacin posible de la matriz de
correlacin reproducida en la poblacin como principio de extraccin. Es decir,
busca la solucin factorial que mejor se ajustara a las correlaciones observadas.
Utiliza chi-cuadrado como estadstico para determinar el grado de ajuste entre lo
observado y lo estimado, lo que permite determinar el nmero de factores
necesarios para que no haya una desviacin significativa de los datos observados.
La fijacin de las comunalidades se realiza por un procedimiento iterativo que
converge en el mejor valor.
42
ello indicara que la variable se solapa totalmente con los tres factores, en lo que
mide. Si una variable tuviera una comunalidad de 0, por otra parte, los pesos de
los tres factores para esta variable seran cero y la variable no tendra nada en
comn con ninguno de ellos. Los valores de comunalidad entre 1.0 y 0 indican
solapamientos parciales entre las variables y los factores en lo que miden.
Por lo tanto las comunalidades debern ser ciertos valores tales que:
0 h2 1
Esta solucin permite aceptar el cumplimiento del objetivo fundamental del AFE:
explicar mediante tres factores ortogonales, las correlaciones existentes entre 9
variables.
Como se ha mencionado el anlisis factorial implica cierto nmero de pasos, entre
ellos se encuentra la extraccin de factores. Muchos de los mtodos producen
factores que no son interpretables. Por consiguiente, dichos factores sin rotacin
se rotan con propsitos de interpretacin, ya que si se intenta interpretar la matriz
sin rotar de la Tabla 1, se enfrenta un problema. Se puede decir que todas las
pruebas se cargan de forma sustancial sobre un factor 1. Lo anterior equivale a
decir que todas las pruebas miden lo mismo (factor 1).
Por lo tanto el anlisis factorial no termina con la extraccin de los factores y la
preparacin de una tabla de pesos o cargas factoriales no rotados. Aunque esta
tabla da una solucin factorial basada en construcciones representadas
aceptables matemticamente, estas construcciones representadas en una matriz
factorial no rotada son raramente usadas en el trabajo cientfico.
Existen grficos que sirven de apoyo importante la hora de valorar tanto el nmero
de factores que se han de elegir como la composicin de cada uno de ellos en
funcin de las saturaciones de las variables.
Para tomar la decisin acerca del nmero de factores puede recurrirse al llamado
scree test o scree plot tambin llamado grfico de sedimentacin. Este grfico
reproduce los autovalores de los distintos factores, los factores importantes deben
explicar la mayor parte de varianza y tener autovalores grandes. En este grfico se
representan en el eje de ordenadas los valores de los autovalores y en el de
abscisas los sucesivos factores. Habr un punto en el que la pendiente de la curva
tiende a ser 0, es decir, los autovalores comienzan a ser casi iguales. En este
punto se establece el punto de corte para el nmero de factores.
La interpretacin del grfico de sedimentacin se realiza as: se aceptan los
valores, comenzando por el primero, cuya lnea de unin con el siguiente se
inclina (en mayor o menor grado), rechazando aquellos factores cuya unin con
los siguientes sea una lnea horizontal (en mayor o en menor grado de
aproximacin a la horizontalidad).
44
En la Figura 3 se presenta el scree test para los datos. Puede observarse como la
solucin de tres factores parece la ms adecuada.
En cuanto a la composicin de los factores, resulta til acudir a la representacin
espacial de los factores rotados. Este grfico muestra nubes de puntos que se
encuentran claramente diferenciados entre s. En el grfico cada una de las cargas
de los tems se trata como una coordenada y se grfica.
En ocasiones, la solucin que se ofrece tras un AFE propone la constitucin de
unos factores cuyas cargas o saturaciones en determinadas variables son muy
parecidas, por lo que arrojan, cuando menos, una sospecha de ambigedad.
Afortunadamente, es posible rotar la matriz factorial a otra forma que es
equivalente matemticamente a la matriz original no rotada, pero que representa
construcciones factoriales que son frecuentemente mucho ms tiles para los
fines cientficos que las construcciones factoriales no rotadas, es decir, con la
rotacin factorial buscamos una solucin factorial menos ambigua. Lo que se
pretende con la rotacin es repartir la varianza de los factores significativos, esto
es, de los factores que se van a tener en cuenta en la continuacin del anlisis, de
forma que cada factor no contenga cargas significativas ms que en un nmero
adecuado de variables. Es, por tanto, una apuesta por encontrar cargas factoriales
muy altas en unas variables para un factor, y cargas muy bajas de estas variables
en el resto de los factores. Con ello se consigue una nueva estructura factorial fcil
de interpretar, ms sencilla y menos ambigua.
En la Figura 4 (idea original de Fenelon, 1981), se observa de forma grfica como,
en un sencillo espacio tridimensional, es muy diferente la informacin que se
obtiene en funcin de la proyeccin elegida (el objeto tridimensional puede
representarse sobre un plano, extendiendo lneas de mira imaginarias desde el
45
objeto hasta donde se sita el ojo del observador. Cada superficie que
observamos es la interseccin de un plano con esas lneas de mira).
matriz factorial que cumpliera con los cinco principios propuestos por Thurstone
tendra la configuracin siguiente (en un caso de 3 factores obtenidos a partir de 9
variables empricas.
Por supuesto, el modelo que representa la matriz D resulta por muchas razones
exagerado, ya que dichas estructuras factoriales perfectas son poco frecuentes.
Sera ms realista reemplazar los valores 1 por el Mximo y los valores 0 por el
mnimo (ya que nunca se darn valores 1 y 0 en una matriz factorial).
Del mismo modo en que existen muchos mtodos de extraccin de factores,
tambin existe una serie de mtodos de rotacin. Los dos tipos principales de
rotacin son: ortogonal y oblicua. A continuacin se dar una breve explicacin
de cada uno.
1. MTODOS DE ROTACIN ORTOGONAL: en esta rotacin los ejes o factores
se mantienen perpendiculares, los nuevos factores son no correlacionados, es
decir, los factores son independientes. Esto se ilustra en la Figura 5, en donde
se supone un anlisis factorial con 7 variables, en que se definen dos factores
F1 y F2. En la Figura 5 se observa que el primer factor est conformado por tres
variables, mientras que el segundo lo constituyen cuatro variables.
1.1. Mtodo Quartimax. Su fundamento es la idea que cada variable est cargada
significativamente slo en un factor. Por ejemplo, si se tiene una variable con
dos factores, si la variable se encuentra sobre un factor, su carga en el otro
factor sera igual a 0, con lo que el producto cruzado de estas dos cargas sera
igual a 0. Por lo tanto, si se consigue minimizar la suma de los productos
cruzados de los cuadrados de las cargas de las variables en dos factores,
significa que las variables que estn significativamente cargadas en uno de los
factores lo estn mnimamente (lo ms cercano a 0 posible) en el otro.
1.2. Mtodo Varimax. Mtodo ideado por Kaiser. Este mtodo est orientado a
limpiar los factores, produciendo factores que tienen altas correlaciones con
un conjunto pequeo de variables y pequea o nula correlacin con el resto de
las variables.
1.3. Mtodo Equimax. En este mtodo se minimizan tanto el nmero de variables
que saturan alto en un factor como el nmero de factores necesarios para
explicar una variable.
48
49
50
CnN
N!
( N n)!n!
(3.1)
muestreo, resulta poco prctico construir cada una de las C n posibles muestras,
con el propsito de obtener una de ellas. Este problema se resuelve extrayendo en
sucesin, aleatoriamente y sin reemplazo, las n unidades; es fcil mostrar que
este mtodo de seleccin proporciona a cada muestra la misma probabilidad de
N 1
P o b l a c i n fi n i ta d e ta m a o
N -3
....
N -2
N -1
S e le c c i n
a le a to r ia
.
M u e s t ra a le a t o ria
s im p le d e t a m a o
4
2
. .
.
n.
El segundo paso sera poner en papelitos todos los nmeros de las muestras,
depositarlos en un recipiente y mezclarlos de tal manera que pueda ser escogido
un papelito sin ver, cuyo nmero identifica una muestra al azar de 2 piezas de pan.
Si el proceso se realiza un gran nmero de veces y cada vez que se tome un
papelito se regresa al recipiente antes de que se efecte la siguiente seleccin, a
la larga cada papelito y por consiguiente cada muestra se extraer con la misma
frecuencia y con una probabilidad conocida de 1/15.
El proceso de seleccin de una muestra aleatoria simple asegura que cada
elemento de la poblacin tiene la misma probabilidad de ser seleccionado. Para
seleccionar una muestra se puede proceder escogiendo los elementos de la
poblacin uno por uno al azar o escogiendo una muestra completa como se ilustr
con el ejemplo. Es claro que este procedimiento resulta poco prctico, por lo que
para seleccionar muestras aleatorias simples se utilizan tablas de nmeros
aleatorios en lugar de seleccionar papelitos de un recipiente, o bien generadores
de nmeros aleatorios en una calculadora o computadora.
Una tabla de nmeros aleatorios es un conjunto de enteros generados de modo
que la tabla contendr los diez dgitos enteros (0,1,2,....,9), en proporciones
aproximadamente iguales, sin tendencias en el patrn en que se generaron los
dgitos; es decir, el nmero que se seleccione de la tabla puede ser cualquiera de
los dgitos entre 0 y 9, ya que todos tienen la misma probabilidad de ser
seleccionados.
La seleccin de nmeros por medio de tablas de nmeros aleatorios es anloga a
la seleccin por medio de papelitos.
La pregunta es Cmo seleccionar esos nmeros de la tabla? Una manera de
hacerlo es apuntando con un lpiz hacia un punto inicial de la tabla y decidir tomar
el ltimo o primer dgito del nmero seleccionado. Antes de iniciar se define si los
siguientes nmeros a obtener van a ser los de abajo o los de un lado del punto
inicial; si un nmero se repite, lo ignoramos puesto que ya ha sido seleccionado;
tambin se omite si aparece un nmero mayor que los que contiene la poblacin, y
se selecciona el siguiente nmero. Esto ltimo es muy raro que suceda ya que
generalmente se manejan poblaciones grandes. De esta manera obtenemos una
muestra aleatoria simple por medio de tablas.
54
Poblacin de tamao N
.
3
.
4
.
...
.
n
8 31 39,
8 2(31) 70,
8 3(31) 101,
55
Note que para llevar a cabo el procedimiento anterior, lo nico que se requiere es
la posibilidad de recorrer fsicamente la poblacin, de tal manera que dicho
recorrido comprenda todas las viviendas, y no los tome en cuenta ms de una vez.
Para el caso en que N no es mltiplo de n se tendra, por ejemplo con N 15,600
y n 500 , k 31.2 , entonces podra tomarse alguna de las siguientes dos
alternativas: k 31 o k 32 .
El muestreo sistemtico es de uso frecuente. La ventaja principal de este mtodo
de muestreo es su simplicidad, ya que a partir de una lista se escoge un elemento
al azar y se contina seleccionando cada elemento n-simo, y es ms sencillo que
elegir una muestra aleatoria simple. Est menos expuesto a errores y
frecuentemente proporciona mayor informacin que el muestreo aleatorio simple
por unidad de costo. Una muestra sistemtica por lo general se extiende por toda
la poblacin, es decir, los elementos de la muestra estn ms distribuidos en ella y
por lo tanto puede dar ms informacin acerca de la poblacin que se est
analizando que una muestra aleatoria simple con la misma cantidad de elementos.
A manera de ilustracin, suponga que tenemos una lista de 100 archivos de los
alumnos de la Facultad de Estadstica y queremos seleccionar una muestra
sistemtica para determinar la proporcin de archivos incorrectos. Suponga
adems que los primeros 50 archivos han sido archivados correctamente y los
otros 50 incorrectamente por diversas razones. El muestreo sistemtico incluir la
misma cantidad de archivos correctos e incorrectos y dar una estimacin ms
precisa de la proporcin de archivos almacenados incorrectamente. En cambio el
muestreo aleatorio simple podra seleccionar un gran nmero de archivos
incorrectos o quiz todos y dar una estimacin muy diferente de p. Si los archivos
incorrectos hubieran sido distribuidos aleatoriamente, la ventaja del muestreo
sistemtico se perder, ya que la precisin de las estimaciones de este muestreo
depende del orden de las unidades de muestreo en el marco.
El muestreo sistemtico se utiliza en muchas reas, por ejemplo, los auditores
utilizan el muestreo sistemtico al muestrear una lista de cuentas para verificar
cantidades o para comprobar que los procedimientos de contabilidad se cumplan.
Tambin es utilizado por los investigadores de mercado y por encuestadores que
muestrean personas en movimiento.
Este tipo de muestreo tambin tiene sus dificultades. Una de ellas es que no se
puede obtener una estimacin sin sesgo del error de muestreo atribuido a la media
estimada sin recurrir a algunas suposiciones, debido a que este muestreo solo
identifica a un conglomerado y para poder evaluar el error de muestreo se
necesitan cuando menos dos conglomerados. Sin embargo, se podra obtener una
estimacin sin sesgo del error de muestreo si en lugar de obtener una muestra
sistemtica de 100 elementos, se obtuvieran 5 muestras sistemticas de 20
elementos cada una, ya que la variacin entre estas muestras permite la medicin
del error de muestreo.
56
n1 n2 nL =n
Figura 9. Esquema de un muestreo aleatorio estratificado.
58
59
Conglomerados
de
Elementos
unidades de muestreo
Ciudad A
Manzanas
Ciudad B
Viviendas
Aeropuertos
Vuelos
4
5
6
Variables
Caractersticas de la
vivienda
Personas
Grado de estudios
Pasajeros que Informacin acerca de
salen
viajes
Viviendas
Escuela
Salones de clase
Secundaria
Trnsito anual
Intervalos de 40 minutos
en un puente
Fbrica
Cajas de artculos
Estudiantes
Planes de carreras
Vehculos
Origen y destino
Artculos
Poblacin finita de
N conglomerados
2
..
6
3
N
Seleccin Aleatoria
de conglomerados
3
1
.
n
n conglomerados
60
Cuando los conglomerados han sido especificados, se debe realizar una lista que
contenga todos los conglomerados que conforman la poblacin. Entonces se
selecciona una muestra aleatoria simple de conglomerados.
Considerando la eficiencia econmica, es decir, el costo relativo de las
observaciones en cada uno de los mtodos, casi siempre veremos que el
muestreo por conglomerados es ms econmico que el muestreo aleatorio simple
y que el estratificado, si el costo por obtener un marco que liste todos los
elementos de la poblacin es muy alto o si el costo por obtener las observaciones
aumenta con la distancia que separa a los elementos, por ejemplo; suponga que
deseamos calcular el gasto promedio por familia de una ciudad. Si usamos
Muestreo Aleatorio Simple se necesita un marco que liste todos los hogares
existentes en la ciudad y esto puede ser muy costoso o imposible de lograr, no se
puede evitar esto utilizando muestreo estratificado ya que se necesita un marco
para cada estrato de la poblacin, lo que se podra hacer es dividir a la ciudad en
regiones tales como manzanas o conglomerados de elementos y seleccionar una
muestra aleatoria de ellos, esto se puede realizar con facilidad utilizando un marco
que liste todas las manzanas existentes, de esta manera se puede calcular el
gasto promedio de cada familia dentro de cada manzana. Adems si se selecciona
una muestra aleatoria de toda una lista de hogares en la ciudad resulta ser muy
costosa, debido a que la muestra elegida puede estar dispersa en toda la ciudad y
los entrevistadores pierden tiempo y dinero en gastos relativos. El muestreo
estratificado es el ms adecuado para reducir estos gastos de transporte, ya que
los elementos de un conglomerado deben de estar geogrficamente cerca uno del
otro.
62
Total
47%
53%
100%
67
Los grupos son pequeos debido a que son muy costosos y adems la
informacin que se tiene de cada grupo est poco estructurada debido a que la
entrevista es en forma libre y se realiza con varias personas a la vez. Por lo
general, este tipo de muestreo se utiliza en las investigaciones exploratorias con el
propsito de conocer las creencias y prcticas de los consumidores respecto al
producto en cuestin. Cada grupo no es un intento riguroso de estimacin de los
parmetros de alguna poblacin. Las muestras de grupo pueden aportar datos
importantes para el desarrollo de hiptesis, no se debe de considerar que aporta
pruebas de magnitud de algn parmetro debido a la dificultad que se tiene en
muestrear a la poblacin mediante esta tcnica, o debido a que cada entrevista es
en realidad una muestra de uno, consistente usualmente en un aglomerado poco
definido de respuestas. En la prctica es comn variar la forma y el contenido de
los interrogatorios de un grupo a otro. Dado que las personas de un grupo son
entrevistadas en conjunto, la respuesta de cada una de ellas est condicionada
por las dems. Los datos que se obtienen de tres grupos cada uno de ellos con
cinco personas, no son equivalentes a los datos que se obtienen de 15 entrevistas
individuales seleccionadas al azar, debido a que los grupos son muestras de
conglomerados por cuotas.
68
xi yi
i 1
xy
n 2
n 2
xi
yi
i 1 x 2 i 1 y 2
n
n
rechazar esta hiptesis, ntese que en esta segunda fase del ejemplo se pretende
llegar a una decisin correcta y no estimar un parmetro. Nuevamente se est
dependiendo de la teora estadstica para obtener as una medida que precise la
decisin a tomar.
En esta antologa se presentan de manera general algunas de las pruebas de
hiptesis tales como para proporciones, para probar independencia y
homogeneidad.
Z0
x np0
np0 (1 p0 )
72
H 0 : p p0
H 1 : p p0
Se utiliza la distribucin binomial para calcular P.
P = P( X x cuando p p0 )
Donde x es el nmero de xitos en la muestra de tamao n.
Si el valor de P es menor o igual a , la prueba es significativa con un nivel y
se rechaza H 0 aceptndose H 1 .
Para probar las hiptesis
H 0 : p p0
H1 : p p0
Con un nivel de significancia , se calcula
P = P( X x cuando p p0 )
Si este valor es menor o igual que , se rechaza H 0 y se acepta H 1 .
Por ltimo para probar las hiptesis:
H 0 : p p0
H1 : p p0
Con un nivel de significancia , se calcula
P = 2P( X x cuando p p0 )
Si x np0
P = 2P ( X x cuando p p0 )
Si x np0
Si P es menor o igual que se rechaza H 0 , aceptndose as H 1
73
Ejemplo.
Una empresa refresquera distribuye dos marcas de refresco, marca A y marca B, y
afirma que el 20% de los consumidores en Xalapa prefieren la marca A. Para
probar esta afirmacin se tom aleatoriamente una muestra de 120 personas y se
les pregunt que marca prefieren. Si 36 de los 120 responden que prefieren la
marca A, qu conclusin puede obtenerse?, Con un nivel de significancia de
0.05.
Solucin
Las hiptesis que se plantean son:
H 0 : p 0.20
H1 : p 0.20
Donde
n 120 , p0 0.20 , x 36
np0 120(0.20) 24
Como n es muy grande, se utiliza la distribucin normal.
La regin crtica z < -1.96 y z > 1.96
Z0
x np0
36 24
2.7386
np0 (1 p0 )
120(0.20)(0.80)
Conclusin.
Se rechaza H 0 , es decir, que los consumidores de refresco en Xalapa que
prefieren la marca A no es igual al 20%.
...
Bj
N1j
n2j
:
:
nij
:
:
nrj
n+j
...
...
Bc
nic
n+c
n1+
n2+
:
:
ni+
:
:
nr+
n++
Bj
N1j
n2j
:
:
Pij
:
:
Prj
P+j
...
...
Bc
Pic
P1+
P2+
:
:
Pi+
:
:
Pr+
1
75
Donde Pij es la proporcin total de la muestra que cae dentro de cada casilla, esto
es:
Pij nij / n ; por lo tanto
Pij 1
Pi j Pij
P j i Pij
Estas distribuciones se denotan por ( Pi ) ( P j ), observe que Pi ni / n y
P j n j / n y que
P P
i
1.
Ejemplo.
Suponga que mediante una tabulacin cruzada se discute el punto de que el
dueo de una rasuradora elctrica (variable dependiente) est con ms frecuencia
entre los hombres de menos de 40 aos que entre los que tienen 40 aos o ms
(variable independiente). Se tom una muestra de tamao 500. Los datos
observados se presentan a continuacin:
Tabla 6. Datos observados
Poseen rasuradora
elctrica
Si (B1)
No (B2)
Total
A1
40 aos o menos
50 (20%)
200 (80%)
250
Grupo de edad
A2
Mayores de 40 aos
25 (10%)
225 (9%)
250
A3
Total
75
425
500
A1
40 aos o menos
0.1
0.4
0.5
Grupo de edad
A2
Mayores de 40 aos
0.05
0.45
0.5
A3
Total
0.15
0.85
1
Pi = 0.15+0.85 =
P j =0.5+0.5 = 1
La Tabla 6 refleja que un 20% de los hombres que tienen 40 aos o menos
poseen una rasuradora elctrica, un 10% de los hombres mayores de 40 aos
poseen una rasuradora elctrica, etc.
Puede suceder que estos resultados no sean satisfactorios para el analista y
desee encontrar una relacin mejor, supongamos que l piensa que el factor
ingreso puede explicar mejor la obtencin de una rasuradora.
La Tabla 6 se modificara de la siguiente manera:
Poseen
rasuradora
elctrica
Si
No
Total
Ingresos de $300,000 o ms
40 aos o
Ms de 40
menos
aos
30
15
70
85
100
100
oi ei
ei
Ejemplo:
Tomando como referencia el ejemplo de las rasuradoras de la seccin anterior,
suponga que el investigador desea saber si la variable de uso de rasuradoras
elctricas es independiente de la edad de las personas. Las frecuencias
observadas se presentan a continuacin:
Tabla 8. Tabla de frecuencias observadas
Uso
de
rasuradora
A1
elctrica
< de 25
Si usan (B1)
50
No usan (B2)
65
Total
115
A2
25-39
75
60
135
Grupo de edad
A3
40-54
95
35
130
A4
> de 54
30
90
120
Total
250
250
500
Solucin:
Grupo de edad
A2
A3
25-39
40-54
75 (67.5)
95 (65)
60 (67.5)
35 (65)
135
130
A4
> de 54
30 (60)
90 (60)
120
Total
250
250
500
79
El estadstico 2 .
2 (50 - 57.5) 2 /57.5 + (75 - 67.5) 2 /67.5 + (95 - 65) 2 /65 + (30 - 60) 2 /60 + (65 - 57.5) 2 /57.5 +
(60 - 67.5) 2 /67.5 + (35 - 65) 2 /65 + (90 - 60) 2 /60
2 61.3155
v (2 1)(4 1) 3 ; 2 ( 0.05,3) 7.815
Xalapa
65
45
93
Ciudad
Veracruz
Poza Rica
66
40
30
33
54
54
Crdoba
34
42
24
H 0 : Las opiniones entre las cuatro ciudades relacionadas con la nueva bebida son
las mismas.
H 1 : Al menos una opinin entre las cuatro ciudades relacionada con la nueva
bebida no es la misma.
La tabla de frecuencias observadas y esperadas es la siguiente.
Opinin
Xalapa
A favor
En contra
Sin opinin
Total
65
45
93
200
Ciudad
Veracruz
Poza
Rica
66
40
30
33
54
54
150
127
Crdoba
Total
34
42
24
100
205
147
225
577
2 (65 - 71) 2 /71 + (45 - 51) 2 /51 (93 - 77.98) 2 /77.98 (66 - 53.3) 2 /53.3 + (30 - 38.2) 2 /38.2
(54 - 58.5) 2 /58.5 (40 - 45.1) 2 /45.1 + (33 - 32.4) 2 /32.4 + (54 - 49.5) 2 /49.5 + (34 - 35.5) 2 /35.5
+ (42 - 25.4) 2 /25.4 + (24 - 38.9) 2 /38.9
2 26.78
v (3 1)(4 1) 6 ; 2 (0.01,6) 16.812
Conclusin.
2
2
Como , rechazamos H 0 por lo tanto las opiniones no son homogneas.
81
Y 0 1 x
Donde Y es una variable dependiente y X una variable independiente o
explicatoria, y 1 es un coeficiente que indica el efecto que tiene en Y un cambio
en una unidad en la variable X, 0 es la ordenada al origen o el valor promedio
cuando X 0 . Debido a que esta ecuacin tiene una variable independiente, se le
conoce como ecuacin de regresin simple. El hacer una regresin lineal a partir
de una poblacin es casi imposible, se recurre a la obtencin de muestras de la
poblacin y con estas se realiza el anlisis de regresin.
Por medio de las tcnicas de regresin y en base a una muestra es posible
estimar una ecuacin que se asemeje lo ms posible a la ecuacin poblacional. A
esta funcin que se estima se le llama funcin de regresin muestral (FRM). La
FRM har lo posible para estimar los valores medios poblacionales de Y dado un
valor de X, con cierto error. Para cada muestra existe un FRM, pero no se podr
saber cul es la que se asemeje mas a la FRP ya que sta es desconocida. Pero
lo que si se asegura es que las tcnicas de regresin en base a los datos de la
muestra harn posible la obtencin de FRM que ms se ajuste a ellos. La FRM se
puede expresar de la siguiente manera:
Y 0 1 x1
Donde:
Yi = es el estimador del valor E (Y X i )
0 = es el estimador de 0
1 = es el estimador de 1
82
Y Y
n X iYi X i Yi
n X i2 X i
0 Y 1 X
Donde X y Y son medias muestrales de X i y Yi .
Siempre que se lleve a cabo un anlisis de regresin, los investigadores tendrn la
necesidad de saber que tan bueno es, es decir, si la ecuacin de regresin explica
adecuadamente la variacin observada de la variable dependiente (Y). Para esto,
se calcula el coeficiente de determinacin ( R 2 ). Este coeficiente puede tomar
valores entre 0 y 1; si R 2 1 indica que la ecuacin de la regresin explica al
100% la variacin que se da en la variable dependiente con relacin a su media, y
por lo tanto todos los residuos deben ser iguales a cero. Cuando R 2 0 la
ecuacin de la regresin no se ajusta a los datos, y algunos residuos sern
mayores de cero.
Varianza total en la Varianza " no exp licada " por
2
R
var ianza total en la var iable dependient e
83
R2
Y Y Y Y
Y Y
H1 : 1 0
Fuente de variacin
Debido a la regresin
Debido a los residuos
Suma total
Suma de
cuadrados
SCR
SCE
SCT
Grados de
libertad
1
n-2
n-1
Suma de
cuadrados medios
SCR/1
SCE/(n-2)
Donde:
2
2
SCR= 1 X i X
SCE= ei
SCT= Yi
Fc
12 X i X 2 / 1
(n 2)
84
Ejemplo.
Se entrevistaron a 10 familias de la ciudad de Coatepec, con el nico propsito de
estudiar la relacin entre el consumo de la leche y los ingresos, para saber si el
consumo familiar de leche aumenta o disminuye conforme se incrementan los
ingresos anuales. El consumo de leche es la variable dependiente, en los datos
que se obtuvieron se observa que sta vara en cada familia. Esta variacin
puede ser explicada por el ingreso?
Familia
Consumo mensual
de leche (litros)
4
8
10
5
6
7
12
11
9
13
1
2
3
4
5
6
7
8
9
10
85
Yi 8.5
Familia
Y2
X2
XY
Yi Y
145
X i 14.5
Yi Y 2
Yi
Yi Yi
Y Y
i
Xi X
X i X 2
10
16
100
40
-4.5
20.25
4.3272
-0.3272 0.10705984
-4.5
20.25
14
64
196
112
-0.5
0.25
8.0364
-0.0364 0.00132496
-0.5
0.25
15
10
100
225
150
1.5
2.25
8.9637
1.0363 1.07391769
0.5
0.25
11
25
121
55
-3.5
12.25
5.2545
-0.2545 0.06477025
-3.5
12.25
12
36
144
72
-2.5
6.25
6.1818
-0.1818 0.03305124
-2.5
6.25
13
49
169
91
-1.5
2.25
7.1091
-0.1091 0.01190281
-1.5
2.25
17
12
144
289
204
3.5
12.25
10.8183
1.1817 1.39641489
2.5
6.25
16
11
121
256
176
2.5
6.25
9.891
1.229881
1.5
2.25
18
81
324
162
0.5
0.25
11.7456
-2.7456 7.53831936
3.5
12.25
10
19
13
169
361
247
4.5
20.25
12.6729
0.3271 0.10699441
4.5
20.25
Suma
145
85
805
2185
1309
1.109
82.5
11.5636365
X Y 1309
Y Y
X 2185
X X 82.50
Y Y 11.56330
2
i i
82.5
82.50
85
0.9273
2
825
102185 145
El coeficiente de determinacin:
R2
82.50 11.5633
0.8598 0.86
82.50
= -4.945 + .92727 * x
14
12
10
2
8
10
12
14
16
18
20
INGRESO ANUAL
Para probar las hiptesis de que el ingreso por familia explica significativamente el
comportamiento del consumo de leche, se realiza el anlisis de varianza.
El juego de hiptesis que se plantea es:
H 0 : 1 0
H1 : 1 0
86
SCR= 1
SCE= ei 11.5595
2
SCT= Yi 82.50
2
Fuente de variacin
Debido a la regresin
Debido a los residuos
Suma total
Suma de
cuadrados
70.9405
11.5595
82.50
Grados de
libertad
1
8
9
Suma de
cuadrados medios
70.9405
1.4449
Fc
70.9405
49.10
1.4449
El tamao de la muestra que se utilice en este tipo de anlisis debe de ser cuando
menos el doble o el triple de las variables medidas.
En el anlisis de regresin lineal mltiple tratamos de encontrar la recta que mejor
se ajuste a un conjunto de datos. En este caso se trata de tres dimensiones y la
expresin que mejor se ajuste ser un plano bidimensional.
La ecuacin de regresin mltiple que se utiliza es:
Y 0 1 X 1 2 X 2 3 X 3 p X p
Y yi y
X 1 x1 x1
X 2 x2 x 2
X p xp xp
Para calcular 1 cuando se utilizan dos variables se emplea la siguiente frmula:
YX X YX X X
X X X X
2
para
YX X YX X X
X X X X
2
0 y 1 x1 2 x2
88
y
# de clientes
105
87
90
110
107
80
60
90
1
2
3
4
5
6
7
8
729
y 91.125
Y=
Pizzera
yi y
X1= x1
x1
X12
x1
Precio
32
22
23
35
29
26
22
31
220
x1 27.5
X2= x 2
x2
x2
Cupo
50
34
42
42
45
22
30
24
289
x2 36.125
X22
YX1
YX2
X1X2
13.875
4.5
20.25
13.875
192.516
62.4375
192.516
62.4375
-4.125
-5.5
30.25
-2.125
4.51563
22.6875
8.76563
11.6875
-1.125
-4.5
20.25
5.875
34.5156
5.0625
-6.6094
-26.4375
18.875
7.5
56.25
5.875
34.5156
141.5625
110.891
44.0625
15.875
1.5
2.25
8.875
78.7656
23.8125
140.891
13.3125
-11.125
-1.5
2.25
-14.125
199.516
16.6875
157.141
21.1875
-31.125
-5.5
30.25
-6.125
37.5156
171.1875
190.641
33.6875
-1.125
3.5
12.25
-12.125
147.016
-3.9375
13.6406
-42.4375
728.875
439.5
807.875
117.5
Suma
174
(174)(728.875) (117.5)
X X X X
2
89
(174)(728.875) (117.5)
X X X X
2
y yi Yi
Yi
Pizzera
x1
x2
yi
Yi
Y2
32
50
105
111.016
192.516
36.192256
22
34
87
78.4856
17.0156
72.49500736
23
42
90
86.7748
1.26563
10.40191504
35
42
110
110.7028
356.266
0.49392784
29
45
107
101.0995
252.016
34.81590025
26
22
80
77.0188
123.766
8.88755344
22
30
60
75.338
968.766
235.254244
31
24
90
88.5626
1.26563
2.06611876
Suma
220
289
729
728.9981
1912.88
400.6069227
yi 91.125
y 1912.88
R2
2
Yi 400.6069
1912.88 400.6069
0.7906
1912.88
91
94
LIBRE
FLOTANTE
Caractersticas
Un predictor es montono, si sus categoras pertenecen a una escala
ordinal, lo que en otras palabras quiere decir, que slo dos categoras
contiguas pueden ser colapsadas.
Si tenemos un predictor con categoras en escala nominal, este es un
predictor libre, ya que se puede agrupar cualquier par de categoras del
predictor. Se utiliza, cuando las categoras del predictor no tienen una
ordenacin natural.
Cuando todas las categoras del predictor, pertenecen a una escala ordinal
menos una de ellas, de las que se desconoce la posicin en la escala
ordinal, entonces tendremos un predictor flotante. En otras palabras, un
predictor flotante, es un predictor montono con una categora flotante de la
cual, no se conoce su posicin.
CC
2
n 2
del cual se dice que es igual a cero, cuando hay independencia absoluta entre
las variables, pero no es igual a 1 cuando hay dependencia total (su valor
mximo depende del nmero de categoras de las variables)
CC max
r 1
r
Tamao Antes (TA). Se establece un tamao mnimo, para que un grupo pueda
segmentarse, es decir, si un grupo G cualquiera, es menor que TA en
individuos, el grupo no se segmenta y se declara terminal.
Tamao Despus (TD). Se establece un tamao mnimo para que un subgrupo
pueda formarse, es decir, si algn grupo formado en la segmentacin de G,
digamos Gj, tiene menos de TD individuos, la segmentacin es descartada.
Filtro de Nivel (FN). Se establece un mximo de nmero de niveles de
segmentacin, tambin denominados niveles de profundidad. Una
segmentacin con un solo nivel resulta demasiado simple, pero por otro lado
una segmentacin de muchos niveles puede resultar compleja de manejar.
Un resultado de aplicar el mtodo CHAID es el denominado, Diagrama de rbol,
como el que se muestra en la Figura 15.
log fij iR Cj j yi y
donde se cumple:
R
i
(4.1)
desconocidos.
El modelo (4.1), tiene IJ 1 ( J 1) ( I 1) ( J 1) ( I 2)( J I ) grados de
libertad, y es no saturado cuando I 2 . El modelo de independencia, es un caso
especial de este modelo y considera todos los j 0 , de no cumplirse la
independencia, el trmino de asociacin refleja la desviacin de las frecuencias
esperadas, respecto del modelo de independencia. Los parmetros de efectos
columna j , pueden ser interpretados como sigue: dentro de una columna
cualquiera, la desviacin de las frecuencias esperadas de independencia, son una
funcin lineal de la variable ordinal, representada por un puntaje j . Si j 0 ,
fcj fdj'
log
j j ' y d yc
fdj fcj '
100
REFERENCIAS
A.Aaker, D. y S. Day, G. 1994. Investigacin de Mercados. Tercera Edicin.
Editorial Mc Graw Hill. Mxico.
Agresti, A. 1984, Analysis of Ordinal Categorical Data. Wiley and Sons.
Breiman, l., Friedman, j., Olsen, r. y Stone, C. 1984: Classification and Regression
Trees. Chapman and Hall.
Bovd. Westfall y Stasch, 1987, Investigacin de Mercados, texto y casos, Mxico.
Editorial UTHEA.
Caldern M. M. 2006, El Anlisis de tems: Comprobacin de la fiabilidad y
validacin del constructo. Tesis de Licenciatura. Facultad de Estadstica e
Informtica. Universidad Veracruzana.
Draper N.R. and Smith H. 1981, Applied Regression Analysis, New York. Editorial
Whiley and Sons Inc.
Frank R.E. Kuehn A. A., Masinv W. S., 1980, Anlisis de Mercados, tcnicas
cuantitativas Mxico, Editorial Trillas.
Fischer de la Vega, L. y Navarro, A.E.1996. Introduccin a la Investigacin de
Mercados. Tercera edicin. Editorial Mc Graw Hill. Mxico, D.F.
Garca E, et. al.. 2000, Anlisis Factorial. Madrid: La Muralla.
Hayes, B.E. 2003. Cmo medir la satisfaccin del cliente. Diseo de encuestas,
uso y mtodos de anlisis estadstico. Segunda edicin. Editorial Oxford. Mxico.
Jonhson R., 1991, Estadstica Elemental, Mxico, Editorial Trillas.
Kass, G. 1980, An Exploratory Technique for Investigating Large Quantities of
Categorical Data. Applied Statistics, 29, 2, 199-127.
Kinnear C. T. y Taylor R. J., 1981, Investigacin de Mercados, Mxico, Editorial
McGraw-Hill Latinoamericana, s.a.
Kotler, P. 1988, Marketing Management 6a ed. Prentice Hall. New Jersey.
Morgan, J. y Sonquist, J. 1963, Problems in the Analysis of Survey Data and A
Proposal. Journal of the American Satistical Association. 67, 768-772.
Scheaffer, Mendenhall, Ott, 1987, Elementos de Muestreo, Mxico, Grupo Editorial
Iberoamericana.
101
102
ANEXO
103
Tamao de muestra
La determinacin del tamao de muestra es un tema que ha dado origen a mucho
trabajo investigativo por parte de los estadsticos. Dado que el tamao de muestra
depende de muchos factores, varias soluciones tericas enfrentan dificultades
prcticas o restricciones de costo. Los factores ms importantes que deben tomarse
en cuenta para la determinacin del tamao de muestra son:
1) La(s) variable(s) a medir.
2) La variabilidad en la poblacin.
3) El tamao de la poblacin.
4) Los objetivos de inferencia.
Una manera muy simple de determinar el tamao de una muestra es cuando
podemos fijar el inters en una sola variable. As el tamao de muestra se obtendr
usando la frmula que corresponda, en la tabla siguiente se presentan formulas
generales.
TIPO DE MUESTREO
PARMETRO
DE INTERS
MUESTREO
ALEATORIO SIMPLE
Estimar
Estimar
FRMULA PARA EL
TAMAO DE MUESTRA
Estimar p
MUESTREO
ALEATORIO
ESTRATIFICADO
Estimar
z2 2 2
B2
z2 2 N 2 2
z2 2 pq
DONDE:
B2
n
N i2
wi i
n
i 1 wi i
n
2
L
1
B
N 2 2 N i i2 V ( x st ) 2
N
Z / 2 i 1
2
si2
Estimar
N i2
i 1 wi i
Estimar p
N i2
i 1
si2
ni
N i ni
Ni
1
xij xi 2
ni 1 j 1
ni
V (st ) N i2
i 1
si2
ni
N i ni
Ni
B
N i i2
Z 2 / 2 i 1
L
i 1
N i2 pi qi
wi
L
1
V ( p st ) 2
N
N
i 1
2
i
N i ni
N
i
p i q i
n 1
i
N D N i pi qi
2
i 1
104
TIPO DE MUESTREO
PARMETRO
DE INTERS
MUESTREO POR
CONGLOMERADOS
Estimar
FRMULA PARA EL
TAMAO DE MUESTRA
DONDE:
N c2
B M
c2
2
z 2
sc2
x
i 1
estimar
usando
N xt
Estimar p
N c2
2
B
c2
2
Nz / 2
n 1
m
Estimar
usando M
x Mi
1 n
Mi
n i 1
s c2
x
i 1
xM i
n 1
N t2
B2
t2
2
Nz / 2
N c2
B2M 2
N 2 c2
z 2
s
2
c
a
i 1
p M i
n 1
105