You are on page 1of 29

Universidad Nacional Experimental de Guayana

Vicerrectorado Acadmico
Proyecto de Carrera Ingeniera Industrial
Investigacin de Mercados
Seccin 01

Profesora:
Keila Urbina

Grupo #3

Integrantes:

Ciudad Guayana, Junio 2014

MTODOS ESTADSTICOS UTILIZADOS PARA EL ANLISIS DE INFORMACIN


Organizar

Propsitos Descriptivos

Resumir

Datos numricos

NIVELES DE MEDICIN

Prueba t de Student
Es un test que permite
decidir si dos variables
aleatorias normales con la
misma
varianza
tienen
medias diferentes.

La eficacia del test aumenta con el nmero de datos


del que constan las dos muestras, en concreto del
nmero de grados de libertad conjunto de las dos
muestras, este nmero viene dado por:
GL = N1 + N2 2
Siendo Ni el tamao muestral, es decir, el nmero
de datos en cada muestra i.

La prueba consiste en examinar el estadstico t obtenido a partir de la dos muestras


como:

Y este valor se compara con un valor de referencia basado en el nmero de grados de


libertad y el nivel de significacin. Dicho valor de referencia se obtiene a partir de la
distribucin t de Student.
Al comparar las 2 medias, frecuentemente siempre se supone que el nivel de
significacin sea menor que 0,05.

Prueba X

La frmula que da el estadstico es la siguiente:

La prueba de Pearson es considerada


como una prueba no paramtrica que
mide la discrepancia entre una distribucin
observada y otra terica (bondad de
ajuste), indicando en qu medida las
diferencias existentes entre ambas, de
haberlas, se deben al azar en el contraste
de hiptesis.

Cuanto mayor sea el valor de


, menos verosmil es que la hiptesis sea correcta. De la misma
forma, cuanto ms se aproxima a cero el valor de chi-cuadrado, ms ajustadas estn
ambas distribuciones.
Los grados de libertad gl vienen dados por:
gl= (r-1)(k-1). Donde r es el nmero de filas y k el de columnas.

Criterio de decisin:

No se rechaza

cuando

. En caso contrario s se rechaza.

Donde t representa el valor proporcionado por las tablas, segn el nivel de significacin
estadstica elegido.

ANLISIS
DELALAVARIANZA
VARIANZA
(ANOVA)
ANLISIS DE
(ANOVA)

Siendo xij el i-simo valor de la muestra j-sima; nj el tamao de dicha muestra y su


media.

U de Mann-Whitney
Es una prueba no paramtrica de comparacin de dos muestras independientes.
debe cumplir las siguientes caractersticas:
Es libre de curva, no necesita una distribucin especfica.
Nivel ordinal de la variable dependiente.
Se utiliza para comparar dos grupos de rangos (medianas) y determinar que la diferencia
no se deba al azar (que la diferencia sea estadsticamente significativa).

Fue propuesto inicialmente en 1945 por Frank


Wilcoxon para muestras de igual tamaos y
extendido a muestras de tamao arbitrario
como en otros sentidos por Henry B.
Mann y D. R. Whitney en 19477.

Yurkis Rodrguez

Planteamiento de prueba.
El planteamiento de partida es:

Las observaciones de ambos grupos son independientes.


Las observaciones son variables ordinales o continuas.
Bajo la hiptesis nula, la distribucin de partida de ambos grupos es la
misma y,
Bajo la hiptesis alternativa, los valores de una de las muestras tienden a
exceder a los de la otra: P(X > Y) + 0.05 P(X = Y) > 0.05.

Calculo estadstico
Para calcular el estadstico U se asigna a cada uno de los valores de las dos
muestras su rango para construir
Donde n1 y n2 son los tamaos respectivos
de cada muestra; R1 y R2 es la suma de los
rangos de las observaciones de las
muestras 1 y 2 respectivamente.
El estadstico U se define como el mnimo
de U1 y U2.

Yurkis Rodrguez

Anlisis de regresin
Es el estudio de la dependencia de un fenmeno econmico respecto de
una o varias variables explicativas, con el objetivo de explorar o
cuantificar la media o valor promedio poblacional de la primera a partir
de un conjunto de valores conocidos o fijos de la/s segunda/s.

Tipos de regresin
Regresin simple: interviene una sola variable independiente.
Regresin
mltiple:
interviene
dos
o
ms
variables
independientes.
Regresin lineal: la funcin es una combinacin lineal de los
parmetros.
Regresin no lineal: la funcin que relaciona los parmetros no
es una combinacin lineal.
La forma ms intuitiva de formarse una primera
impresin sobre el tipo de relacin que existe entre
dos variables es a travs del Diagrama de Dispersin.

Yurkis Rodrguez

Anlisis de regresin

Objetivo

Procedimiento

Determinar la ecuacin de
regresin para predecir los
valores
de
la
variable
dependiente (Y) en base a la o
a las variables independientes
(X).

Seleccionar una muestra a


partir de la poblacin; listar
pares de datos para cada
observacin; dibujar un
diagrama de puntos para
dar una imagen visual de la
relacin;
determinar
la
ecuacin de regresin.

Yurkis Rodrguez

Correlacin.
El anlisis de correlacin emplea mtodos para medir la significacin del
grado o intensidad de asociacin entre dos o ms variables

el coeficiente de correlacin debe ser:


Grande cuando el grado de asociacin es alto (cerca de +1 o -1, y pequeo
cuando es bajo, cerca de cero.
Independiente de las unidades en que se miden las variables.

Yurkis Rodrguez

Yurkis Rodrguez

Iconografa de las Correlaciones.


Uno de los mtodos de anlisis de datos, consiste en reemplazar una
matriz de correlacin por un esquema o grafo donde las correlaciones
notables son representadas por un trazo continuo (correlacin positiva),
o un trazo punteado (correlacin negativa).
Qu
es
notable?

una

correlacin

Una correlacin no tiene sentido aisladamente. Recprocamente una correlacin


escasa no implica la ausencia de vnculo.

Ejemplo 1

Ejemplo 2

Yurkis Rodrguez

Frecuencia Estadstica.
Se denomina frecuencia
a la cantidad de veces
que se repite un
determinado valor de la
variable.

Marifel Figuera

Frecuencia absoluta

Frecuencia absoluta
acumulada

La ltima
frecuencia
absoluta
acumulada
deber ser igual a
N.

Frecuencia relativa

Al multiplicar por 100

Frecuencia relativa
acumulada
Es el cociente entre la
frecuencia absoluta
acumulada y el nmero
total de datos, N.
Fi = Ni / N.

Ejemplo:
una profesora en su informe anual, sealar que
para el curso de 35 alumnos, la frecuencia de
notas es la siguiente.

Marifel Figuera

Anlisis de frecuencia acumulada.


La frecuencia acumulada o frecuencia
acumulativa es la frecuencia de ocurrencia de
valores de un fenmeno menores que un valor de
referencia.
El anlisis de la frecuencia acumulada se
hace con el propsito de obtener una
idea de cuantas veces ocurrira un cierto
fenmeno

Marifel Figuera

La frecuencia acumulada es la frecuencia estadstica F(X Xr) con que


el valor de un variable aleatoria (X) es menor que o igual a un valor de
referencia (Xr).
La frecuencia acumulada relativa se deja escribir como Fc(X Xr), o en
breveFc(Xr), y se calcula de:
Fc (Xr) = MXr / N
Donde MXr es el nmero de datos X con un valor menor que o igual a Xr,
y N es nmero total de los datos.

En breve se escribe:
Fc = M / N
Cuando Xr = Xmin, donde Xmin es el valor mnimo observado, se ve que
Fc=1/N, porque M=1.
Por otro lado, cuando Xr = Xmax, donde Xmax es el valor mximo
observado, se ve que Fc=1, porque M=N.
En porcentaje la ecuacin es:
Fc(%) = 100 M / N

Prueba de la diferencia menos significante de Fisher.

Marifel Figuera

Coeficiente de correlacin de Pearson

Siendo la expresin que nos permite


calcularlo:

De manera anloga podemos calcular este coeficiente


sobre un estadstico muestral, denotado como

:es la covarianza de
(X,Y)
es la desviacin
tpica de la variable
X
es la desviacin
tpica de la variable
Y
Marifel Figuera

Si r = 1, existe una
correlacin positiva
perfecta.
Si 0 < r < 1, existe una
correlacin positiva.
Si r = 0, no existe relacin
lineal.
Si -1 < r < 0, existe una
correlacin negativa.

Si r = -1, existe una


correlacin negativa
perfecta.
Marifel Figuera

Coeficiente de correlacin de Spearman.


Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son
ordinales, es decir, cuando una o ambas escalas de medida son posiciones.
Ejemplo: Orden de llegada en una carrera y peso de los atletas.
Se calcula aplicando la siguiente ecuacin:

Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los puntajes ms elevados le
asignamos el rango 1 al siguiente el rango 2 y as sucesivamente. Si se repiten dos puntajes o
ms se calculan las medias aritmticas.
Estudiante

X Y

Dyana

Elizabeth

Mario

Orlando

Mathas

Josu

Anita

Luca

La interpretacin de
coeficiente de Spearman
es igual que la del
coeficiente de correlacin
de Pearson. Oscila entre -1
y +1, indicndonos
asociaciones negativas o
positivas respectivamente,
0 cero, significa no
correlacin pero no
independencia.

Cesar Rizo

Anlisis factorial exploratorio


Es una forma de anlisis de los factores que hace hincapi en "explorar" un
conjunto de datos para las relaciones entre las variables. Lo que un investigador
encuentra a travs de un anlisis factorial exploratorio puede ayudar al
investigador en el desarrollo de un modelo o un conjunto de hiptesis sobre las
variables de inters en los datos. Un aspecto importante del anlisis factorial
exploratorio es su capacidad para tomar grandes conjuntos de variables y los
reduce a un conjunto de nuevas variables, conocidos como "factores", que
pueden desempear el papel de un conjunto nuevo y ms pequeo de variables
para estudios posteriores.
Tcnica
El procedimiento bsico del anlisis factorial
exploratorio es ingresar una serie de datos,
ejecutar el modelo del factor comn (un modelo
que permite que las variables se combinen y
formen factores) y girar la solucin de manera
que sea fcilmente interpretable. La parte de este
procedimiento que es de mayor inters es la
rotacin, que es el trabajo ms importante en la
extraccin de factores, en la que el investigador
rota la solucin para producir un resultado lgico.
Cesar Rizo

Anlisis factorial confirmatorio


El anlisis factorial confirmatorio es una forma especial de anlisis factorial en la
que el investigador usa su modelo como base para los factores finales. Su
propsito es confirmar o refutar el modelo del investigador. Para completar un
anlisis factorial confirmatorio, el investigador debe desarrollar un modelo y las
hiptesis correspondientes antes de realizar el anlisis de los datos. Este modelo
relaciona las variables de inters entre ellas; las hiptesis deben posicionar qu
tan fuertemente estn relacionadas estas variables. La meta final de un anlisis
factorial confirmatorio es confirmar o refutar estas hiptesis y el modelo en s
observando cmo se conforman en el resultado del anlisis.

Cesar Rizo

Grfica Estadstica
Las representaciones grficas deben conseguir que un simple anlisis visual ofrezca la mayor
informacin posible. Segn el tipo del carcter que estemos estudiando, usaremos una
representacin grfica u otra. Segn sea la variable, los grficos ms utilizados son
Diagramas de barra.
Es un tipo de grfico estadstico que se utiliza para variables cualitativas y
discretas.
En el eje X se sitan:
Las modalidades de la variable cualitativa.

Diagramas de sectores.
Es un grfico empleado fundamentalmente para variables cualitativas. Las
modalidades se representan en un crculo dividido en sectores. La amplitud de
cada sector, en grados, se obtiene multiplicando la frecuencia relativa de cada
modalidad o valor por 360.

Ejemplo: Un estudio hecho entre 100 alumnos universitarios elegidos al


azar sobre el nmero de das a la semana que practican alguna actividad

Los valores de la variable cualitativa discreta.

fsica viene dada por la siguiente tabla:

Y sobre ellos se levantan barras cuya altura sea proporcional a sus frecuencias.
Si se unen los extremos superiores de las barras con una lnea poligonal se
obtiene el polgono de frecuencias

Ejemplo: Un estudio hecho en un conjunto de 25 personas con objeto de


determinar su grupo sanguneo ha conducido a los siguientes resultados:

Cesar Rizo

Histogramas.
Se utiliza con variables continuas, o agrupadas en intervalos, representando en
el eje X los intervalos de clase y levantando rectngulos de base la longitud de los
distintos intervalos y de altura tal que el rea sea proporcional a las frecuencias
representadas.
El polgono de frecuencias se obtiene uniendo los puntos medios de las bases Mixtos
superiores de los rectngulos.

Un caso particular de aplicacin de los histogramas y los polgonos de

Los histogramas permiten compara datos de una forma rpida (basta mirar la frecuencias es el climograma, que representa la marcha anual de las temperaturas
grfica)

Ejemplo: El peso de un grupo de alumnos aparece recogido en las siguiente

y de las lluvias medias, sobre un mismo sistema de coordenadas.


Veamos un ejemplo:

tabla:

Cesar Rizo

Pictogramas.
Son grficos con dibujos alusivos al carcter que se est estudiando y cuyo
tamao es proporcional a la frecuencia que representan dicha frecuencia se suele
representar.
Ejemplo: hemos representado el nmero de partidos ganados, perdidos o
empatados de un equipo.

Cesar Rizo

You might also like