Professional Documents
Culture Documents
DIAGRAMAS
DIAGRAMAS
2500
2000
1500
1000
500
REVISTA
RADIO
TV
PERIOD
HISTOGRAMAS
HISTOGRAMA
FREC. ABSOLU
MARCA DE CLASE
HISTOGRAMAS
8
2 Desv. tp. = ,72 Media = 1,67 0 1,00 1,50 2,00 2,50 3,00 N=15,00
Tamao de la enpresa
POLIGONOS DE FRECUENCIA
ni
VARIABLE
ni = Frecuencia absoluta
POLIGONOS DE FRECUENCIA
PICTOGRAMAS
PICTOGRAMAS
CARTOGRAMAS
GRAFICOS CIRCULARES
CARACTERISTICAS BUSCADAS EN UN CENTRO DE SALUD
Infraestructura 17,7% Hignico 23,7%
Otros 10,7%
Atencin 31,0%
BARRAS COMPARATIVAS
ANALISIS DE LA INFORMACION
OBJETIVOS DEL ANLISIS =Que hay en los datos? Que tanto varan los datos
TCNICAS ESTADSTICAS. Media, Mediana, Moda Desviacin estndar. Desviacin media. Rango Varianza. Frecuencias. Correlacin Medidas de asociacin Regresin. Series de tiempo. Estimacin. Prueba t Prueba z
Como estn distribuido los datos. Que relacin existen entre los datos. Hacer predicciones y estimaciones.
RANGO INTERCUARTIL
INFERENCIA
PRUEBA t PRUEBA z
CHI CUADRADO
VARIABLES DE INTERVALO.
Una variable de intervalo es aquella que se presenta en rango. Ejemplo. INGRESO EDAD. 1000 1500 10 15 1500 2000 15 20 2000 2500 20 25 2500 3000 25 30 En una variable de intervalo se pueden encontrar estadgrafos: De tendencia Central. De dispersin. De inferencia
Lic. Pedro Navarro
VARIABLES DE INTERVALO.
Para la construccin de rangos se deben considerar los siguientes elementos : NUMERO APROXIMADO DE CLASE. (Regla de Sturges) K= 1+3,3 Log n
280 200 360 355 375 400 410 390 310 415 415 420 370 355 305 420 390 385 300 305 405 400 380 375 385 395 360 330 320 330 335 355 370 385 360 395
Lic. Pedro Navarro
VARIABLES DE INTERVALO.
K= 1+3,3 Log n
K= 1+3,3 Log 45
VARIABLES DE INTERVALO.
ANCHO DE CLASE.
VARIABLES DE INTERVALO.
420 - 200 AC == 6
280 200 360 355 375 400 410 390 310
==36.66415 ==37
415 420 370 355 305 420 390 385
200 a 237 237 a 274 274 a 311 311 a 348 348 a 385 385 a 422
VARIABLES DE INTERVALO.
MARCA DE CLASE.
Vi + Vs c == 2
Variable 200 a 237 237 a 274 274 a 311 311 a 348 348 a 385 385 a 422 c 218,5 255,5 292,5 329,5 366,5 403,5
x ==
=x
i=n
25 42 67 84 73 35 8 25 373
373 x == ==37.3 10
Lic. Pedro Navarro
= fx x == =fi
RANGO DE CLASE 10 12 12 14 14 16
fx ==fi * ci
Frecuencia
fi
4 3 4
Producto fx=fi x c 44 39 60
11
143
143 ==13 x == 11
ESTADIGRAFOS DE DISPERSIN
Son tres los estadgrafos de tendencia central. RANGO. DESVIACIN MEDIA DESVIACIN TIPICA O ESTANDART RANGO. Es la diferencia entre el nmero mayor y el nmero menor de una nube de datos. Ej. 3,2,8,5,9 R [9 2 ]== 9 2 = 7.
ESTADIGRAFOS DE DISPERSIN RANGO Cual de los siguientes casos son mas dispersos: a). 2,3,8,5,9 R [9 2 ]== 9 2 = 7. b). 1003, 1002, 1008, 1005, 1009 R [1009 1002 ]== 1009 1002 = 7. Los nmeros del caso a); son mas dispersos por ser ms pequeos
ESTADIGRAFOS DE DISPERSIN DESVIACIN MEDIA. Es la media aritmtica de los valores absolutos de las desviaciones de cada un de los valores de la variable respecto a la media aritmtica . Caso nmeros.
=fx x =x
n
MARCA (x ) 28 31 34 37 40 43 46 fi 1 10 14 33 14 7 3 82
x ===fx = N
fx 28 310 476 1221 560 301 138 3034
3,034 82
= 37
x- x
9 6 3 0 3 6 9
2 f ( x =x )2 ( x = x ) f x = x
9 60 42 0 42 42 27 222
81 36 9 0 9 36 81
DM =
222 82
= 2,71
Es un estadgrafo que permite interpretar los valores en funcin de sus medias y su desviacin. Para datos
2
s=
=n(x=1 - x)
i
X= 67
RESOLVIENDO
S=
= 4.74 90 5 =1
Lic. Pedro Navarro
CALCULAR LA MEDIA.
x ===fx = N
3,034 82
2
=f
i (x - x ) n =1
= 37
2
MARCA (x ) 28 31 34 37 40 43 46
fi 1 10 14 33 14 7 3 82
x- x
9 6 3 0 3 6 9
f x = x
9 60 42 0 42 42 27 222 36 9 0 9 36 81
81 x ) ( x =
f ( x81 =x )
360 126 0 126 252 243 1,188
S ==
1.18 8 81
==3.83
Lic. Pedro Navarro
TEST DE SIGNIFICACION
DISTRIBUCION HOMOGENEA
Si la S =al 10% de la x =DISTRIBUCION HOMOGENEA. Si el 10% de la x S 30% de x DISTRIBUCION MEDIA Si la S =al 30% de la x = DISTRIBUCION HETEROGENEA
Lic. Pedro Navarro
TEST DE SIGNIFICACION
Si la S =al 10% de la x =DISTRIBUCION HOMOGENEA. Si el 10% de la x S 30% de x DISTRIBUCION MEDIA Si la S =al 30% de la x = DISTRIBUCION HETEROGENEA
Ejemplo. Media = 28.35 S = 5.65, Distribucin media; 10% de media = 2.8 30% de media 9 S = 4.24 Media = 67 DISTRIBUCIN HOMOGNEA Distribucin media;
La inferencia es una induccin de los datos que se obtienen en una muestra a toda la poblacin, lo que permite extraer generalizaciones de un proceso del Muestreo.
Una hiptesis es una presuncin de la que parte un investigador. Los datos de una muestra raramente son iguales. En toda investigacin se presentan dudas. Es el % de la muestra tan diferente al de la poblacin? La verificacin de la hiptesis pretende resolver este tipo de dudas. Tiene que existir una verificacin de hiptesis
INFERENCIA EN VARIABLES DE INTERVALO. PASOS QUE SE SIGUEN Se debe definir la hiptesis. oUna hiptesis puede ser INDIFERENTE (HO). oUna hiptesis puede ser ALTERNA (HA) LA HIPTESIS INDIFERENTE ES LA QUE SE VERIFICA (HO). Una hiptesis alterna puede ser: DIRECCIONAL. NO DIRECCIONAL. Se dice que es direccional cuando nos encontramos frente a una verificacin de una punta (DOCIMA UNILATERAL)
) H A : U > Uo a) H A : U > Uo
b) HA : U < Uo
= 0.05 = 0.05
= 2
= 2
REGION DE RECHAZO
Lic. Pedro Navarro
PRUEBAS DE DECISIN. (PRUEBA DE EXTREMOS) DERECHO Ejemplo. Mediante una investigacin de mercados con tamao 388 de tamao maestral se conoce que una estrategia de mercado logro que se vendiera un promedio de 155 docenas por da de un producto que se utiliza para la higiene del hogar, con una desviacin de 8 docenas. La consultora que asesora a la empresa sugiere que se debe cambiar de estrategia asegurando que las ventas promedio por da sern mayores a 155 docenas. En un sondeo de mercado a 35 clientes se establece que la media de es 160 docenas y se mantiene una desviacin de 8 docenas.
Lic. Pedro Navarro
Formulacin de la HIPOTESIS Asumamos que el gerente piensa en que las ventas podran ser superiores al promedio de las 155 docenas dia.. Formulando las HIPTESIS tenemos: HO: u = 155 docenas HA :u >155 docenas
Lic. Pedro Navarro
Es el subconjunto del espacio Muestral que nos conduce a rechazar HO (HIPTESIS indiferente) Los niveles de significacin que ms se utilizan son: = = 0.01 = = 0.05 la seleccin de estadstico de prueba.
Lic. Pedro Navarro
Se utiliza una Distribucin z cuando el tamao de la muestra es mayor a 30, de lo contrario la Distribucin t
N > 30
= == x
Sx n
HA
PRUEBAS DE DECISIN.
Un vendedor de una Importadora de ceras para Cermica, gana una comisin promedio de 980 $us. Mensuales, con una desviacin estndar de 225 Sus. Aparece en el mercado una nueva marca de cera, este echo har reducir el volumen de ventas por vendedor, disminuyendo en consecuencia sus ingresos. Por otro lado los costos de produccin han sufrido variaciones como consecuencia de la inflacin. Esto implica que los precios suban, como consecuencia los vendedores incrementarn sus ingresos con la nueva estrategia propuesta. El gerente de la empresa desea conocer el efecto neto de estos dos factores que influyen sobre las comisiones del vendedor, Para tomar una decisin se toma una muestra aleatoria de tamao 100 de todas las cuentas del vendedor cuyo promedio es de 940 $us. Y su desviacin 235
Lic. Pedro Navarro
= 0.05.
ESTADSTICO DE PRUEBA. x - 0 Z= x
HA
0 0
=0
Regla de decisin.
0.01 0.05 Rechazar Ho si y solo si z < - 2,33 z < - 1,65 z > 2,33 z > 1,65 z < - 2,58 z < - 1,96 z > 2,58 z > 1,96
Lic. Pedro Navarro
PRUEBAS DE DECISIN. PRUEBA DE DOBLE EXTREMO. Para una dsima bilateral, la regla de decisin llega a ser: RECHAZAR Ho SI Y SOLO SI, | Z | > 1.96 O lo que es lo mismo: Se rechaza Ho sisiempre y cuando z< -1.96 z > 1.96 CALCULOS. x - = o z= x
x ==
z=
= 23.5 == 1.7
x -235 = o == 100 x
HA
Z -1.7 Se encuentra dentro de la regin de aceptacin, Ho no se rechaza. Esto significa que el ingreso mensual del vendedor no ha variado significativamente.
Lic. Pedro Navarro
PRUEBA t
Tiene el mismo principio que el estadgrafo z La prueba t se utiliza cuando se tiene muestras pequeas. EJEMPLO Un gerente comercial asume que el despacho de mercaderas tarda como promedio cuatro das. Una carta enviada por uno de los clientes ms importantes de la empresa manifiestan su queja debido a demoras por encima de los cinco das. En un sondeo de 25 clientes muestra que el promedio de recepcin despus de un pedido es de 4.7 das. Surge una duda, es correcta o incorrecta generalizar la apreciacin de los 25 clientes seleccionados al azar. Entre los das de despacho existe una desviacin de 1.1 das.
PRUEBA t
PLANTEAMIENTO DE LA HIPOTESIS. Ho : u = 4 das HA : u > 4 das Nivel de significacin. = 0.05. ESTADSTICO DE PRUEBA. x - = 4.7 - 4 0 t= t= ; 1.1 S 25 n
==3.18
PRUEBA t
PROCEDIMIENTO PARA ENCONTRAR EL FACOTOR EN TABLAS El numero de elementos es de 25 tomados de la muestra El valor sera (n 1) Aplicando este principio (25-1) = 24 Buscando en tablas tenemos 1.711 DECISION: SI t > se acepta HA t =3.18 > = 1.711 Se rechaza la suposicin de una entrega se realiza en cuatro dias. Si t < Se rechaza HA
X1 X3 X2
10
3.
9.5
X4 X5
5 8.5
10
Rango Intercuartil es la diferencia entre el cuartil tres y cuartil uno. Rango Intercuartil ser: (RI)= Q3 Q1
PASOS PASOS PARA PARA CALCULAR CALCULAR EL EL RANGO INTERCUARTIL RANGO INTERCUARTIL
Veamos el siguiente ejemplo: Determine el rango intercuartil para los datos siguientes; 30, 40, 35, 5, 10, 20, 15, 30 y 45: Paso 1. Ordenar los datos de forma ascendente. 5 10 15 20 30 30 35 40 45 Paso 2. Calcular los cuartiles Q3 y Q1
PASOS PASOS PARA PARA CALCULAR CALCULAR EL EL RANGO INTERCUARTIL RANGO INTERCUARTIL
EN PERCENTILES 25 25% Q1 25% Q2 25% Q3 25% 50 75 100
Q3 = 75 percentil Q1 = 25 percentil Nota: Utiliza el mismo procedimiento para calcular los percentiles.
CONTINUACIN CONTINUACIN
Cuartil uno: Considerando los percentiles Q1 = 25 percentil
=P = i == n =100 =
= =25 =9 i = =100 =
=2.25
Como (i) no es un entero, redondeamos al prximo entero mayor que 2.25, o sea 3. As, que Q1 est ubicado en la posicin tres (3) de los datos, que en este ejemplo es 15. Q 1= Q 1 = 15 15 5 10 15 20 30 30 35 40 45
CONTINUACIN CONTINUACIN
Cuartil tres Q3 = 75 percentil
CONTINUACIN CONTINUACIN
Paso 3. Ahora, podemos sustituir los valores de los cuartiles en la frmula. Rango Intercuartil = Q3 1 Q RI = Q3 11 35 15 RI Q 3 = 35 15 = Q= 20 Q 20
VARIABLES NOMINALES
VARIABLES NOMINALES
MEDIDAS DE TENDENCIA CENTRAL: Moda = El numero que mas se repite dentro de una nube de datos. MEDIDAS DE DISPERSION: Frecuencia absoluta Frecuencia relativa
Si No Total
130 68 198
Chi : Es un estadgrafo que permite evaluar la hiptesis sobre la relacin existente entre dos variables. Ej. Se quiere determinar la relacin que pueda existir entre el consumo por marca y el sexo del que compra.
SEXO DEL ENCUESTADO Masculino Femenino Marca A Marca B Marca C Total 180 190 170 540 100 280 120 500
.4
Fei ==
.6
==145
1040
280 * 500
==134
CHI
(Fo =Fe
Fe
GL= (3 1) (2 1 ) = 2