Professional Documents
Culture Documents
TEMA:
Aplicar funciones de probabilidad y su uso en la distribucin
binomial y distribucin binomial negativa tanto en Excel como
en SPSS.
GRUPO # 2
INTEGRANTES:
GOMEZ DE LA TORRE MOHAMEHT SAYNER SIMBAD
GUALOTO JUNA RONALD PATRICIO
PINCAY BERMUDEZ PAOLA BEATRIZ
TROYA OCAA EDMUNDO EDUARDO
VASQUEZ GUALPA WASHINGTON FELIPE
II PARCIAL
AGOSTO, 2015
ndice
1. INTRODUCCIN ................................................................................................................... 1
1.1 OBJETIVOS: ........................................................................................................................ 2
1.1.1 Objetivos Generales: ................................................................................................. 2
1.1.2 Objetivos Especficos: .............................................................................................. 2
2. DISTRIBUCIN DE PROBABILIDAD BINOMIAL. ......................................................... 3
2.1 Definicin ......................................................................................................................... 3
2.2 Sintaxis ............................................................................................................................. 4
2.3 Propiedades de la distribucin Binomial ................................................................ 5
2.4 Anexos .............................................................................................................................. 5
2.4.1 Ejemplo: 1..................................................................................................................... 5
3. DISTRIBUCIN DE PROBABILIDAD BINOMIAL NEGATIVA ..................................... 9
3.1 Definicin ......................................................................................................................... 9
3.2 Sintaxis ........................................................................................................................... 10
3.3 Propiedades de distribucin Binomial negativo ................................................. 11
3.4 Ejemplo: 1 ...................................................................................................................... 11
4. CONCLUSIN ..................................................................................................................... 16
5. BIBLIOGRAFA ................................................................................................................... 17
1. INTRODUCCIN
Estudiaremos en este tema dos de las distribuciones de probabilidad ms
importantes y que son imprescindibles en el estudio de la estadstica.
La distribucin binomial es uno de los primeros ejemplos de las llamadas
distribuciones discretas (que solo pueden tomar un nmero finito, o infinito
numerable, de valores). Fue estudiada por Jakob Bernoulli (Suiza, 1654-1705),
quin escribi el primer tratado importante sobre probabilidad, Ars conjectandi
(El arte de pronosticar). Los Bernoulli formaron una de las sagas de matemticas
ms importantes de la historia.
Hoy en da, en las empresas tenemos muchas situaciones donde se espera que
ocurra o no un evento especifico. Este puede ser de xito o fracaso sin dar paso
a un punto medio. Por ejemplo, En la produccin de un artculo, este puede salir
bueno o malo. Casi bueno no es un resultado de inters. Para situaciones como
estas se utilizan la distribucin binomial.
Se describe el uso de la distribucin binomial para obtener probabilidad de
ocurrencia de ese evento que representa un resultado esperado.
La distribucin binomial negativa puede considerarse como una extensin o
ampliacin de la distribucin geomtrica. La distribucin binomial negativa es un
modelo adecuado para tratar aquellos procesos en los que se repite un
determinado ensayo o prueba hasta conseguir un nmero determinado de
resultados favorables (por vez primera). Es por tanto de gran utilidad para
aquellos muestreos que procedan de esta manera. Si el nmero de resultados
favorables buscados fuera 1 estaramos en el caso de la distribucin geomtrica.
~1~
1.1 OBJETIVOS:
1.1.1 Objetivos Generales:
Conocer las funciones de Probabilidad que se aplicaran en Excel y SPSS
para realizar la Distribucin Binomial y Distribucin Binomial Negativa.
1.1.2 Objetivos Especficos:
Analizar el concepto de Distribucin Binomial y Binomial Negativa.
Calcular la probabilidad del xito o fracaso de un evento.
Identificar las funciones y elementos de probabilidades
~2~
~3~
2.2 Sintaxis
La funcin de probabilidad es
Donde
P(X) =Probabilidad de X xitos, dadas n y p
n = Nmero de observaciones
p = Probabilidad de xitos
1-p = Probabilidad de fracasos
X = Nmero de xitos en la muestra ( X = 0, 1, 2, 3, 4, n )
Donde
Siendo
Las combinaciones de
en
Ejemplo:
Supongamos que se lanza un dado (con 6 caras) 50 veces y queremos conocer
la probabilidad de que el nmero 3 salga 20 veces. En este caso tenemos una X
~ B (50, 1/6) y la probabilidad sera P(X=20):
~4~
np
Desviacin estndar de la distribucin binomial
2 np(1 p)
2.4 Anexos
2.4.1 Ejemplo: 1
Una Urna contiene 40 bolas blancas y 60 bolas negras. Sacamos 8 veces una
bola, devolvindola, cada vez, a la urna:
A. Cul es la probabilidad de que 5 sean blancas?
Paso 1: Identificacin de datos:
~5~
~6~
~7~
Paso 3:
Se abrir un cuadro de dialogo y en Grupo de Funciones escogemos la opcin
FDP Y FDP NO CENTRADA, luego en Funciones y Variables Especiales
escogemos la opcin PDF.BINOM:
Paso 4:
Reemplazamos en
la
funcin
indicada
nuestros datos
~8~
del
ejercicio,
Paso 5:
Comparamos los resultados arrojados en la tabla con los resultados de Excel:
~9~
Nm_fracasos
Nm_xitos
Prob_xito
Acumulado
~ 10 ~
~ 11 ~
~ 12 ~
~ 13 ~
Paso 2: Nos dirigimos a Vista de datos, luego clic en opcin Transformar se abre
una ventana y damos clic en Calcular variable:
~ 14 ~
Paso 5:
Comparamos los resultados arrojados en la tabla con los resultados de Excel:
~ 15 ~
4. CONCLUSIN
En conclusin la mejor manera de visualizar el proyecto es gracias a la
comprensin de conceptos, entendimos que la distribucin binomial y la
distribucin binomial negativa son una poderosa herramienta probabilstica que
bien aplicada nos podr ayudar a facilitar los clculos para la solucin de
problemas.
El objetivo central de este trabajo es saber que aprendimos a diferenciar entre
una distribucin binomial y una distribucin binomial negativa.
Por medio de los grandes avances tecnolgicos hemos ahorrado tiempo para el
anlisis probabilstico, sin embargo la comprensin de la lgica que se utiliza
para llegar a la resolucin del mismo.
~ 16 ~
5. BIBLIOGRAFA
Distribucin de Probabilidad Binomial
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial
Lind, D & Marchal, W & Wathen, S (2008). Estadstica aplicada a los Negocios y
la Economa (13 Ed). Mc Graw Hill
https://support.office.com/es-mx/article/NEGBINOMDIST-funci%C3%B3nNEGBINOMDIST-c8239f89-c2d0-45bd-b6af-172e570f8599?ui=es-ES&rs=esMX&ad=MX
~ 17 ~
TEMA:
DISTRIBUCION DE POISSON Y
DISTRIBUCION HIPERGEOMETRICA
~ 18 ~
POISSON
Es una distribucin de probabilidad discreta que expresa la probabilidad
de que un nmero de eventos ocurran en un periodo de tiempo y es
utilizado en situaciones donde los sucesos son impredecibles o de
ocurrencia aleatoria.
Una distribucin discreta es un conjunto de variables aleatorias que slo
pueden tomar un conjunto finito o infinito numerable de valores
diferentes.
Aqu la formula donde k es el nmero de ocurrencias del evento o
fenmeno
es un parmetro positivo que representa el nmero de veces que se
espera que ocurra el fenmeno durante un intervalo dado.
e es la base de los logaritmos naturales
~ 19 ~
Como se puede apreciar las variables que debo llenar son las siguientes:
X en este caso es 4 pues me pide detectar 4 infracciones al da
Media en este caso es mi promedio y en el planteamiento del problema
indica que existe un promedio de 6 infracciones diarias
Acumulado, ponemos cero, porque no se acumula ya que pide un valor
igual a 4, en ninguna parte indica menor o mayor 4, si fuera de esta ltima
forma, se pone 1.
Aqu visto el problema desde otro punto de vista
~ 20 ~
~ 21 ~
Como se puede apreciar las variables que debo llenar son las siguientes:
X en este caso es 1 pues me pide detectar menos de dos infracciones al
da
Media en este caso es mi promedio y en el planteamiento del problema
indica que existe un promedio de 6 infracciones diarias
Acumulado, ponemos uno, porque aqu si se acumula ya que pide un
valor menor a dos.
Aqu visto el problema desde otro punto de vista
~ 22 ~
~ 23 ~
~ 24 ~
~ 25 ~
X es igual a dos porque se busca mnimo tres llamadas por hora, mi media
es 10 y como mi valor es acumulado, se pone 1.
La resolucin del ejercicio en SPSS
~ 26 ~
~ 27 ~
~ 28 ~
HIPERGEOMETRICA
En Estadstica, la hipergeomtrica es una de las distribuciones de
probabilidad discreta. Esta distribucin se utiliza para calcular la
probabilidad de una seleccin aleatoria de un objeto sin repeticin.
Aqu, el tamao de la poblacin es el nmero total de objetos en el
experimento.
Ejercicio No. 1:
De 40 edificios en un parque industrial 15 no cumplen con el cdigo
elctrico. Si se seleccionan 10 edificios aleatoriamente. Determine la
probabilidad de que:
3 no cumplan el cdigo
PROCEDIMIENTO:
Para desarrollar en Excel realizamos el siguiente procedimiento:
1. Determinamos los elementos:
N=
n=
C=
x=
40
10
15
3
N-C=
n-x=
25
7
~ 29 ~
3. Se obtiene el resultado:
En SPSS:
Para desarrollar el ejercicio en SPSS realizamos el siguiente
procedimiento:
1. Identificamos y detallamos los datos de la siguiente manera:
X= poblacin
Y= muestra
Z= poblacin xito
A= muestra xito
B= resultado
~ 30 ~
~ 31 ~
~ 32 ~
4. Presionamos
aceptar
~ 33 ~
se
procesa
el
resultado:
5. Se
obtiene
el
resultado:
Ejercicio No. 2:
1.- Planteamiento:
~ 34 ~
Variables
Acierto
muestra
3
22
7
70
1
8
11
Probabilidad
Fx= Excel
Fx= SPSS
0.254948
0.254948
0.231960
0.231960
0.407297
0.407297
100
b)
Seleccin de
variables.vez
identificada
formula se
procede a la
seleccin las
variables
Una
la
~ 35 ~
c) Resultado:
Una vez seleccionadas las variables se procede a dar clip en aceptar
y se obtiene la probabilidad, y el proceso se repite para cada una de las
variables
Variables
Acierto muestra
Mujeres
Varones
Repetidor
Suman
22
70
11
100
Probabilidad
Fx= Excel
Fx= SPSS
0.254948
0.231960
0.407297
~ 36 ~
~ 37 ~
a)
c) Seleccin de
variables.- Una vez
identificada la
formula se
procede a la
seleccin las variables requeridas por la ventana de Calcular variable:
Formula PDF.HYPER(,?,?,?)
* C: Es la columna de los nmeros de aciertos que deseamos en el caso de
nuestro ejercicio es Aciertos.
* total: Es la columna del total de la poblacin en nuestro ejercicio es igual a
Total_Poblacin.
* Muestra: es cada una de la muestra de las diferentes variables o variable
que plante el ejercicio, en el caso de nuestro ejercicio es la columna
muestra.
* Aciertos: Es la sumatoria de cada uno de los aciertos que deseamos en
cada variable, en nuestro ejercicio es la columna Total Aciertos
* Variable de destino: es el nombre que le damos a la columna donde se
reflejara el resultado.
c) Resultado:
~ 38 ~
~ 39 ~
Ejercicio No. 3:
Al someter a prueba un tipo de caucho para camiones sobre un terreno
mojado, se observ que de los 120 camiones puesto a prueba,
36 no terminaron la prueba por deslizamiento. Si
se someten a prueba 16 camiones
Hallar
la
probabilidad
de
que
exactamente 6 no finalicen la prueba
Halle la probabilidad de que
menos que 2 no finalicen la
prueba
Paso 1
Comienzo a analizar el ejercicio, aqu me est indicando que tengo un
total de 120 camiones. Cual sera mi probabilidad de que de estos
exactamente 6 no finalicen la prueba y de que menos de 2 no finalicen
la prueba. Defino mis variables y comienzo a resolver
probabilidad de que 6 exactamente no finalicen
la prueba
N=
120
C=
36
n=
16
x=
6
120
36
16
1
~ 40 ~
Paso 2
Comienzo a aplicar mi formula de Excel de la siguiente manera
Ejercicio en spss
Comienzo a ubicar mis variables y valores
~ 41 ~
~ 42 ~
Y procedo a calcular
Ubicando mis variables
~ 43 ~
Y obtengo mi resultado
~ 44 ~
Y obtenemos el resultado
~ 45 ~
Docente:
Integrantes:
N3:
GRUPO # 5
7HOO - 10H00 AM
Segundo Parcial
~ 47 ~
Yi = a + bXi + ei
~ 48 ~
Donde:
~ 49 ~
10
16
5
9
7
3
19
25
11
7
8
13
~ 50 ~
~ 51 ~
n datos
Para obtener la media y se debe aplicar la funcin promedio y nos indicara que
ingrese los valores y tenemos que ingresar los valores de media excepto la suma
total y se presiona enter y nos da un resultado como se puede observar.
media y
10
Las obtener la media de x se debe aplicar la funcin promedio y nos indicara que
ingrese los valores y tenemos que ingresar los valores de x excepto la suma
total y se presiona enter y nos da un resultado como se puede observar.
~ 52 ~
~ 53 ~
~ 54 ~
~ 55 ~
~ 56 ~
= a + bx
En la cual se toma el resultado de a ms el resultado de b multiplicado con
variable x que a su vez da como resultado de 13,96.
~ 57 ~
Ahora realizamos el literal b que es estime cual sera el monto total cuyo nmero
de depsitos es 20 interprete el resultado.
Procedemos a restar el valor de y menos el monto miles dlares que es 19
menos el resultado de la ecuacin que es 13,96 y nos un resultado de 5,04 y en
el siguiente grafico podemos observar el anlisis de este resultado.
~ 58 ~
~ 59 ~
~ 60 ~
~ 61 ~
Y nos dar una serie opciones de entre las cuales haremos clic en
complementos, iremos en donde dice administracin y haremos clic en
complementos de Excel y haremos clic en donde dice ir:
~ 62 ~
~ 63 ~
~ 64 ~
~ 65 ~
Y = a+bx
Y=3,85263158+ 0,50526316x
~ 66 ~
Para llevar las variables X y se lo puede hacer con las teclas CTRL + C; luego y
ya abierto el SPSS damos con las teclas CTRL + V para copiar los valores en
SPSS como podemos ver en el siguiente grfico:
~ 67 ~
4. El cual nos va a mostrar otra ventana, en donde tenemos que ubicar las
variables independientes (X) y las variables dependientes (Y) como se muestra
en el siguiente grficos
~ 68 ~
~ 69 ~
~ 70 ~
7. De aqu se nos abre una ventana en donde tenemos que definir las variables
dependientes (Y) y las variables independientes (X)
~ 71 ~
Con estos resultados podemos comparar con EXCEL los resultados que est en
el TEXTO DEL SPSS encerrados en crculos; incluyendo tambin el grafico tanto
en EXCEL como en el SPSS:
~ 72 ~
EN EXCELL
~ 73 ~
UNIVERSIDAD DE GUAYAQUIL
FACULTAD DE CIENCIAS ADMINISTRATIVAS
TRABAJO EN EQUIPO
REGRESIN LINEAL MLTIPLE
ASIGNATURA: CMPUTO 3
TUTOR: ING. GALO APOLO
INTEGRANTES:
~ 74 ~
1
2
3
4
5
6
7
8
9
10
11
X1
rea
2.3
3.4
3.2
5.7
5.3
5.1
4.8
6.4
5.4
9.1
10.4
X2
Antigedad
2
8
11
9
11
12
22
8
17
18
12
Y
Precio
98
162
164
230
210
200
182
300
192
360
464
DE FORMA MANUAL
~ 75 ~
DEMOSTRACIN
FRMULA MATRICIAL
DEMOSTRACIN
~ 76 ~
PRIMERA MATRIZ
PRIMERA COLUMNA DE LA FRMULA
1.
N es el nmero de datos
11
61.1
130
61.1
397.81
775
cuadrado.
3. X1*X2 es la multiplicacin de los valores de rea por antigedad.
XXT
11
61.1
130
61.1
397.81
775
130
775
1840
SEGUNDA MATRIZ
1. y es la suma total de los valores del precio.
2. X1*Y es la multiplicacin del rea por el precio.
3. X2*Y es la multiplicacin de la antigedad por el precio.
~ 77 ~
130
775
1840
2562
16677
31792
XTY
2562
16677
31792
18.9680762
44.352118
-2.74279421
~ 78 ~
Donde:
B0 = 18.9680762
B1 = 44.352118
B2= -2.74279421
Realizamos el anlisis:
El precio depende del rea y la antigedad a mayor valor aumentar sus precios.
A menor valor de las variables independientes el precio disminuye.
1
2
3
4
5
6
7
8
9
10
11
X1
rea
2.3
3.4
3.2
5.7
5.3
5.1
4.8
6.4
5.4
9.1
10.4
X2
Antigedad
2
8
11
9
11
12
22
8
17
18
12
~ 79 ~
Y
Precio
98
162
164
230
210
200
182
300
192
360
464
~ 80 ~
Estadsticas de la regresin
Coeficiente de correlacin mltiple
0.96691439
R^2 ajustado
0.95864299
Error tpico
21.1259041
Observaciones
11
ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresin
104344.4785
52172.23924
Residuos
3570.430607
446.3038259
10
107914.9091
Total
Coeficientes
Intercepcin
Error tpico
Estadstico t
F
116.8984808
Probabilidad
Valor crtico de F
1.19828E-06
Inferior 95%
Superior 95%
Inferior 95,0%
Superior 95,0%
18.9680762
18.88567882
1.004362957
0.344611754
-24.58237722
62.51852967
-24.58237722
Area
44.352118
3.011607702
14.7270569
4.44265E-07
37.40733817
51.2968978
37.40733817
51.2968978
Antigedad
-2.7427942
1.321080602
-2.076174768
0.071539279
-5.789211544
0.303623119
-5.789211544
0.303623119
~ 81 ~
62.51852967
1
2
3
4
5
6
7
8
9
10
11
X1
rea
2.3
3.4
3.2
5.7
5.3
5.1
4.8
6.4
5.4
9.1
10.4
X2
Antigedad
2
8
11
9
11
12
22
8
17
18
12
Y
Precio
98
162
164
230
210
200
182
300
192
360
464
~ 82 ~
1. Ubicamos en vista de datos los valores de nuestras variables (copiar, tipear o enviar
directamente desde el archivo).
~ 83 ~
Variables entradas/eliminadasa
Modelo
1
Variables
Variables
introducidas
eliminadas
Mtodo
Antiguedad,
. Intro
Areab
a. Variable dependiente: Precio
Modelo
1
R
,983a
R cuadrado
R cuadrado
Error estndar
ajustado
de la estimacin
,967
,959
21,126
Es la estadstica de la regresin.
ANOVAa
Suma de
Modelo
1
cuadrados
Regresin
104344,478
Media
gl
cuadrtica
2
~ 84 ~
52172,239
F
116,898
Sig.
,000b
Residuo
Total
3570,431
107914,909
10
446,304
Es el anlisis de la varianza
Coeficientesa
Coeficientes
Coeficientes no estandarizados
Modelo
1
Error estndar
(Constante)
18,968
18,886
Area
44,352
3,012
Antiguedad
-2,743
1,321
estandarizados
Beta
Sig.
1,004
,345
1,032
14,727
,000
-,145
-2,076
,072
COMPROBACIN
FORMA MANUAL
18.9680762
44.352118
-2.74279421
18.9680762
44.352118
-2.74279421
SPSS
Coeficientesa
Coeficientes
Coeficientes no estandarizados
Modelo
1
Error estndar
(Constante)
18,968
18,886
Area
44,352
3,012
Antiguedad
-2,743
1,321
~ 85 ~
estandarizados
Beta
Sig.
1,004
,345
1,032
14,727
,000
-,145
-2,076
,072
GRUPO #4
EXCEL
En Excel tenemos las siguientes calificaciones de dos universidades distintas, la
Universidad de Guayaquil y la Universidad Catlica. Queremos verificar si las medias
de los datos son diferentes o iguales entonces declaramos las siguientes hiptesis (cabe
recalcar en utilizaremos un margen de error de 0.05):
H1= Existe una diferencia significativa entre la media de calificaciones del grupo de la
Universidad de Guayaquil y la media de calificaciones del grupo de la Universidad
Catlica.
H0= NO existe una diferencia significativa entre la media de calificaciones del grupo
de la Universidad de Guayaquil y la media de calificaciones del grupo de la
Universidad Catlica.
~ 86 ~
Para realizar ambas frmulas elaboramos la siguiente tabla. Es solamente tomar los
datos de ambas universidades y elevarlos al cuadrado como nos pide la formula y
calcular n.
~ 87 ~
S2:
~ 88 ~
Obtenemos el valor 0.1522. Este es nuestro estadstico T. Para confirmar que esta
bien, realizamos la prueba T mediante Analisis de datos en Excel.
Primero, hacemos clic en Datos y despues en Analisis de datos.
~ 89 ~
Despues para cada variable, elegimos los rangos de cada universidad. En este caso el
primer rango son las calificaciones de la Universidad de Guayaquil y el segundo rango
las calificaciones de la Universidad Catlica.
Elegimos una opcion de salida. Vamos a escoger un rango de salida para que nos
aparezca en la misma hoja de trabajo.
~ 90 ~
Aqu podemos verificar que nuestro estadistico t si tiene el mismo valor que nos dio la
formula (0.1522).
Ahora, para ver cual hipotesis se rechaza y cual se acepta, observamos el estadistico t
(0.15522) y el valor critico de t (dos colas). Utilizamos dos colas porque son dos
muestras.
H1= Existe una diferencia significativa entre la media de calificaciones del grupo de
la Universidad de Guayaquil y la media de calificaciones del grupo de la Universidad
Catlica.
~ 91 ~
SPSS
Abrimos el programa SPSS y copiamos los mismos datos de Excel de esta forma:
~ 92 ~
El siguiente paso es copiar y pegar nuestros valores de Excel a SPSS y eso se hace
seleccionando los datos y pegarlos en SPSS en donde corresponden. Tenemos lo siguiente:
~ 93 ~
~ 94 ~
Ponemos el cursor sobre Comparar medias y despus hacemos clic en Prueba T para
muestras independientes.
Nos aparece la siguiente ventana. En esta ventana ingresamos la variable de prueba que este
caso es la variable dependiente, la calificacin de los estudiantes de cada universidad. En
Variable de agrupacin insertamos la variable Universidad.
Como podemos observar en la imagen superior, despus de universidad nos aparecen dos signos
de interrogacin. Aqu vamos a dar uso a los valores de cada etiqueta, o cada universidad.
~ 95 ~
Hacemos clic en Definir grupos y nos aparece la siguiente ventana. Si bien recordamos el
numero 1 representaba a la Universidad de Guayaquil, en este caso el grupo 1. Y el numero 2
representaba a la Universidad Catlica, en este caso el grupo 2. Hacemos clic en Continuar y
despus en Aceptar.
Finalmente, se abre otra ventana donde aparecen los datos de la Prueba T. Aqu tambin
podemos analizar las medias. Tambin se puede verificar el valor del estadstico t (0,152) que
es igual al de Excel.
En lo contrario al procedimiento en Excel, en vez de comparar el valor del estadstico t con el
valor crtico, vamos a comparar el valor significativo (si se asumen varianzas iguales) con
nuestro margen de error (0.05) para ver cul hiptesis se rechaza o se acepta.
~ 96 ~
~ 97 ~
VALOR REQUERIDO
MEDIA
DESVIACION ESTANDAR
VARIABLE
MEDIA
DESV. ESTA
500
485
30
0.50
~ 98 ~
EDAD
3
6
9
12
15
18
21
24
27
30
33
36
39
42
45
48
51
Z
ESTNDAR
~ 99 ~
GRAFICO:
1. Seleccionamos los valores de la columna DISTRIBUCIN NORMAL
2. Damos clic en INSERTAR, Grafico de dispersin.
~ 100 ~
~ 101 ~
~ 102 ~
GRAFICO
1. DAMOS CLIC EN GRFICOS, CUADRO DE DILOGOS ANTIGUOS Y
DISPERSIN/PUNTOS
~ 103 ~
~ 104 ~
TEMA:
INTEGRANTES:
ESTADISTICO F O DISTRIBUCION F
PROFESOR:
2015 - 2016
~ 105 ~
~ 106 ~
INDICE
Tabla de contenido
CONCEPTO .................................................................................................................................... 1
CALCULO DEL ESTADISTICO F .................................................................................................. 2
DETERMINACION DE LOS GRADOS DE LIBERTAD ................................................................... 3
EJERCICIO.................................................................................................................................. 4
FORMA MAUAL........................................................................................................................ 5
FORMA FUNCION ..................................................................................................................... 8
FORMA IBM
SPSS.....10
~ 107 ~
1.1.1.-Caractersticas de la distribucin F
1.- Existe una distribucin F diferente para cada combinacin de tamao de muestra y
numero de muestras. Por lo tanto existe una distribucin F que se aplica cundo se toman
cinco muestras de seis observaciones cada una. En caso de la distribucin F, los valores
crticos para los niveles 0,005 y 0,01 generalmente se proporcionan para determinadas
combinaciones de tamaos de muestra y numero de muestras.
2.- La distribucin es continua respecto al intervalo de 0 a + . La razn no puede ser
negativa, ya que ambos trminos de la razn F estn elevados al cuadrado. Por otra
parte, grandes diferencias entre valores medios de muestra, acompaadas de pequeas
variancias mustrales pueden dar como resultado valores extremadamente grandes de
la razn F. La distribucin F no puede ser negativa, El menor valor que F puede tomar
es 0.
3.- La forma de cada distribucin de muestreo terico F depende del nmero de grados
de libertad que estn asociados a ella. Tanto el numerador como el denominador tienen
grados de libertad relacionados.
4.- Tiene sesgo positivo la cola larga de la distribucin es hacia el lado derecho. Cuando
el nmero de grados de libertad aumenta, tanto en el numerador como en el
denominador, la distribucin se aproxima a ser normal.
5.- Es asinttica cuando los valores de X aumentan, la curva F se aproxima al eje X pero
nunca lo toca. Este caso es similar al comportamiento de la distribucin de
probabilidad normal.
~ 108 ~
indeseable del error tipo 1. Suponga cuatros mtodos distintos (A, B, C, D) para capacitar
personal para ser bomberos. La asignacin de cada uno de los 40 prospectos del grupo
de este ao es aleatoria en cada uno de los cuatros mtodos. Al final del programa de
capacitacin, a los cuatros grupos se les administra una prueba comn para medir la
compresin de las tcnicas contra incendios. La pregunta es: existe una diferencia entre
las calificaciones medias del examen de los cuatros grupos? La respuesta a esta pregunta
permitir comprar los cuatros mtodos de capacitacin.
ANOVA
PRUEBA T
PRUEBA ESTADISITICO F
REGRESION LINEAL
CHI-CUADRADO
~ 109 ~
las diferencias elevadas al cuadrado entre el nmero de medias (muestras) menos uno,
o bien, k 1. As, k -1 es el nmero de grados de libertad para el numerador.
En forma semejante, el calcular cada variancia muestral, la suma de las diferencias
elevadas al cuadrado entre el valor medio de la muestra y cada valor de la misma se
divide entre el nmero de observaciones de la muestra menos uno, o bien, n 1. Por lo
tanto el promedio de las variancias mustrales se determina dividiendo la suma de las
variancias de la muestra entre el nmero de muestras, o K. los grados de libertad para
el denominador son entonces, k(n 1).
Los trminos
Son las varianzas mustrales respectivas. Si la hiptesis nula es verdadera, el estadstico
de prueba.
Sigue la distribucin F con n1 1 y n2 1 grados de libertad. A fin de reducir el tamao
de la tabla de valores crticos, la varianza ms grande de la muestra se coloca en el
numerador; de aqu, la razn F que se indica en la tabla siempre es mayor que 1.00. As,
el valor crtico de la cola derecha es el nico que se requiere. El valor crtico de F de una
prueba de dos colas se determina dividiendo el nivel de significancia entre dos y despus
se consultan los grados de libertad apropiados en el apndice.
3.1.-Ejercicio N1
APLICADO EN EXCEL
3.1.1FORMA MANUAL
Un profesor universitario tiene en su grupo de alumnos que provienen de 4 escuelas
de bachillerato, despus de aplicarles el primer examen, obtiene los siguientes
resultados:
ESCUELA A ESCUELA B
6
6
8
7
9
8
ESCUELA C
10
6
5
ESCUELA D
9
9
9
6
7
t 2c
2
~ 110
SCT
x / ~N
nc
T 2c
1er Paso
2do Paso
Nmero de datos
Suma total de X ^2
~ 111 ~
SUMAS
CUADRADO
S
36
36
100
81
TOTAL
253
64
49
36
81
230
81
64
25
81
251
81
36
117
49
49
900
FUENTE
FACTOR
ERROR
MANUAL
GRADOS DE LIBERTAD
3
11
SUMA DE CUADRADOS
10.8
22.8
TOTAL
Nmero de datos
~ 112 ~
CUADRADO MEDIO
3.6
2.07
F
1.74
SUMA DE CUADRDOS
TOTAL DE LOS GRADOS DE LIBERTAD DEL FACTOR
SUMA DE CUADRADOS
TOTAL DE LOS GRADOS DE LIBERTAD DE ERROR
Obtenidos estos datos (3.6 y 2.07), los dividimos y como resultado me da 1.74 que es
la funcin F como lo vemos en la grafica remarcada de color rojo.
~ 113 ~
Posteriormente vamos al MENU de Excel parte superior y damos clic en DATOS y luego
HERRAMIENTA DE ANALISIS DE DATOS y nos despliega una ventana llamada ANALISIS
DE DATOS posteriormente damos clic en ANALISIS DE VARIANZA DE UN FACTOR
~ 114 ~
Comparamos los resultados que estn remarcados con rojo y notamos que de la forma
matemtica y Excel el estadstico F es el mismo resultado.
~ 115 ~
~ 116 ~
Luego vamos a vista de datos y colocamos los datos que tenemos en Excel , es decir en
ESCUELA colocamos el tipo de ESCUELA A,B,C O D y en POBLACION colocamos los
DATOS de cada escuela.
~ 117 ~
Luego vamos a la opcin del men ANALIZAR damos clic y posteriormente vamos a
COMPARAR MEDIAS y luego ANOVA DE UN FACTOR y damos clic.
~ 118 ~
~ 119 ~
Siguiendo el proceso anterior despus doy clic en OPCIONES y me aparece una ventana
llamada ANOVA DE UN FACTOR OPCIONES activo con una pestaa en las casillas
DESCRIPTIVOS, PRUEBA DE HOMOGENIEDAD DE LAS VARIANZAS y GRAFICOS DE LAS
MEDIAS y doy clic en CONTINUAR.
~ 120 ~
Luego del proceso anterior me aparecer una ventana nueva de resultado, en esta
ventana observamos los diferentes resultados como los GRADOS DE LIBERTAD y el
ESTADISTICO F con el mismo valor de FORMA MANUAL O MATEMATICAMENTE, EXCEL
y IBM SPSS. Los resultados los podemos comparar de FORMA MANUAL O
MATEMATICAMENTE, EXCEL y IBM SPSS ya que estn sombreados de color rojo.
~ 121 ~
ANOVA
poblacion
Suma de
cuadrados
Media
gl
cuadrtica
Entre grupos
10,800
3,600
Dentro de grupos
22,800
11
2,073
Total
33,600
14
~ 122 ~
F
1,737
Sig.
,217
Zona de aceptacin
de la hiptesis nula
Zona de rechazo
~ 123 ~