You are on page 1of 18

UNIVERSIDAD MARIANO GALVEZ

MAZATENANGO, SUCHITEPEQUEZ
NOMBRE:
Miguel Antonio Ramrez Cache

Carn: 3090-14-8416
cuarto semestre

Estadstica I
Ing. Rudy Santisteban

Seccion: B

U
M
G

MARCO TEORICO
La prueba estadstica de X2 para una muestra se emplea frecuentemente como
prueba de bondad de ajuste, sin embargo, en un plan experimental, en el que se
cuenta con un grupo muestral, con diversas subclases y las mediciones estn en
escala nominal, resulta muy til este procedimiento.
La eficacia de la prueba est de acuerdo con el tamao de la muestra, pues con
un grado de libertad, si hay dos subclases, algunos autores consideran que la
prueba es insensible, no obstante la informacin que aporta ms de dos
categoras.
La variable continua X se dice que sigue una distribucin normal de media y
desviacin tpica si:
a) Puede tomar cualquier valor en el intervalo (-; +)
b) la grfica de esta funcin tiene forma de campana
c) En la distribucin normal hay que observar:
d) c)

Depende de dos parmetros m y s

Es una distribucin probabilstica verstil que permite modelar el cambio de la


probabilidad en funcin del tiempo y que permite representar varios modelos
estadsticos segn sea el valor de alguno de sus parmetros.

DISTRIBUCIN CHI CUADRADA


En estadstica, la distribucin de Pearson, llamada tambin ji cuadrada(o) o chi
cuadrado(a) (), es una distribucin de probabilidad continua con un parmetro
que representa los grados de libertad de la variable aleatoria

Donde

son variables aleatorias normales independientes de media cero y

varianza uno. El que la variable aleatoria


habitualmente as:

tenga sta distribucin se representa

Propiedades
Funcin de densidad
Su funcin de densidad es:

donde

es la funcin gamma.

El estadstico ji-cuadrado (o chi cuadrado), que tiene distribucin de probabilidad


del mismo nombre, sirve para someter a prueba hiptesis referidas a
distribuciones de frecuencias. En trminos generales, esta prueba contrasta
frecuencias observadas con las frecuencias esperadas de acuerdo con la hiptesis
nula. En este artculo se describe el uso del estadstico ji-cuadrado para probar la
asociacin entre dos variables utilizando una situacin hipottica y datos
simulados. Luego se describe su uso para evaluar cun buena puede resultar una
distribucin terica, cuando pretende representar la distribucin real de los datos
de una muestra determinada. A esto se le llama evaluar la bondad de un ajuste.
Probar la bondad de un ajuste es ver en qu medida se ajustan los datos

observados a una distribucin terica o esperada. Para esto, se utiliza una


segunda situacin hipottica y datos simulados.
Del mismo modo que los estadsticos z, con su distribucin normal y t, con su
distribucin t de Student, nos han servido para someter a prueba hiptesis que
involucran a promedios y porcentajes, el estadstico ji-cuadrado (o chi cuadrado),
que tiene distribucin de probabilidad del mismo nombre, nos servir para someter
a prueba hiptesis referidas a distribuciones de frecuencias.
En primer lugar usaremos el estadstico ji-cuadrado para probar la asociacin
entre dos variables, y luego lo usaremos para evaluar en qu medida se ajusta la
distribucin de frecuencias obtenida con los datos de una muestra, a una
distribucin terica o esperada.
En trminos generales, esta prueba contrasta frecuencias observadas con las
frecuencias esperadas de acuerdo con la hiptesis nula. Al igual que en el caso de
las pruebas anteriormente presentadas, ilustraremos con ejemplos.
Ji- cuadrado como prueba de asociacin
Supongamos que un investigador est interesado en evaluar la asociacin entre
uso de cinturn de seguridad en vehculos particulares y el nivel socioeconmico
del conductor del vehculo. Con este objeto se toma una muestra de conductores a
quienes se clasifica en una tabla de asociacin, encontrando los siguientes
resultados:

Uso de Nivel

Nivel

Nivel

TOTAL

cinturn socioeconmico socioeconmico socioeconmico


bajo

medio

alto

SI

15

28

51

NO

13

16

14

43

TOTAL

21

31

42

94

Tabla I. Tabla de asociacin, valores observados.


Permiten estos datos afirmar que el uso del cinturn de seguridad depende del
nivel socioeconmico? Usaremos un nivel de significacin alfa=0,05.
Los pasos del anlisis estadstico en este caso son los siguientes:
1. En primer lugar se debe plantear las hiptesis que someteremos a prueba
H0: El uso de cinturn de seguridad es independiente del nivel socioeconmico.
H1: El uso de cinturn de seguridad depende del nivel socioeconmico.
En esta prueba estadstica siempre la hiptesis nula plantea que las variables
analizadas son independientes.
2. En segundo lugar, obtener (calcular) las frecuencias esperadas
Estas son las frecuencias que debieran darse si las variables fueran
independientes, es decir, si fuera cierta la hiptesis nula.
Las frecuencias esperadas se obtendrn de la distribucin de frecuencias del total
de los casos, 51 personas de un total de 94 usan el cinturn y 43 de 94 no lo usan.
Esa misma proporcin se debera dar al interior de los tres grupos de nivel
socioeconmico, de manera que el clculo responde al siguiente razonamiento: si
de 94 personas 51 usan cinturn; de 21 personas, cuntas debieran usarlo?
La respuesta a esta pregunta se obtiene aplicando la regla de tres y es 11,4.
Este procedimiento debe repetirse con todas las frecuencias del interior de la
tabla.
El detalle de los clculos es el siguiente:
Nivel

bajo:

(21x51/94)=11,4-(21x43/94)=9,6

Nivel

medio:

(31x51/94)=16,8-(31x43/94)=14,2

Nivel alto: (42x51/94)=22,8-(42x43/94)=19,2

Estas son las frecuencias que debieran presentarse si la hiptesis nula fuera
verdadera y, por consiguiente, las variables fueran independientes.
Estos valores los anotamos en una tabla con las mismas celdas que la anterior;
as tendremos una tabla con los valores observados y una tabla con los valores
esperados, que anotaremos en cursiva, para identificarlos bien.
Uso de cinturn Nivel bajo Nivel medio Nivel alto TOTAL
SI

11,4

16,8

22,8

51

NO

9,6

14,2

19,2

43

TOTAL

21

31

42

94

Tabla II. Tabla de asociacin, valores esperados.


3. En tercer lugar se debe calcular el estadstico de prueba
En este caso, el estadstico de prueba es Ji-cuadrado que, como dijimos al
comienzo, compara las frecuencias que entregan los datos de la muestra
(frecuencias observadas) con las frecuencias esperadas, y tiene la siguiente
frmula clculo:

donde oi representa a cada frecuencia observada y ei representa a cada


frecuencia esperada.
De este modo el valor del estadstico de prueba para este problema ser:

Entonces

Este es el valor de nuestro estadstico de prueba que ahora,

siguiendo el procedimiento de problemas anteriores (paso 4), debemos comparar

con un valor de la tabla de probabilidades para ji-cuadrado (x2). Esta tabla es muy
parecida a la tabla t de student, pero tiene slo valores positivos porque jicuadrado slo da resultados positivos. Vase grfico 1, que muestra la forma de la
curva, con valores desde 0 hasta infinito.

Grfico 1.
Dado que el estadstico ji cuadrado slo toma valores positivos, la zona de
rechazo de la hiptesis nula siempre estar del lado derecho de la curva.
Uso de tabla ji-cuadrado
La tabla de ji-cuadrado tiene en la primera columna los grados de libertad y en la
primera fila la probabilidad asociada a valores mayores a un determinado valor del
estadstico

(vase

grfico

de

la

tabla

III).

Los grados de libertad dependen del nmero de celdas que tiene la tabla de
asociacin donde estn los datos del problema y su frmula de clculo es muy
sencilla:
Grados de libertad (gl)=(n de filas1)x(n de columnas1)
As, en nuestro ejemplo, en que hay 2 filas y 3 columnas, los grados de libertad
sern:
gl=(2-1)x(3-1)=2

Ntese que no se consideran la fila ni la columna de los totales.

Tabla III. Tabla de ji-cuadrado.


Al comienzo elegimos un nivel de significacin alfa=0,05. Entonces un valor de
tabla para x2 asociado a 2 grados de libertad y alfa 0,05 es 5,99.

Por lo tanto, como en el grfico 2 vemos que 5,23 se encuentra a la izquierda de


5,99, la probabilidad asociada a valores superiores a 5,23 es mayor que alfa
(0,05).

Grfico 2.
Segn esto, debemos aceptar la hiptesis nula que plantea que las variables uso
de cinturn de seguridad y nivel socioeconmico son independientes.
Limitacin: como norma general, se exige que el 80% de las celdas en una tabla
de asociacin tengan valores esperados mayores de 5.
Ji-cuadrado como prueba de bondad de ajuste
Tambin se puede usar el estadstico ji-cuadrado para evaluar cun buena puede
resultar una distribucin terica, cuando pretende representar la distribucin real
de los datos de una muestra determinada. A esto se le llama evaluar la bondad
de un ajuste. Probar la bondad de un ajuste es ver en qu medida se ajustan los
datos observados a una distribucin terica o esperada.
Tomemos como ejemplo la distribucin esperada para los individuos de una
poblacin que son clasificados segn grupo sanguneo. Segn estudios realizados
en poblacin, se espera que dicha distribucin, en porcentajes, sea la siguiente:
Grupo Frecuencia esperada
AB

2,0%

30,5%

9,3%

58,2%

Tabla IV. Ejemplo de distribucin esperada.


En una muestra de 150 dadores de sangre se encontr la siguiente distribucin:
Grupo Frecuencia observada
AB

48

15

83

Tabla V. Ejemplo de distribucin observada.

DISTRIBUCIN LOGARTMICA NORMAL


Distribucin

Logaritmo

Normal

(Lognormal)

Ocurre en la prctica cada vez que existe una variable aleatoria X tal que su
logaritmo natural es una nueva variable aleatoria Y con distribucin normal,
entonces X sigue el modelo probabilstico llamado logaritmo normal.
Sea la variable aleatoria X nLa funcin de densidad de X se puede obtener teniendo en cuenta:
Se puede demostrar que:
NOTACIN.

Sea

X~

ln

Se lee, la variable aleatoria X tiene distribucin logaritmo normal ( lognormal) con


parmetros y .

Ejercicio 23. La ganancia X de corriente, en ciertos transistores se mide en


unidades iguales al logaritmo de la relacin de la corriente de salida con la de
entrada (I0 /Ii =X). Si este logaritmo, Y, es normalmente distribuido con parmetros
=2, y = 0.01, calcule:
a. La probabilidad de que la razn de las corrientes de salida y entrada se
encuentre

entre

6.1

8.2.

b. Valor esperado y varianza de la razn especificada.


a. P(6.1< X < 8.2 )=
Tambin es posible obtener el mismo resultado haciendo
P(6.1< X < 8.2 )= P(ln 6.1< Y <ln 8.2 )=
______________=0.85113 0.027613=0.8252
b. E(X) =7.43, y V(X)= = 0.56_____ = .74833
Se X1, X2, ., Xk una muestra aleatoria de una variable aleatoria lognormal. Una
variable digamos X, distribuye lognormal, cuando los logaritmos naturales de
dichas variables ln(X1), ln(X2), ., ln(Xk) una variable digamos X se describen
mediante una distribucin normal con media y desviacin estndar finita. Es el
caso en el que las variaciones en la fiabilidad de una misma clase de
componentes tcnicos se representan considerando la tasa de fallos aleatoria en
lugar

de

una

variable

constante.

Es la distribucin natural a utilizar cuando las desviaciones a partir del valor del
modelo estn formadas por factores, proporciones o porcentajes ms que por
valores absolutos como es el caso de la distribucin normal. La distribucin
lognormal tiene dos parmetros en el ln(X) como y , sin embargo la variable
original

tiene

los

_X=E(X)=e^(+^2/2)
_X^2=V(X)=e^(2+^2 ) (e^(^2 )-1)

siguientes

parmetros:

Propiedades
La distribucin lognormal se caracteriza por las siguientes propiedades:
Asigna a valores a las tasas y probabilidades de fallo que de esta forma slo
pueden

ser

positivas.

Como depende de dos parmetros, segn se ver, se ajusta bien a un gran


nmero

de

distribuciones

empricas.

Es idnea para parmetros que son a su vez producto de numerosas cantidades


aleatorias (mltiples efectos que influyen sobre la fiabilidad de un componente).
La esperanza matemtica o media en la distribucin lognormal es mayor que su
mediana. De este modo da ms importancia a los valores grandes de las tasas de
fallo que una distribucin normal con los mismos percentiles del 5% y 50%
tendiendo,

por

tanto,

ser

pesimista.

APLICACIONES
La distribucin lognormal se ajusta a ciertos tipos de fallos (fatiga de componentes
metlicos), vida de los aislamientos elctricos, procesos continuos (procesos
tcnicos) y datos de reparacin y puede ser una buena representacin de la
distribucin de los tiempos de reparacin. Es tambin una distribucin importante
en

la

valoracin

de

sistemas

con

reparacin.

La distribucin lognormal es importante en la representacin de fenmenos de


efectos Proporcionales, tales como aquellos en los que un cambio en la variable
en cualquier punto de un proceso es una proporcin aleatoria del valor previo de la
variable. Algunos fallos en el programa de mantenimiento entran en esta
categora.
Segn hemos visto, la distribucin lognormal es aquella en que el logaritmo de la
variable est distribuida normalmente. Por tanto podemos obtener la funcin
densidad de probabilidad de la distribucin lognormal a partir de la distribucin
normal

mediante

la

transformacin

f(x)=1/(2 x) exp[-(ln(x)-)^2/(2^2 )], Para x>0

Y=Ln(X):

DISTRIBUCIN DE WIEBULL,
La distribucin de Weibull es una distribucin verstil que se puede utilizar para
modelar una amplia gama de aplicaciones en ingeniera, investigacin mdica,
control de calidad, finanzas y climatologa. Por ejemplo, la distribucin se utiliza
frecuentemente en anlisis de fiabilidad para modelar datos de tiempo para falla,
como la probabilidad de que una parte falle despus de uno, dos o ms aos. La
distribucin de Weibull tambin se utiliza para modelar datos asimtricos del
proceso en el anlisis de capacidad.
La distribucin de Weibull se describe segn los parmetros de forma, escala y
valor umbral. El caso en que el parmetro de valor umbral es cero se conoce
como la distribucin de Weibull de 2 parmetros. La distribucin de Weibull se
define solo para variables no negativas. Dependiendo de los valores de los
parmetros, la distribucin de Weibull puede adoptar varias formas.

Efecto del parmetro de forma


La forma describe cmo estn distribuidos los datos. Una forma de 3 se aproxima
a una curva normal. Una forma entre 2 y 4 an es aproximadamente normal. Un
valor de forma menor, por ejemplo 1.25, produce una curva con asimetra hacia la
derecha. Un valor de forma alto, por ejemplo 10, produce una curva con asimetra
hacia la izquierda.

Efecto del parmetro de escala


La escala, o vida caracterstica, es el percentil 63.2 de los datos. La escala define
la posicin de la curva de Weibull respecto del valor de umbral, lo cual es anlogo
a la forma en que la media define la posicin de una curva normal. Una escala de
20, por ejemplo, indica que 63.2% de los equipos fallarn en las primeras 20 horas
despus del valor umbral de tiempo.

Efecto del parmetro de valor umbral


El valor umbral es un desplazamiento de la distribucin que se aleja de 0. Un valor
umbral negativo desplaza la distribucin hacia la izquierda del 0, mientras que un
valor umbral positivo desplaza la distribucin hacia la derecha del 0. Todos los

datos deben ser mayores que el valor umbral. La distribucin de Weibull de 2


parmetros es igual que la distribucin de Weibull de 3 parmetros, pero con un
valor umbral de 0. Por ejemplo, una distribucin de Weibull de 2 parmetros
(3,100) es exactamente igual a una distribucin de Weibull de 3 parmetros
(3,100,50), excepto por el hecho de que la distribucin de Weibull de 3 parmetros
est desplazada 50 unidades hacia la derecha del 0.
Debido a que la distribucin de Weibull puede asumir las caractersticas de otros
tipos de distribucin, es extremadamente flexible para ajustar diferentes tipos de
datos. Por ejemplo:

La distribucin de Weibull es una alternativa a la distribucin normal en el


caso de datos asimtricos.

La distribucin exponencial es un caso especial de distribucin de Weibull


que suele utilizarse para estudiar la dispersin de la radiacin o la velocidad
del viento.

Si X sigue una distribucin de Weibull, entonces ln(X) sigue una distribucin


de valores extremos. Las distribuciones de valores extremos se utilizan
para describir condiciones extremas, tales como rfagas de viento
extremas, energa extrema durante terremotos o tensin mecnica o fsica
extrema.

OBJETIVOS
Utilizar la investigacin como herramienta para mejorar el conocimiento y la
pronta solucin a problemas en el mundo real.

Aplicar la Investigacin a problemas reales.

Analizar las soluciones de los problemas

CONCLUSION
La distribucin Normal es una buena aproximacin de la distribucin
Binomial. Cuando en una distribucin Binomial n tiende a cero.
Una distribucin chi-cuadrado es una distribucin sesgada cuya forma
depende exclusivamente del nmero de grados de libertad. Conforma este
aumenta, la distribucin se vuelve ms simtrica.
la distribucin de Weibull es una distribucin utilizada para el anlisis de
fiabilidad y segn entiendo es derivada de la distribucin normal.

BIBLIOGRAFIA
http://www.medwave.cl/link.cgi/Medwave/Series/MBE04/5266
https://prezi.com/jpljomawm-dl/distribucion-log-normal/

Investigacion de Operaciones de la Ciencia Administrativa. Eppen G.D /


Gould F.J / Schmidt C.P / Moore J.H / Weatherford L:R Pearson. Mexico
1999. Quinta Edicion.

http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-andgraphs/probability-distributions-and-random-data/distributions/weibull-distribution/

You might also like