Professional Documents
Culture Documents
on
Beatriz Pateiro L
opez
estadstica.
(Del al. Statistik).
1. f. Estudio de los datos cuantitativos de la poblaci
on, de los recursos
naturales e industriales, del tr
afico o de cualquier otra manifestaci
on
de las sociedades humanas.
2. f. Conjunto de estos datos.
3. f. Rama de la matem
atica que utiliza grandes conjuntos de datos
numericos para obtener inferencias basadas en el c
alculo de probabilidades.
Diccionario de la lengua espa
nola. Real Academia Espa
nola
Introduccion
Introducci
on
Introduccion
Un ejemplo
Un cardi
ologo, que investiga un nuevo f
armaco para rebajar el colesterol,
desea conocer el consumo de grasas en varones adultos mayores de 40
a
nos. C
omo debe proceder?
Conceptos basicos
Estadstica
Tipos de Variables
el sexo
color de ojos
Ejemplo
En la u
ltima hora han acudido al servicio de urgencias de un hospital ocho
pacientes, cuyos datos de ingreso se encuentran resumidos en la siguiente tabla.
Clasifica las variables recogidas (sexo, peso, estatura, temperatura, n
umero de
visitas previas al servicio de urgencias y dolor).
Sexo
M
M
H
M
M
M
H
M
Peso (kg.)
63
58
84
47
70
57
87
55
Estatura (m.)
1.74
1.63
1.86
1.53
1.75
1.68
1.82
1.46
Temperatura (o C)
38
36.5
37.2
38.3
37.1
36.8
38.4
36.6
Visitas
0
2
0
0
1
0
1
1
Dolor
Leve
Intenso
Intenso
Moderado
Intenso
Leve
Leve
Intenso
Ejemplo
Descripci
on de variables cualitativas y cuantitativas discretas
En la u
ltima hora han acudido al servicio de urgencias de un hospital ocho
pacientes, cuyos datos de ingreso se encuentran resumidos en la siguiente tabla.
Clasifica las variables recogidas (sexo, peso, estatura, temperatura, n
umero de
visitas previas al servicio de urgencias y dolor).
Sexo
M
M
H
M
M
M
H
M
Peso (kg.)
63
58
84
47
70
57
87
55
Estatura (m.)
1.74
1.63
1.86
1.53
1.75
1.68
1.82
1.46
Temperatura (o C)
38
36.5
37.2
38.3
37.1
36.8
38.4
36.6
Visitas
0
2
0
0
1
0
1
1
Dolor
Leve
Intenso
Intenso
Moderado
Intenso
Leve
Leve
Intenso
Supongamos que los distintos valores que puede tomar la variable son:
c1 , c2 , . . . , cm .
Frecuencia absoluta: Se denota por ni y representa el n
umero de veces que
ocurre el resultado ci .
Frecuencia relativa: Se denota por fi y representa la proporci
on de datos en
cada una de las clases,
ni
fi =
n
Frecuencia absoluta acumulada. Es el n
umero de veces que se ha observado el
resultado ci o valores anteriores. La denotamos por
X
Ni =
nj
cj ci
C
omo resumimos la informaci
on contenida en los datos de la variable Dolor?
Fi =
X
Ni
=
fj
n
cj ci
Descripci
on de variables cualitativas y cuantitativas discretas
Descripci
on de variables cualitativas y cuantitativas discretas
ni
n1
n2
..
.
nm
fi
f1
f2
..
.
fm
Ni
N1
N2
..
.
Nm
Fi
F1
F2
..
.
Fm
ci
c1
c2
..
.
cm
ni
n1
n2
..
.
nm
fi
f1
f2
..
.
fm
Ni
N1
N2
..
.
Nm
Fi
F1
F2
..
.
Fm
Propiedades:
Frecuencias
Frecuencias
Frecuencias
Frecuencias
Ejemplo
Pm
i=1 ni = n
Pm
i=1 fi = 1
Nm = n
Fm = 1
0 ni n
0 fi 1
0 Ni n
0 Fi 1
Ejemplo
En la u
ltima hora han acudido al servicio de urgencias de un hospital ocho
pacientes, cuyos datos de ingreso se encuentran resumidos en la siguiente tabla.
Clasifica las variables recogidas (sexo, peso, estatura, temperatura, n
umero de
visitas previas al servicio de urgencias y dolor).
Sexo
M
M
H
M
M
M
H
M
absolutas
relativas
absolutas acumuladas
relativas acumuladas
Peso (kg.)
63
58
84
47
70
57
87
55
Estatura (m.)
1.74
1.63
1.86
1.53
1.75
1.68
1.82
1.46
Temperatura (o C)
38
36.5
37.2
38.3
37.1
36.8
38.4
36.6
Visitas
0
2
0
0
1
0
1
1
Dolor
Leve
Intenso
Intenso
Moderado
Intenso
Leve
Leve
Intenso
C
omo resumimos la informaci
on contenida en los datos de la variable Visitas?
En la u
ltima hora han acudido al servicio de urgencias de un hospital ocho
pacientes, cuyos datos de ingreso se encuentran resumidos en la siguiente tabla.
Clasifica las variables recogidas (sexo, peso, estatura, temperatura, n
umero de
visitas previas al servicio de urgencias y dolor).
Sexo
M
M
H
M
M
M
H
M
Peso (kg.)
63
58
84
47
70
57
87
55
Estatura (m.)
1.74
1.63
1.86
1.53
1.75
1.68
1.82
1.46
Temperatura (o C)
38
36.5
37.2
38.3
37.1
36.8
38.4
36.6
Visitas
0
2
0
0
1
0
1
1
Dolor
Leve
Intenso
Intenso
Moderado
Intenso
Leve
Leve
Intenso
C
omo resumimos la informaci
on contenida en los datos de la variable Peso?
Descripci
on de variables cuantitativas continuas
Para construir las frecuencias es habitual agrupar los valores que puede
tomar la variable en intervalos. De este modo contamos el n
umero de
veces que la variable cae en cada intervalo
A cada uno de estos intervalos le llamamos intervalo de clase y a su
punto medio marca de clase
Por tanto, para la definici
on de las frecuencias y la construcci
on de la
tabla de frecuencias sustituiremos los valores ci por los intervalos de clase
y las marcas de clase.
Representaciones graficas
Descripci
on de variables cuantitativas continuas
n.
La representaci
on gr
afica de la informaci
on contenida en una tabla estadstica
es una manera de obtener una informaci
on visual clara y evidente de los valores
asignados a la variable estadstica. Existen multitud de gr
aficos adecuados a
cada situaci
on. Unos se emplean con variables cualitativas y otros con variables
cuantitativas.
Interpretaci
on del histograma
Una determinada operaci
on de vescula se puede realizar siguiendo seis t
ecnicas
distintas. Para cada t
ecnica, hemos registrado el tiempo de postoperatorio de 100
pacientes sometidos a dicha operaci
on. Los resultados aparecen resumidos en los
siguientes histogramas.
Medidas de posicion
Medidas de posici
on. Media aritmetica
Media aritmetica
Mediana
Moda
x =
Cuantiles
n
x1 + x2 + . . . + xn
1X
=
xi
n
n i=1
Medidas de posici
on. Moda
Medidas de posici
on.
Seras capaz de deducir cual es aproximadamente la media y mediana de
los conjuntos de datos con los siguientes histogramas?
Hemos visto que la mediana divide a los datos en dos partes iguales. Pero
tambien tiene interes estudiar otros par
ametros, llamados cuantiles, que
dividen los datos de la distribuci
on en partes iguales, es decir en intervalos
que comprenden el mismo n
umero de valores.
Sea p (0, 1). Se define el cuantil p como el n
umero que deja a su
izquierda una frecuencia relativa p. Existen distintos metodos para calcular
los cuantiles. Una posible forma de calcular el cuantil p consistira en
ordenar la muestra y tomar como cuantil el menor dato de la muestra
(primero de la muestra ordenada) cuya frecuencia relativa acumulada es
mayor que p.
Algunos
ordenes de los cuantiles tienen nombres especficos. As los
cuartiles son los cuantiles de orden (0.25, 0.5, 0.75) y se representan por
Q1 , Q2 , Q3 . Los cuartiles dividen la distribuci
on en cuatro partes. Los
deciles son los cuantiles de orden (0.1, 0.2,..., 0.9). Los percentiles son
los cuantiles de orden j/100 donde j=1,2,...,99.
Medidas de posicion.
Seras capaz de deducir cual es aproximadamente la media y mediana de
los conjuntos de datos con los siguientes histogramas?
Medidas de posici
on.
Seras capaz de deducir cual es aproximadamente la media y mediana de
los conjuntos de datos con los siguientes histogramas?
Medidas de posicion.
Seras capaz de deducir cual es aproximadamente la media y mediana de
los conjuntos de datos con los siguientes histogramas?
Medidas de posicion.
Seras capaz de deducir cual es aproximadamente la media y mediana de
los conjuntos de datos con los siguientes histogramas?
Medidas de dispersion
Medidas de posici
on.
Seras capaz de deducir cual es aproximadamente la media y mediana de
los conjuntos de datos con los siguientes histogramas?
Medidas de posici
on.
Seras capaz de deducir cual es aproximadamente la media y mediana de
los conjuntos de datos con los siguientes histogramas?
Medidas de dispersi
on. Recorrido o rango
Recorrido o rango
Recorrido intercuartlico
R = m
ax xi mn xi .
Varianza
Desviaci
on tpica
Coeficiente de variaci
on
Medidas de dispersi
on. Varianza
n
(x1 x)2 + (x2 x)2 + . . . + (xn x)2
1 X
=
(xi x)2
n1
n 1 i=1
Coeficiente de variaci
on
Hay situaciones en las que tenemos que comparar poblaciones en las que
Sean x1 , x2 , . . . , xn un conjunto de n observaciones de la variable X . Se define
la desviaci
on tpica como:
v
r
u
n
u 1 X
(x1 x)2 + (x2 x)2 + . . . + (xn x)2
s=
=t
(xi x)2
n1
n 1 i=1
Hay situaciones en las que tenemos que comparar poblaciones en las que
o que a
un teniendo la misma unidad de medida difieren en sus magnitudes.
Medidas de dispersi
on. Coeficiente de variaci
on
Hay situaciones en las que tenemos que comparar poblaciones en las que
las unidades de medida son distintas, o que a
un teniendo la misma unidad
de medida difieren en sus magnitudes. Para estos casos necesitamos una
medida de la dispersi
on en la que no influyan las unidades, sera
conveniente tener una medida adimensional.
Si queremos una medida de dispersi
on que no dependa de la escala y que,
por tanto, permita una comparaci
on de las dispersiones relativas de varias
muestras, podemos utilizar el coeficiente de variaci
on, que se define as:
CV =
s
.
x
Por supuesto, para que se pueda definir esta medida es preciso que la
media no sea cero.
Diagramas de caja
Los diagramas de caja (boxplots) nos dan informaci
on visual sobre como est
an
distribuidos los datos. El diagrama de caja consta de:
una caja central delimitada por los cuartiles Q1 y Q3 .
Dentro de esa caja se dibuja la lnea que representa la mediana (cuartil Q2 ).
Ejemplo:
Peso de hormigas en gramos: (CV = 0,229)
8.180881
10.503650 8.210198
13.096271 9.259044
15.540982 7.854185
12.010111 8.725924
11.712810
Peso de elefantes en kg: (CV = 0,065)
5100.636 4987.702 5035.441 5321.591 5502.833
4737.402 4537.105 4731.434 4742.981 4444.282
De los extremos de la caja salen los bigotes que se extienden hasta los puntos
LI = m
ax {mn(xi ), Q1 1,5RI } y LS = mn {m
ax(xi ), Q3 + 1,5RI }
Los datos que caen fuera de los bigotes se representan individualmente mediante
(datos atpicos moderados) y o (datos atpicos extremos).
Introduccion
Beatriz Pateiro L
opez
Introduccion
Captulo 2. Probabilidad
Introduccion
Cu
al es la probabilidad de que salga un seis en una tirada de dado?
Cu
al es la probabilidad de que salga un seis en una tirada de dado?
Cu
al es la probabilidad de acertar los seis n
umeros de la lotera primitiva?
Captulo 2. Probabilidad
Introduccion
Captulo 2. Probabilidad
Introduccion
Cu
al es la probabilidad de que salga un seis en una tirada de dado?
Cu
al es la probabilidad de que salga un seis en una tirada de dado?
Cu
al es la probabilidad de acertar los seis n
umeros de la lotera primitiva?
Cu
al es la probabilidad de acertar los seis n
umeros de la lotera primitiva?
Cu
al es la probabilidad de que me caiga en el examen un tema de los que
tengo preparados?
Cu
al es la probabilidad de que me caiga en el examen un tema de los que
tengo preparados?
Cu
al es la probabilidad de que un paciente sobreviva a una determinada
operaci
on de trasplante?
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Introduccion
Introduccion
Cu
al es la probabilidad de que salga un seis en una tirada de dado?
Cu
al es la probabilidad de acertar los seis n
umeros de la lotera primitiva?
Cu
al es la probabilidad de que me caiga en el examen un tema de los que
tengo preparados?
Cu
al es la probabilidad de que un paciente sobreviva a una determinada
operaci
on de trasplante?
Y si el paciente sobrevive a la operaci
on, cu
al es la probabilidad de que su
cuerpo rechace el trasplante en menos de un mes?
Captulo 2. Probabilidad
Introduccion
Captulo 2. Probabilidad
Conceptos basicos
Experimento aleatorio
Espacio muestral
Suceso
Probabilidades pr
oximas a 0 indican que no cabe esperar que ocurran los
sucesos en cuesti
on.
Probabilidades pr
oximas a 0.5 indican que es tan verosmil que ocurra el
suceso como que no.
Captulo 2. Probabilidad
Experimento aleatorio
Captulo 2. Probabilidad
Experimento aleatorio
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Experimento aleatorio
Espacio muestral
Captulo 2. Probabilidad
Sucesos elementales
Captulo 2. Probabilidad
Sucesos elementales
Consideremos ahora el experimento E =Lanzar un par de dados
Este espacio muestral tiene 36 (6 6) sucesos elementales.
Captulo 2. Probabilidad
Sucesos
Captulo 2. Probabilidad
Sucesos
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Sucesos
Ejemplo
Intersecci
on: Ocurre A B si ocurren los dos sucesos A y B a la vez.
La intervenci
on quir
urgica de colocaci
on de pr
otesis de rodilla se realiza mediante anestesia general
o epidural. Durante la intervenci
on se realiza una incisi
on en la rodilla para cortar y extraer
parcialmente uno de los huesos (f
emur, tibia o peron
e) en la zona pr
oxima a la rodilla, y a
continuaci
on se sustituye por la pr
otesis, que puede ser de metal o resina.
Intervenci
on
Anestesia
Hueso
Pr
otesis
Posibilidades
General o epidural
F
emur, tibia o peron
e
Metal o resina
Complementario: Ocurre Ac si y s
olo si no ocurre A.
Captulo 2. Probabilidad
Definici
on de probabilidad
Captulo 2. Probabilidad
Definici
on clasica o de Laplace
casos favorables
casos posibles
Captulo 2. Probabilidad
Un ejemplo
Captulo 2. Probabilidad
Definici
on axiomatica de Kolmogorov
Sea el espacio muestral, y sea P() el conjunto formado por todos los
sucesos. Se define la probabilidad como una aplicaci
on P : P() [0, 1] que
cumple las siguientes condiciones:
P() = 1
La probabilidad del suceso seguro es 1.
A B = P(A B) = P(A) + P(B)
Si A y B son sucesos incompatibles, entonces la probabilidad de su uni
on
es la suma de sus probabilidades.
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Definici
on axiomatica de Kolmogorov
Un ejemplo
Una tabla de contingencia clasica es la presentada por Sir Ronald Fisher en 1940, que
presenta la clasificaci
on de 5387 escolares escoceses seg
un su color de pelo y color de
ojos.
A partir de la definici
on anterior se pueden sacar una serie de consecuencias:
1
P() = 0
X \Y
claros
azules
casta
nos
oscuros
total
P(A ) = 1 P(A)
rubio
688
326
343
98
1455
pelirrojo
116
38
84
48
286
casta
no
584
241
909
403
2137
oscuro
188
110
412
681
1391
negro
4
3
26
85
118
1580
718
1774
1315
5387
Captulo 2. Probabilidad
Probabilidad condicionada
Cu
al es la probabilidad de que la persona elegida tenga pelo rubio?
Cu
al es la probabilidad de que la persona elegida tenga ojos casta
nos o pelo
rubio?
Cu
al es la probabilidad de que la persona elegida tenga ojos casta
nos y pelo
rubio?
Cu
al es la probabilidad de que la persona elegida tenga pelo casta
no o pelo
rubio?
Captulo 2. Probabilidad
Probabilidad condicionada
Captulo 2. Probabilidad
Probabilidad condicionada
P(A B)
,
P(B)
siendo
P(B) 6= 0
Captulo 2. Probabilidad
Un ejemplo
P(A B)
,
P(B)
siendo
X \Y
claros
azules
casta
nos
oscuros
total
P(B) 6= 0
rubio
688
326
343
98
1455
pelirrojo
116
38
84
48
286
casta
no
584
241
909
403
2137
oscuro
188
110
412
681
1391
negro
4
3
26
85
118
1580
718
1774
1315
5387
Captulo 2. Probabilidad
Cu
al es la probabilidad de que una persona con ojos oscuros tenga pelo rubio?
Captulo 2. Probabilidad
Regla de Bayes
Captulo 2. Probabilidad
1/2
1/2
Captulo 2. Probabilidad
1/2
4/9
5/9
P(A1 A2 . . .An ) = P(A1 )P(A2 /A1 )P(A3 /A1 A2 ) P(An /A1 A2 . . .An1 )
A
R
A
4/9
R
5/9
1/2
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Independencia de sucesos
Comentarios:
Si P(B) > 0, A y B son independientes si y s
olo si P(A/B) = P(A), esto
es, el conocimiento de la ocurrencia de B no modifica la probabilidad de
ocurrencia de A.
Si P(A) > 0, A y B son independientes si y s
olo si P(B/A) = P(B), esto
es, el conocimiento de la ocurrencia de A no modifica la probabilidad de
ocurrencia de B.
No debemos confundir sucesos independientes con sucesos incompatibles
Captulo 2. Probabilidad
Captulo 2. Probabilidad
La ley de las probabilidades totales considera todas las ramas que llegan al
resultado final observado.
5/9
5/9
1/2
A
4/9
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Teorema de Bayes
Los resultados de un experimento dan informaci
on sobre lo que ocurri
o en las
etapas intermedias.
5/9
5/9
1/2
Captulo 2. Probabilidad
Teorema de Bayes
A
R
A
4/9
Captulo 2. Probabilidad
Teorema de Bayes
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Teorema de Bayes
Teorema de Bayes
P(Ai ) P(B/Ai )
P(B)
P(Ai /B) =
P(Ai ) P(B/Ai )
P(B)
Adem
as, aplicando en el denominador la ley de probabilidades totales:
P(Ai /B) =
P(Ai ) P(B/Ai )
P(A1 ) P(B/A1 ) + P(A2 ) P(B/A2 ) + + P(An ) P(B/An )
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Prevalencia e incidencia
Captulo 2. Probabilidad
Las leyes de probabilidad que hemos visto hasta ahora son fundamentales
en el campo de ciencias de la salud, en la evaluaci
on de pruebas
diagn
osticas.
Captulo 2. Probabilidad
Prevalencia e incidencia
519
= 0.085
6139
Seg
un datos de 2008, la prevalencia del VIH en adultos en Europa
occidental y central es del 0.3 %
Seg
un datos de 2008, la prevalencia del VIH en adultos en Africa
subsahariana es del 5.2 %
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Prevalencia e incidencia
Prevalencia e incidencia
Captulo 2. Probabilidad
15
= 0.028 en un a
no.
525
Captulo 2. Probabilidad
A los medicos les interesa tener mayor capacidad para determinar sin
equivocarse la presencia o ausencia de una enfermedad en un paciente a
partir de los resultados (positivos o negativos) de pruebas o de los
sntomas (presentes o ausentes) que se manifiestan.
Captulo 2. Probabilidad
Relacionando estas ideas con los conceptos de probabilidad que hemos visto
anteriormente, definiremos los siguientes sucesos:
+ = El resultado de la prueba diagn
ostica es positivo.
= El resultado de la prueba diagn
ostica es negativo.
E = El paciente tiene la enfermedad.
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Sensibilidad = P(+/E )
Captulo 2. Probabilidad
P(+/E ) = 0.95
P(+/E ) = 0.95
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Captulo 2. Probabilidad
Introducci
on
Beatriz Pateiro L
opez
Introduccion
Variable aleatoria
Variable aleatoria
Variables aleatorias
Definici
on
Llamamos variable aleatoria a una aplicaci
on del espacio muestral asociado a
un experimento aleatorio en R, que a cada resultado de dicho experimento le
asigna un n
umero real, obtenido por la medici
on de cierta caracterstica.
X :
R
X ()
Ser
a continua cuando el conjunto de valores que puede tomar es un
intervalo. Para dichas variables veremos:
Funci
on de densidad
Funci
on de distribuci
on
P (X = x1 ) ,
p2
P (X = x2 ) ,
...
pn
P (X = xn ) .
constituyen la distribuci
on de X . Esta funci
on se denomina funci
on de
probabilidad o funci
on de masa. La funci
on de probabilidad se puede
representar an
alogamente al diagrama de barras.
Definici
on
La funci
on de distribuci
on de una variable aleatoria se define como:
F :
R
x0
R
F (x0 ) = P (X x0 )
F (x2 )
F (xn )
P (X x1 ) = P (X = x1 )
P (X x2 ) = P (X = x1 ) + P (X = x2 )
..
.
P (X xn ) = P (X = x1 ) + ... + P (X = xn ) = 1
La funci
on de distribuci
on es siempre no decreciente y verifica que,
F ()
0,
F (+)
1.
Para distinguir entre las propiedades de los conjuntos de datos y las de las
distribuciones de probabilidad, usaremos cierta terminologa y ciertos smbolos
que describimos a continuaci
on.
pi
0.4
0.5
0.1
pi
0.4
0.5
0.1
C
omo definiras el n
umero medio (o n
umero esperado) de das que el jugador
pasar
a de baja?
X
E(X ) = =
xi pi = 7 0,4 + 8 0,5 + 9 0,1 = 7,7
Propiedades
Sea X una variable aleatoria discreta con valores xi . Entonces:
E(a + bX )= a + bE(X )
Var(X )= E(X 2 ) (E(X ))2
Var(a + bX )= b 2 Var (X )
C
omo definiras la varianza de la variable X ?
X
Var(X ) = 2 =
(xi )2 pi = (77,7)2 0,5+(87,7)2 0,5+(97,7)2 0,1 = 0,41
i
Variable Bernoulli
En muchas ocasiones nos encontramos ante experimentos aleatorios con s
olo
1 si Exito
X =
0 si Fracaso
Variable Bernoulli
En muchas ocasiones nos encontramos ante experimentos aleatorios con s
olo
1 si Exito
X =
0 si Fracaso
Lo u
nico que hay que conocer es la probabilidad de exito, p, ya que los valores
de X son siempre los mismos y la probabilidad de fracaso es q = 1 p. Un
experimento de este tipo se llama experimento de Bernoulli Be(p).
Lo u
nico que hay que conocer es la probabilidad de exito, p, ya que los valores
de X son siempre los mismos y la probabilidad de fracaso es q = 1 p. Un
experimento de este tipo se llama experimento de Bernoulli Be(p).
Calcula la funci
on de masa y la funci
on de distribuci
on de una Be(p).
Si X Be(p), entonces:
=p
2 = p(1 p)
Variable Binomial
La variable aleatoria binomial X es el n
umero de exitos en n repeticiones de
una prueba de Bernoulli con probabilidad de exito p, es decir:
X = N
umero de exitos en las n pruebas
Denotaremos esta variable como Bin(n, p).
Variable Binomial
Empezando con una prueba de Bernoulli con probabilidad de exito p, vamos a
construir una nueva variable aleatoria al repetir n veces la prueba de Bernoulli.
La variable aleatoria binomial X es el n
umero de exitos en n repeticiones de
una prueba de Bernoulli con probabilidad de exito p.
Debe cumplirse:
Cada prueba individual puede ser un exito o un fracaso
La probabilidad de exito, p, es la misma en cada prueba
Las pruebas son independientes. El resultado de una prueba no tiene
influencia sobre los resultados siguientes
Variable Binomial
La variable aleatoria binomial X es el n
umero de exitos en n repeticiones de
una prueba de Bernoulli con probabilidad de exito p, es decir:
X = N
umero de exitos en las n pruebas
Denotaremos esta variable como Bin(n, p).
Que valores toma una Bin(n, p)?
Cu
al es su funci
on de masa?
Coeficientes binomiales
El coeficiente binomial
X = N
umero de exitos en las n pruebas
La probabilidad de obtener k exitos en n pruebas es
n
P(X = k) =
p k (1 p)nk
k
n
k
n!
k!(n k)!
representa el n
umero de subconjuntos diferentes de k elementos que se pueden
definir a partir de un total de n elementos (combinaciones de n elementos
tomados de k en k).
El coeficiente binomial
n!
n
=
k
k!(n k)!
representa el n
umero de subconjuntos diferentes de k
elementos que se pueden definir a partir de un total de
n elementos (combinaciones de n elementos tomados
de k en k).
Coeficientes binomiales
El coeficiente binomial
n
k
n!
k!(n k)!
representa el n
umero de subconjuntos diferentes de k elementos que se pueden
definir a partir de un total de n elementos (combinaciones de n elementos
tomados de k en k).
Variable Binomial
La variable aleatoria binomial X es el n
umero de exitos en n repeticiones de
una prueba de Bernoulli con probabilidad de exito p, es decir:
X = N
umero de exitos en las n pruebas
Variable Poisson
Una variable aleatoria X tiene distribuci
on de Poisson de par
ametro , y lo
denotamos X Poisson(), si es discreta y
P(X = k) = e
k
k!
si k {0, 1, 2, 3, . . .}
Ejemplo
La probabilidad de que una persona se desmaye en un concierto es p = 0,005.
Cu
al es la probabilidad de que en un concierto al que asisten 3000 personas se
desmayen 18?
Utilizaremos la distribuci
on de Poisson como aproximaci
on de la
distribuci
on binomial cuando n sea grande y p peque
no, en base al lmite
que hemos visto.
Como criterio podremos aproximar cuando n > 50 y p < 0,1.
Ejemplo
La probabilidad de que una persona se desmaye en un concierto es p = 0,005.
Cu
al es la probabilidad de que en un concierto al que asisten 3000 personas se
desmayen 18?
La variable X =N
umero de personas que se desmayan en el concierto
sigue una distribuci
on Bin(3000, 0,005). Queremos calcular
3000
P(X = 18) =
0,00518 0,9952982 = 0,07071.
18
Aunque la distribuci
on de Poisson se ha obtenido como forma lmite de una
distribuci
on Binomial, tiene muchas aplicaciones sin conexi
on directa con las
distribuciones binomiales. Por ejemplo, la distribuci
on de Poisson puede servir
como modelo del n
umero de exitos que ocurren durante un intervalo de tiempo
o en una regi
on especfica.
1518
= 0,07061.
18!
Ejemplo
El n
umero de nacimientos en un hospital constituye un proceso de Poisson con
intensidad de 10 nacimientos por semana. Cu
al es la probabilidad de que se
produzcan al menos tres nacimientos en una semana?
El n
umero medio de sucesos por unidad de tiempo es constante. A esa
constante la llamamos intensidad del proceso.
Los n
umeros de ocurrencias en subintervalos disjuntos son independientes.
Ejemplo
El n
umero de nacimientos en un hospital constituye un proceso de Poisson con
intensidad de 10 nacimientos por semana. Cu
al es la probabilidad de que se
produzcan al menos tres nacimientos en una semana?
P(X 3)
Ejemplo
El n
umero de nacimientos en un hospital constituye un proceso de Poisson con
intensidad de 10 nacimientos por semana. Cu
al es la probabilidad de que se
produzcan al menos tres nacimientos en una semana?
P(X 3)
=
=
Cu
al es la probabilidad de que se produzcan 5 nacimientos un da?
Beatriz Pateiro L
opez
Ejemplo
En un estudio sobre atenci
on a la tercera edad se desea evaluar la edad a la que las
personas mayores deciden ingresar en un centro geri
atrico.
Se registra la edad a la que ingresaron los 50 residentes de un determinado
centro gerontol
ogico y se construye el histograma correspondiente.
Ejemplo
En un estudio sobre atenci
on a la tercera edad se desea evaluar la edad a la que las
personas mayores deciden ingresar en un centro geri
atrico.
Se registra la edad a la que ingresaron los 50 residentes de un determinado
centro gerontol
ogico y se construye el histograma correspondiente.
Sea A el suceso El residente ingresa con edad entre 70 y 80 a
nos.
Ejemplo
En un estudio sobre atenci
on a la tercera edad se desea evaluar la edad a la que las
personas mayores deciden ingresar en un centro geri
atrico.
Se registra la edad a la que ingresaron los 50 residentes de un determinado
centro gerontol
ogico y se construye el histograma correspondiente.
Se registra la edad a la que ingresaron los 100 residentes de un determinado
centro gerontol
ogico y se construye el histograma correspondiente.
Ejemplo
En un estudio sobre atenci
on a la tercera edad se desea evaluar la edad a la que las
personas mayores deciden ingresar en un centro geri
atrico.
Idealmente, se registra la edad de todos los residentes de centros gerontol
ogicos
y se construye el histograma correspondiente.
Ejemplo
En un estudio sobre atenci
on a la tercera edad se desea evaluar la edad a la que las
personas mayores deciden ingresar en un centro geri
atrico.
Idealmente, se registra la edad de todos los residentes de centros gerontol
ogicos
y se construye el histograma correspondiente.
Sea A el suceso El residente ingresa con edad entre 70 y 80 a
nos.
Tomando m
as observaciones de una variable continua y haciendo m
as
finas las clases, el histograma tiende a estabilizarse en una curva suave que
describe la distribuci
on de la variable.
Esta funci
on, f (x) , se llama funci
on de densidad de la variable X .
La funci
on de densidad constituye una idealizaci
on de los histogramas de
frecuencia o un modelo del cual suponemos que proceden las
observaciones.
La funci
on de densidad cumple dos propiedades b
asicas: es no negativa y
el
area total que contiene es uno.
Ejemplo
Un estudiante va todos los das a la facultad en la lnea 1 del autob
us urbano.
Llega a la parada a las 3 de la tarde y cuenta el tiempo (en minutos) que tiene
que esperar hasta que llega el autob
us. A continuaci
on se muestra el
histograma correspondiente al tiempo de espera de los u
ltimos 1000 das. A la
vista del histograma, c
omo modelizaras el tiempo de espera?
Ejemplo
Un estudiante va todos los das a la facultad en la lnea 6 del autob
us urbano.
Llega a la parada a las 3 de la tarde y cuenta el tiempo (en minutos) que tiene
que esperar hasta que llega el autob
us. A continuaci
on se muestra el
histograma correspondiente al tiempo de espera de los u
ltimos 1000 das. A la
vista del histograma, c
omo modelizaras el tiempo de espera?
Ejemplo
Un estudiante va todos los das a la facultad en la lnea 1 del autob
us urbano.
Llega a la parada a las 3 de la tarde y cuenta el tiempo (en minutos) que tiene
que esperar hasta que llega el autob
us. A continuaci
on se muestra el
histograma correspondiente al tiempo de espera de los u
ltimos 1000 das. A la
vista del histograma, c
omo modelizaras el tiempo de espera?
Ejemplo
Un estudiante va todos los das a la facultad en la lnea 6 del autob
us urbano.
Llega a la parada a las 3 de la tarde y cuenta el tiempo (en minutos) que tiene
que esperar hasta que llega el autob
us. A continuaci
on se muestra el
histograma correspondiente al tiempo de espera de los u
ltimos 1000 das. A la
vista del histograma, c
omo modelizaras el tiempo de espera?
Una funci
on f (x), definida sobre el conjunto de todos los n
umeros reales R, se
denomina funci
on de densidad si
1
2
f (x) 0.
R
f (x) dx = 1.
Definici
on
La funci
on de distribuci
on de una variable aleatoria se define como:
F :
R
x0
R
F (x0 ) = P (X x0 )
La funci
on de densidad expresa probabilidades por
areas.
La probabilidad de que una variable X sea menor que un determinado
valor x0 se obtiene calculando el
area de la funci
on de densidad hasta el
punto x0 , es decir,
Z x0
F (x0 ) = P (X x0 ) =
f (x) dx,
Propiedades
Sea X una variable aleatoria continua con funci
on de densidad f (x). Entonces:
E(a + bX )= a + bE(X )
Var(X )= E(X 2 ) (E(X ))2
Var(a + bX )= b 2 Var (X )
x0
The palpated cranial rhythmic impulse (CRI): Its normative rate and examiner experience.
International Journal of Osteopathic Medicine (2010)
The spontaneous eye-blink as sleepiness indicator in patients with obstructive sleep apnoea syndrome-a pilot study.
Sleep Medicine 6 (2005) 155-162.
Bioestadstica. Grado en Medicina. Beatriz Pateiro L
opez
Modeling potential generation during single and dual electrode stimulation of CA3 axons in hippocampal slice.
Computers in Biology and Medicine (2010)
Hemoglobin A1c Predicts Diabetes but Not Cardiovascular Disease in Nondiabetic Women.
The American Journal of Medicine (2007)
Bioestadstica. Grado en Medicina. Beatriz Pateiro L
opez
Selenium status of the Swiss population: Assessment and change over a decade.
Journal of Trace Elements in Medicine and Biology (2008)
Door-to-ECG time in patients with chest pain presenting to the ED.
American Journal of Emergency Medicine (2006)
Bioestadstica. Grado en Medicina. Beatriz Pateiro L
opez
Ejemplo
Un centro hospitalario dispone de 3 m
aquinas de electrocardiograma (m
aquina
de ECG). A continuaci
on se muestra el histograma correspondiente al tiempo
(medido en minutos) de 500 registros de la actividad electrica del coraz
on
producidos con la primera m
aquina. A la vista del histograma. c
omo
modelizaras el tiempo de registro de la primera m
aquina?
Ejemplo
Un centro hospitalario dispone de 3 m
aquinas de electrocardiograma (m
aquina
de ECG). A continuaci
on se muestra el histograma correspondiente al tiempo
(medido en minutos) de 500 registros de la actividad electrica del coraz
on
producidos con la primera m
aquina. A la vista del histograma. c
omo
modelizaras el tiempo de registro de la primera m
aquina?
Ejemplo
Un centro hospitalario dispone de 3 m
aquinas de electrocardiograma (m
aquina
de ECG). A continuaci
on se muestra el histograma correspondiente al tiempo
(medido en minutos) de 500 registros de la actividad electrica del coraz
on
producidos con la segunda m
aquina. A la vista del histograma. c
omo
modelizaras el tiempo de registro de la segunda m
aquina?
Ejemplo
Un centro hospitalario dispone de 3 m
aquinas de electrocardiograma (m
aquina
de ECG). A continuaci
on se muestra el histograma correspondiente al tiempo
(medido en minutos) de 500 registros de la actividad electrica del coraz
on
producidos con la tercera m
aquina. A la vista del histograma. c
omo
modelizaras el tiempo de registro de la tercera m
aquina?
Ejemplo
Un centro hospitalario dispone de 3 m
aquinas de electrocardiograma (m
aquina
de ECG). Supongamos que modelizamos el tiempo de registro de la tres
m
aquinas mediante las siguientes curvas. Que tienen en com
un dichas curvas?
Que las diferencia?
Ejemplo
Un centro hospitalario dispone de 3 m
aquinas de electrocardiograma (m
aquina
de ECG). A continuaci
on se muestra el histograma correspondiente al tiempo
(medido en minutos) de 500 registros de la actividad electrica del coraz
on
producidos con la segunda m
aquina. A la vista del histograma. c
omo
modelizaras el tiempo de registro de la segunda m
aquina?
Ejemplo
Un centro hospitalario dispone de 3 m
aquinas de electrocardiograma (m
aquina
de ECG). A continuaci
on se muestra el histograma correspondiente al tiempo
(medido en minutos) de 500 registros de la actividad electrica del coraz
on
producidos con la tercera m
aquina. A la vista del histograma. c
omo
modelizaras el tiempo de registro de la tercera m
aquina?
La distribuci
on normal es la m
as importante y de mayor uso de todas las
distribuciones continuas de probabilidad.
Por m
ultiples razones se viene considerando la m
as id
onea para modelizar
una gran diversidad de mediciones de la Fsica, Qumica o Biologa.
La normal es una familia de variables que depende de dos par
ametros, la
media y la varianza.
Dado que todas est
an relacionadas entre si mediante una transformaci
on
muy sencilla, empezaremos estudiando la denominada normal est
andar
para luego definir la familia completa.
z R)
Si Z N(0, 1) entonces = 0 y 2 = 1.
Supongamos que Z N(0, 1). Calcula usando las tablas de la normal est
andar:
P(Z 1,64)
P(Z > 1)
P(Z 0,53)
P(1,96 Z 1,96)
P(1 Z 2)
Cu
anto vale aproximadamente P(Z > 4,2)?
Variable Normal
Efectuando un cambio de localizaci
on y escala sobre la normal est
andar,
podemos obtener una distribuci
on con la misma forma pero con la media y
desviaci
on tpica que queramos.
Si Z N(0, 1) entonces
f (x) =
(x)2
1
e 22 ,
2
2
x R
X = +Z
tiene distribuci
on normal de media y desviaci
on tpica .
Denotaremos X N(, ).
f (x)dx =
P(X 1) =
e 22 dx
2
2
En la pr
actica s
olo disponemos de la tabla de la distribuci
on normal est
andar.
Para efectuar c
alculos sobre cualquier distribuci
on normal hacemos la
transformaci
on inversa, esto es, le restamos la media y dividimos por la
desviaci
on tpica. A este proceso le llamamos estandarizaci
on de una variable
aleatoria.
Si X N(, ) entonces Z =
Ejemplo
Supongamos que X N(5, 2). C
omo calcularas P(X 1)?
Ejemplo
Supongamos que X N(5, 2). C
omo calcularas P(X 1)?
X 5
15
P(X 1) = P
= P (Z 2)
2
2
donde Z =
X
N(0, 1).
X 5
2
N(0, 1).
Tambi
en se establece que la tensi
on ocular en pacientes glaucomatosos se distribuye como
una normal de media 24mmHg y desviaci
on tpica 5mmHg.
Tambi
en se establece que la tensi
on ocular en pacientes glaucomatosos se distribuye como
una normal de media 24mmHg y desviaci
on tpica 5mmHg.
Sanos
Glaucomatosos
Sanos
Glaucomatosos
Sensibilidad
13 16
24
13 16
24
Cu
al es la sensibilidad y la especificidad de la prueba si el punto de corte es 16mmHg?
Cu
al es la sensibilidad y la especificidad de la prueba si el punto de corte es 16mmHg?
Cu
al es la probabilidad de falso positivo? Y la de falso negativo?
Cu
al es la probabilidad de falso positivo? Y la de falso negativo?
Tambi
en se establece que la tensi
on ocular en pacientes glaucomatosos se distribuye como
una normal de media 24mmHg y desviaci
on tpica 5mmHg.
Tambi
en se establece que la tensi
on ocular en pacientes glaucomatosos se distribuye como
una normal de media 24mmHg y desviaci
on tpica 5mmHg.
Sanos
Glaucomatosos
Sanos
Glaucomatosos
Especificidad
Falso +
13 16
24
13 16
24
Cu
al es la sensibilidad y la especificidad de la prueba si el punto de corte es 16mmHg?
Cu
al es la sensibilidad y la especificidad de la prueba si el punto de corte es 16mmHg?
Cu
al es la probabilidad de falso positivo? Y la de falso negativo?
Cu
al es la probabilidad de falso positivo? Y la de falso negativo?
Sanos
Glaucomatosos
Falso
13 16
24
Cu
al es la sensibilidad y la especificidad de la prueba si el punto de corte es 16mmHg?
Cu
al es la probabilidad de falso positivo? Y la de falso negativo?
Introducci
on
Beatriz Pateiro L
opez
En la pr
actica contaremos con una muestra representativa de la poblaci
on.
Introduccion
Introducci
on
Captulo 1: conceptos b
asicos de Estadstica Descriptiva, que nos
proporcionaban herramientas para resumir, ordenar y extraer los aspectos
m
as relevantes de la informaci
on de la muestra.
Captulo 1: conceptos b
asicos de Estadstica Descriptiva, que nos
proporcionaban herramientas para resumir, ordenar y extraer los aspectos
m
as relevantes de la informaci
on de la muestra.
INFERENCIA ESTADISTICA
Ahora podremos empezar a hacer inferencia sobre la poblaci
on
de interes bas
andonos en lo que observamos en una muestra
Introduccion
Introducci
on
Introduccion
Introducci
on
Introduccion
Introducci
on
Introduccion
Estimaci
on Puntual. Consiste en aventurar un valor, calculado a partir de
la muestra, que este lo m
as pr
oximo posible al verdadero par
ametro.
Contrastes de Hip
otesis. Se trata de responder a preguntas muy
concretas sobre la poblaci
on, y se reducen a un problema de decisi
on sobre
la veracidad de ciertas hip
otesis.
Conceptos basicos
Llamamos realizaci
on muestral a los valores concretos que tomaron las n
variables aleatorias despues de la obtenci
on de la muestra.
Seg
un un estudio el 25 % de la poblaci
on sufre problemas mentales por la
situaci
on econ
omica. El mismo estudio afirma que el 40 % de la poblaci
on
utiliza el alcohol para evadirse de la situaci
on econ
omica. Sin embargo,
hay otros an
alisis que dudan de la veracidad de dichas conclusiones.
X1 , X2 , , Xn
independientes y con la misma distribuci
on que X .
Adem
as del modelo normal, existen otros modelos que desempe
nan un papel
importante en la inferencia estadstica. Entre ellos se encuentran
la distribuci
on 2
la distribuci
on t de Student.
N ,
.
n
n
La distribucion 2
La distribuci
on t de Student
Propiedades.
1 La variable Chi-cuadrado toma valores en [0, +).
2
La distribuci
on Chi-cuadrado es asim
etrica.
La distribucion t de Student
La distribuci
on t de Student
Figura : En verde densidad de una t de Student con 2 grados de libertad, en rojo N(0,1) y en
negro densidad de una t de Student con 20 grados de libertad
Propiedades.
1 La variable t de Student toma valores en toda la recta real.
2
La distribuci
on t de Student es sim
etrica en torno al origen.
tk N(0, 1) cuando k .
Introducci
on
Estimaci
on Puntual. Consiste en aventurar un valor, calculado a partir de
la muestra, que este lo m
as pr
oximo posible al verdadero par
ametro.
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Beatriz Pateiro L
opez
Contrastes de Hip
otesis. Se trata de responder a preguntas muy
concretas sobre la poblaci
on, y se reducen a un problema de decisi
on sobre
la veracidad de ciertas hip
otesis.
Introduccion
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Estimaci
on puntual (de una proporci
on)
Estimaci
on Puntual. Consiste en aventurar un valor, calculado a partir de
la muestra, que este lo m
as pr
oximo posible al verdadero par
ametro.
X1 + X2 + . . . + Xn
n
p
N
Captulo 6. Estimaci
on puntual e Intervalos de confianza
p,
p(1 p)
n
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Propiedades de un estimador
Estimaci
on puntual de la media
= X1 + X2 + . . . + Xn
X
n
=
es insesgado si E()
Entonces,
0 cuando n ,
Si adem
as Var()
el estimador es consistente
Distribuci
on de X
N
X
,
n
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Intervalo de confianza
Intervalo de confianza
Sea el par
ametro desconocido y [0, 1].
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Intervalo de confianza
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Intervalo de confianza
Sea el par
ametro desconocido y [0, 1].
Sea el par
ametro desconocido y [0, 1].
P(L1 L2 ) 1
Los valores de L1 y L2 depender
an de la muestra!!!!.
P(L1 L2 ) 1
Los valores de L1 y L2 depender
an de la muestra!!!!.
El nivel de confianza con frecuencia se expresa en porcentaje. As, un
intervalo de confianza del 95 % es un intervalo de extremos aleatorios que
contiene al par
ametro con una probabilidad de 0,95.
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Captulo 6. Estimaci
on puntual e Intervalos de confianza
z/2
z/2
Captulo 6. Estimaci
on puntual e Intervalos de confianza
z/2
z/2
Captulo 6. Estimaci
on puntual e Intervalos de confianza
z/2
Equivalentemente,
z/2 X
+ z/2
P X
=1
n
n
Equivalentemente,
z/2 X
+ z/2
P X
=1
n
n
z/2
es conocida
Captulo 6. Estimaci
on puntual e Intervalos de confianza
C
omo estimaras el nivel medio de protena a partir de esta muestra?
Captulo 6. Estimaci
on puntual e Intervalos de confianza
S/ n
Recuerda que:
Captulo 6. Estimaci
on puntual e Intervalos de confianza
v
u
u
S=t
n
1 X
)2
(Xi X
n 1 i=1
Captulo 6. Estimaci
on puntual e Intervalos de confianza
S/ n
Recuerda que:
v
u
u
S=t
n
1 X
)2
(Xi X
n 1 i=1
t/2
t/2
En este caso:
X
tn1
S/ n
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Equivalentemente,
t/2 S X
+ t/2 S
P X
=1
n
n
t/2
t/2
Equivalentemente,
t/2 S X
+ t/2 S
P X
=1
n
n
t/2
t/2
Captulo 6. Estimaci
on puntual e Intervalos de confianza
t/2 S , X
+ t/2 S
X
n
n
t/2 S , X
+ t/2 S
X
n
n
Captulo 6. Estimaci
on puntual e Intervalos de confianza
C
omo estimaras el Volumen Espiratorio Forzado medio?
Construye un intervalo de confianza para el Volumen Espiratorio Forzado medio
con nivel de confianza del 95 %.
Cu
al sera el intervalo de confianza para un nivel de confianza del 90 %?
1 X
2 ) (1 2 )
(X
r
N(0, 1)
12
n1
22
n2
1
El Volumen Espiratorio Forzado es la cantidad de aire expulsado durante el primer segundo de
la espiraci
on m
axima, realizada tras una inspiraci
on m
axima
Bioestadstica. Grado en Medicina. Beatriz Pateiro L
opez
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Captulo 6. Estimaci
on puntual e Intervalos de confianza
1 X
2 ) z/2
(X
12
2
1 X
2 ) + z/2
+ 2 , (X
n1
n2
12
2
+ 2
n1
n2
acido u
rico en pacientes con y sin un determinado sndrome. Se recogieron en un
hospital especializado en dicha enfermedad, los niveles de
acido u
rico de 12 individuos
con el sndrome. Se obtuvo una media muestral de 4.5 unidades. En otro hospital
general se recogieron los niveles de
acido u
rico de 15 individuos sin el sndrome. En ese
caso la media muestral obtenida fue 3.4 unidades. Asumimos que ambas poblaciones
se distribuyen seg
un una normal con varianzas 1 y 1.5, respectivamente. Calcula el
intervalo de confianza para la diferencia de medias 1 2 al 95 %.
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Sp2
n1
Sp2
n2
1 X
2 ) + t/2
, (X
Sp2
n1
Sp2
n2
1 X
2 ) (1 2 )
(X
r
tn1 +n2 2
Sp2
n1
En ese caso es natural que los individuos donde se aplican los tratamientos sean los mismos.
(1 2 )
D
tn1 .
SD / n
Ejemplo: Se quiere estudiar los efectos del abandono de la bebida sobre la presi
on sist
olica en
individuos alcoh
olicos. Para ello se mide la presi
on sist
olica en 10 individuos alcoh
olicos antes y
despu
es de 2 meses de haber dejado al bebida.
Sujeto
X1 presi
on antes
X2 presi
on despu
es
1
140
145
2
165
150
3
160
150
4
160
160
5
175
170
7
170
160
3
160
150
4
160
160
5
175
170
6
190
175
7
170
160
8
175
165
9
155
145
10
160
170
Captulo 6. Estimaci
on puntual e Intervalos de confianza
8
175
165
2
165
150
t con n1 g.l.
6
190
175
1
140
145
Ejemplo: Se quiere estudiar los efectos del abandono de la bebida sobre la presi
on sist
olica en
individuos alcoh
olicos. Para ello se mide la presi
on sist
olica en 10 individuos alcoh
olicos antes y
despu
es de 2 meses de haber dejado al bebida. Calcula el IC para 1 2 al 95 %.
Sujeto
X1 presi
on antes
X2 presi
on despu
es
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Sp2
n2
Captulo 6. Estimaci
on puntual e Intervalos de confianza
SD
SD
t/2
D
, D + t/2
n
n
Consideraremos la variable D = X1 X2
9
155
145
Captulo 6. Estimaci
on puntual e Intervalos de confianza
10
160
170
SD
SD
t/2
D
, D + t/2
n
n
t con n1 g.l.
Ejemplo: Se quiere estudiar los efectos del abandono de la bebida sobre la presi
on sist
olica en
individuos alcoh
olicos. Para ello se mide la presi
on sist
olica en 10 individuos alcoh
olicos antes y
despu
es de 2 meses de haber dejado al bebida. Calcula el IC para 1 2 al 95 %.
Sujeto
X1 presi
on antes
X2 presi
on despu
es
Diferencias Di
1
140
145
5
2
165
150
15
3
160
150
10
4
160
160
0
5
175
170
5
6
190
175
15
7
170
160
10
8
175
165
10
9
155
145
10
Captulo 6. Estimaci
on puntual e Intervalos de confianza
10
160
170
10
SD
SD
t/2
D
, D + t/2
n
n
t con n1 g.l.
Ejemplo: Se quiere estudiar los efectos del abandono de la bebida sobre la presi
on sist
olica en
individuos alcoh
olicos. Para ello se mide la presi
on sist
olica en 10 individuos alcoh
olicos antes y
despu
es de 2 meses de haber dejado al bebida. Calcula el IC para 1 2 al 95 %.
Sujeto
X1 presi
on antes
X2 presi
on despu
es
Diferencias Di
1
140
145
5
2
165
150
15
3
160
150
10
= 5 + 15 + . . . + 10 10 = 6,
D
10
4
160
160
0
2
SD =
5
175
170
5
6
190
175
15
7
170
160
10
8
175
165
10
9
155
145
10
10
160
170
10
Captulo 6. Estimaci
on puntual e Intervalos de confianza
p
(1 p
)
,p
+ z/2
n
p
(1 p
)
n
Sujeto
X1 presi
on antes
X2 presi
on despu
es
Diferencias Di
2
165
150
15
3
160
150
10
4
160
160
0
5
175
170
5
6
190
175
15
7
170
160
10
8
175
165
10
9
155
145
10
Captulo 6. Estimaci
on puntual e Intervalos de confianza
p1 (1 p1 )
p2 (1 p2 )
+
, (p1 p2 ) + z/2
n1
n2
p1 (1 p1 )
p2 (1 p2 )
+
n1
n2
10
160
170
10
Captulo 6. Estimaci
on puntual e Intervalos de confianza
(p1 p2 ) z/2
p1 (1 p1 )
p2 (1 p2 )
+
, (p1 p2 ) + z/2
n1
n2
p1 (1 p1 )
p2 (1 p2 )
+
n1
n2
http://www.pewinternet.org/
1
140
145
5
Ejemplo: Una encuesta del proyecto Pew Internet and American Life Project2
llevada a cabo en 2010 determina que el 16 % de los usuarios de internet utilizan la
red para consultar informaci
on sobre resultados de pruebas m
edicas. La encuesta, que
forma parte de un estudio sobre el uso de internet en Am
erica, se basa en entrevistas
telef
onicas a un total de 3001 adultos. Asumimos que los encuestados fueron elegidos
de manera aleatoria. Contruye un intervalo de confianza al 95 % para la proporci
on de
usuarios de internet que consultan informaci
on sobre resultados de pruebas m
edicas en
Am
erica.
t con n1 g.l.
Ejemplo: Se quiere estudiar los efectos del abandono de la bebida sobre la presi
on sist
olica en
individuos alcoh
olicos. Para ello se mide la presi
on sist
olica en 10 individuos alcoh
olicos antes y
despu
es de 2 meses de haber dejado al bebida. Calcula el IC para 1 2 al 95 %.
p
z/2
SD
SD
t/2
D
, D + t/2
n
n
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Captulo 6. Estimaci
on puntual e Intervalos de confianza
Contraste de hip
otesis
Beatriz Pateiro L
opez
Contraste de hipotesis
Contraste de hip
otesis
Hip
otesis nula
Hip
otesis nula
H0 : = 29.3
H0 : = 29.3
= 30.5 a
X
nos
= 30.5 a
X
nos
Contraste de hipotesis
Contraste de hip
otesis
Realidad
H0 es verdadera
H0 es falsa
Decisi
on
No se rechaza H0
Se rechaza H0
Decisi
on correcta
Error tipo I
Error tipo II
Decisi
on correcta
Contraste de hip
otesis
Hip
otesis nula: el acusado es inocente (todo acusado es
inocente hasta que se demuestre lo contrario).
Nivel de significaci
on
Hip
otesis alternativa: el acusado es culpable.
Juicio: es el procedimiento en el cual se trata de probar la
culpabilidad del acusado y la evidencia debe ser muy fuerte
para que se rechace la inocencia (H0 ) en favor de la
culpabilidad (Ha ).
Decisi
on: el veredicto.
Error de tipo I: condenar a un inocente.
Error de tipo II: absolver a un culpable.
Regi
on crtica. Contrastes bilaterales y unilaterales
Regi
on crtica. Contrastes bilaterales y unilaterales
Contraste bilateral
Contraste unilateral
H0 : = 29.3
H1 : 6= 29.3
H0 : 29.3
H1 : > 29.3
29.3
Regi
on de rechazo
Regi
on de rechazo
Puntos de corte
Punto de corte
Regi
on crtica. Contrastes bilaterales y unilaterales
Contraste unilateral
H0 : 29.3
H1 : < 29.3
Si estamos interesados en determinar si es significativamente menor
est
que 29.3, deberamos rechazar H0 si X
a lejos de 29.3 en una sola
direcci
on.
29.3
Contraste de hip
otesis
Regi
on de rechazo
Punto de corte
29.3
Regi
on de rechazo
La regi
on de rechazo o regi
on crtica que tiene probabilidad (bajo H0 ).
La regi
on de aceptaci
on que tiene probabilidad 1 (bajo H0 ).
Contraste de hip
otesis
Las etapas en la resoluci
on de un contraste de hip
otesis son:
Especificar las hip
otesis nula H0 y alternativa H1 .
Beatriz Pateiro L
opez
es N(29.3, 2/6)
Si H0 es cierta, la distribuci
on de X
es N(29.3, 2/6)
Si H0 es cierta, la distribuci
on de X
c1
29.3
29.3
Regi
on de rechazo
c2
Regi
on de rechazo
es N(29.3, 2/6)
Si H0 es cierta, la distribuci
on de X
Si H0 es cierta, la distribuci
on de X 29.3 es N(0, 1)
0.333
Si H0 es cierta, la distribuci
on de X 29.3 es N(0, 1)
0.333
c1
29.3
Regi
on de rechazo
c2
z/2
Regi
on de rechazo
Regi
on de rechazo
z/2
Regi
on de rechazo
c1
c2
29.3
Regi
on de rechazo
z/2
Regi
on de rechazo
Regi
on de rechazo
z/2
Regi
on de rechazo
Si H0 es cierta, la distribuci
on de
0
X
/ n
es N(0, 1)
es N(29.3, 2/6)
Si H0 es cierta, la distribuci
on de X
Si H0 es cierta, la distribuci
on de X 29.3 es N(0, 1)
0.333
c1
29.3
Regi
on de rechazo
z/2
c2
z/2
Regi
on de rechazo
Regi
on de rechazo
z/2
Regi
on de rechazo
Regi
on de rechazo
z/2
Regi
on de rechazo
Rechazamos la hip
otesis nula H0 : = 29.3 frente a H1 : 6= 29.3 si
30.5 29.3
z/2
0.333
Rechazamos la hip
otesis nula H0 : = 0 frente a H1 : 6= 0 si
0
X
z/2
/ n
0
X
z/2
/ n
30.5 29.3
z/2
0.333
Relaci
on entre el contraste bilateral y los Intervalos de confianza
H 0 : = 0
es N 0 ,
Si H0 es cierta, la distribuci
on de X
z
X
/2 n
+z
X
/2 n
El sentido com
un nos aconseja rechazar la hip
otesis nula de que la media
sea considerablemente mayor
poblacional es 0 cuando la media muestral X
que 0 .
Si H0 es cierta, la distribuci
on de
0
X
/ n
es N(0, 1)
H0 : 0
H1 : < 0
z
Regi
on de rechazo
Rechazamos la hip
otesis nula H0 : 0 frente a H1 : > 0 si
El sentido com
un nos aconseja rechazar la hip
otesis nula de que la media
sea considerablemente menor
poblacional es 0 cuando la media muestral X
que 0 .
0
X
z
/ n
Si H0 es cierta, la distribuci
on de
0
X
/ n
El p-valor
es N(0, 1)
Regi
on de rechazo
Rechazamos la hip
otesis nula H0 : 0 frente a H1 : < 0 si
0
X
z
/ n
Rechazamos la hip
otesis nula H0 : = 0 frente a H1 : 6= 0 si
Sea X1 , X2 , . . . , Xn una muestra formada por n variables independientes y con la
misma distribuci
on N(, ).
Supongamos que 2 es desconocida
Se desea contrastar una hip
otesis relativa a la media, .
Si H0 es cierta,
Recuerda que:
0
X
t/2
S/ n
n
1 X
)2
(Xi X
n 1 i=1
0
X
t/2
S/ n
Rechazamos la hip
otesis nula H0 : 0 frente a H1 : > 0 si
0
X
t
S/ n
0
X
tn1
S/ n
v
u
u
S=t
Rechazamos la hip
otesis nula H0 : 0 frente a H1 : < 0 si
0
X
t
S/ n
t con n 1 g.l.
Si H0 es cierta, la distribuci
on de
rX1 X2
2
1
n1
+ n2
es N(0, 1)
z/2
Contraste bilateral
(hip
otesis nula simple)
Rechazamos la hip
otesis nula H0 : 1 2 frente a H1 : 1 > 2 si
12
n1
22
n2
12
n1
1 X
2
X
r
12
n1
22
n2
z/2
1 X
2
X
r
12
n1
22
n2
z/2
Suponemos que las muestras son independientes (los individuos donde se han
obtenido las mediciones de la poblaci
on 1 son distintos de los individuos donde se
han obtenido las mediciones de la poblaci
on 2).
Recuerda que si suponemos que las varianzas de las dos poblaciones son iguales
el mejor estimador de la varianza ser
a:
Sp2 =
22
n2
Regi
on de rechazo
Rechazamos la hip
otesis nula H0 : 1 2 frente a H1 : 1 < 2 si
1 X
2
X
r
z/2
Rechazamos la hip
otesis nula H0 : 1 = 2 frente a H1 : 1 6= 2 si
El sentido com
un nos aconseja rechazar la hip
otesis nula de que 1 = 2 cuando
1 X
2 sea muy distinta de 0.
X
1 X
2
X
r
Regi
on de rechazo
H0 : 1 = 2
H1 : 1 6= 2
Rechazamos la hip
otesis nula H0 : 1 = 2 frente a H1 : 1 6= 2 si
1 X
2
X
r
Sp2
n1
Sp2
n2
t/2
1 X
2
X
r
Sp2
n1
Sp2
n2
t/2
En ocasiones nos interesar
a comparar dos m
etodos o tratamientos.
Rechazamos la hip
otesis nula H0 : 1 2 frente a H1 : 1 > 2 si
1 X
2
X
r
Sp2
n1
Sp2
n2
En ese caso es natural que los individuos donde se aplican los tratamientos sean
los mismos.
Se supone X1 N (1 , 1 ) y X2 N (2 , 2 ) pero X1 y X2 no son
independientes.
Consideraremos la variable D = X1 X2
Rechazamos la hip
otesis nula H0 : 1 2 frente a H1 : 1 < 2 si
1 X
2
X
r
Sp2
n1
Sp2
n2
t con n1 + n2 2 g.l.
Bioestadstica. Grado en Medicina. Beatriz Pateiro L
opez
Rechazamos la hip
otesis nula H0 : 1 = 2 frente a H1 : 1 6= 2 si
D
t/2
SD / n
D
t/2
SD / n
Rechazamos la hip
otesis nula H0 : p = p0 frente a H1 : p 6= p0 si
p
p0
q
p0 (1p0 )
n
Rechazamos la hip
otesis nula H0 : 1 2 frente a H1 : 1 > 2 si
D
t
SD / n
D
t
SD / n
p
p0
q
p0 (1p0 )
n
z/2
Rechazamos la hip
otesis nula H0 : p p0 frente a H1 : p > p0 si
p
p0
q
Rechazamos la hip
otesis nula H0 : p p0 frente a H1 : p < p0 si
p
p0
q
p0 (1p0 )
n
t con n 1 g.l.
p0 (1p0 )
n
Rechazamos la hip
otesis nula H0 : 1 2 frente a H1 : 1 < 2 si
z/2
Datos categ
oricos
Beatriz Pateiro L
opez
12
24
31
16
Tablas de contingencia r s
Tablas de contingencia 2 2
Dolor
Tratamiento
A
B
Total
Ausente
12
20
32
Leve
24
18
42
Moderado
31
30
61
Intenso
16
14
30
Total
83
82
165
Tablas de contingencia 2 2
Se utiliza para representar datos de dos variables, cada una de las cuales
presenta dos u
nicos valores o categoras.
Variable 1
Variable 1
Valor 1 Valor 2
a
b
c
d
Tablas de contingencia 2 2
Variable 2
Valor 1
Valor 2
Total
Valor 1
a
c
a+c
Valor 2
b
d
b+d
Total
a+b
c+d
a+b+c+d
Tipo
Caso
Control
Tablas de contingencia 2 2
Pruebas Chi-cuadrado
Tipo
Caso
Control
Total
29
2537
8747
11284
Total
3220
10245
13465
30
683 (521.561)
1498 (1659.439)
2181
29
2537 (2698.439)
8747 (8585.561)
11284
Total
3220
10245
13465
30
683 (521.561)
1498 (1659.439)
2181
29
2537 (2698.439)
8747 (8585.561)
11284
Total
3220
10245
13465
(observados esperados)2
.
esperados
(observados esperados)2
.
esperados
(observados esperados)2
.
esperados
Rechazamos la hip
otesis nula H0 : X e Y son independientes en tablas 2 2 si
2 =
(observados esperados)2
esperados
En tablas 2 2 se pide que todos los valores esperados sean mayores que 5.
Aun as, en tablas 2 2 la aproximaci
on a la Chi-cuadrado puede no ser
buena y, por eso, se suele aplicar la llamada correcci
on por continuidad
de Yates.
2corregido =
Casi nunca
4
12
11
8
35
Siempre
99
195
58
17
369
Total
144
309
105
42
600
Estado de Salud
Excelente
Bueno
Normal
Deficiente
Total
Casi nunca
4(8.40)
12(18.02)
11(6.13)
8(2.45)
35
Siempre
99(88.56)
195(190.04)
58(64.57)
17(25.83)
369
Total
144
309
105
42
600
2 =
(observados esperados)2
.
esperados
(observados esperados)2
esperados
Introducci
on
Beatriz Pateiro L
opez
Ejemplos
A continuaci
on se muestra la estatura (en cm.) y el VEF (en l.) de 12
ni
nos en ese rango de edad:
Estatura
VEF
El diagrama de dispersion
134
1.7
138
1.9
142
2.0
146
2.1
150
2.2
154
2.5
158
2.7
162
3.0
166
3.1
170
3.4
174
3.8
178
3.9
El diagrama de dispersi
on
La representaci
on gr
afica m
as u
til de dos variables continuas es el
diagrama de dispersi
on.
La representaci
on gr
afica m
as u
til de dos variables continuas es el
diagrama de dispersi
on.
A mayor relaci
on entre las variables m
as estrecha y alargada ser
a la nube.
A mayor relaci
on entre las variables m
as estrecha y alargada ser
a la nube.
Estatura
VEF
134
1.7
138
1.9
142
2.0
146
2.1
150
2.2
154
2.5
158
2.7
162
3.0
166
3.1
3.5
3.0
VEF
2.5
2.0
140
150
160
170
Estatura
170
3.4
174
3.8
178
3.9
Diagramas de dispersion
Covarianza
20
4.0
3.5
10
3.0
Adem
as, en el contexto bidimensional surgen nuevas medidas que nos
permiten cuantificar la dispersi
on conjunta de dos variables estadsticas.
2.5
2.0
10
0.0
0.2
Covarianza entre X e Y
0.4
0.6
0.8
0.0
0.2
0.4
0.6
0.8
Cov(X , Y ) = sxy =
200
n
1 X
(xi x)(yi y ).
n 1 i=1
150
50
100
0.2
0.4
0.6
0.8
0.0
0.2
0.4
0.6
0.8
1.0
Covarianza
Covarianza
Adem
as, en el contexto bidimensional surgen nuevas medidas que nos
permiten cuantificar la dispersi
on conjunta de dos variables estadsticas.
Adem
as, en el contexto bidimensional surgen nuevas medidas que nos
permiten cuantificar la dispersi
on conjunta de dos variables estadsticas.
Covarianza entre X e Y
Cov(X , Y ) = sxy =
1
n1
n
X
i=1
(xi x)(yi y ).
Covarianza entre X e Y
Cov(X , Y ) = sxy =
n
1 X
(xi x)(yi y ).
n 1 i=1
Covarianza
Para los datos del ejemplo sobre el VEF y la estatura se obtiene que:
Covarianza entre X e Y
Cov(X , Y ) = sxy =
n
1 X
(xi x)(yi y ).
n 1 i=1
Coeficiente de correlaci
on lineal
Para los datos del ejemplo sobre el VEF y la estatura se obtiene que:
La estatura media es x = 156 centmetros.
El VEF medio es y = 2.691 litros.
La covarianza entre X e Y se calcula como
sxy =
sxy
.
sx sy
Coeficiente de correlaci
on lineal
La soluci
on es utilizar el coeficiente de correlaci
on lineal
La soluci
on es utilizar el coeficiente de correlaci
on lineal
Coeficiente de correlaci
on lineal entre X e Y
rxy
Coeficiente de correlaci
on lineal entre X e Y
sxy
=
.
sx sy
La correlaci
on lineal toma valores entre 1 y 1 y sirve para investigar la relaci
on
lineal entre las variables.
rxy =
sxy
.
sx sy
La correlaci
on lineal toma valores entre 1 y 1 y sirve para investigar la relaci
on
lineal entre las variables.
Si toma valores cercanos a 1 diremos que hay una relaci
on inversa entre X e Y .
Coeficiente de correlaci
on lineal
La soluci
on es utilizar el coeficiente de correlaci
on lineal
La soluci
on es utilizar el coeficiente de correlaci
on lineal
Coeficiente de correlaci
on lineal entre X e Y
rxy =
Coeficiente de correlaci
on lineal entre X e Y
sxy
.
sx sy
La correlaci
on lineal toma valores entre 1 y 1 y sirve para investigar la relaci
on
lineal entre las variables.
Si toma valores cercanos a 1 diremos que hay una relaci
on inversa entre X e Y .
rxy =
sxy
.
sx sy
La correlaci
on lineal toma valores entre 1 y 1 y sirve para investigar la relaci
on
lineal entre las variables.
Si toma valores cercanos a 1 diremos que hay una relaci
on inversa entre X e Y .
Para los datos del ejemplo sobre el VEF y la estatura se obtiene que:
Para los datos del ejemplo sobre el VEF y la estatura se obtiene que:
La desviaci
on tpica de la estatura es sx = 14.422 centmetros.
La desviaci
on tpica del VEF es sy = 0.748 litros.
El coeficiente de correlaci
on lineal entre X e Y ser
a
rxy =
10.672
= 0.9881
14.422 0.7488
La correlaci
on es pr
oxima a 1 y por lo tanto la relaci
on entre ambas
variables es directa.
Modelo de regresi
on lineal
Recta de regresi
on
Y = 0 + 1 X + .
El tipo de relaci
on m
as sencilla que se establece entre un par de variables es la
relaci
on lineal Y = 0 + 1 X
3.0
2.5
2.0
En la pr
actica tal precisi
on casi nunca es alcanzable, de modo que lo m
aximo que
se puede esperar es que la ecuaci
on anterior sea v
alida sujeta a un error aleatorio,
es decir, la relaci
on entre la variable dependiente (Y ) y la variable regresora (X )
se articula mediante una recta de regresi
on.
Dada una muestra (x1 ,y1 ),. . . ,(xn ,yn ) de la variable bidimensional (X , Y ),
Cu
al es la recta que mejor ajusta los datos?
1.5
Sin embargo, este modelo supone que una vez determinados los valores de los
par
ametros 0 y 1 es posible predecir exactamente la respuesta Y dado
cualquier valor de la variable de entrada X .
1.0
Recta de regresi
on
0.5
0.0
Y = 0 + 1 X + .
0.0
0.5
1.0
1.5
2.0
2.5
3.0
El m
etodo de mnimos cuadrados consiste en encontrar los valores 0 y 1 que,
dada la muestra de partida, minimizan la suma de los errores al cuadrado.
sxy
1 = 2
sx
0 = y 1 x
3.0
El m
etodo de mnimos cuadrados
2.5
n
n
1X 2
1X
M(0 , 1 ) =
i =
(yi (0 + 1 xi ))2 .
n i=1
n i=1
1.5
2.0
2.5
2.0
0.5
1.0
3.0
0.0
1.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
1.0
Recta de regresi
on de Y sobre X
0.5
0.0
y = 0 + 1 x
0.0
0.5
1.0
1.5
2.0
2.5
3.0
y = 0 + 1 x = 5.312 + 0.0513x
3.5
3.0
VEF
2.5
2.0
140
150
160
170
Estatura
Descomposicion de la variabilidad
Coeficiente de determinaci
on
n
X
i=1
(yi y )2 .
El coeficiente de determinaci
on (R 2 ) se define como la proporci
on de
variabilidad de la variable dependiente que es explicada por la regresi
on
n
X
i=1
n
X
i=1
R2 =
(
yi y )2 .
(yi yi )2 .
VE
VNE
=1
.
VT
VT
En el modelo de regresi
on lineal simple, el coeficiente de determinaci
on coincide
con el cuadrado del coeficiente de correlaci
on.
2
R 2 = rxy
Descomposici
on de la variabilidad
VT = VE + VNE.
Para los datos del ejemplo sobre el VEF y la estatura se obtiene que:
Para los datos del ejemplo sobre el VEF y la estatura se obtiene que:
R 2 = 0.98812 = 0.976
Con el modelo de regresi
on lineal simple hallado, la variable X es capaz de
explicar el 97.6 % de la variaci
on de Y .
3.5
3.0
VEF
2.5
2.0
140
150
160
170
Estatura
Captulo 2: Probabilidad
1. Un hospital clasica a cada paciente segn disponga o no de seguro mdico y segn su estado
de salud, que puede ser catalogado como bueno, aceptable, serio o crtico. El administrador
registra primero un 0 si el paciente no tiene seguro y un 1 si lo tiene y despus registra una de
las letras b, a, s, c, segn el estado en que se encuentre el paciente. Considera el experimento
consistente en otorgar un cdigo a un paciente nuevo.
a)
b)
c)
Indica cul es el suceso de que el paciente est en estado serio o crtico y no tiene seguro.
d)
a)
b)
3. El 4 % de las personas de una poblacin son daltnicas, el 18 % son hipertensas y el 0.5 % son
daltnicas e hipertensas. Cul es el porcentaje de personas que son daltnicas o hipertensas?
4. La diabetes constituye un problema delicado durante el embarazo, tanto para la salud de la
madre como para la del hijo. Entre las embarazadas diabticas se presentan toxemias en un
25 % de los casos, hidroamnios en un 21 % y deterioro fetal en un 15 %. En un 6 % de los casos
se dan otras complicaciones. Supongamos que no fuera posible que dos de estas complicaciones
pudiesen presentarse simultneamente en un mismo embarazo. El espacio muestral
para el
b)
5. Los pacientes que llegan a una clnica pueden seleccionar entre una de tres secciones para ser
atendidos. Supongamos que los mdicos se asignan al azar a las secciones y que los pacientes
no tienen preferencia especial por ninguna de las secciones. Tres pacientes llegan a la clnica y
se registra a la seccin que escogen.
a)
b)
Sea
a)
b)
c)
Son independientes los sucesos recibir asistencia sanitaria pblica y contratar asistencia
sanitaria privada?
d)
9. Sninsky y otros realizaron un estudio para evaluar la ecacia y seguridad de una preparacin
de mesalamina oral recubierta de polmero sensible al pH en pacientes con actividad de leve a
moderada de colitis ulcerosa. En la siguiente tabla se muestran los resultados del tratamiento
al nal de seis semanas, por tratamiento recibido:
Resultado
a)
Grupo en tratamiento
Placebo
En remisin
Mejorado
13
15
Estable
12
11
14
Empeorado
22
14
b)
Cul es la probabilidad de que un paciente que recibe placebo logre la remisin al nal de
las seis semanas?
c)
d)
mente, de los individuos que tienen cierta deciencia en la sangre. Ambas pruebas clnicas se
consideran independientes. Si un individuo tiene la deciencia, calcular:
a)
b)
c)
ha dada positiva.
11. Estamos interesados en saber cul de dos anlisis A y B es mejor para el diagnstico de una
enfermedad, de la cual sabemos que la presenta un 10 % de los individuos de la poblacin. El
porcentaje de resultados falsos positivos del anlisis A es del 15 % y el de B es del 22 %. El
porcentaje de falsos negativos de A es del 7 % y de B es del 3 %. Cul es la probabilidad de
acertar en el diagnstico con cada mtodo?
12. Elegido un individuo al azar y observado por rayos X, se diagnostic que estaba tuberculoso. La
probabilidad de que en la poblacin de la que se eligi el individuo, uno de ellos sea tuberculoso
es de 0.01. La sensibilidad de la prueba es de 0.97 y la probabilidad de falso positivo es 0.001.
Cul es la probabilidad de que el individuo sea tuberculoso, habindolo diagnosticado como tal
por rayos X?
13. Una enfermedad puede estar producida por tres virus A,B y C. en el laboratorio hay 3 tubos de
ensayo con el virus A, 2 tubos con el virus B y 5 tubos con el virus C. La probabilidad de que
el virus A produzca la enfermedad es de 1/3, que la produzca B es de 2/3 y que la produzca
el virus C es de 1/7. Se inocula un virus a un animal y contrae la enfermedad, Cul es la
probabilidad de que el virus que se inocule sea el C?
14. Los estudios epidemiolgicos indican que el 20 % de los ancianos sufre un deterioro neuropsicolgico. Sabemos que la tomografa axial computerizada (TAC) es capaz de detectar este
trastorno en el 80 % de los que lo sufren, pero tambin da un 3 % de falsos positivos entre las
personas sanas. Si tomamos un anciano al azar y da positivo en el TAC, cul es la probabilidad
de que est realmente enfermo?
15. Una ambulancia en la plaza Roja, al trasladarse hacia el hospital, puede hacerlo por la calle Fray
Rosendo Salvado, Repblica del Salvador o San Pedro de Mezonzo, con probabilidades 0.2 , 0.7
y 0.1, respectivamente. La probabilidad de que la ambulancia sufra un atasco por la calle Fray
Rosendo Salvado es 0.5, por la calle Repblica del Salvador es 0.6 y por la calle San Pedro de
Mezonzo es 0.4.
a)
b)
16. Con el objeto de diagnosticar la colelietasis se usan ultrasonidos. Tal tcnica tiene una sensibilidad del 91 % y una especidad del 98 %. En la poblacin que nos ocupa la probabilidad de
colelietasis es de 0.2.
a)
b)
17. Una poblacin est formada por tres grupos tnicos: A (30 %), B (10 %) y C (60 %). Los
porcentajes del carcter ojos claros son, respectivamente, 20 %, 40 % y 5 %. Si un individuo
elegido al azar tiene los ojos claros, a qu grupo es ms probable que pertenezca?
18. Un equipo de investigacin mdica pretende evaluar la utilidad de cierto sntoma (llamado S)
para el diagnstico de determinada enfermedad. En una muestra aleatoria independiente de 775
pacientes con esa enfermedad, 744 pacientes presentaron el sntoma. En una muestra aleatoria
independiente de 1380 individuos sin la enfermedad, 21 presentaron el sntoma.
a)
b)
Qu es un falso negativo?
c)
d)
e)
f)
g)
Calcular los valores que predicen la positividad y la negatividad del sntoma para las siguientes tasas hipotticas: 0.0001, 0.01, 0.10.
h)
Con base en los resultados obtenidos en el apartado g), qu se puede concluir acerca de
los valores que predicen el sntoma?
x
p
0
0.230
1
0.322
2
0.177
3
0.155
4
0.067
5
0.024
6
0.015
7
0.01
Comprueba que se trata efectivamente de una distribucin de probabilidad y represntala. Calcula y representa la funcin de distribucin. Cul es el nmero medio de pacientes con enfermedades articulares?
2. En el grupo de adultos (> 16 aos) la probabilidad de sobrevivir al trasplante de mdula sea en
talasemia es 0.6. Un centro hospitalario planea realizar trasplantes de mdula sea a 3 pacientes
adultos.
a) Escribe el espacio muestral correspondiente al posible resultado de las 3 operaciones de
trasplante.
b) Considera la variable
dula?
4. La probabilidad de que un paciente que acude a una consulta de atencin primaria sea derivado
a otra consulta es 0.2. Si a una consulta de atencin primaria acuden 5 pacientes calcula:
a) La probabilidad de que sean derivados exactamente 3 pacientes.
b) La probabilidad de que sean derivados exactamente 5 pacientes.
c ) La probabilidad de que sean derivados menos de 5 pacientes.
d ) Calcula el nmero medio de pacientes derivados a otra consulta, la varianza y la desviacin
tpica.
6. Se estima que la probabilidad de que haya complicaciones graves en pacientes con fallos coronarios ingresados en la UCI es 0.05. Si en la UCI de un determinado hospital hay ingresados 60
pacientes con fallos coronarios, cul es la probabilidad de que ninguno de ellos sufra complicaciones graves?
7. En un hospital, el nmero medio de ingresos por da en la unidad de quemados es 8.4. Calcula:
a) La probabilidad de que una semana haya exactamente 7 ingresos en la unidad de quemados.
b) La probabilidad de que un da haya exactamente dos ingresos en la unidad de quemados.
c ) La probabilidad de que un da haya al menos un ingreso en la unidad de quemados.
8. Un estudio sobre salud laboral establece que el 9 % de los profesores que imparten clase en
centros de Primaria y Secundaria se da de baja por sufrir alguna patologa psiquitrica, siendo
la ms comn la depresin, aunque tambin hay casos de estrs o neurosis.
a) Supongamos que un determinado centro de primaria cuenta con 7 docentes. cul es la
probabilidad de que ninguno de ellos solicite la baja por alguna patologa psiquitrica?
b) cul es la probabilidad que ningn docente solicite la baja por alguna patologa psiquitrica
9. El gerente de un centro de atencin primaria sabe, por experiencia, que el 20 % de las personas
que solicitan cita previa no asisten a la consulta. Si el centro da 10 citas pero solo puede atender
a 8 pacientes, cul es la probabilidad de que todas las personas que acuden con cita previa a
la consulta sean atendidas?
10. Diez individuos entran en contacto con un portador de tuberculosis. La probabilidad de que la
enfermedad se contagie del portador a un sujeto cualquiera es de 0.1.Cuntos individuos se
espera que contraigan la enfermedad?
11. Sea
entre -1 y +1.
entre -2 y +2.
entre -3 y +3.
=0
yz
= 1:35.
P (Z 2)
c ) P ( 0:5 Z 2:65)
d ) El valor de z (z > 0) de manera que el rea encerrada entre 0 y z sea 0.2.
e ) El valor de z tal que la probabilidad de obtener un valor mayor que z sea 0.1.
b)
3. Los errores en el peso proporcionado por la bscula de un ambulatorio son normales de media 0
y desviacin 1 kg. Calcula la probabilidad de que la diferencia entre el peso real de un paciente
y el proporcionado por la bscula no supere los 500 gr. (bien por exceso o bien por defecto).
4. La capacidad vital es la cantidad de aire que es posible expulsar de los pulmones despus de
haber inspirado completamente. Hemos calculado la capacidad vital estandarizada CVE en una
poblacin infantil (la CVE se calcula como la capacidad vital corregida adecuadamente mediante
la media y desviacin tpica). Se asume que la capacidad vital estandarizada se distribuye como
una normal N (0; 1).
a) Si se considera que la salud pulmonar de un nio es dbil cuando su capacidad vital estan-
darizada es menor que -1.5, qu porcentaje de la poblacin estudiada presenta una salud
pulmonar dbil?
b) Un nio tiene un crecimiento pulmonar normal si su capacidad vital estandarizada est entre
1) Segn el modelo, el 90 % de la poblacin infantil tiene una capacidad vital estandarizada menor que aproximadamente
.
2) Segn el modelo, el 20 % de la poblacin infantil con mayor capacidad pulmonar
estandarizada tiene una CVE mayor que aproximadamente
.
5. Los valores de sodio srico en adultos sanos se distribuye como una variable normal de media
141mM y varianza 9 mM2 . Asumiendo dicha distribucin:
Beatriz Pateiro Lpez. Bioestadstica. Grupo C
6. El nivel de colesterol en la sangre se mide de acuerdo a un ndice llamado LDL. Para el caso
de personas adultas, la distribucin del colesterol en la sangre es aproximadamente normal y
en el caso de los hombres tiene una media de 4.8 unidades LDL con una desviacin estndar
igual a 0.6 unidades. El nivel normal (o riesgo normal) de colesterol se considera aquel que
queda entre los lmites en unidades LDL. Una persona con ms de + pero menos de
+ 2 unidades LDL tiene un nivel de riesgo moderado. Si tiene un nivel de + 2 o superior
se considera de alto riesgo y se hace propenso a sufrir un infarto. Por otra parte, si el nivel de
colesterol en la sangre de un adulto est por debajo de ? unidades, se considera de riesgo
bajo.
a) Cules son los porcentajes de poblacin de hombres adultos que estn incluidos en cada
2 N (; )
a) Qu porcentaje del rea encerrada bajo la funcin de densidad est contenida entre
y + ?
b) Qu porcentaje del rea encerrada bajo la funcin de densidad est contenida entre 2
y + 2 ?
c ) Qu porcentaje del rea encerrada bajo la funcin de densidad est contenida entre 3
y + 3 ?
20-24 aos
40-44 aos
55-64 aos
a 150 mmHg?
Calcula, para cada grupo de edad, los lmites de presin sistlica que clasican a un paciente
como hipotenso, hipertenso, en riesgo o con presin sangunea normal.
9. Para ayudar a la evaluacin del pronstico de pacientes con una determinada enfermedad pulmonar se calculan dos ndices, independientes entre s. Se asume que el primero de los ndices
se distribuye segn una normal N (120; 10) y que el segundo se distribuye segn una normal
N (15; 3). Se consideran susceptibles de una revisin ms profunda aquellos pacientes que en
el primer ndice superen el valor 142. Tambin son susceptibles de una revisin ms profunda
aquellos pacientes que en el segundo ndice presenten un valor inferior a 8. Qu porcentaje de
pacientes son susceptibles de una revisin ms profunda?
10. Una determinada prueba mide los niveles de las tres clulas sanguneas bsicas: glbulos rojos,
blancos y plaquetas. Se asume que el nivel de glbulos blancos se distribuye segn una normal
de media 14 y desviacin tpica 3.6. Adems una persona se clasica en un grupo de riesgo de
infeccin cuando su nivel de glbulos blancos es inferior a 10.
a) Cul es la probabilidad de que un paciente sea clasicado en el grupo de riesgo de infec-
cin?
12. El coeciente intelectual de una poblacin sigue una distribucin normal de media 100 y desviacin tpica 15. Cul de las siguientes armaciones es correcta?
a) El 95 % central de los individuos de la poblacin estarn situados entre 85 y 115.
b) El 95 % central de los individuos de la poblacin estarn situados entre 50 y 150.
Beatriz Pateiro Lpez. Bioestadstica. Grupo C
13. Queremos estudiar la capacidad diagnstica de una prueba de glucemia. En base a la experiencia
se determina que el nivel de glucosa en sangre de pacientes sanos se distribuye como una normal
de media 80 mg/dl y desviacin tpica 10 mg/dl. Tambin se sabe que el nivel de glucosa en
sangre de pacientes diabticos se distribuye como una normal de media 160 mg/dl y desviacin
tpica 31.4 mg/dl.
a) Si la prueba de glucemia establece que un individuo est enfermo cuando su nivel de glucosa
establece en 90 mg/dl.?
) De los 307 surstas encuestados, 132 armaron haber necesitado tratamiento mdico
para infecciones de odo en alguna ocasin. Cmo estimaras la proporcin de surstas
que sufren infecciones de odo en base a la muestra? Calcula el intervalo de conanza
para la proporcin de surstas que sufren algn tipo de infeccin de odo con un nivel de
conanza del 95 %. Calcula el intervalo de conanza para la proporcin de surstas que
sufren algn tipo de infeccin de odo con un nivel de conanza del 90 %.
) Los surstas encuestados en este estudio surfean fundamentalmente en aguas fras (por
debajo de 12o C). Se cree que la prevalencia de EAE es distinta en surstas de aguas
templadas. Supongamos que de los 307 surstas examinados 230 fueron diagnosticados
de EAE y que en otro estudio realizado a 75 surstas de aguas templadas, 30 fueron
diagnosticados de EAE. Construye un intervalo de conanza al 90 % para la diferencia de
prevalencias de EAE entre surstas de aguas fras y surstas de aguas templadas.
Los datos del apartado a) estn tomados del artculo Prevalence of external auditory canal
exostoses in surfers. Arch Otolaryngol Head Neck Surg. 1999
2. Una empresa de tecnologa que elabora productos para el cuidado de la salud comercializa
electrodos adhesivos redondos. Estamos interesados en determinar el dimetro medio de dichos
electrodos. Se sabe que el proceso de produccin sigue una distribucin normal y padece una
desviacin tpica de 0.1 cm. Construye un intervalo de conanza para el dimetro medio de los
electrodos al 95 % utilizando que en una muestra de 25 electrodos fabricados por la empresa el
dimetro medio fue de 3.5 cm.
3. Supongamos que la proporcin real de fumadores en una determinada comunidad se conoce y
es igual a 0.4. Si queremos estimar dicha proporcin de fumadores a partir de una muestra de
tamao n = 100, cul es la probabilidad de que la proporcin estimada sea correcta salvo un
error de 3 %? Y si se realiza la estimacin con una muestra de tamao n = 200?
4. Cierta empresa se ha propuesto comercializar un aparato para analizar la concentracin de
glucosa en sangre. Los fabricantes son conocedores de que su mtodo presenta un error de
medicin cuya desviacin tpica es de 2.4 mg/l. Sin embargo, dado que desconocen la media, se
han decidido a tomar una muestra que les permita estimarla. A continuacin consta tal muestra
de los errores de medicin (en mg/l):
0.51
1.47
-2.75
-1.54
1.83
0.30
2.97
-1.25
-0.82
0.18
2.32
-0.21
-0.69
-1.95
-2.19
-3.67
Elabora una estimacin del error medio y construye un intervalo de conanza a un nivel del
99 %, suponiendo que los errores siguen una distribucin normal.
5. Se pretende conocer la media y la varianza del tiempo de eliminacin de un medicamento. Para
ello se han observado los tiempos en una muestra de pacientes obtenindose los siguientes datos
(en horas):
5.64
7.33
7.83
8.24
6.92
7.68
5.31
6.47
8.85
6.09
7.94
8.75
6.04
5.87
5.19
7.28
Supn que los datos proceden de una distribucin normal y, en base a ello, confecciona estimaciones para la media y la varianza. Calcula el intervalo de conanza a un nivel del 90 % para el
tiempo medio de eliminacin del medicamento.
6. Para estudiar si la presin ejercida en la parte superior del brazo aumenta o no el tiempo de
hemorragia, 29 personas fueron sometidas a una presin de 40 mmHg y a continuacin se les
practic una puncin digital obtenindose un tiempo medio de hemorragia de 2.192 minutos
con una desviacin estndar de 0.765 minutos. Otras 33 personas actuaron como controles,
no se les aplic presin y su tiempo medio de hemorragia al pincharles un dedo fue de 1.407
minutos con una desviacin estndar de 0.588 minutos. Determina con un nivel de conanza
de 95 % un intervalo de conanza para la diferencia de los tiempos medios de hemorragia entre
los tratados y los controles. Se asume que los tiempos de hemorragia en ambos grupos son
normales y con la misma varianza.
7. En un estudio sobre nutricin se analiz la ganancia de peso de 16 nios sometidos a una dieta
especial durante un periodo de 3 meses. Se observ una ganancia media de peso 2.49 kg. Un
grupo de control formado por 16 nios de constitucin fsica similar fue sometido a una dieta
normal durante el mismo periodo de tiempo, observndose una ganancia media de peso de 2.05
kg. Se supone que la desviacin estndar para la ganancia de peso es 2 kg.
a
8. Un investigador est planeando hacer un estudio sobre el nivel medio de presin sistlica en
pacientes con hipertensin. Algunos resultados previos indican que la presin sistlica es aproximadamente normal con una desviacin tpica de 15 mmHg.
a
) Cul ser la longitud del intervalo de conanza al 95 % para el nivel medio de presin
sistlica si hace el estudio sobre 100 pacientes? Qu pasar con la longitud del intervalo
si reduce el estudio a 50 pacientes manteniendo el nivel de conanza? Y si hace el estudio
sobre 100 pacientes pero construye el intervalo de conanza al 99o
9. Segn reconoce Sanidad, es cada vez ms elevada la prevalencia de pacientes polimedicados (que
toman 6 o ms medicamentos) en el nivel asistencial. Esto hace necesario reforzar las estrategias
para optimizar los recursos. Un centro de salud ha llevado a cabo un estudio para conocer
la prevalencia de polimedicados. Se han seleccionado 649 pacientes de los cuales 149 estn
sometidos a tratamientos que superan los 6 medicamentos. Calcula un intervalo de conanza
para la prevalencia de polimedicados con un nivel de conanza del 95 %.
10. Para estudiar el efecto del ejercicio fsico sobre el nivel de triglicrido, se ha realizado el siguiente
experimento con 11 individuos: previo al ejercicio se tomaron muestras de sangre para determinar
el nivel de triglicrido por 100 mililitros de sangre de cada sujeto. Despus los individuos fueron
sometidos a un programa de ejercicios que se centraba diariamente en carreras y marchas. Al nal
del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda
lectura del nivel de triglicrido. De este modo, se dispone de dos conjuntos de observaciones
del nivel de triglicrido por 100 mililitros de sangre de los sujetos:
Sujeto
Previo
Posterior
1
68
95
2
77
90
3
94
86
4
73
58
5
37
47
6
131
121
7
77
136
8
24
65
9
99
131
10
629
630
11
116
104
de dichas mujeres es 30.5 aos. Asumimos que la edad de las madres primerizas en Galicia
sigue una distribucin normal con una desviacin tpica de 2 aos. Para una signicacin
del 5 %, podemos concluir que la edad media de las madres primerizas en Galicia diere
de la de Espaa?
b) Se considera ahora una muestra de 10 madres primerizas de Portugal. Sus edades son:
30
28
27
28
28
28
24
23
31
30
Asumimos que la edad de las madres primerizas en Portugal tambin sigue una distribucin
normal con una desviacin tpica de 2 aos.
1) Para una signicacin del 5 %, podemos concluir que la edad media de las madres
primerizas en Portugal diere de la de Espaa?
2) Calcula el p-valor del contraste.
3) Para una signicacin del 1 %, podemos concluir que la edad media de las madres
primerizas en Portugal diere de la de Espaa?
2. Segn datos de 2003, el 62.68 % de los jvenes espaoles de entre 18 y 29 aos arman
utilizar preservativo siempre que mantienen relaciones sexuales con parejas ocasionales. Tras una
campaa preventiva sobre el uso del preservativo llevada a cabo en los ltimos aos, se realiz
encuesta a 3150 jvenes de entre 18 y 29 aos. De ellos, 2047 armaron utilizar preservativo
siempre que mantienen relaciones sexuales con parejas ocasionales. Se puede concluir que la
campaa preventiva ha sido efectiva para una signicacin del 5 %?
Puedes encontrar datos sobre salud en Espaa en la web del Instituto Nacional de Estadstica:
http://www.ine.es/inebmenu/mnu_salud.htm
-2.75
-1.54
1.83
0.30
2.97
-1.25
-0.82
0.18
2.32
-0.21
-0.69
-1.95
-2.19
-3.67.
a) Es el error medio signicativamente distinto de cero para una signicacin 0.1? Cmo
presenta una desviacin tpica de 0.67 mg/l. Diras ahora que el error medio es signicativamente distinto de cero para una signicacin 0.05? Calcula e interpreta el p-valor.
4. Para conocer el uso que hombres y mujeres hacen de los servicios sanitarios es necesario realizar
estudios que permitan conocer mejor los factores que intervienen en sus decisiones y en las del
personal sanitario. Segn la Encuesta Nacional de Salud de 2003, un 17 % de las mujeres acuden
a consulta mdica con frecuencia. Se lleva a cabo un estudio en el que participan 2150 hombres.
Del total de los hombres, 275 arman haber acudido a consulta mdica durante las dos semanas
anteriores al momento de la encuesta. Se puede concluir que el uso de los servicios sanitarios
por parte de los hombres es menor que el de las mujeres?
En la Encuesta Nacional de Salud se analizan las diferencias entre hombres y mujeres en el estado de
salud o en los hbitos de consulta. Algunos estudios apuntan, para explicar el diferente uso de los
servicios, a una mayor medicalizacin de la salud de las mujeres o la prctica ms frecuente de
conductas de riesgo por parte de los hombres, sobre todo en edades tempranas.
http://www.msps.es/organizacion/sns/planCalidadSNS/e02_t05.htm
5. Para estudiar si la presin ejercida en la parte superior del brazo aumenta o no el tiempo de
hemorragia, 29 personas fueron sometidas a una presin de 40 mmHg y a continuacin se les
practic una puncin digital obtenindose un tiempo medio de hemorragia de 2.192 minutos con
una desviacin estndar de 0.765 minutos. Otras 33 personas actuaron como controles, no se
les aplic presin y su tiempo medio de hemorragia al pincharles un dedo fue de 1.407 minutos
con una desviacin estndar de 0.588 minutos. Se asume que los tiempos de hemorragia en
ambos grupos son normales y con la misma varianza.
a) Se puede concluir que el tiempo medio de hemorragia es signicativamente distinto al
ejercer presin en la parte superior del brazo que al no ejercer presin? (signicacin 0.05).
6. Para estudiar el efecto del ejercicio fsico sobre el nivel de triglicrido, se ha realizado el siguiente
experimento con 11 individuos: previo al ejercicio se tomaron muestras de sangre para determinar
el nivel de triglicrido por 100 mililitros de sangre de cada sujeto. Despus los individuos fueron
sometidos a un programa de ejercicios que se centraba diariamente en carreras y marchas. Al nal
del periodo de ejercicios, se tomaron nuevamente muestras de sangre y se obtuvo una segunda
lectura del nivel de triglicrido. De este modo, se dispone de dos conjuntos de observaciones
del nivel de triglicrido por 100 mililitros de sangre de los sujetos:
Sujeto
Previo
Posterior
1
68
95
2
77
90
3
94
86
4
73
58
5
37
47
6
131
121
7
77
136
8
24
65
9
99
131
10
629
630
11
116
104
Suponiendo normalidad en el nivel de triglicrido, hay pruebas sucientes para armar que el
ejercicio fsico produce cambios en el nivel de triglicrido?
7. En un estudio sobre nutricin se analiz la ganancia de peso de 16 nios sometidos a una dieta
especial durante un periodo de 3 meses. Se observ una ganancia media de peso 3.05 kg. Un
Beatriz Pateiro Lpez. Bioestadstica. Grupo C
grupo de control formado por 16 nios de constitucin fsica similar fue sometido a una dieta
normal durante el mismo periodo de tiempo, observndose una ganancia media de peso de 2.05
kg. Se supone que la desviacin estndar para la ganancia de peso es 2 kg.
a) Se puede concluir que la ganancia media de peso es signicativamente mayor en los nios
8. Se trata de estudiar el efecto de un tratamiento dirigido a elevar el colesterol HDL. Para ello se
ha medido el colesterol HDL de 10 pacientes. A continuacin se les ha sometido al tratamiento
y se ha vuelto a medir el colesterol HDL. Los datos se muestran a continuacin. Determinar si
Caso No
1
2
3
4
5
6
7
8
9
10
HDL pre-tratamiento
81
37
35
64
46
37
45
43
21
51
HDL post-tratamiento
85
38
37
72
51
45
38
58
25
61
hay suciente evidencia estadstica, a nivel 0.01, para armar que el tratamiento es efectivo.
9. Una compaa farmacutica arma que cierto medicamento elimina el dolor de cabeza en un
cuarto de hora en el 90 % de los casos. Tomada una muestra de 200 pacientes a los que se les
administr el medicamento, se observ la desaparicin del dolor en 170 de ellos. Contrastar la
hiptesis de la compaa para un nivel de signicacin del 5 %.
10. Registramos los niveles en plasma de determinado cido graso en 30 pacientes de Retinitis
Pigmentosa (RP) y en 32 voluntarios sanos (S), y los resultados fueron los siguientes:
RP
S
Media =35.8
Media =45.8
n = 30
n = 32
Desviacin tpica=20.5
Desviacin tpica=30.1
a) Suponiendo que las poblaciones son normales y a la vista de los resultados obtenidos,
4.5
6.5
5.5
A la vista de los datos, puede decirse que los enfermos han mejorado signicativamente?
(Existe mejora si la puntuacin es mayor de 4. Utilizar un nivel de signicacin de 0.01.)
Bajo
Medio bajo
Medio alto
Alto
Bajo
114
7
7
2
Medio
229
134
63
38
Alto
228
277
150
94
2. Para evaluar el efecto de la exposicin a asbesto sobre el riesgo de fallecer por cncer de pulmn,
un estudio compar un grupo de 6.245 trabajadores expuestos a este agente con otro grupo
de 7.895 trabajadores sin exposicin a este factor. A lo largo de 22 aos de seguimiento, en
el primer grupo se presentaron 76 defunciones por cncer en el aparato respiratorio, en tanto
que en el grupo no expuesto el nmero de defunciones por esta causa fue 28. Construye la
tabla de contingencia correspondiente y determina si existe una asociacin signicativa entre la
exposicin a asbesto y el riesgo de fallecer por cncer de pulmn.
El asbesto es un grupo de minerales naturales brosos. Se ha venido utilizando en el aislamiento de los
edicios, como componente de diversos productos (tejas, tuberas de agua, mantas ignfugas y
envases mdicos), como aditivo de los plsticos y en la industria automovilstica.
http://www.who.int/mediacentre/factsheets/fs343/es/index.html
ese estadstico si, para un nivel de signicacin del 5 %, existe una asociacin signicativa
entre la prevalencia de osteoporosis y antecedentes de dieta pobre en calcio.
4. Supongamos que se quiere estudiar la posible asociacin entre el hecho de que una gestante
fume durante el embarazo y que el nio presente bajo peso al nacer. Para responder a esta
pregunta se realiza un estudio de seguimiento sobre una cohorte de 2000 gestantes, a las que
se interroga sobre su hbito tabquico durante la gestacin y se determina adems el peso del
recin nacido. Los resultados de este estudio se muestran en la siguiente tabla:
Recin nacido de bajo peso
S
43
105
Gestante
Fumadora
No fumadora
No
204
1645
a) Se puede concluir que existe una relacin estadsticamente signicativa entre el hecho de
que una gestante fume durante el embarazo y que el nio presente bajo peso al nacer?
b) Calcula el estadstico Chi-cuadrado corregido (correccin de Yates) y determina si existe
una relacin estadsticamente signicativa entre el hecho de que una gestante fume durante
el embarazo y que el nio presente bajo peso al nacer.
Ejemplo tomado de http://www.fisterra.com/mbe/investiga/chi/chi.asp#ji
5. En un estudio sobre VIH se pretende determinar si existe asociacin signicativa entre la edad
del paciente y el nivel de linfocitos CD4. Para ello se determina el nivel de linfocitos CD4 (<200,
200-500, >500) en pacientes de 3 grupos de edad. Se puede concluir que existe una relacin
estadsticamente signicativa entre el nivel de linfocitos y la edad del paciente?
Nivel de linfocitos
<200
200-500
>500
30 aos
Edad
31
6
20
19
41 aos
40 aos
30
72
49
6
21
12
< 65 aos
IPO
15
190
DIAB
S
No
65 aos
NO IPO
29
1103
IPO
28
215
DIAB
S
No
NO IPO
65
584
S
No
55
64 kg.
8
290
65
74 kg.
18
680
75
84 kg.
48
550
85
94 kg.
93
205
> 95 kg.
23
75
1.7
2.1
2.2
3.0
3.5
1.8
4.3
2.5
8.0
4.2
6.0
4.0
modelo de regresin lineal para explicar el valor del plomo en funcin del hierro?
b) Calcula y representa la recta de regresin del valor del plomo sobre el valor del hierro.
c ) Cul es el coeciente de correlacin lineal?
d ) Qu valor de plomo cabe esperar para una persona con un nivel de hierro igual a 2.2?
e ) Calcula el porcentaje de explicacin de la recta.
2. Para tener valores comparables del gasto cardaco entre distintos sujetos se utiliza un determinado ndice cardaco. Se ha medido dicho ndice cardaco (Y ) en 7 pacientes de diferentes
edades.
X
Y
= Edad
= ndice cardaco
15
6.5
20
5.6
30
5.4
40
6
50
4.6
60
1.4
70
0.1
8
50
81
102
140
181
0.12
0.71
1.09
1.38
1.95
2.50
de mnimos cuadrados.
c ) Supongamos que sabemos que un nuevo paciente tiene una concentracin en sangre de la
sustancia A igual a 95, pero hemos extraviado su correspondiente medida de la concentracin de la sustancia B. Haz una prediccin de dicha concentracin.
sobre
es
= 2 + 0 : 5X .
La recta de regresin de
sobre
es
4 + 2Y .
X = 3.
y la varianza de Y .
5. Registramos la evolucin del nivel de creatinina en pacientes tratados con Captopril despus de
ser sometidos a dilisis.
Das transcurridos
Creatinina (mg/dl)
1
5.7
5
5.2
10
4.8
15
4.5
20
4.2
25
4
35
3.8
= 2:5
x = 10
y = 0:5
sobre Y ?