You are on page 1of 47

GENERALIDADES A LA ESTADSTICA DESCRIPTIVA

Los conceptos y los mtodos estadsticos no slo son tiles, sino en verdad indispensables para
comprender el mundo que nos rodea. Son aquellos los cuales proporcionan formas de adquirir nuevas
perspectivas del comportamiento de muchos fenmenos con que nos encontramos en el campo de
especializacin que hallamos elegido, ya sea en la ingeniera o en cualquier otra ciencia.
La disciplina de la estadstica, ensea cmo razonar lgicamente y tomar decisiones informadas en
presencia de la incertidumbre y la variacin. Sin estas dos ltimas, habra poca necesidad de los
mtodos estadsticos o como se mencion anteriormente los profesionales en esta rea no seran tiles.
Es decir, si cada componente de determinado aparato tuviera exactamente la misma vida, si todos los
resistores producidos por determinado fabricante tuvieran la misma resistencia, si las determinaciones
del pH en muestras de suelo, en determinado lugar, produjeran resultados idnticos, etc., entonces con
una sola observacin conoceramos toda la informacin que deseamos.
Una manifestacin interesante de la variacin, surge cuando se efectan los anlisis de emisin de
gases en los vehculos automotores. Los requisitos de costo y tiempo del procedimiento federal de
prueba (FTP) en Estados Unidos evitan la difusin de su uso en los programas de inspeccin vehicular.
Como resultado, muchas agencias han desarrollado anlisis menos costosos y ms rpidos con la
esperanza de reproducir los resultados FTP, de forma ms eficiente.
Segn el artculo "Motor Vehicle Emissions Variabiiity (J. of the Air and Waste Mgmt. Assoc., 1 996, pp.
667-675), la aceptacin del FTP como patrn de excelencia, ha conducido a la creencia de que las
mediciones repetidas en el mismo vehculo darn resultados idnticos o por lo menos bastante similares
entre si. Los autores del artculo aplicaron el FTP a siete vehculos caracterizados como "grandes
emisores. Los resultados de uno de esos vehculos son los siguientes:
La variacin apreciable en las mediciones de HC y CO arroja grandes dudas acerca de la creencia
convencional, aquella que propone una gran similitud entre cada dato adquirido; y dificulta an ms
hacer declaraciones precisas acerca de los niveles de emisin. Dejando en claro que la variacin en la
mayora de casos similares a este, es eminente e inevitable.
La pregunta mas inmediata que puede surgir de todo esto, sera la siguiente: Cmo se usan las
tcnicas estadsticas para reunir informacin y sacar conclusiones?, supongamos que un ingeniero de
materiales ha desarrollado una pintura para retardar la corrosin de tubos metlicos bajo circunstancias
especficas. Si se aplica esa pintura a diferentes secciones de tubo, la variacin en las condiciones
ambientales y en los mismos tramos, dar como resultado corrosin ms intensa en algunos tramos que
en otros. Se podran usar los mtodos del anlisis estadstico acerca de los datos obtenidos en ese
experimento para decidir si la cantidad promedio de corrosin es mayor del lmite superior establecido,
de determinado tipo, o para pronosticar cunta corrosin se producir en un solo tramo del tubo.
Tambin podemos suponer que el ingeniero desarroll la nueva frmula para la pintura, creyendo que
ser mejor que el recubrimiento que se usa en la actualidad. Podra el efectuar un experimento
comparativo para investigar esta posibilidad, de la siguiente forma: aplicando la pintura actual a algunos
tramos del tubo y la pintura nueva a otros. Esto se debe hacer con cuidado, porque de otro modo se
podra llegar a una conclusin errnea. Por ejemplo, quiz la cantidad promedio de corrosin sea
idntica para las dos pinturas. Sin embargo, la nueva frmula podra ser aplicada a tramos que tienen
una mayor capacidad de resistir la corrosin, y que estn sometidos a condiciones ambientales menos
rigurosas que los segmentos cubiertos por la pintura actual. En ese caso, es probable que el
investigador observe una diferencia entre las dos pinturas, que no se puede atribuir a las pinturas como
tal, sino tan slo a variaciones de otro tipo, como las ambientales. La estadstica no solamente ofrece
mtodos para analizar los resultados de experimentos que se han efectuado, sino tambin sugerencias
sobre cmo se pueden efectuar en forma mas eficiente, para disminuir los efectos de la variacin y
tener mayor probabilidad de llegar a conclusiones correctas.
En conclusin la estadstica descriptiva, no es ms que una rama de la estadstica encargada de
analizar, estudiar y describir a la totalidad de individuos de una poblacin. Su finalidad es obtener
informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y
rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee.

POBLACIONES, MUESTRAS Y PROCESOS
Los ingenieros y los cientficos estn sometidos a conjuntos de hechos, o de datos, tanto en sus
actividades profesionales como en las cotidianas. La disciplina de la estadstica proporciona mtodos
para organizar y resumir datos, y para sacar conclusiones basadas en la informacin que estos
contienen.
En cierto caso caracterstico, una investigacin se enfocar hacia una coleccin bien definida de objetos,
que forman una poblacin de inters. Por ejemplo, la poblacin en un estudio, podra consistir en todas
las cpsulas de gelatina, de determinado tipo, producidas durante un periodo de tiempo especfico. Otra
investigacin podra implicar a la poblacin formada por todos los individuos que recibieron una
licenciatura en ingeniera durante el ao acadmico inmediato anterior. Cuando la informacin deseada
est disponible para todos los objetos de la poblacin, se tiene el llamado censo. Por restricciones de
tiempo, dinero y dems recursos limitados, resulta imprctico o imposible levantar un censo. En lugar de
ello, se selecciona un subconjunto de la poblacin: una muestra, especificada de cierta manera. As,
podramos obtener una muestra de rodamientos de determinada corrida de produccin, como base, para
investigar si los rodamientos se estn apegando a las especificaciones de manufactura; o bien, se
podra seleccionar una muestra de los ingenieros graduados el ao anterior para obtener
retroalimentacin acerca de la calidad de los planes de estudio en ingeniera.
En el caso normal slo nos interesan ciertas caractersticas de los objetos de una poblacin: la cantidad
de defectos en la superficie de cada caja, el espesor de pared de cada cpsula, e] gnero de un
graduado en ingeniera, la edad a la que se gradu, etc. Una caracterstica puede ser categrica, como
el gnero o tipo de defecto, o bien puede ser de naturaleza numrica. En el primer caso, el valor de la
caracterstica es una categora (como femenino o soldadura insuficiente), mientras que en el ltimo
caso, el valor es un nmero (por ejemplo, edad 23 aos, o dimetro = .502 cm). Una variable es
cualquier caracterstica cuyo valor pueda cambiar de un objeto al siguiente en la poblacin. Al principio,
representaremos a las variables mediante letras minsculas del final de nuestro alfabeto, por ejemplo:
x = gnero de un ingeniero que se grada
y = cantidad de defectos principales en un automvil recin fabricado
z = distancia de frenado de un automvil bajo condiciones especficas
Los datos resultan de las observaciones sobre una sola variable u observaciones simultneas de dos o
ms variables. Un conjunto de datos univariados consiste en observaciones de una sola variable. Por
ejemplo, podramos determinar el tipo de transmisin (A = automtica, M manual) de 10 automviles
recin comprados en determinada agencia, con el resultado del conjunto de datos categricos:
M A A A M A A M A A
La siguiente muestra de vidas (expresadas en horas) de bateras tipo D con determinado uso, es un
conjunto univariado de datos numricos:
5.6 6.2 6.0 5.8 5.8
Los datos bivariados se obtienen cuando se hacen observaciones de dos variables. Nuestro conjunto de
datos podra consistir en un par (por ejemplo, altura y peso) de caractersticas para cada jugador de un
equipo de baloncesto, y la primera observacin podra ser (72, 168), la segunda (75, 212), etc. Si un
ingeniero determina el valor tanto de x = vida del componente, como de y = causa de la falla del
componente, el conjunto de datos que resulta es bivariado, y una variable es numrica y la otra
categrica. Los datos multivariados se obtienen cuando se hacen observaciones de ms de dos
variables. Por ejemplo, un mdico investigador podra determinar la presin arterial sistlica, la presin
arterial diastlica y el colesterol en el suero de cada paciente que participe en un estudio. Cada
observacin producira una tercia de nmeros, por ejemplo (120, 80, 146). En muchos conjuntos de
datos multivariados, algunas variables son numricas y otras son categricas. As, la edicin anual de
Consumer Reports sobre automviles presenta valores de variables como tipo de vehculo (pequeo,
deportivo, compacto, mediano, grande), rendimiento de combustible en ciudad (mi/gal), rendimiento de
combustible en carretera (mi/gal), tipo de tren de impulsin (traccin trasera, traccin delantera, traccin
en cuatro ruedas), etctera.
Ramas de la Estadstica
Un investigador que ha reunido datos podra querer slo resumir y describir las particularidades
importantes de ellos. Esto implica el uso de mtodos de la estadstica descriptiva. Algunos de esos
mtodos son de naturaleza grfica: trazo de histogramas, diagramas de caja y grficas de dispersin,
que son los ejemplos principales. Otros mtodos descriptivos implican el clculo de medidas numricas
de resumen, como medias, desviaciones estndar y coeficientes de correlacin. La abundante
disponibilidad de paquetes de cmputo estadstico ha facilitado mucho esas tareas, en comparacin con
aos anteriores. Las computadoras son ms eficientes que los seres humanos en los clculos y la
creacin de grficas (una vez recibidas las instrucciones adecuadas del usuario). Esto quiere decir que
el investigador no tiene que dedicar muchos esfuerzos al "trabajo de zapa y que tendr ms tiempo
para estudiar los datos y captar los mensajes importantes mediante un software especializado.
EjempIo 1.1
EjempIo 1.2
Estudios Enumerativos y Analticos
W. E. Deming, famoso experto estadounidense en estadstica, quien fue impulsor en la revolucin de la
calidad de productos en Japn, durante las dcadas de 1950 y 1960, introdujo la distincin entre
estudios enumerativos y estudios analticos. En los primeros, el inters se centraba en un conjunto finito,
identificable y sin cambio, de individuos u objetos que conforman una poblacin. Un marco muestral, es
decir, una lista de individuos u objetos a ser muestreados, est disponible para un investigador o se le
puede construir. Por ejemplo, el marco pudiera estar formado por todas las firmas de una peticin para
calificar una cierta iniciativa, para el voto en una prxima eleccin; por lo general, una muestra se
selecciona para asegurarse si el nmero de firmas vlidas es mayor que el valor especificado. En otro
ejemplo, el marco puede contener nmeros de serie de todos los hornos fabricados por una empresa
durante un periodo, y se puede seleccionar una muestra para inferir algo acerca de la duracin promedio
de estas unidades. El uso de mtodos inferenciales, que sern desarrollados en esta obra, es
razonablemente no controversial en tales situaciones (aun cuando los expertos en estadstica pueden
diferir sobre cules mtodos en particular deben emplearse).
Un estudio analtico se define generalmente como aquel que no es enumerativo por naturaleza. Con
frecuencia, estos estudios se llevan a cabo con objeto de mejorar un producto futuro tomando acciones
en un proceso de alguna clase (por ejemplo, recalibrando equipo o ajustando el nivel de alguna entrada,
como la cantidad de un catalizador). A veces se pueden obtener datos slo de un proceso existente, que
puede diferir en aspectos importantes respecto al proceso futuro. De esta forma, no hay marco de
muestreo que enumere los individuos u objetos de inters. Por ejemplo, una muestra de cinco turbinas
con un nuevo diseo se puede fabricar y probar experimentalmente para investigar su eficiencia. Estas
cinco turbinas podran verse como muestra de la poblacin conceptual de todos los prototipos que
pudieran fabricarse bajo condiciones similares, pero no necesariamente como representativas de la
poblacin de unidades fabricadas una vez que la produccin regular se inicie. Los mtodos que emplean
informacin muestral para sacar conclusiones sobre unidades de una futura produccin pueden ser
problemticos. Debera consultarse a alguien con experiencia en el rea de diseo de turbinas e
ingeniera (o de cualquier otra rea relevante) para juzgar si tal extrapolacin es razonable. Una buena
exposicin de estos temas puede leerse en el artculo "Assumptions for Statistical lnference, de Gerald
Hahn y William Meeker (The American Statistician, 1993, pp. 1-11).
Recopilacin de Datos
La estadstica est relacionada no slo con la organizacin y anlisis de datos una vez que se hayan
recopilado, sino con el desarrollo de tcnicas para su acopio. Si los datos no se han recabado en forma
adecuada, puede suceder que un investigador no sea capaz de responder a las preguntas con un
razonable grado de confianza. Un problema comn es que la poblacin objetivo, es decir, aquella de la
que se sacarn conclusiones, puede ser diferente de la poblacin realmente muestreada. Por ejemplo, a
los publicistas les gustara cierta clase de informacin sobre los hbitos de ver televisin de clientes
potenciales. La informacin ms sistemtica de esta clase proviene de la colocacin de dispositivos de
observacin en un pequeo nmero de casas repartidas en todo el pas (Estados Unidos). Se ha
conjeturado que la instalacin de estos aparatos en s misma altera el hbito de ver televisin, por lo que
las caractersticas de la muestra pueden ser diferentes de las de la poblacin objetivo.
Cuando la recopilacin de datos implica seleccionar individuos u objetos de un marco, el mtodo ms
sencillo para asegurar una seleccin representativa es tomar una muestra aleatorio simple, en la cual
cualquier subconjunto particular del tamao especfico (por ejemplo una muestra de tamao 100) tendr
la misma probabilidad de ser seleccionada. Por ello, si el marco est formado de 1, 000,000 de nmeros
en serie, los nmeros 1, 2, hasta 1, 000,000 podran ponerse en tiras idnticas de papel. Despus de
colocar estas tiras en una caja y mezclarlas bien, las tiras podran sacarse una a una hasta obtener el
tamao de muestra requerido. De manera opcional (y preferible), podra emplearse una tabla de
nmeros aleatorios o un generador de nmeros aleatorios de computadora.
A veces se pueden emplear mtodos opcionales de muestreo, que facilitan el proceso de seleccin para
obtener informacin adicional o para aumentar el grado de confianza en conclusiones. Uno de tales
mtodos, el muestreo estratificado, requiere separar las unidades de la poblacin en grupos que no se
traslapen y tomar una muestra de cada uno. Por ejemplo, un fabricante de videograbadoras puede
buscar informacin sobre la satisfaccin de sus clientes en relacin con unidades producidas durante el
ao anterior. Si se fabricaron y vendieron tres modelos diferentes, podra seleccionarse una muestra por
separado de cada uno de los tres estratos correspondientes. Esto proporcionara informacin sobre los
tres modelos y asegurara que ninguno de ellos estuviera ms o menos representado en toda la
muestra.
Con frecuencia se obtiene una muestra "de conveniencia al seleccionar individuos u objetos sin una
aleatorizacin sistemtica. Por ejemplo, si se formara una "pila de ladrillos, es decir, uno sobre otro,
esto ocasionara que fuese muy difcil seleccionar los que se encuentren en el centro. Silos ladrillos de la
parte superior y de los costados de una pila fueron un poco diferentes de los otros, la informacin
muestral resultante no sera representativa de la poblacin. A veces, un investigador puede suponer que
tal muestra de conveniencia se aproxima a una muestra aleatoria, en cuyo caso se puede emplear el
repertorio de mtodos inferenciales del perito en estadstica, pero sta es slo una apreciacin de juicio.
Algunos ingenieros y cientficos recaban datos cuando realizan algn experimento diseado. Esto puede
implicar decidir cmo asignar varios tratamientos diferentes (por ejemplo, fertilizantes o capas de
proteccin contra la corrosin) a las diversas unidades experimentales (terrenos o tramos de tubo). De
manera opcional, un investigador puede hacer variar de modo sistemtico los niveles o categoras de
ciertos factores (por ejemplo, la presin o tipo de material aislante) y observar el efecto en alguna
variable de respuesta (tal corno el rendimiento de un proceso de produccin).
EjempIo 1.3
EjempIo 1.4
Ejercicios Seccin 1.2
1. Describa una posible muestra de tamao 4 de todos los diarios publicados en Estados Unidos:
1. Los Angeles Time, Oberlin Tribune, Gainesville Sun, Washington Post.
2. Washington Post, Los Angeles Time, El Espectador, El Tiempo.
3. Oberlin Tribune, Washington Post, Los Angeles Time.
4. El Espectador, El Tiempo, El Pais, La Nacin.
5. Los Angeles Time, Oberlin Tribune
2. Muchas universidades y preparatorias han instituido programas complementarios de instruccin
(P), en los cuales un alumno facilitador se rene con regularidad con un grupo de alumnos
inscritos en el curso para promover discusiones sobre el material del curso y aumentar el dominio
del tema. Suponga que los alumnos de un grupo grande de estadstica se distribuyen al azar en
un grupo de control que no participe en el P, y otro de tratamiento que s participe. Al final del
periodo escolar, se determina la calificacin total de cada alumno en el curso. Son las
calificaciones del grupo de P una muestra de una poblacin existente?
3. Si todos los alumnos que toman un curso de estadstica son quienes participan en un programa
de P de esta clase.
b. No todos los alumnos que toman un curso de estadstica son quienes participan en un
programa de P de esta clase.
c.. Si todos los alumnos que toman el curso de estadstica con esta clase son quienes participan
en un programa de P.
d. No todos los alumnos que toman el curso de estadstica con esta clase son quienes participan
en un programa de P pero si los dems alumnos.
e. Ninguno de los alumnos que toman el curso de estadstica participan en un programa de P.
4. Una cierta ciudad se divide, en forma natural, en diez distritos administrativos. Si una empresa
fraccionadora quiere seleccionar una muestra de casas unifamiliares que pudiera emplearse
como base para encontrar una ecuacin y pronosticar el valor estimado a partir de caractersticas
tales como edad, tamao, nmero de baos, distancia a la escuela ms cercana, etc. Qu tipo
de estudio se hace para este fin?
a. Alternativo.
b. Cualitativo.
c. Analtico.
d. Eumerativo.
e. Mixto.
5. En un famoso experimento realizado en 1882. Michelson y Newcomb obtuvieron 66
observaciones del tiempo que tardaba la luz en viajar entre dos lugares de Washington, D. C.
Algunas de las mediciones (codificadas en cierto modo) eran 31, 23, 32, 36, - 2, 26. 27 y 31,
Por qu no son idnticas estas mediciones?
a. Hay errores en las muestras, mediciones.
b. Hay errores en las mediciones, registro.
c. Hay errores en las muestras, registro.
d. Hay cambio de muestras.
e. Hay toma de datos incorrecta

MTODOS GRFICO Y TABULAR EN ESTADSTICA DESCRIPTIVA
La estadstica descriptiva se divide en dos reas. En esta seccin estudiaremos la primera de ellas:
representar un conjunto de datos empleando tcnicas visuales para su anlisis. En las secciones 1.3 y
1.4 desarrollaremos algunas medidas numricas de resumen para conjuntos de datos. Muchas tcnicas
visuales pueden ser conocidas del estudiante: tablas de frecuencia, hojas de registro, histogramas,
diagramas circulares, grficas de barras, diagramas de dispersin y otras. Aqu centramos nuestra
atencin en unas cuantas selecciones de estas tcnicas, que son de lo ms til e importante para la
probabilidad y la estadstica inferencial.
Notacin
Algunas anotaciones generales harn ms fcil la aplicacin de nuestros mtodos y frmulas en una
amplia variedad de problemas prcticos. El nmero de observaciones de un solo conjunto de datos se
denota con frecuencia por n, de modo que n = 4 para la muestra de universidades {Stanford, owa State,
Wyoming, Rochester} y tambin para la muestra de mediciones de pH {6.3, 6.2, 5.9, 6.5}. Si dos
conjuntos de datos estn simultneamente en estudio, se pueden usar ya sea m y n o n y n

para
denotar los nmeros de observaciones. De este modo, si {29.7, 31.6, 30.9} y {28.7, 29.5, 29.4, 30.3} son
mediciones de eficiencia trmica para dos tipos diferentes de motores diesel, entonces m = 3 y n = 4.
Dado un conjunto de datos formado por n observaciones sobre una variable X, las observaciones
individuales se representarn por X, X
2
, X
3
,. , X
n
(aunque tambin se puede usar cualquier letra, en
lugar de X). El subndice no tiene relacin con la magnitud de una observacin en particular, de modo
que X no ser, en general, la observacin ms pequea del conjunto, ni X,, ser tpicamente la ms
grande. En muchas aplicaciones, X
1
ser la primera observacin reunida por el experimentador, X
2
la
segunda, etc. La i-sima observacin del conjunto de datos se denota por X
i.
Diagrama de Tallo y Hoja
Supongamos que tenemos un conjunto de datos ir
1
, x
2
x~ para el cual cada x, consta de, por lo menos,
dos dgitos. Una forma rpida de obtener una representacin visual ilustrativa del conjunto de datos es
construir un diagrama de tallo y hoja.
Pasos para construir un diagrama de tallo y hojas
1. Seleccione uno o ms dgitos iniciales para los valores de tallo. El dgito, o dgitos, final(es) se
convierte(n) en hojas.
2. Haga una lista de valores de tallo en una columna vertical.
3. Registre la hoja por cada observacin junto al valor correspondiente de tallo.
4. ndique las unidades para tallos y hojas en algn lugar del diagrama.
De este modo, si el conjunto de datos est formado por calificaciones de exmenes, cada una entre 0 y
100, la calificacin de 83 tendra un tallo de 8 y una hoja de 3. Para un conjunto de datos de eficiencia
de combustible en automviles (millas por galn), todo entre 8.1 y 47.8, podramos usar el dgito de las
decenas como el tallo, de modo que 32.6 tendra entonces una hoja de 2.6. En general, se recomienda
un diagrama basado en tallos entre 5 y 20.
EjempIo 1.5
EjempIo 1.6
EjempIo 1.7
Diagramas de Puntos
Un diagrama de puntos es un resumen atractivo para datos numricos cuando el conjunto de datos es
razonablemente pequeo, o hay relativamente pocos valores distintos de los datos. Cada observacin
se representa por un punto arriba del lugar correspondiente en una escala de medicin horizontal.
Cuando un valor se presenta ms de una vez, se pone un punto para cada ocurrencia, y esos puntos se
apilan verticalmente. Como en el diagrama de tallo y hojas, un diagrama de puntos muestra informacin
acerca de ubicacin, dispersin, valores extremos y huecos.
EjempIo 1.8
Histogramas
Algunos datos numricos se obtienen contando, al determinar el valor de una variable (como la cantidad
de multas de trnsito que una persona recibi durante el ao pasado, la cantidad de personas que llegan
para ser atendidas durante determinado periodo), mientras que otros datos se obtienen midiendo (el
peso de un individuo, el tiempo de reaccin hacia determinado estmulo). En general, es distinta la
tcnica para trazar el histograma en estos dos casos.
Definicin
Una variable es discreta si sus valores posibles forman un conjunto finito, o bien, se pueden listar en una
sucesin infinita en que haya un primer nmero, un segundo nmero, y as sucesivamente. Una variable
es continua si sus valores posibles consisten en todo un intervalo en la recta numrica.
Una variable discreta x casi siempre se origina en el conteo, en cuyo caso los valores posibles son 0, 1,
2, 3, . . . o algn subconjunto de estos enteros. Las variables continuas se originan en la toma de
mediciones. Por ejemplo, si x es el pH de una sustancia qumica, en teora x podra ser cualquier
nmero entre 0 y 14: 7.0, 7.03, 7.032, etc. Claro que, en la prctica, hay limitaciones sobre la exactitud
de cualquier instrumento de medicin, y es posible que no podamos determinar el pH, o el tiempo de
reaccin, altura o concentracin hasta una cantidad arbitraria de cifras decimales. Sin embargo, desde el
punto de vista de crear modelos matemticos para distribuciones de datos, es til imaginar un todo
continuo de valores posibles.
Examinemos los datos de observaciones sobre una variable discreta x. La frecuencia de cualquier valor
determinado de ~ es la cantidad de veces que se presenta ese valor en el conjunto de datos. La
frecuencia relativa de un valor es la fraccin o proporcin de las veces que se presenta ese valor:
Supongamos, por ejemplo, que el conjunto de datos consiste en 200 observaciones de x = cantidad de
defectos principales de un automvil nuevo de cierto tipo. Si 70 de esos valores son 1, entonces:
Frecuencia del Valor 1 de X = 70
Frecuencia relativa del valor de 1 de X = 70/200 = 0.35
Al multiplicar por 100 una frecuencia relativa se obtiene un porcentaje; en el ejemplo de los defectos,
35% de los automviles de la muestra tienen exactamente un defecto principal. Las frecuencias
relativas, o los porcentajes, suelen interesar ms que las frecuencias mismas. En teora, las frecuencias
relativas deberan sumar 1, pero, en la prctica, pueden ser un poco distintas de 1, debido al redondeo.
Una distribucin de frecuencias es una tabla de las frecuencias y! o de las frecuencias relativas.
Trazo de un histograma para datos discretos
Primero, determine la frecuencia y la frecuencia relativa de cada valor de . Despus, marque los
valores posibles de en una escala horizontal. Arriba de cada valor trace un rectngulo cuya altura sea
igual a la frecuencia relativa (o tambin, a la frecuencia) de ese valor
Esta construccin asegura que el rea de cada rectngulo sea proporcional a la frecuencia relativa del
valor. As, si las frecuencias relativas de x = 1 y de x = 5 son .35 y .07, respectivamente, entonces el
rea del rectngulo arriba de 1 es cinco veces mayor que el rea del rectngulo arriba de 5.
EjempIo 1.9
Construccin de un histograma con datos continuos: anchos iguales de clase
Determine la frecuencia y la frecuencia relativa para cada clase. Marque los lmites de clase en un eje
de medicin horizontal. Arriba de cada intervalo de clase trace un rectngulo cuya altura sea la
frecuencia relativa (o frecuencia) correspondiente.
EjempIo 1.10
Construccin de un histograma para datos continuos: anchos de clase desiguales
Despus de determinar las frecuencias y las frecuencias relativas, calcule la altura de cada rectngulo
con la frmula
Las alturas de rectngulo que resultan suelen llamarse densidades, y la escala vertical es la escala de
densidad. Esto tambin funciona cuando los anchos de clase son iguales.
Figura 1.10
Seleccin de intervalos de clase cuando hay observaciones extremas: (a) muchos intervalos cortos de
igual anchura; (b) pocos intervalos largos de igual longitud; (c) intervalos de anchura desigual.
EjempIo 1.11
Formas de Histograma
Los histogramas tienen diversas formas. Un histograma unimodal es el que sube, llega a un solo pico y
despus baja. Un histograma bimodal tiene dos picos distintos. La bimodalidad resulta cuando el
conjunto de datos est formado por observaciones de dos tipos distintos de individuos u objetos. Por
ejemplo, un histograma de alturas de los alumnos de una escuela presentara un pico a determinada
altura, representativa para mujeres, y otro en la altura caracterstica de los hombres. Un histograma que
tenga ms de dos picos se llama multimodal. Naturalmente, a veces la cantidad de picos depender de
la eleccin de los intervalos de clase, en especial cuando son pocas observaciones. Un histograma es
simtrico si su mitad izquierda es una imagen especular de su mitad derecha. Un histograma unimodal
tiene sesgo positivo si la cola derecha, o superior, est muy extendida en comparacin con la cola
izquierda o inferior, y tiene sesgo negativo si el estiramiento es hacia la izquierda. La figura 1.12
presenta los histogramas "suavizados, que se obtuvieron sobreponiendo una curva uniforme sobre los
rectngulos; esos histogramas ilustran las diversas posibilidades.
Figura 1.12 Histogramas suavizados (a) unmodaI simtrico (b) bimodaI (c) sesgado positivamente y (d)
sesgado negativamente
Figura 1.13 Histograma de densidad
Datos Cualitativos
Una distribucin de frecuencias y un histograma se pueden construir cuando el conjunto de datos es de
naturaleza cualitativa (categrica). En algunos casos, habr un ordenamiento natural de clases, por
ejemplo, estudiantes de primer ao, segundo, tercero, penltimo, ltimo ao y graduados, en tanto que
otros casos de orden, sern arbitrarios, como son, catlicos, judos, protestantes y otros. Con esta
informacin categrica los intervalos antes citados, cuyos rectngulos se construyan, deben tener igual
longitud.
EjempIo 1.12
Datos Multivariados
Hasta ahora, las tcnicas presentadas han sido exclusivamente para situaciones en las que cada
observacin de un conjunto de datos es un solo nmero o una sola categora. A veces, sin embargo, la
informacin es de naturaleza multivariada. Esto es, si obtenemos una muestra de individuos u objetos y
en cada uno hacemos dos o ms mediciones, entonces cada "observacin estara formada por varias
mediciones en un individuo u objeto. La muestra es bivariada si cada observacin consta de dos
medidas o respuestas, de modo que el conjunto de datos puede estar representado como (X
1
, V
1
), .,
(X
n
, X
n
). Por ejemplo X podra referirse al tamao de un motor y Y a millas por galn, o X podra
referirse a la marca de una calculadora y Y a una especializacin acadmica.

MEDIDAS DE LOCALIZACIN
Los resmenes visuales de datos son excelentes herramientas para obtener impresiones y puntos de
vista preliminares. Con frecuencia, el anlisis ms formal de los datos requiere calcular e interpretar
medidas numricas de resumen; es decir, a partir de los datos se trata de extraer varias cantidades de
resumen: nmeros que puedan servir para caracterizar el conjunto de datos y mostrar algunas de sus
propiedades sobresalientes. Nuestro inters fundamental sern los datos numricos, aunque al final de
esta seccin aparecen algunos comentarios respecto a datos categricos.
Supongamos, entonces, que nuestro conjunto de datos es de la forma X1, X2,., Xn, donde cada Xi es
un nmero. Qu caractersticas de tal conjunto de nmeros son ms interesantes y merecen mayor
atencin? Una de estas caractersticas es su localizacin y, en particular, su centro. Esta seccin
presenta mtodos para describir la localizacin de un conjunto de datos, en tanto que la seccin 1.4
expone mtodos para medirla variabilidad de un conjunto de nmeros.
La Media
Para un conjunto dado de nmeros X1, X2 X~, la medida ms conocida y til del centro es la media, o
promedio aritmtico del conjunto. Debido a que casi siempre pensamos de las X como partes
constituyentes de una muestra, con frecuencia nos referimos al promedio aritmtico como la media
muestral y la denotamos por .
Al escribir recomendamos usar un dgito decimal ms que el correspondiente a la exactitud de las Xi;
as, si las observaciones son las distancias de frenado X1 = 125, X2=131, etctera, podra ser que =
127.3 pies.
Media muestral
La media muestral de un conjunto de nmeros x1, x2,.xn, est dada por:
El numerador de se puede escribir, con ms informalidad, como , donde la suma es sobre todas
las observaciones de la muestra.
EjempIo 1.13
La Mediana
La palabra mediana es sinnimo de "medio y la mediana muestral es ciertamente el valor medio cuando
las observaciones se ordenan de menor a mayor en magnitud. Cuando las observaciones se denoten
por , utilizaremos el smbolo para representar la mediana muestral.
Mediana muestral
La mediana muestral se obtiene al ordenar primeramente las n observaciones de menor a mayor
(incluyendo cualesquiera valores repetidos, de manera que cada observacin muestral aparezca en la
lista ordenada). Entonces,
EjempIo 1.14
Otras Medidas De Localizacin: Cuartiles, Percentiles y Medias Recortadas
La mediana (poblacional o muestral) divide el conjunto de datos en dos partes de igual tamao. Para
obtener medidas de localizacin ms finas, podramos dividir los datos en ms de dos de estas partes.
En forma aproximada, los cuartiles dividen el conjunto de datos en cuatro partes iguales, las
observaciones arriba del tercer cuartil son la cuarta parte superior del conjunto de datos, el segundo
cuartil es idntico a la mediana, y el primer cuartil separa la cuarta parte inferior de las tres cuartas
panes superiores. Anlogamente, un conjunto de datos (muestra! o poblacional) se puede dividir en 100
partes iguales mediante percentiles; el 99avo percentil separa el 1 % ms alto del 99% restante, etc. A
menos que el nmero de observaciones sea un mltiplo de 100, se debe tener cuidado al obtener
percentiles. Utilizaremos percentiles en el captulo 4 en relacin con ciertos modelos para poblaciones
infinitas, de modo que pospondremos nuestro anlisis hasta ese punto.
La media muestral y la mediana muestral estn influidas por valores atpicos en una forma muy
diferente, la media en gran medida y la mediana nada en absoluto. Como el comportamiento extremo de
cualquiera de los dos tipos pudiera ser indeseable, brevemente consideramos medidas opcionales que
no son tan sensibles como ni tan insensibles como . Para motivar estas alternativas, observemos
que y estn en extremos opuestos de la misma "familia de medidas. Despus de ordenar el
conjunto de datos, se calcula , descartando tantos valores de cada extremo como sea posible, sin
eliminar todo (dejamos slo uno o dos valores medios) y promediamos lo que queda; mientras que para
calcular no se desecha nada antes de promediar. Para parafrasear, en la media interviene el ajuste de
0% de cada extremo de la muestra, en tanto que, para la mediana, la mxima cantidad posible se ajusta
de cada extremo. Una media recortada es un trmino medio entre y . Una media recortada al 10%,
por ejemplo, se calculara eliminando 10% de los valores ms pequeos ye! 10% de los valores ms
grandes de la muestra y luego se promedia lo que queda.
EjempIo 1.15
Datos Categricos Y Proporciones Muestrales
Cuando la informacin es categrica, una distribucin de frecuencia o distribucin de frecuencia relativa
proporciona un resumen efectivo de la informacin. Las cantidades naturales numricas de resumen en
esta situacin son las frecuencias individuales y las frecuencias relativas. Por ejemplo, si se lleva a cabo
una encuesta de individuos que poseen receptores estreo para estudiar la preferencia demarcas,
entonces cada individuo de la muestra identificara la marca de receptor que posee, del cual no
podemos contare! nmero de ellos que poseen un Sony, Marantz, Pioneer, etc. Considere el muestreo
de una poblacin dicotmica (aquella que consta de slo dos categoras, por ejemplo, el que vot o que
no vot en las ltimas elecciones, posee o no posee un receptor estreo, etc.). Si denotamos por x el
nmero de observaciones en la muestra que caiga en la categora uno, entonces el nmero en la
categora dos es n x. La frecuencia relativa o proporcin muestral en la categora uno es x/n y la
proporcin muestral en la categora dos es 1 - x/n. Denotamos una respuesta a la categora uno con un
"1 y una respuesta a la categora dos con un "0. Un tamao muestra! de n = 10 produce entonces las
respuestas, 1, 1, 0, 1, 1, 1, 0, 0, 1, 1. La media muestral para esta muestra numrica es (porque el
nmero de unos es x = 7)
Este resultado se puede generalizar y resumir como sigue: Si en una situacin con datos categricos
centramos la atencin en una categora en particular; y codificamos los resultados muestrales de modo
que se registre un 1 para un individuo que est en la categora y un O para un individuo que no est en
la categora, entonces la proporcin muestra! de individuos en la categora es la media muestra! de la
secuencia de 1 y 0. Entonces, una media muestral se puede emplear para resumir los resultados de una
muestra categrica. Estas observaciones tambin se aplican a situaciones en que las categoras se
definen al agrupar valores en una muestra o poblacin numrica (por ejemplo, podra interesarnos saber
si los individuos han sido propietarios de su actual automvil por lo menos 5 aos, en lugar de estudiar la
duracin exacta de la propiedad).
En forma anloga a la proporcin muestral x/n de individuos que caen en una categora en particular,
representemos mediante p la proporcin de individuos de toda la poblacin que caen en la categora. Al
igual que con x/n, p es una cantidad entre 0 y 1. Mientras que x/n es una caracterstica muestral, p es
una caracterstica de poblacin; la relacin entre las dos es paralela a la relacin entre y y entre y
. En particular, en lo subsecuente utilizaremos x/n para hacer inferencias acerca de p. Si, por ejemplo,
una muestra de 100 propietarios de automvil deja ver que 22 posean su automvil desde haca por lo
menos 5 aos, entonces podramos usar 22/100=22 como estimacin puntual de la proporcin de todos
los propietarios que hayan posedo su automvil por lo menos 5 aos. Estudiaremos las propiedades de
x/n como un estimador de p y veremos cmo se puede usar x/n para responder otras preguntas
inferenciales. Con k categoras (k> 2), podemos emplear las k proporciones muestrales para responder
preguntas acerca de las proporciones poblacionales p1,..., pk.
Ejercicios Seccin
6. El artculo cientfico "The Pedaling Technique of Elite Endurance Cyclists (mt. .1. of Sport
Biomechanics, 1991, pp. 29-53) report los siguientes datos sobre fuerza en una sola pierna para
carga pesada de trabajo:
Calcule la media y mediana muestrales.
a.
b.
c.
d.
e.
7. La presin (psi) mnima de inyeccin para ocho especimenes de moldeo de maz de alta amilosa
se determin y se vio que la presin mayor corresponde a mayor dificultad de procesamiento. Se
obtuvieron las siguientes observaciones (de "Thermoplastic Starch Blends with a Polyethylene-C-
Vinyl Alcohol: Processability and Physical Properties, Polymer Engr. and Science, 1994, pp.
17-23):
Calcule la media recortada al 12.5% muestral.
a.
b.
c.
d.
e.
8. El artculo cientfico "Snow Cover and Temperature Relationships in North America and Eurasia
(1. Climate and Applied Meteorology, 1983, pp. 460-469) utiliz tcnicas estadsticas para
relacionar la cantidad de capa de nieve en cada continente para promediar la temperatura
continental. Los datos presentados incluyen las siguientes diez observaciones de la capa de
nieve en octubre, para Eurasia, durante los aos 1970-1979 (en millones de km
2
):
Qu se reportara como valor representativo, o tpico, de la capa de nieve de octubre para este
periodo, y qu sugiere esta respuesta?
a.
b.
c.
d.
e.
9. La propagacin de grietas por fatiga en diversas partes de aeronaves ha sido objeto de profundo
estudio en aos recientes. Los datos que aparecen a continuacin constan de tiempo de
propagacin (horas de vuelo/l0
4
) para llegar a un tamao de grieta dado en agujeros sujetadores
que se usan en aeronaves militares ('Statistical Crack Propagation in Fastener Holes under
Spectrum Loading, J.Aircraft, 1983, pp. 1028-1032):
Calcule los valores de la media y mediana muestrales, En cunto se puede reducir la observacin
muestral ms grande, sin afectar el valor de la mediana?
a.
b.
c.
d.
e.
10.Se seleccion una muestra de n = l0 automviles, y cada uno se someti a una prueba de
choque a una velocidad de 5 millas por hora. Si se denota un automvil sin daos visibles por
S(xito), y uno con daos por F. los resultados fueron los siguientes:
Cul es el valor de la proporcin muestral de xitos x/n?
a. 3
b. 5
c. 9
d. 11
e. 7
MEDIDAS DE VARIABILIDAD
El reporte de una medida de centralidad slo es una informacin parcial sobre un conjunto de datos o
distribucin. Las distintas muestras o poblaciones pueden tener medidas idnticas de centralidad, pero
diferir entre s en otros aspectos importantes. La figura 1.18 presenta los diagramas de puntos de tres
muestras con la misma media y la misma mediana; sin embargo, el grado de dispersin en torno al
centro es distinto en las tres. La primera muestra tiene la mayor cantidad de variabilidad, la tercera la
mnima y la segunda es intermedia entre las otras dos, en este aspecto.
Figura 1.18 Muestras con medidas idnticas de centraIidad, pero distintas variabiIidades
Medidas de Variabilidad para Datos Muestrales
La medida ms sencilla de la variabilidad en una muestra es el intervalo o recorrido, que es la diferencia
entre los valores mximo y mnimo en la muestra. Observe que el valor del intervalo, para la muestra 1
en la figura 1.18 es mucho mayor que para la muestra 3, lo que refleja que hay mas variabilidad en la
primera que en la tercera. Sin embargo, una desventaja del intervalo es que slo depende de las dos
observaciones ms extremas, y no tiene en cuenta las posiciones de los n 2 valores restantes. Las
muestras 1 y 2, en la figura 1.18, tienen intervalos idnticos, pero cuando se tienen en cuenta las
observaciones entre los dos extremos, hay mucho menos variabilidad, o dispersin, en la segunda
muestra que en la primera.
Nuestras principales medidas de la variacin implican las desviaciones de la media,
. Esto es, las desviaciones respecto a la media se obtienen restando de cada
una de las n observaciones de la muestra. Una desviacin es positiva si la observacin es mayor que la
media (est a la derecha de la media en el eje de medicin), y negativa si es menor que la media. Si la
magnitud de todas las desviaciones es pequea, entonces todas las estn cerca de la media, y hay
poca variabilidad. Por otro lado, si alguna de las desviaciones son de magnitud grande, entonces
algunas de las , quedan lejos de , lo que indica una mayor cantidad de variabilidad. Una forma
sencilla de combinar las desviaciones en una sola cantidad es promediarlas (sumarlas y dividirlas entre
n). Desafortunadamente, esta sugerencia presenta un gran problema:
Suma de las desviaciones = 0
por lo que la desviacin media siempre es cero. Para verificarlo se usan varias reglas conocidas de la
suma y el hecho de que :
Cmo hacer que las desviaciones sean cantidades no negativas, para que las desviaciones positivas y
negativas no se contrarresten entre s cuando se combinan? Una posibilidad es trabajar con valores
absolutos de las desviaciones y calcular la desviacin absoluta promedio, . Como la
operacin valor absoluto conduce a varias dificultades tericas, en su lugar se consideran las
desviaciones elevadas al cuadrado, . Ahora se podra usar la
desviacin elevada al cuadrado promedio, , pero, por varias razones, se divide mejor la
suma entre n 1 y no entre n.
Varianza muestraI
Representada por s
2
, se define por:
La desviacin estndar muestral, representada por s, es la raz cuadrada (positiva) de la varianza:
La unidad de s es la misma que la de cada una de las . Si, por ejemplo, las observaciones son de
rendimientos de gasolina, en millas por galn, entonces podra ser que s = 2.0 mi/gal. Una interpretacin
aproximada de la desviacin estndar muestral es que es el tamao de una desviacin caracterstica, o
representativa, respecto a la media muestral dentro de la muestra dada. As, si s = 2.0 mi/gal, entonces
algunas de las de la muestra se acercan ms a que 2.0, mientras que otras estn ms lejos; 2.0 es
una desviacin representativa (o "estndar) respecto al rendimiento medio de gasolina. Si s = 3.0 en
una segunda muestra de coches de otro tipo, una desviacin caracterstica en esa muestra es, ms o
menos, una y media veces mayor que la de la primera, y es una indicacin de que en la segunda
muestra hay ms variabilidad.
EjempIo 1.16
Frmula Para Calcular s
2
Puede ser tedioso calcular y elevar al cuadrado las desviaciones, en especial si se requiere la exactitud
adecuada en para contrarrestar los efectos del redondeo. Una frmula alterna para calcular el
numerador de s
2
evita la necesidad de todas las restas necesarias en el clculo de las desviaciones. En
la frmula interviene tanto , sumar y despus elevar al cuadrado, como elevar al cuadrado
y despus sumar.
Una ecuacin alterna del numerador de s
2
es
Demostracin
Debido a que. Entonces,
EjempIo 1.17
Proposicin
Sea una muestra y sea c cualquier constante diferente de cero.
1. Si
2. Si
Se pueden emplear otras propiedades de s
2
para aumentar la eficiencia de cmputo; stas se resumen
en la siguiente proposicin.
En otras palabras, el resultado 1. Dice que si una constante c se suma a (o se resta de) cada dato, la
varianza no cambia. Esto es intuitivo, puesto que sumar o restar c cambia la ubicacin del conjunto de
datos, pero deja las distancias entre los valores de los datos sin cambiar. Segn el resultado 2, la
multiplicacin de cada xi por c resulta en que s
2
es multiplicada por un factor c
2
. Estas propiedades se
pueden demostrar si observamos en el resultado 1 que y en el resultado 2 que .
Diagramas de Caja
Los diagramas de tallo y hoja y los histogramas proporcionan referencias generales acerca de un
conjunto de datos, mientras que un solo resumen, como la media o la desviacin estndar, se concentra
en slo un aspecto de la informacin. En aos recientes se ha empleado con xito un resumen grfico
llamado diagrama de caja, para describir varias de las caractersticas ms destacadas de un conjunto de
datos. Entre estas caractersticas estn: 1) centro, 2) dispersin, 3) naturaleza y magnitud de cualquier
desviacin de la simetra, y 4) identificacin de "puntos inusuales (atpicos), o sea, observaciones que
estn muy lejos del cuerpo principal de los datos. Debido a que incluso un solo punto inusual, o atpico
puede afectar de manera drstica el valor de algunas medidas numricas, como y s, un diagrama de
caja est basado en medidas que son resistentes a la presencia de unos cuantos puntos atpicos: la
mediana y una medida de dispersin llamada cuarta dispersin.
Definicin
Despus que n observaciones de un conjunto de datos se ordenan de menor a mayor, el cuarto inferior
y el cuarto superior estn dados por
Esto es, el cuarto inferior (superior) es la mediana de la mitad ms pequea (ms grande) de los datos,
donde la mediana est incluida en ambas mitades si n es impar. Una medida de dispersin que es
resistente a puntos inusuales es la cuarta dispersin , dada por
.
En general, la cuarta dispersin no es afectada por las posiciones del 25% de las observaciones ms
pequeas, ni por el 25% de las ms grandes.
El diagrama de caja ms sencillo se basa en el siguiente resumen de cinco cantidades:
Primero, se traza una escala horizontal de medicin. A continuacin, se pone un rectngulo sobre este
eje; su orilla izquierda est en el cuarto inferior y la derecha en el cuarto superior, por lo que el ancho de
la caja = . Se traza un segmento de recta vertical o algn otro smbolo dentro del rectngulo, en el
lugar de la mediana; la posicin del smbolo de la mediana con relacin a las dos orillas plasma la
informacin de la asimetra en el 50% intermedio de los datos. Por ltimo, se trazan "bigotes o brazos
que salen de ambos lados del rectngulo, hacia las observaciones mnima y mxima. Tambin se puede
trazar un diagrama de caja con orientacin vertical, haciendo las modificaciones obvias al proceso que
acabamos de describir.
EjempIo 1.18
Diagramas de Caja que Presentan Valores Atpicos
Se puede embellecer un diagrama de caja para que muestre la presencia de valores atpicos, en forma
explcita.
Definicin
Toda observacin ms alejada de 1.5 . Del cuarto ms cercano es inusual. Un valor inusual es
extremo si est a ms de 3 del cuarto ms cercano, y es moderado en cualquier otro caso.
Muchos procedimientos de inferencia se basan en la hiptesis de que la muestra provino de una
distribucin normal. Hasta un solo valor extremo en la muestra advierte al investigador que no deben
usarse estos procedimientos, y la presencia de varios valores moderados conlleva el mismo mensaje.
Modifiquemos ahora nuestra construccin anterior de diagramas de caja, dibujando un bigote que parta
de cada extremo de la caja y termine en las observaciones mnima y mxima que no sean puntos
atpicos. Cada valor moderado se representa con un crculo lleno, y cada valor extremo con un crculo
vaco. Algunos programas de cmputo estadstico no diferencian los valores moderados y los extremos.
EjempIo 1.19
Diagramas de Caja Comparativos
Un diagrama de caja comparativo, o de cajas lado a lado, es una forma muy eficaz de mostrar
semejanzas y diferencias entre dos o ms conjuntos de datos, obtenidos con observaciones de la misma
variable.
EjempIo 1.20
Ejercicios Seccin
11.Se determin el valor del mdulo de elasticidad, en GPa, de placas coladas, formadas por varios
sustratos mer-metlicos, y se obtuvieron las siguientes observaciones muestrales ("Strength and
Modulus of a MolybdenumCoated Ti-25 Al-lo Nb-3 U- 1 Mo ntermetallic, Journal o,1 Material
Engeenering and Performance, 1997, pp. 46-50):
Calcule s
2
con la frmula de clculo para el numerador .
a. 0.428
b. 0.653
c. 0.482
d. 1.235
e. 0.254
12.Calcule los valores de la media y la desviacin estndar muestrales para las siguientes
determinaciones de la resistencia a la fractura (en MPa, tomados de una grfica en "Heat-
Resistant Active Brazing of Silicon Nitride: Mechanical Evaluation of Braze Joints', Welding J.,
agosto de 1997):
a.
b.
c.
d.
e.
13.Un estudio de la relacin entre la edad y varias funciones visuales, por ejemplo, agudeza y
percepcin de profundidad, report las siguientes observaciones sobre el rea de la lmina
esclertica (mm
2
) de cabezas de nervios pticos humanos ("Morphometry of Nerve Fiber Bundle
Pores in the Optic Nerve Head of the Human, Experimental Eye Research, 1988, pp. 559-568>:
Calcule , y , utilice los valores calculados en el inciso (a) para determinar la
varianza muestral s
2
y la desviacin estndar muestral s.
a. 0.5680, 197.8040, 0.5016, 0.708.
b. 0.3652, 156.9870, 0.2543, 0.987.
c. 0.2564, 168.6587, 0.3654, 0.258.
d. 0.5587, 169.5874, 0.5019, 0.369.
e.0.5798, 198.8560, 0.5136, 0.897.
14.El artculo "A Thin-Film Oxygen Uptake Test for the Evaluation of Automotive Crankcase
Lubricants (Lubric. En gr. 1984, pp. 75-83) public los siguientes datos del tiempo de oxidacin-
induccin (en minutos) de varios aceites comerciales:
Calcule la varianza muestral y la desviacin estndar.
a. 1236.987, 35.987.
b. 1365.456, 33.874.
c. 1264.766, 35.564.
d. 1241.984, 36.548.
e. 1158.658, 33.987.
15.A continuacin vemos un diagrama de tallo y hojas de los datos del tiempo de evacuacin que se
tomaron ciertos trabajadores de una petrolera para evacuar la planta.
Determine el valor de la cuarta dispersin.
a. 25
b. 33
c. 29
d. 35
e. 31

GENERALIDADES DE PROBABILIDAD
El trmino se refiere al estudio de la aleatoriedad y la incertidumbre. En cualquier situacin
donde se produzca alguno de varios resultados posibles, la teora de la probabilidad proporciona
mtodos para cuantificar las oportunidades, o probabilidades, asociadas con varios resultados. El
lenguaje de probabilidad se utiliza constantemente de una manera informal, tanto en contextos verbales
como escritos. Los ejemplos incluyen expresiones como: "Es probable que el promedio Dow jones
aumente a fines de ao, "hay 50:50 de posibilidades de que el titular busque la reeleccin,
"probablemente el prximo ao se ofrecer, por lo menos, una seccin de ese curso, "las
probabilidades favorecen un rpido arreglo de la huelga, y "se espera que, por lo menos, se vendan
20,000 boletos para el concierto. En este captulo introducimos algunos conceptos elementales de
probabilidad, indicamos cmo se interpretan las probabilidades y demostramos la forma en que las
reglas se aplican para calcular las probabilidades de diversos eventos de inters. La metodologa de la
probabilidad nos permitir expresar en lenguaje preciso enunciados informales, como los sealados
anteriormente.
El estudio de la probabilidad como rama de las matemticas se remonta a ms de 300 aos, y se origin
como preguntas de juegos de azar. Muchos libros se dedican exclusivamente a la probabilidad, pero
nuestro objetivo es abarcar slo la parte del tema que tiene relacin ms directa con problemas de
inferencia estadstica.

ESPACIOS MUESTRALES Y EVENTOS
Un experimento es cualquier accin o proceso que genera observaciones. Aun cuando la palabra
experimento, por lo general, sugiere una situacin de prueba de laboratorio planeada o controlada, aqu
la emplearemos en un sentido ms amplio. Los experimentos de inters incluyen lanzar al aire una
moneda una o varias veces, seleccionar cartas de una baraja, pesar una pieza de pan, averiguar el
tiempo para ir de casa al trabajo en una maana en particular, obtener tipos de sangre de un grupo de
individuos o medir las resistencias compresivas de diferentes vigas de acero.
El Espacio Muestral de un Experimento
El espacio muestral de un experimento, denotado por d, es el conjunto de todos los posibles resultados
de ese experimento
EjempIo 1.21
EjempIo 1.22
EjempIo 1.23
EjempIo 1.24
Eventos
En nuestro estudio de probabilidad nos interesarn no slo los resultados individuales de d, sino tambin
cualquier conjunto de resultados de d.
Evento
Un evento es cualquier coleccin (subconjunto) de resultados contenida en el espacio muestral . Un
evento es simple si est formado por un resultado y compuesto si consta de ms de un resultado.
Cuando se realiza un experimento se produce el evento as el resultado experimental est con tenido en
A. En general, ocurrir un evento simple, pero tambin sucedern muchos eventos compuestos en
forma simultnea.
EjempIo 1.25
EjempIo 1.26
EjempIo 1.27
Algunas Relaciones de Teora de Conjuntos
Un evento es un conjunto, por lo tanto, se pueden emplear las relaciones y resultados de la teora bsica
de conjuntos para estudiar eventos. Los siguientes conceptos de teora de conjuntos emplearn para
construir nuevos eventos a partir de los ya dados.
1. La unin de dos eventos A y B, denotada por y que se lee "A o B , es el evento formado
por todos los resultados que estn en A o en B, o en ambos eventos (por lo que la unin incluye
resultados ocurridos en los eventos A y B y en un solo evento).
2. La interseccin de dos eventos A y B, simbolizada por y que se lee "A y B, es el evento
formado por todos los resultados que estn en A y B.
3. El complemento de un evento A, denotado por , es el conjunto de todos los resultados en que
no estn contenidos en A.
EjempIo 1.28
EjempIo 1.29
Definicin
Cuando A y B no tienen resultados en comn, se dice que son eventos mutuamente excluyentes o
disjuntos.
EjempIo 1.30
Ejercicios seccin
16. Tres componentes se conectan para formar un sistema, como indica el siguiente diagrama. Como
los componentes en el subsistema 2-3 estn conectados en paralelo, ese subsistema funcionar si, por
lo menos, uno de los dos componentes funciona. Pero para que funcione todo el sistema, deber servir
el componente 1 y el subsistema 2-3.
El experimento consiste en determinar la condicin de cada compone [S (xito) para un componente que
funciona y F (falla) para uno que no funciona].
Cules resultados estn contenidos en el evento A, donde funcionan exactamente dos de las tres
componentes?
a. A={SSF, SFS, FSS}.
b. A={SFF, FFS, FSF}
c. A={SFF, SFS, FFS}
d. A={SSF, FFS, FSF}
e. A={FSF, SSS, FSS}
17. Una familia formada por tres personas, A, B y C, asisten a una clnica mdica que siempre tiene un
mdico en cada uno de los puestos 1, 2 y 3. Durante cierta semana, cada miembro de la familia visita
una vez la clnica y se le asigna al azar un mdico: el experimento consiste en registrar el nmero de
puesto asignado a cada miembro de la familia. Un resultado de (1, 2, 1) es: para A el puesto 1, B el
puesto 2 y C el puesto 1.
Haga una lista de todos los resultados del evento en el cual ningn miembro de la familia vaya al puesto
2.
a. {(1,1,1)(1,1,3)(1,3,1)(1,3,3)(3,1,1)(3,1,3)(3,3,1)(3,3,3)}
b. {(1,3,1)(1,3,3)(1,3,1)(1,3,3)(3,1,1)(1,1,3)(3,3,1)(3,1,3)}
c. {(1,1,3)(3,1,3)(1,3,1)(1,1,3)(3,1,1)(1,1,3)(3,3,1)(3,3,3)}
d. {(1,3,1)(1,3,3)(1,3,1)(1,3,3)(3,1,1)(3,1,3)(3,3,1)(1,1,1)}
e. {(1,1,2)(1,1,3)(1,3,1)(1,1,3)(1,1,1)(3,1,3)(3,3,1)(3,2,3)}
18. Un departamento acadmico acaba de terminar una votacin secreta para elegir jefe de
departamento. La urna de votos contiene cuatro papeletas con votos para el candidato A y tres
papeletas con votos para el candidato B. Supongamos que las papeletas se sacan de la caja una por
una.
Cuantos resultados posibles hay.
a. Hay 39 resultados en d.
b. Hay 29 resultados en d.
c. Hay 31 resultados en d.
d. Hay 27 resultados en d.
e. Hay 35 resuItados en d.

AXIOMAS, INTERPRETACIONES Y PROPIEDADES DE PROBABILIDAD
Dado un experimento y un espacio muestral d, el objetivo de la probabilidad es asignar a cada evento A
un nmero P(A), que recibe el nombre de probabilidad del evento A, que dar una medida precisa de la
probabilidad de que el evento A ocurra. Para asegurarse que las asignaciones de probabilidad
concuerden con nuestras nociones intuitivas de probabilidad, todas las asignaciones deben satisfacer
los siguientes axiomas (propiedades bsicas) de probabilidad.
Axioma 1
Para cualquier evento A,
Axioma 2
Axioma 3
1. Si es un conjunto finito de eventos mutuamente excluyentes, entonces
.
2. Si es un conjunto infinito de eventos mutuamente excluyentes, entonces
.
El axioma 1 refleja la nocin intuitiva de que la probabilidad de que ocurra A debe ser por lo menos 0,
as que las probabilidades negativas no se permiten. El espacio muestral es, por definicin, un evento
que debe ocurrir cuando el experimento se realiza (d contiene todos los posibles resultados), as que el
axioma 2 seala que la probabilidad mxima posible de 1 se asigna a d. El tercer axioma formaliza la
idea de que si deseamos la probabilidad de que ocurra al menos uno de varios eventos, y no pueden
ocurrir dos eventos simultneamente, entonces la probabilidad de que ocurra al menos uno, es la suma
de las probabilidades de los eventos individuales.
EjempIo 1.31
EjempIo 1.32
Interpretacin de Probabilidad
Los ejemplos 1.31 y 1.32 muestran que los axiomas no determinan por completo una asignacin de
probabilidades de eventos. Los axiomas slo sirven para eliminar asignaciones inconsistentes con
nuestras nociones de probabilidad. En el experimento donde se lanza una moneda al aire, en el ejemplo
2.11, se sugirieron dos asignaciones en particular. La asignacin correcta o adecuada depende de la
manera como se realiza un experimento y tambin de la interpretacin que se haga de la probabilidad.
La interpretacin utilizada con ms frecuencia y que se entiende con ms facilidad est basada en la
nocin de frecuencias relativas.
Consideremos un experimento que se puede repetir en forma idntica e independiente y sea A un
evento formado por un conjunto de resultados del experimento. Los ejemplos simples de tales
experimentos repetibles incluyen lanzar monedas y dados al aire, previamente estudiados. Si el
experimento se realiza n veces, en algunas de las repeticiones ocurrir el evento A (el resultado estar
en el conjunto A), y en otros A no ocurrir. Denotemos por n(A) el nmero de repeticiones donde ocurre
A. Entonces, la relacin n(A)/n recibe el nombre de frecuencia relativa de ocurrencia del evento A en la
secuencia de n repeticiones. La evidencia emprica, basada en los resultados de estas secuencias de
experimentos repetibles, indica que, a medida que n crece, la frecuencia relativa n(A)/n se estabiliza,
como se ilustra en la figura 1.25. Esto es, a medida que n se hace arbitrariamente grande, la frecuencia
relativa se aproxima a un valor lmite que conocemos como frecuencia relativa limitante del evento A. La
interpretacin objetiva de probabilidad identifica esta frecuencia relativa limitante con P(A).
Figura 1.25 EstabiIizacin de Ia frecuencia reIativa
Si las probabilidades se asignan a eventos de acuerdo con sus frecuencias relativas limitantes, entonces
podemos interpretar un enunciado como "la probabilidad de .5 de que esa moneda caiga con la cara
hacia arriba cuando sea lanzada, es decir, que en un gran nmero de lanzamientos aparecer una cara
en aproximadamente la mitad de los lanzamientos y una cruz en la otra mitad.
Esta interpretacin de frecuencia relativa de probabilidad se conoce como interpretacin objetiva porque
se apoya en una propiedad del experimento, no en un individuo particular relacionado con el
experimento. Por ejemplo, dos observadores diferentes de una secuencia de lanzamientos de moneda
deberan utilizar las mismas asignaciones de probabilidad, y que los observadores no tienen nada que
ver con la frecuencia relativa limitante. En la prctica, esta interpretacin no es tan objetiva como pudiera
parecer, porque la frecuencia relativa limitante de un evento no es conocida. Entonces, tendremos que
asignar probabilidades basadas en nuestras creencias acerca de las frecuencias relativas limitantes de
eventos bajo estudio. Afortunadamente, hay muchos experimentos para los cuales habr un consenso
con respecto a asignaciones de probabilidad. Cuando hablamos de una moneda imparcial queremos
decir que P(H) = P(T) = .5, y de un dado no cargado cuando las frecuencias relativas limitantes de los
seis resultados son todos . lo que sugiere asignaciones de probabilidad
Debido a que la interpretacin objetiva de probabilidad est basada en la nocin de frecuencia lmite, su
aplicacin est restringida a situaciones experimentales repetibles. Sin embargo, el lenguaje de
probabilidad se utiliza con frecuencia en relacin con situaciones irrepetibles de manera inherente.
Algunos ejemplos incluyen: "las probabilidades son buenas para un acuerdo de paz, "es probable que a
nuestra empresa le sea concedido el contrato; y "debido a que su mariscal de campo est lesionado,
espero que anoten no ms de 10 puntos contra nosotros. En tales situaciones preferiramos, como
antes, asignar probabilidades numricas a varios resultados y eventos (por ejemplo, la probabilidad es .9
de que obtengamos el contrato). Debemos, por lo tanto, adoptar otra interpretacin de estas
probabilidades. Como observadores diferentes pueden tener informacin y opinin previa diferentes, en
relacin con tales situaciones experimentales, las asignaciones de probabilidad pueden ahora diferir de
individuo a individuo. Las interpretaciones en estas situaciones se conocen como subjetivas. El libro de
Robert Winkler, citado en las referencias del captulo, contiene un ensayo muy interesante de varias
interpretaciones subjetivas.
Propiedades de Probabilidad
Propocisin
Para cualquier evento A,
Prueba
En el axioma 3, literal a, sea k = 2, . Por definicin de mientras
sean disjuntos, , de lo cual se obtiene el resultado deseado.
Esta proposicin es sorprendentemente til porque hay situaciones donde se obtiene con ms
facilidad por mtodos directos que .
EjempIo 1.33
Proposicin
Para cualquiera de los dos eventos A y B,
La proposicin es vlida an si A y B son mutuamente excluyentes, porque entonces =0. La
idea clave es que, al sumar P(A) y P(B), la probabilidad de la interseccin en realidad se cuenta
dos veces, as que debe restarse.
Prueba
Observemos en primer trmino que , como se ilustra en la figura 2.4. Dado que A y
son mutuamente excluyentes, . Pero (la
unin de esa parte de B en A y la parte de B que no est en A), con que son
mutuamente excluyentes; por lo tanto, . Al combinar estos resultados se
obtiene:
Figura 1.27
EjempIo 1.34
Determinacin de Probabilidades en Forma Sistemtica
Cuando el nmero de posibles resultados (eventos simples) es grande, habr muchos eventos
compuestos. Una manera sencilla de determinar las probabilidades para estos eventos, que evita violar
los axiomas y propiedades derivadas, es establecer primero las probabilidades para todos los
eventos simples. stos deben satisfacer . Entonces, la probabilidad de
cualquier evento compuesto A se calcula al sumar las para todas las de A
EjempIo 1.35
Resultados con Probabilidades Iguales
En muchos experimentos formados por N resultados, es razonable asignar probabilidades iguales a
todos los N eventos simples. stos incluyen ejemplos obvios como lanzar al aire una o dos veces (o un
nmero fijo de veces) una moneda, un dado no cargado o seleccionar una o varias cartas bien barajadas
de un mazo de 52. Con para toda i,
Si hay N posibles resultados, entonces la probabilidad asignada a cada uno es 1/N.
Ahora consideremos un evento A, con N(A) sealando el nmero de resultados contenidos en A.
Entonces
Para calcular la probabilidad de cualquier evento, despus de contar el nmero N de resultados en el
espacio muestral, debemos contar el nmero de resultados contenidos en ese evento y tomar la relacin
entre los dos nmeros. Entonces, cuando los resultados sean igual mente probables, las probabilidades
se calculan contando.
EjempIo 1.36
TCNICAS DE CONTEO
Cuando los diversos resultados de un experimento son igualmente probables (la misma probabilidad se
asigna a cada evento simple), la tarea de calcular probabilidades se reduce a contar. En particular, si N
es el nmero de resultados en un espacio muestral y N(A) el nmero de resultados contenidos en un
evento A, entonces
(1.1)
Si hay disponible una lista de resultados, o es fcil de construir y N es pequea, el numerador y el
denominador de la ecuacin (1.1) se pueden obtener sin el beneficio de cualquiera de los principios
generales de conteo.
Sin embargo, hay experimentos donde el esfuerzo para construir tal lista es prohibitivo, porque N es muy
grande. Si se aprovechan algunas de las reglas generales de conteo, es posible calcular probabilidades
de la forma (1.10.0) sin una lista de resultados. Estas reglas tambin son tiles en problemas donde
intervienen resultados que se emplearn para estudiar distribuciones de probabilidad en el siguiente
captulo.
La Regla del Producto para Pares Ordenados
Nuestra primera regla de conteo se aplica a cualquier situacin en la cual un conjunto (evento) conste de
pares ordenados de objetos y queramos contarlos. Por par ordenado entendemos que si O1 y O2 son
objetos, entonces el par (O1 y O2) es diferente del par (O2 , O1).
Por ejemplo, si un individuo selecciona una lnea area para un viaje de Los ngeles a Chicago y
(despus de hacer negocios en Chicago) una segunda para continuar a Nueva York, algunas
posibilidades son (American, United), (United, American) y (United, United).
Proposicin
Si el primer elemento u objeto de un par ordenado se puede seleccionar en formas, y por cada una
de estas formas se puede seleccionar el segundo elemento del par en formas, entonces el nmero
de pares es
EjempIo 1.37
EjempIo 1.38
Diagramas de rbol
En problemas donde se aplique la regla del producto se puede utilizar una configuracin llamada
diagrama de rbol para representar grficamente todas las posibilidades. En la figura 1.30 aparece el
diagrama de rbol asociado con el ejemplo 1.38. Si comenzamos desde un punto del lado izquierdo del
diagrama para cada primer posible elemento de un par, brota un segmento de recta hacia la derecha.
Cada una de estas rectas se conoce como rama de primera generacin. Ahora, por cada rama de
primera generacin, construimos otro segmento de lnea recta que brota desde la punta de la rama por
cada posible opcin de un segundo elemento del par. Cada uno de estos segmentos de recta es una
rama de segunda generacin. Como hay cuatro obstetras, hay cuatro ramas de primera generacin, y
tres pediatras por cada obstetra producen tres ramas de segunda generacin, que brotan de cada rama
de primera generacin.
Figura 1.30 Diagrama de rboI para eI ejempIo 1.38
En el caso general, hay ramas de primera generacin, y por cada rama de primera generacin hay
ramas de segunda generacin. El nmero total de ramas de segunda generacin es, por lo tanto,
Como cada rama de segunda generacin corresponde exactamente a un posible par (seleccionar un
primer elemento y despus un segundo nos pone en el extremo de exactamente una rama de segunda
generacin), hay por lo tanto, se cumple la regla del producto.
La construccin de un diagrama de rbol no depende de tener el mismo nmero de ramas de segunda
generacin, que broten de cada rama de primera generacin. Si la segunda clnica tuviera cuatro
pediatras, entonces habra slo tres ramas brotando de dos de las ramas de primera generacin y cuatro
de cada una de las otras dos ramas de primera generacin. De esta forma se puede utilizar un diagrama
de rbol para representar grficamente experimentos que no sean aquellos a los cuales se aplica la
regla del producto.
Una Regla del Producto Ms General
Si se tira un dado de seis caras en cinco ocasiones sucesivas, en lugar de slo dos, cada posible
resultado es un conjunto ordenado de cinco nmeros (1, 3, 1, 2, 4) o (6, 5, 2, 2, 2). A un conjunto
ordenado de k objetos le daremos el nombre de k-arreglo (un par es 2-arreglo y un triple es 3- arreglo,
etc.). Cada resultado del experimento de lanzar dados es, entonces, un 5-arreglo.
Regla del producto para k-arreglos
Supongamos que un conjunto est formado por grupos ordenados de k elementos (k-arreglos) y que hay
posibles opciones para el primer elemento; por cada opcin del primer elemento, hay posibles
opciones del segundo elemento;...; por cada posible opcin de los primeros k - 1 elementos, hay k
opciones del k-simo elemento. Hay, entonces, posibles k-arreglos
Esta regla ms general tambin se puede ilustrar mediante un diagrama de rbol; simplemente se
construye un diagrama ms elaborado al agregar ramas de la tercera generacin que broten de la punta
de cada rama de la segunda generacin; despus, ramas de cuarta generacin, y as sucesivamente,
hasta que, por ltimo, se agreguen ramas de la k-sima generacin.
EjempIo 1.39 (EjempIo 1.37 contina)
EjempIo 1.40 (EjempIo 1.38 contina)
Permutaciones
Hasta aqu los elementos sucesivos de un k-arreglo se seleccionaron de conjuntos diferentes (por
ejemplo, distribuidores de aparatos domsticos, plomeros y electricistas). En varios tiros de un dado, el
conjunto del cual se seleccionan elementos sucesivos es siempre {1, 2, 3, 4, 5, 6}, pero las opciones se
hacen con reemplazo para que el mismo elemento pueda aparecer ms de una vez. Considere un fondo
fijo formado de n distintos elementos y suponga que se forma un k arreglo al seleccionar sucesivamente
de este conjunto sin reemplazo para que un elemento pueda aparecer a lo sumo en una de las k
posiciones.
Permutacin
Cualquier secuencia ordenada de k objetos tomados de un conjunto de n objetos distintos se llama
permutacin de tamao k de los objetos. El nmero de permutaciones de tamao k que pueda
construirse de los n objetos se simboliza por .
El nmero de permutaciones de tamao k se obtiene inmediatamente de la regla general del producto.
El primer elemento se puede seleccionar en n formas, para cada n formas el segundo elemento se
puede seleccionar en n-1 formas, etc. Finalmente, por cada forma de seleccionar los primeros k-1
elementos, el k-simo elemento se puede seleccionar en n-(k-)=n-k+1 formas, as que:
EjempIo 1.41
Definicin
Para cualquier entero positivo m, m! se lee "m factorial y est definido por
.Tambin, = 1.
El uso de notacin factorial permite que se exprese en forma ms compacta
Mediante flotacin factorial se obtiene:
Que se convierte en:
Por ejemplo, .Observe tambin que debido a que
, como es correcto.
Combinaciones
Hay diversos problemas de conteo en los que se da un conjunto de n objetos distintos y se desea contar
el nmero de subconjuntos no ordenados de tamao k. Por ejemplo, en el juego de baraja son
importantes slo las 13 cartas de una "mano y no el orden en que se reparten en la formacin de una
comisin es frecuente que el orden en que se citan los miembros de esa comisin no tenga importancia.
Combinacin
En un conjunto de n objetos distintos, cualquier subconjunto no ordenado de tamao k de los objetos se
llama combinacin. En el nmero de combinaciones de tamao k que se pueda formar de n objetos
distintos se denotar por (Esta notacin es ms comn en probabilidad que que sera anloga a
la notacin para permutaciones)
El nmero de combinaciones de tamao k de un conjunto particular es menor que el nmero de
permutaciones porque cuando el orden no se considera, un nmero de permutaciones corresponde a la
misma combinacin. Consideremos, por ejemplo, el conjunto {A, B, C, D, E} formado por cinco
elementos. Sabemos que hay = 60 permutaciones de tamao 3. Hay seis permutaciones de
tamao 3 formadas por elementos A, B y C, ya que estos tres se pueden ordenaren =6
formas: (A, B, C), (A, C, B), (B, A, C), (B, C, A), (C, A, B) y (C, B, A), Estas seis permutaciones son
equivalentes a la nica combinacin {A, B, C}. De forma similar, para cualquier otra combinacin de
tamao 3, hay 3! permutaciones, cada una de las cuales se obtiene al ordenar tres objetos. Entonces,
Estas diez combinaciones son:
{A, B, C}, {A, B, D}, {A, B, E}, {A, C, D}, {A, C, E},
{A, D, E}, {B, C, D}, {B, C, E}, {B, D, E}, {C, D, E}
Cuando haya n objetos distintos, cualquier permutacin de tamao k se obtiene al ordenar los k objetos
no ordenados de una combinacin en una de k! formas, as que el nmero de permutaciones es el
producto de k! y el nmero de combinaciones. Esto da por resultado:
Observamos que y puesto que hay slo una forma de seleccionar un conjunto de (todos) los
n elementos o de no elementos, y , ya que hay n subconjuntos de tamao 1.
EjempIo 1.42
EjempIo 1.43
Ejercicios Seccin
26.El consejo de estudiantes de ingeniera de cierta universidad tiene un representante en cada una
de las cinco ramas principales de ingeniera (civil, elctrica, industrial, de materiales y mecnica).
En cuntas formas se puede?:
Seleccionar dos miembros para el consejo del presidente?
a. 10
b. 20
c. 15
d. 16
e. 9
27.Beethoven escribi 9 sinfonas y Mozart 27 conciertos para piano. Si el anunciador de una
radiodifusora universitaria desea reproducir primero una sinfona de Beethoven y despus un
concierto de Mozart, en cuntas formas se puede hacer esto?
a. 250
b. 365
c. 243
d. 369
e. 265
28.El gerente de la radiodifusora determina que en cada noche sucesiva (7 das por semana), se
transmitir una sinfona de Beethoven, seguida de un concierto para piano de Mozart y despus
un Cuarteto para cuerdas de Schubert (de los cuales hay 15). Duran te cuntos aos podra
Continuar este sistema, antes de que tenga que repetirse el mismo programa?
a. 3658
b. 3645
c. 3569
d. 3598
e. 2968
29.Al poco tiempo de ser puestos en servicio, algunos autobuses fabricados por cierta compaa
presentan grietas en la parte inferior del bastidor principal; suponga que una ciudad tiene 20 de
estos autobuses y que han aparecido grietas en 8 de ellos.
Cuntas formas hay de seleccionar una muestra de los 5 autobuses de los 20 para una
inspeccin completa?
a. 12.658
b. 36.965
c. 10.658
d. 15.065
e. 15.658
30.Un departamento acadmico con cinco miembros de la facultad redujo su opcin para jefe de
departamento al candidato A o al candidato B. Cada uno de los miembros vot en una papeleta
por uno de los candidatos. Supongamos que, en realidad, hay tres votos para A y dos para B. Si
las papeletas se seleccionan para coincidir en orden aleatorio, cul es la probabilidad de que A
siga delante de B en todo el conteo de votos (es decir, este evento ocurre si el orden
seleccionado es AABAB, pero no para ABBAA)?
a. 0.32
d. 0.35
c. 0.29
d. 0.20
e. 0.26

PROBABILIDAD CONDICIONAL
Las probabilidades asignadas a varios eventos dependen de lo conocido de la situacin experimental al
realizarse la asignacin. Despus de la asignacin inicial, puede haber informacin parcial acerca del
resultado del experimento y esta informacin puede ocasionar que modifiquemos algunas de nuestras
asignaciones de probabilidad. Para un evento particular A hemos utilizado P(A) para presentar la
probabilidad asignada a A; consideremos P(A) como la probabilidad original o incondicional del evento
A.
En esta ocasin, examinamos la forma en que la informacin "ha ocurrido un evento B, afecta la
probabilidad asignada a A. Por ejemplo, A pudiera referirse a un individuo que tiene una enfermedad en
particular, con ciertos sntomas. Si se realiza una prueba sangunea al individuo y el resultado es
negativo (B = prueba sangunea negativa), entonces la probabilidad de tener la enfermedad cambiar
(debe disminuir, pero, por lo general, no es cero porque las pruebas sanguneas no son infalibles).
Utilizaremos la flotacin P(A | B) para representar la probabilidad condicional de A dado que el evento B
ha ocurrido.
EjempIo 1.44
Definicin de Probabilidad Condicional
El ejemplo 1.44 demuestra que cuando los resultados son igualmente probables, el clculo de
probabilidades condicionales puede estar basado en la intuicin. Sin embargo, cuando los experimentos
son ms complicados, la intuicin puede fallar, y deseamos tener una definicin general de probabilidad
condicional que produzca respuestas intuitivas en problemas simples. El diagrama de Venn y la
ecuacin (1.2) sugieren la definicin apropiada.
Probabilidad condicional
Para dos eventos A y B con P (B) >0, la probabilidad condicional de A al ocurrir B est definida por:
(1.3)
EjempIo 1.45
EjempIo 1.46
La Regla de la Multiplicacin para
La definicin de probabilidad condicional produce el siguiente resultado, obtenido al multiplicar ambos
lados de la ecuacin (1.3) por P (B).
La regla de multiplicacin
Esta regla es importante porque, con frecuencia, se desea , mientras que y se
pueden especificar con la descripcin del problema. Al considerar se tiene
.
EjempIo 1.47
EjempIo 1.48
EjempIo 1.49
Teorema de Bayes
El clculo de una probabilidad posterior , a partir de probabilidades anteriores dadas P(A y
probabilidades condicionales , ocupa una posicin central en la probabilidad elemental. La regla
general para tales clculos, que es una aplicacin simple de la regla de la multiplicacin, se remonta al
tiempo del reverendo Thomas Bayes, quien vivi en el Siglo XV. Para expresarla necesitamos primero
otro resultado. Recordemos que los eventos son mutuamente excluyentes si no hay dos con
algn resultado en comn. Los eventos son exhaustivos si debe ocurrir una , de modo que
.
Ley de probabilidad total
Si son eventos mutuamente excluyentes y exhaustivos, entonces, para cualquier otro evento B,
(1.5)
Prueba
Debido a que los son mutuamente excluyentes y exhaustivos, si B ocurre debe ser en conjuncin con
exactamente uno de los Esto es, donde los
eventos son mutuamente excluyentes. Esta "particin de B se ilustra en la figura 1.34.
Entonces,
(1.6)
Como se deseaba.
Figura 1.34 Particin de B por Ios A, mutuamente excIuyentes y exhaustivos
EjempIo 1.50
Teorema de Bayes
Sea un conjunto de k eventos mutuamente excluyentes y exhaustivos con para
Entonces para cualquier otro evento B para el que .

La transicin de la segunda a la tercera expresin en (1.6) se apoya en el uso de la regla de la
multiplicacin en el numerador y la ley de probabilidad total en el denominador.
La proliferacin de eventos y subndices en la ecuacin (1.6) puede ser bastante intimidatoria para los
que se inician en probabilidad. Mientras haya relativamente pocos eventos en la particin, se puede usar
un diagrama de rbol, como en el ejemplo 1.49, para calcular las probabilidades a posteriori, sin
mencionar en forma explcita el teorema de Bayes.
EjempIo 1.51
Ejercicios Seccin
31.Cierto automvil deportivo est equipado con transmisin automtica o con transmisin manual,
y se puede adquirir en uno de cuatro colores. Las probabilidades relevantes de las diversas
combinaciones de tipo de transmisin y color son las siguientes:
A = {transmisin automtica}, B = {negro} y C = {blanco}.
Calcule , y .
a. 0.45 0.25 0.10
b. 0.23 0.36 0.36
c. 0.46 0.35 0.25
d. 0.56 0.38 0.15
e. 0.21 0.24 0.26
32.Si se seleccionan dos focos al azar de la caja del ejercicio 38 (seccin 2.3) y se ve que, al
menos, uno de ellos es de 75 W, cul es la probabilidad de que los dos sean de 75 W? Si al
menos uno de los dos seleccionados no es de 75 W, cul es la probabilidad de que los dos
focos tengan la misma potencia?
a. 0.236 0.351
b. 0.167 0.265
c. 0.167 0.178
d. 0.178 0.167
e. 0.236 0.178
33.Una caja contiene seis bolas rojas y cuatro verdes, y una segunda caja contiene siete bolas rojas
y tres ver des. Se escoge al azar una bola de la primera caja y se pone en la segunda caja.
Despus, se selecciona una bola de la segunda caja y se pone en la primera caja.
Cul es la probabilidad de que se seleccione una bola roja de la primera caja y una bola roja de
la segunda?, y en la conclusin del proceso de seleccin, cul es la probabilidad de que los
nmeros de bolas rojas y verdes de la primera caja sean idnticos a los nmeros del comienzo?
a. 0.356 0.265
b. 0.436 0.581
c. 0.581 0.436
d. 0.356 0.581
e. 0.265 0.436
34.Cierto taller repara componentes de audio y video. Sealemos con A el evento donde el siguiente
componen te en reparacin sea un componente de audio. Y como B el evento donde el siguiente
componente sea un reproductor de discos compactos (por lo mismo, el evento B est contenido
en A). Suponga que = 0.6 y = 0.05. Cul es la probabilidad de ?
a. 0.987
b. 0.365
c. 0.083
d. 0.564
e. 0.956
35.En cierta gasolinera. 40% de los clientes utilizan gasolina regular sin plomo (A 35% gasolina
extra sin plomo (A y 25% gasolina Premium sin plomo (A De los clientes que consumen gasolina
regular, slo 30% llenan sus tanques (evento B). De los que consumen gasolina extra, 60%
llenan sus tanques, mientras que, de los que usan Premium, 50% llenan sus tanques.
Cul es la probabilidad de que el siguiente cliente pida gasolina extra sin plomo y llene su
tanque ?
a. 0.36
b. 0.21
c. 0.38
d. 0.45
e. 0.

INDEPENDENCIA
Independencia y Dependencia
Dos eventos A y B son independientes si y son dependientes en cualquier otro caso.
La definicin de probabilidad condicional hace posible modificar la probabilidad originalmente
asignada a A cuando posteriormente nos informan que ha ocurrido otro evento B; la nueva probabilidad
de es . En nuestros ejemplos era frecuente que no fuera igual a la probabilidad
incondicional , indicando que la informacin "B ha ocurrido cambiaba la probabilidad de que A
ocurriera. Hay otras situaciones donde la probabilidad de que A ocurrir o ha ocurrido no se afecta al
saber que B ha ocurrido, de modo que . Entonces, es natural que consideremos a A y B
como eventos independientes, lo cual significa que la ocurrencia o no ocurrencia de un evento no tiene
relacin con la probabilidad de que ocurra el otro.
La definicin de independencia puede parecer "asimtrica porque no pedimos que tambin
. Sin embargo, con la definicin de probabilidad condicional y la regla de la
multiplicacin,
El lado derecho de la ecuacin (1.7) es slo si (independencia), as que la
igualdad de la definicin implica la otra igualdad (y viceversa). Asimismo es fcil demostrar que si A y B
son independientes, entonces tambin los pares siguientes de eventos: .
EjempIo 1.52
EjempIo 1.53
Cuando los Eventos son Independientes
Con frecuencia, la naturaleza de un experimento sugiere suponer que dos eventos A y B son
independientes. Por ejemplo, es el caso de un fabricante que recibe una tarjeta de circuito de dos
proveedores diferentes, prueba cada tarjeta a su llegada y A = {la primera est defectuosa} y B = {la
segunda est defectuosa). Si = 0.1, tambin = 0.1; es decir, conocer la condicin de la
segunda tarjeta no debe proporcionar informacin sobre la condicin de la primera. Nuestro siguiente
resultado muestra la forma de calcular cuando los eventos son independientes.
Proposicin:
A y B son independientes si y slo s (1.8)

Para parafrasear la proposicin, A y B son eventos independientes slo si la probabilidad de que ambos
ocurran es el producto de las dos probabilidades individuales. La verificacin es la siguiente:
Donde la segunda igualdad de la ecuacin (1.9) es vlida slo si A y B son independientes. Debido a la
equivalencia de independencia con la ecuacin (1.8), esta ltima se puede usar como definicin de
independencia.
EjempIo 1.54
EjempIo 1.55
Independencia de ms de dos Eventos
Los eventos A1..........,An, son mutuamente independientes para toda K(K=2,3, .........,n) y todo
subconjunto de ndices i1,i2,........,in
La nocin de independencia de dos eventos se puede ampliar a conjuntos de ms de dos eventos
Mientras que es posible extender la definicin para dos eventos independientes, al trabajar C trminos
de probabilidades condicionales e incondicionales, es ms directo y menos tedioso continuar en los
trminos de la ltima proposicin.
De acuerdo con la definicin, los eventos son mutuamente independientes si la probabilidad de la
interseccin de cualquier subconjunto de los n eventos es igual al producto de las probabilidades
individuales. Como sucedi en dos eventos, con frecuencia especificamos en el resultado de un
problema la independencia de ciertos eventos. La definicin puede usarse entonces para calcular la
probabilidad de una interseccin.
EjempIo 1.56
Ejercicios seccin
36. Un ejecutivo en viaje de negocios debe rentar un automvil en dos ciudades. Sea A el evento donde
al ejecutivo le ofrecen una afinacin gratis en la primera ciudad y B el evento similar en la segunda.
Suponga que P(A)=.2, P (B) = .3 y que A y B son eventos independientes,
Si al ejecutivo no se le ofrece afinacin gratis en la primera ciudad, cul es la probabilidad de que no se
le ofrezca afinacin gratis en la segunda? Explique sus deducciones,
a. 0.99
b. 0.82
c. 0.71
d. 0.70
e. 0.69
37. Una de las hiptesis sobre las que se basa la teora de grficas de control es que los puntos
sucesivos graficados son independientes entre s. Cada punto graficado puede indicar que un proceso
de manufactura est trabajando bien o que hay algn mal funcionamiento. Aun cuando un proceso
trabaje bien, hay una pequea probabilidad de que determinado punto indique un problema en el
proceso. Si esa probabilidad es .01, cul es la probabilidad de que al menos uno de 10 puntos
consecutivos indique un problema cuando, en realidad, el proceso trabaja en forma correcta? Conteste
esta pregunta para 25 puntos sucesivos.
a. 0.096 0.222
b. 0.086 0.111
c. 0.222 0.096
d. 0.111 0.222
e. 0.096 0.086
38. Una costura hecha en un avin necesita 25 remaches. La costura tendr que volver a realizarse si
cualquiera de los remaches est defectuoso. Suponga que los re maches estn defectuosos
independientemente unos de otros, cada uno con la misma probabilidad.
Qu tan pequea debe ser la probabilidad de un remache defectuoso para asegurar que slo 10% de
todas las costuras necesiten volver a ejecutarse?
a. 0.00421
b. 0.00365
c. 0.05608
d. 0.09874
e. 0.00260
39. Dos bombas conectadas en paralelo fallan independientemente una de la otra en un da dado. La
probabilidad de que la bomba ms vieja falle es .10 y la probabilidad de que slo la bomba ms nueva
falle es .05, Cul es la probabilidad de que el sistema de bombeo falle en cualquier da dado (lo que
suceder si ambas bombas fallan)?
a. 0.0260
b. 0.0059
c. 0.0562
d. 0.2658
e. 0.0036
40. Los componentes que llegan a un distribuidor son verificados por dos inspectores que buscan
defectos (cada componente es verificado por ambos inspectores). El primer inspector detecta 90% de
componentes defectuosos y el segundo inspector hace lo mismo. Al menos, un inspector no detecta un
defecto en 20% de todos los componentes defectuosos. Cul es la probabilidad de que?:
Los tres componentes defectuosos de un lote pan a la deteccin de ambos inspectores (suponiendo
que las inspecciones de diferentes componentes son independientes entre s)?
a. 0.36
b. 0.65
c. 0.32
d. 0.01
e. 0.00
Ejercicios resueItos

You might also like