You are on page 1of 502

Recursos para el

Aprendizaje Efectivo de la
ESTADSTICA
RAEEP
Lic. Gabriel Leandro, MBA

Ms de 1000 ejercicios resueltos y ms de 2000 diapositivas,


Videos y materiales interactivos
Es como tener al profesor disponible 24 horas al da

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
2

Tabla de contenidos
Captulo 1 11
Introduccin a la estadstica 11
Estadstica 12
Estadstica descriptiva e inferencia estadstica 12
Importancia del anlisis de la informacin estadstica 13
Funciones de la estadstica 14
Conceptos bsicos de estadstica descriptiva 15
Fases de una investigacin estadstica 23
Fuentes de informacin o conocimiento 24
Mtodos e instrumentos de recoleccin de informacin 25
Escalas de medida 29
Ejercicios 33

Captulo 2 44
Presentacin de la informacin estadstica 44
Presentacin de los datos 45
Presentacin textual 45
Cuadros estadsticos 46
Construccin de cuadros 46
Representacin grfica 49
Construccin de grficos 49
Clases de grficos 51
Ejercicios 67

Captulo 3 78
Anlisis descriptivo de la informacin estadstica 78
Anlisis descriptivo de la informacin 79
Medidas de posicin 79
Medidas de posicin central 79
Cuantilos 97
Medidas de variabilidad 114
Rango o amplitud total 115
Varianza y la desviacin estndar 116
Medidas de variabilidad relativa: El coeficiente de variacin 126
Ejercicios 133

Captulo 4 148
Distribuciones de frecuencias 148
Necesidad de resumir la informacin 149
Construccin de distribuciones de frecuencias 150
Grficos de las distribuciones de frecuencias: 155
Clculo de medidas de posicin y variabilidad en distribuciones de frecuencias 159
Ejercicios 169

Captulo 5 177
Introduccin a las probabilidad 177
Probabilidad 178
Conteo 179

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
3

Definicin clsica de probabilidad 185


Frecuencia relativa como probabilidad 186
Concepto intuitivo o subjetivo de probabilidad 187
Axiomas y teoremas de probabilidad 187
Probabilidad condicional 192
Teorema de Bayes 195
Ejercicios 198

Captulo 6 209
Distribuciones de probabilidad de variable discreta 209
Distribuciones de probabilidad 210
Media y varianza de una distribucin de probabilidad 212
Distribucin binomial 215
Distribucin hipergeomtrica 223
Distribucin de Poisson 230
Aproximacin de la distribucin de Poisson a la binomial 235
Distribucin multinomial 237
Distribucin geomtrica 239
Ejercicios 244

Captulo 7 258
Distribuciones de probabilidad de variable continua 258
Distribuciones continuas de probabilidad 259
Distribucin normal 259
Aproximacin de la distribucin normal a la binomial 276
Distribucin exponencial 280
Ejercicios 286

Captulo 8 295
Estimacin por intervalos 295
Inferencia estadstica 296
Distribucin muestral de la media si es conocida 296
Teorema del lmite central 300
Distribucin muestral de la media con desconocida (distribucin t de Student) 301
Inferencia para la media 302
Intervalos de confianza para la media y error mximo de la estimacin 303
Inferencia para proporciones 314
Ejercicios 318

Captulo 9 329
Muestreo 329
Introduccin 330
Necesidad de trabajar con muestras 332
Muestreo estadstico y no estadstico 334
Errores de muestreo y sesgos 334
Determinacin del tamao de muestra para estimar la media poblacional 335
Determinantes del tamao de la muestra 336
Clculo del tamao de la muestra 337
Determinacin del tamao de muestra para estimar la proporcin poblacional 342
Clculo del tamao de la muestra 343

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
4

Tcnicas de muestreo 346


Ejercicios 358

Captulo 10 370
Pruebas de hiptesis 370
Inferencia mediante pruebas de hiptesis 371
Procedimiento para pruebas de hiptesis sobre la media 377
Prueba de hiptesis con muestras pequeas 380
Prueba de hiptesis para la proporcin poblacional 382
Uso de Minitab para realizar la prueba de hiptesis y uso del valor P 384
Intervalos de confianza y prueba de hiptesis 388
Ejercicios 390

Captulo 11 404
Pruebas de hiptesis para la diferencia de dos medias poblacionales 404
Diferencia entre medias en poblaciones independientes 405
Diferencias entre medias (muestras pequeas) 411
Observaciones pareadas 416
Pruebas para la diferencia de dos proporciones: 421
Ejercicios 426

Captulo 12 441
Correlacin lineal y regresin lineal simple 441
Asociacin estadstica entre dos variables 442
Correlacin lineal 443
Correlaciones espurias y causalidad 457
Regresin lineal simple 458
Bondad de ajuste: el coeficiente de determinacin 465
Interpolacin y extrapolacin 466
Ejercicios 468

Tablas y frmulas 488


Apndice 1: Frmulas de estadstica descriptiva 489
Apndice 2: Frmulas de probabilidad: 491
Apndice 3: Frmulas de distribuciones de probabilidad: 492
Apndice 4: Frmulas de inferencia estadstica 493
Apndice 5: Frmulas de regresin y correlacin 494
Apndice 6: Distribucin normal estndar acumulada 495
Apndice 7: Distribucin T de Student 496
Apndice 8: Percentiles de la distribucin ChiCuadrado 497
Apndice 9: Valores de F con probabilidad de 5% 498
Apndice 10: Tabla de nmeros aleatorios 499

Indice 500

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
5

Prefacio
Hay muchos factores que influyen en el desempeo de un estudiante en un curso de
estadstica. Entre ellos estn la clara exposicin de los conceptos por parte del profesor, la
motivacin y empeo por parte del estudiante, los conocimientos previos del alumno,
materiales apropiados para el curso, etc. Este texto y todos los materiales digitales que lo
acompaan han sido diseados para ayudar al estudiante y al profesor en todos estos aspectos,
pues provee al profesor de materiales que puede emplear en su clase para exponer los
conceptos con claridad, presenta al estudiante materiales con ejercicios paso a paso,
aplicaciones y amplio uso de la tecnologa, de modo que pueda sentirse ms motivado al
disponer de recursos para adquirir los distintos conceptos y procedimientos, a la vez que se le
ofrece gran cantidad de ejercicios resueltos, presentaciones interactivas, videos, entre otras
ventajas.

Caractersticas didcticas
A lo largo del texto las definiciones se presentan en recuadros de modo que el estudiante
pueda efectuar un repaso posterior de estos conceptos, los cuales son de gran importancia para
comprender los ejercicios e interpretar los resultados obtenidos.

Adicionalmente cada tema incluye gran cantidad de ejemplos. Los ejemplos en el texto
impreso se presentan en cuadros que incluyen primero el planteamiento del ejercicio y su
solucin explicada paso a paso.

Luego de los ejemplos se incluye un ejercicio de revisin, que es similar al ejemplo. La


finalidad es que el estudiante pueda efectuar ese ejercicio luego de leer y realizar por cuenta
propia el ejemplo. Las soluciones de los ejercicios de revisin se proveen en la pgina de
internet del texto www.auladeeconomia.com/raeep.html.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
6

Al final de cada captulo se proveen muchos ejercicios. Estos ejercicios se dividen en dos
bloques. Los primeros son ejercicios de desarrollo. Los segundos son ejercicios se seleccin
nica y se les llama examen del captulo. Las soluciones de estos ejercicios se proveen a
travs de la pgina de internet del texto.

Ejercicios: Examen del captulo:


1. Se tiene un grupo de n libros. El nmero de diferentes rdenes posibles de los n libros e
Ejercicios de desarrollo: una mesa no equivale a:
( a ) P(n, n) ( b ) n!
( c ) C(n,
1. A continuacin se presenta una lista de variables obtenidas en distintas n)
investigaciones, ( d ) Ninguna de las anteriores
en cada caso indique cul tipo de grfico debera efectuarse para representar en forma
2. Suponga que los n libros se van a conformar en grupos de 3 libros (n > 3). El nmero d
adecuada los datos: diferentes grupos con distinto orden, equivale a:
a. Tiempo medio de espera de los pacientes de un hospital en el( aservicio
) P(n, 3)de consulta ( b ) n! / 3!
externa obtenido mes a mes durante un ao. ( c ) C(n, 3) ( d ) P(n, n 3)

Por otro lado, cabe destacar que Recursos para el Aprendizaje Efectivo de la Estadstica y la
Probabilidad es en realidad ms que solo un libro, pues se compone de una gran cantidad de
recursos en lnea de gran utilidad tanto para el estudiante como para el profesor.

Con la factura de compra del texto cada lector podr recibir una contrasea de ingreso a la
pgina del texto www.auladeeconomia.com/raeep.html y as acceder a una gran cantidad de

Ms de 2000 diapositivas que puede ser presentadas por el profesor para impartir su
clase, o bien, empleados por el estudiante para repasar posteriormente.
Videos que explican los conceptos y que exponen el uso del software.
Ejercicios interactivos. El texto y las diapositivas contienen ms de mil ejercicios con
sus soluciones

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
7

Uso de software Excel y Minitab y uso de la calculadora. El uso de la tecnologa es


fundamental en el procesamiento, presentacin y anlisis de datos y por eso se le concede
gran importancia en el texto.
Adems se incluye una gran coleccin de otros recursos disponibles en la web, tales
como links a pginas con bases de datos, simulaciones (applets), calculadoras de
probabilidades y medidas estadsticas, entre otros recursos disponibles en internet.

El lector debe escribir a info@auladeeconomia.com y as recibir una contrasea para acceder


a los recursos completos.

A lo largo del texto se incluyen cuadros que indican algunos de los principales recursos
audiovisuales que pueden ser empleados por estudiantes y profesores.

En la pgina los temas estn agrupados de modo similar al que se emplea en el texto, tal como
se muestra en la imagen, donde se pueden elegir los diferentes recursos.

Adicionalmente, en cada captulo se presenta uno o varios cuadros de Aplicacin, los cuales
consisten en algunos ejemplos de aplicaciones de la estadstica en distintos mbitos, como las
ciencias econmicas, la ingeniera, las ciencias sociales y las ciencias de la salud, entre otras
reas del conocimiento humano.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
8

En trminos generales, este material pretende ser una valiosa ayuda para estudiantes y
profesores de modo que puedan seguir un mejor proceso de enseanza aprendizaje, ya que
al disponer de gran cantidad de recursos a travs de internet ofrece una serie de ventajas que
los textos tradicionales no proveen:

Est siempre disponible. Es como tener al profesor disponible las 24 horas del da y en
cualquier lugar donde haya conexin a internet.
Es interactivo. El texto tradicional no es interactivo, pero Recursos para el Aprendizaje
Efectivo de la Estadstica y la Probabilidad es totalmente interactivo. Muestra una
explicacin paso a paso y ejercicios solucionados paso a paso. Usted da clic y el material
lo lleva a su ritmo.
Es motivador e innovador. Actualmente los jvenes emplean intensivamente las
tecnologas de informacin y la comunicacin. De hecho, la mayora de la poblacin
joven emplea internet como su principal herramienta para investigar y estudiar.
Se ajusta a distintos estilos de aprendizaje. Bien es sabido que cada persona posee
diferente modo de aprender. Algunos aprenden ms por lo que ven, otros aprenden ms
por lo que oyen, y aprendemos mucho por lo que hacemos. Recursos para el Aprendizaje
Efectivo de la Estadstica y la Probabilidad ofrece presentaciones con mltiples imgenes,
videos, herramientas tecnolgicas, entre otros recursos que ayudan al estudiante a
aprender segn su estilo de aprendizaje.
Fomenta el uso de la tecnologa. Tanto a travs del uso de software como Excel y
Minitab como por los recursos disponibles en la web se realiza un uso intensivo de las
tecnologas de la informacin y la comunicacin.
Facilita aprender haciendo. Recursos para el Aprendizaje Efectivo de la Estadstica y la
Probabilidad promueve una modalidad de estudio en la que se aprende haciendo, pues
usted puede ir desarrollando los ejercicios en su cuaderno o computadora conforme se
presentan en el material.
Expone aplicaciones diversas: Recursos para el Aprendizaje Efectivo de la Estadstica y
la Probabilidad posee ejemplos y ejercicios que se relacionan con la ingeniera, las
ciencias econmicas, las ciencias de la salud, las ciencias sociales, etc.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
9

Acerca del autor

Gabriel Leandro Oviedo

Es Licenciado en Economa y Mster en Administracin de Empresas. Tambin realiz


estudios de Enseanza de la Matemtica.

Por ms de 18 aos se ha desempeado como docente en diversas instituciones, entre las que
figuran la Universidad Latina de Costa Rica, la Universidad Nacional, la Universidad
Latinoamericana de Ciencia y Tecnologa, la Universidad Estatal a Distancia, la Universidad
Fidlitas y la Universidad de La Salle, entre otras, siempre obteniendo un desempeo docente
sobresaliente, por lo cual ha ganado varios reconocimientos.

En la Universidad Latinoamericana de Ciencia y Tecnologa ocup el cargo de Director de


Investigacin y Director de la Revista Universitaria Rhombus.

Se ha desempeado por varios aos como experto en las auditoras de la Norma Nacional de
los Principios de Inversin y Administracin de Riesgos Operativos y Financieros de los
Fondos Administrados por las entidades reguladas por la Superintendencia de Pensiones.

Tambin ha sido consultor por varios aos para Soluciones Administrativas y Financieras,
S.A., en donde ha laborado en la realizacin de mltiples estudios estadsticos, como
encuestas de satisfaccin de clientes, estudios de clima organizacional, entre otros.

En la Cmara de Industrias de Costa Rica ha sido evaluador del Premio a la Excelencia en


mltiples ocasiones.

Actualmente es el Director de AulaDeEconomia.com, por medio de la cual se provee


capacitacin en lnea a distintas organizaciones pblicas y privadas en Costa Rica y otras
entidades en Amrica Latina y Estados Unidos.

Los materiales publicados a travs de la pgina www.auladeeconomia.com son empleados por


miles de estudiantes, profesores y profesionales en Amrica Latina, Espaa y Estados Unidos.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
10

Agradecimientos

Muchas personas me han brindado su colaboracin en la creacin de todo este material, pero
en forma especial deseara agradecer a mis compaeros Erick Torres, Pablo Caldern, Flix
Amado y Lipcia Mungua por sus valiosos comentarios y sugerencias en el desarrollo de este
texto. Igualmente a Natalie Leitn, a doa Higinia Esquivel y don Orlando Saboro por el
apoyo que me han dado. Por otro lado a mis estimados compaeros Felipe Mass, Edgar
Chaves, Hctor Guerra, Rodolfo Mainieri y don Jorge Acua. Por supuesto a don Rodrigo
Ortiz por la gran oportunidad que me ha brindado. Por supuesto, tambin mi familia y al
Seor Jess que me ha dado la vida y toda capacidad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
11

1 .

Introduccin a la estadstica
OBJETIVOS:
Al concluir el captulo, ser capaz de:
Explicar el concepto de estadstica y sus funciones principales
Reconocer la diferencia entre estadstica descriptiva e inferencial
Identificar las fases bsicas de una investigacin estadstica
Conocer las escalas de medicin de las variables estadsticas

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
12

Estadstica
Con mucha frecuencia la gente habla de estadsticas. Por ejemplo, las estadsticas sobre
accidentes en las carreteras, sobre la economa, sobre enfermedades, entre muchos temas.
Adems, es posible observar en la televisin, los peridicos, internet, libros, revistas,
boletines y otros medios distintos grficos, cuadros con datos, proyecciones, a la vez que se
habla de encuestas, realizacin de experimentos, entre otros temas relacionados con la
estadstica.

ESTADSTICA La estadstica es un conjunto de mtodos y teoras aplicadas a la


recoleccin, descripcin y anlisis de datos, los cuales constituyen evidencia numrica
para la toma de decisiones en condiciones de incertidumbre.

Esta definicin es particularmente til en los distintos campos de accin, en donde los
profesionales en las distintas reas diariamente tienen que tomar decisiones sobre situaciones
que comprenden tanto datos numricos como incertidumbre, en situaciones que van desde la
contratacin de personal cuyo desempeo no puede ser anticipado, el requerimiento de
materias primas para la produccin de artculos cuya demanda es incierta, las decisiones en
materia de poltica pblica cuando no se conoce la evolucin futura de las variables
econmicas y sociales, las prescripciones que un profesional de la salud puede realizar aun
cuando no tiene certeza de la reaccin del paciente ante el tratamiento, entre muchas otras
posibles situaciones.

Material En la pgina de internet de este texto


podr encontrar una presentacin de
audiovisual diapositivas que expone este tema y es un
complemento a este texto.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Estadstica descriptiva e inferencia estadstica


El nfasis sobre la importancia de la estadstica en la toma de decisiones es bastante reciente.
En sus primeros tiempos los estudios estadsticos consistan primordialmente de metodologas
para recopilar y describir datos numricos, casi siempre en forma de tablas y diagramas. A
esta rea de la disciplina se le conoce ahora como Estadstica descriptiva. Los mtodos
mencionados contrastan con el enfoque moderno en el cual se realizan generalizaciones
acerca de la totalidad de los datos, los cuales constituyen la poblacin, a partir de las
investigaciones realizadas en una parte de la poblacin, a la que se llama muestra. El estudio
de cmo realizar estas generalizaciones constituye la estadstica inferencial o inferencia
estadstica.

Estos mtodos inferenciales se requieren para pronosticar las tendencias de la demanda de los
artculos (con base en perodos anteriores a las ventas) o para estimar las necesidades de
capital de trabajo (basndose en crecimientos o decrecimientos de los costos) o la necesidad
de ajuste de una mquina (analizando las tendencias de ciertas mediciones importantes) o los

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
13

porcentajes defectuosos, etc. En todos estos ejemplos existe incertidumbre puesto que no se
cuenta con la informacin completa y es mediante la inferencia estadstica que se puede
llegar a encontrar el curso de accin que facilita la toma de decisiones.

Importancia del anlisis de la informacin estadstica


Tanto individuos como organizaciones necesitan informacin para realizar sus distintas
actividades, sin embargo, para que sta informacin sea vlida y confiable, es necesario que
haya sido obtenida y procesada apropiadamente. Ah precisamente es donde entra en juego la
estadstica, y por eso es de gran relevancia en todo proceso de investigacin cientfica.

Aplicacin Utilidad de la estadstica


En prcticamente todos los campos del conocimiento humano se emplea la
estadstica. Sin tratar de ser exhaustivos, se mencionan algunas
aplicaciones importantes de la estadstica en algunos reas distintas:

En el mbito de las empresas se emplea la estadstica en:


El control de la rentabilidad de la empresa, de sus ventas y de sus
costos, entre otras partidas.
La investigacin de mercados, la medicin de la satisfaccin de los
clientes y las proyecciones de la demanda.
La evaluacin de oportunidades de inversin y la gestin de los riesgos
presentes en toda inversin.
La evaluacin de desempeo, la evaluacin del clima organizacional,
el control de la seguridad ocupacional, etc.
La verificacin del alcance de las metas, la toma de decisiones bajo
condiciones de riesgo e incertidumbre, etc.

En el mbito de la ingeniera:
El control de la calidad, de la productividad, de los inventarios, etc.
Al desarrollar un proyecto urbanstico se requieren registros
demogrficos, datos sobre el abastecimiento de agua potable, etc.
Son necesarios registros del trnsito para disear el tiempo que duran
los semforos.
En la descripcin de modelos termodinmicos complejos
(termodinmica estadstica).
Al tratar de comprender la variabilidad de sistemas de medicin y el
control de procesos

En el mbito de la psicologa, la educacin y otras ciencias del


comportamiento:
Se emplea el mtodo cientfico tratando de cuantificar distintos
fenmenos y aplicando tcnicas estadsticas como la prueba de
hiptesis y la realizacin de experimentos.
En el contexto de la psicologa laboral son muy importantes los
aspectos psicolgicos presentes en el comportamiento individual y
colectivo en el lugar de trabajo de las personas.
El estudio de los fenmenos del aprendizaje y de ese modo cmo
mejorar los procesos de enseanza y aprendizaje.
Las investigaciones sobre los distintos trastornos mentales.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
14

La utilizacin de diversos tipos de pruebas para obtener informacin


tanto a nivel individual como colectivo.

En el mbito de las ciencias de la salud:


Tanto el diagnstico, e pronstico como la terapia que un profesional
en salud pueda realizar se basan en datos estadsticos que han
determinado la eficacia y riesgos de las distintas acciones posibles.
En la administracin sanitaria son fundamentales los datos, a fin de
realizar la mejor utilizacin de los recursos disponibles.
En la realizacin de ensayos clnicos, fundamentales para que luego se
puedan emplear en diversos tratamientos mdicos.
En decisiones de polticas pblicas son fundamentales los indicadores
del estado de la salud para los pases y sus distintas regiones, sean
estados, distritos, etc.

En el mbito de las ciencias de la comunicacin y otras ciencias sociales:


Se pueden medir las opiniones de distintos grupos, o medir variables
importantes como la intencin de voto.
Cuantificar la audiencia de un programa de televisin o de un evento
especfico.
Monitorear distintos medios de comunicacin y monitorear la
publicidad.
Presentar informacin cuantitativa de forma accesible y adecuada para
los consumidores de noticias.
Determinar la efectividad de las comunicaciones realizadas por una
empresa, un partido poltico, un gobierno, etc.

En general, resulta evidente que la Estadstica provee la informacin necesaria y herramientas


para analizar datos y as facilita la toma de decisiones y la solucin de problemas.

Funciones de la estadstica
Se pueden establecer como las funciones bsicas de la estadstica las siguientes:
1. Recoleccin: La estadstica busca recolectar en forma adecuada la informacin. Con
este fin muchas veces se emplean cuestionarios, la observacin, experimentos y otros
tipos de instrumentos, a fin de recopilar los datos requeridos.
2. Procesamiento: Una vez que se han recopilado los datos, se desea organizarlos, lo
cual significa que hay que corregir, clasificar y tabular los datos que se obtuvieron de
la etapa anterior, para lo cual tambin es necesario hacer uso de las tcnicas
estadsticas apropiadas.
3. Presentacin: Luego es necesario presentar adecuadamente los datos. Para esto
generalmente se hace uso de cuadros estadsticos y grficos, y se calculan diferentes
tipos de medidas, como los promedios, las proporciones, varianzas, se elaboran
distribuciones de frecuencias, etc.
4. Anlisis: Esto es la aplicacin y desarrollo de modelos, establecimiento de
correlaciones, estimaciones, proyecciones, etc. El anlisis puede ser de una sola
variable en un momento dado o podra ser de series de tiempo, o sea, analizar cmo ha

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
15

evolucionado la variable a lo largo del tiempo. El anlisis podra ser de la relacin que
una variable tiene con otras variables, por ejemplo, determinar si una variable se
correlaciona con otra.
5. Interpretacin: Una vez obtenidas las distintas medidas, estos nuevos datos son
empleados para interpretar el comportamiento de las variables en estudio, para realizar
proyecciones, tomar decisiones, etc.

Conceptos bsicos de estadstica descriptiva


A continuacin se describen algunos de los ms importantes conceptos de la estadstica
descriptiva.

UNIDAD ESTADSTICA Es aquella unidad u objeto de inters en la investigacin y


de ella se desprenden las observaciones, o sea, de ella se derivan los datos para el
anlisis.

La clara definicin de la unidad estadstica es el aspecto ms importante del proceso de


obtencin de informacin, pues la unidad estadstica es la generadora de dichos datos, no es la
informacin misma (observaciones), sino que es la fuente u origen de donde se obtienen los
datos.

Por ejemplo, si un investigador desea estudiar la proporcin de hogares pobres en un pas,


entonces las unidades estadsticas seran las familias, ya que el objetivo de su estudio es
determinar cules familias son pobres y cules no.

Dependiendo del estudio, la unidad estadstica puede ser una persona, una familia, una
empresa, un rbol, un pas, un ecosistema, etc.

Cabe recalcar la importancia de su delimitacin en al menos 4 dimensiones bsicas:

1. Qu/Quin?
2. Dnde?
3. Cundo?
4. Cmo?

Realmente decir que la unidad estadstica es una persona es insuficiente, pues hay que agregar
cules son las cualidades que definen a esa unidad estadstica, por ejemplo, segn su edad, su
lugar de residencia, el periodo y cualquier otro aspecto relevante. Entonces sera mejor decir
que la unidad estadstica es un "profesional en periodismo que haya residido en la ciudad
capital del pas durante los ltimos 12 meses".

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
16

CARACTERSTICAS O VARIABLES Cada unidad estadstica posee una o varias


caractersticas, tambin llamadas variables, que son distintas de una unidad estadstica
a otra y que el estudio tiene inters en conocer.

De una unidad estadstica a otra hay una serie de diferencias de inters para el investigador,
por eso la caracterstica o variable es cambiante. Por tanto, las variables son las caractersticas
de los sujetos, que debido a su variabilidad, se requiere conocer.

Continuando con el ejemplo del estudio de la pobreza, se espera considerar ciertas


caractersticas o variables de las familias del pas, como lo pueden ser el ingreso del
hogar, el nmero de personas que laboran en la familia, las condiciones de la vivienda (acceso
a agua potable, disponibilidad de bao, etc.), el nivel educativo de los miembros de la familia,
etc.

Tal como se ha podido observar las caractersticas o variables pueden ser variables
cuantitativas, cuando producen directamente una magnitud numrica, o bien, pueden ser
variables cualitativas, cuando no pueden cuantificarse. En este ltimo caso se recurre a una
clave o un cdigo para su proceso. Ms adelante en este captulo se ampliar con respecto a
este ltimo punto.

Cuando una variable cuantitativa se puede determinar por conteo, se dice que es una variable
discreta, como es el caso del nmero de hijos que una persona tiene, el nmero de cursos que
un estudiante universitario est realizando, el nmero de empleados de una empresa o el
nmero de artculos defectuosos obtenidos por da en un proceso de produccin, entre muchos
otros posibles ejemplos. Por otro lado, cuando la variable se obtiene por medicin, se dice que
es una variable continua. En estos casos se emplea un instrumento de medicin, tal como una
balanza, un termmetro o un cronmetro, y la unidad se expresa con unidades de medida,
tales como los gramos, grados centgrados, segundos, etc. Algunos ejemplos son el peso de
paquetes de azcar, la temperatura mxima diaria en una ciudad, tiempo de produccin de un
artculo, etc.

Ejercicio Clasifique las siguientes variables como cualitativas o cuantitativas, y en


caso de ser cuantitativas seale si son discretas o continuas:
de
revisin 1. Marca de un refresco producido en el pas.
2. Grado acadmico de un profesional.
3. Ingreso mensual familiar.
4. Nmero de hijos.
5. Talla de una camiseta (pequea, mediana, grande).
6. Nmero de la talla de un pantaln (10, 12, etc.).
7. Tiempo de espera en una fila para recibir un servicio.
8. Ciudad de residencia.
9. Calidad de un producto (sin defectos, con defectos menores o con
defectos mayores).
10. Peso de un paquete de harina.
11. Nombre del principio activo de un medicamento.
12. Nmero de personas en una fila.
13. Cantidad de energa elctrica consumida por mes en una empresa.
14. Nmero de artculos defectuosos por lnea de ensamble.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
17

15. Consumo de caloras por da.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

OBSERVACIN Cada caracterstica bajo estudio se expresa numricamente, ya sea


porque se mide, se cuenta o se le asigna un cdigo, por lo que cuando se recopilan los
datos se tiene una serie de valores numricos, y a cada de ellos se le llama observacin.

O sea, una observacin es un dato. No es el resultado de la investigacin como un todo. Tomando


el mismo ejemplo de la pobreza, entonces una observacin para la variable Ingreso mensual
del Hogar puede ser $500. En este caso por ser una caracterstica cuantitativa su medicin es
simple. En otros casos lo que hace es un recuento, como lo sera para la variable Nmero de
miembros del hogar que laboran, donde una observacin podra ser 2. En otros casos se
asigna un cdigo, por ejemplo si se desea considerar la variable Grado acadmico del jefe del
hogar, donde se podra establecer una codificacin como: 1. Ninguno. 2. Primaria. 3.
Secundaria. 4. Tcnica o para universitaria. 5. Universitaria. En este caso una observacin
podra ser 3 para un jefe de hogar que realiz sus estudios de secundaria.

POBLACIN Es el conjunto total de elementos de referencia o unidades estadsticas


sobre el que se interesara realizar la observacin en una investigacin estadstica.

El investigador desea entonces conocer cules seran esas observaciones para todas las
familias del pas, y poder analizar esos datos. Ese conjunto total de observaciones constituye
su poblacin.

La poblacin bajo estudio puede ser infinita o finita. Es infinita cuando tiene un nmero
infinito de elementos, es decir, no termina. Por ejemplo, el agua que corre por un ro. Al
contrario, una poblacin finita tiene un nmero limitado de elementos. Una poblacin infinita
podra convertirse en una finita si se le establece un intervalo de tiempo. Por ejemplo, el
nmero de habitantes de una ciudad podra ser una poblacin infinita si se considera a lo largo
de todo el tiempo, pero si se considera el nmero de habitantes en un momento dado, entonces
ser una poblacin finita.

Las poblaciones pueden ser homogneas o heterogneas, segn si los valores de las
caractersticas en estudio son iguales o diferentes, respectivamente. As, la sangre que una
persona posee ser una poblacin homognea, pero los empleados de una empresa sern una
poblacin heterognea en cuanto a sus salarios, por ejemplo.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
18

Ejercicio El encargado de recursos humanos de una empresa va a realizar un estudio


de clima organizacional. Para ello va a aplicar un cuestionario a todos los
de funcionarios que actualmente laboran en la empresa y les va a pedir que
revisin den su opinin con respecto a la comunicacin dentro de la empresa, el
liderazgo de los gerentes, las relaciones interpersonales, entre otros
aspectos. Con respecto a esta situacin indique:

1. Cul es la unidad estadstica?


2. Cul puede ser un ejemplo de una caracterstica o variable cuantitativa
que pueda interesar en este estudio?
3. Cul puede ser un ejemplo de una caracterstica o variable cualitativa
que pueda interesar en este estudio?
4. Cul es la poblacin?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

PARMETRO Es una medida descriptiva de la poblacin total de todas las


observaciones de inters para el investigador.

Si el investigador tuviera toda esa poblacin de datos deseara calcular algunas medidas que le
ayuden a describir el total de datos. Por ejemplo, deseara conocer parmetros como el ingreso
promedio de esa poblacin, la proporcin de familias que satisfacen todas sus necesidades
bsicas, etc.

MUESTRA Es una parte de la poblacin que se selecciona para ser estudiada, ya que
estudiar toda la poblacin es demasiado costoso, toma demasiado tiempo o es
imposible.

Dado que muchas veces es demasiado costoso o requiere demasiado tiempo obtener las
observaciones para toda la poblacin, e incluso a veces es imposible, entonces se emplea una
muestra, la que si es bien seleccionada, va a representar a la poblacin, y entonces las
conclusiones que en ella se obtengan luego podrn ser generalizadas al resto de la poblacin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
19

ESTADSTICO Elemento que se obtiene como una funcin de las observaciones


obtenidas en la muestra, que describe dicha muestra y sirve como una estimacin del
parmetro de la poblacin correspondiente.

Tal como se mencion anteriormente, el investigador desea conocer el ingreso de todas y cada
una de las familias de la poblacin, pero como obtener ese datos sera demasiado costoso y
toma demasiado tiempo, entonces toma una muestra representativa y obtiene el ingreso
promedio de las familias de la muestra. Este ltimo dato es un estadstico que servir como
estimador del parmetro poblacional.

En la prctica pueden usarse dos tipos de muestra, segn el mtodo que se utilice para hacer la
seleccin de los elementos:

Muestreo aleatorio o muestreo estadstico: en este tipo de muestreo se emplea un


procedimiento que conceda a cada unidad de la poblacin una probabilidad conocida de
formar parte de la muestra. Por ejemplo, en el muestreo simple al azar, todas las unidades
de la poblacin tienen la misma probabilidad de ser incluidos en la muestra. Adems del
muestreo simple al azar, existen otras tcnicas como el muestreo estratificado, en etapas,
sistemtico, de conglomerados, etc. En el captulo 9 se amplan estos conceptos sobre
muestreo.
Muestreo no aleatorio: En este tipo de muestreo se emplea un procedimiento mediante el
cual no es posible calcular la probabilidad de que cada unidad de la poblacin sea
seleccionada en la muestra. Existen varias modalidades, por ejemplo, la seleccin por
conveniencia, en la cual el investigador incluye a aquellas unidades que le facilitan ms su
trabajo, lo cual puede introducir grandes sesgos en la investigacin. Tambin existe el
muestreo intencional o de juicio, que se emplea haciendo uso del criterio de un experto en
el campo bajo estudio. Algunos investigadores consideran que en ciertos casos este tipo de
muestreo puede ser til, especialmente si la poblacin es muy heterognea y se debe tomar
una muestra pequea. Otra posibilidad es el muestreo voluntario, en cuyo caso las
unidades de estudio eligen voluntariamente participar en el estudio. Esto lo realizan con
frecuencia algunos medios de comunicacin cuando formulan una pregunta de opinin y
las personas voluntariamente llaman por telfono para dar su respuesta.

Los muestreos no aleatorios tienden a generar muestras que no son representativas de la


poblacin y por tanto los resultados incluyen errores. Estos errores en la eleccin de los
individuos o grupos que se dan en los muestreos no aleatorios se conocen como sesgos de
seleccin. La principal ventaja del muestreo aleatorio es que limita ese sesgo de seleccin, e
incluso es posible cuantificarlo y controlarlo.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
20

Cuando en una investigacin la informacin se obtiene mediante el uso de una muestra, es


posible que aparezcan dos tipos de errores, que son los errores de muestreo y los sesgos. Los
errores de muestreo solo pueden aparecer en las investigaciones en las que se emplea una
muestra. Este error surge porque la muestra se obtiene al azar, entonces no va a ser
"perfectamente" representativa de la poblacin. El nico modo de eliminar estos errores es
utilizar la poblacin completa. La mayora de los investigadores estn dispuestos a aceptar un
error de muestreo relativamente pequeo, pues esto permite reducir los costos del estudio y
controlar mejor el trabajo de la recopilacin de datos.

ERROR DE MUESTREO Es la diferencia, causada por el azar, entre el valor


verdadero de una caracterstica y el valor estimado mediando el uso de una muestra.

Si un investigador desea saber qu tan grande puede ser el error de muestreo, puede utilizar
los modelos de probabilidad apropiados para determinar su magnitud. Despus, si se quisiera
reducir ese error de muestreo, entonces puede emplear una muestra de mayor tamao.

Ahora bien, los sesgos pueden aparecer tanto en estudios por muestreo como en aquellos que
realizan un censo, o sea, que abarcan la poblacin completa. Por ejemplo, si se ha diseado un
cuestionario inadecuado, entonces habr ciertos errores que no se corregirn ni siquiera
empleando la poblacin completa. Los errores de muestreo surgen por la naturaleza aleatoria
de la muestra, mientras que los sesgos son errores sistemticos que se dan en el proceso de
investigacin.

SESGO Error sistemtico, no debido al azar, entre el valor verdadero de una


caracterstica y el valor estimado en una investigacin.

Los sesgos son errores de naturaleza sistemtica, o sea que producen errores que se dan en el
mismo sentido. Por ejemplo, si en un estudio de satisfaccin de los usuarios de un servicio,
las encuestas se aplican en los momentos en que hay menor cantidad de usuarios y el servicio
es ms rpido, entonces los resultados tendern a dar una evaluacin del servicio mejor que la
real. Los sesgos generalmente no son cuantificables, pero deben evitarse mediante las
medidas administrativas adecuadas, que procuren que todo el proceso de recoleccin,
procesamiento y anlisis de los datos se realice del mejor modo posible.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
21

Son muchas las posibles causas de los sesgos, pero algunos sesgos se producen por las
siguientes razones:

Se define la unidad estadstica en forma inadecuada y, por tanto, no se identifica


claramente cul es la poblacin.
Se selecciona inadecuadamente la muestra.
Los instrumentos de recoleccin de datos no se diseaban correctamente o no se aplican
del modo adecuado.
La recoleccin de los datos no se realiza bien, por ejemplo, cuando los entrevistados no
contestan todas las preguntas que se les aplican, o cuando el entrevistador influye en las
respuestas.
No se emplea el mtodo de estimacin correcto, o bien, se comenten errores en los
clculos, etc.

Ejemplo Un funcionario de un banco desea hacer una evaluacin de cliente interno,


es decir, una evaluacin de ciertos servicios que los distintos
departamentos del banco se prestan entre s. Con ese fin ha elaborado un
cuestionario, el cual, por el nivel de sus contenidos deber ser aplicado al
personal que ocupa puestos de jefatura. El banco posee 5.000 empleados,
pero solo 350 ocupan puestos de jefatura. Con base en la informacin
anterior, determine:

5. Cul es la unidad estadstica?


6. Cul puede ser un ejemplo de una caracterstica o variable cuantitativa
que pueda interesar en este estudio?
7. Cul puede ser un ejemplo de una caracterstica o variable cualitativa
que pueda interesar en este estudio?
8. Cul es la poblacin?
9. Vale la pena emplear una muestra o es mejor aplicar el cuestionario a
toda la poblacin?
10. Suponga que se aplica el cuestionario a la poblacin, habra error a la
hora de hacer la estimacin de los parmetros investigados?
11. Cul podra ser un posible sesgo?

Solucin 1. Dado que el cuestionario solo debe ser aplicado a los puestos de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
22

jefatura, entonces la unidad estadstica no corresponde a un empleado


del banco, sino a un empleado que ocupe un puesto de jefatura en el
periodo en el cual se va a realizar el estudio.
2. Una caracterstica o variable cuantitativa que pueda interesar en este
estudio puede ser el tiempo que tiene el funcionario de laborar para el
banco, o el nmero de empleados que tiene como subordinados, entre
muchas otras posibles respuestas.
3. Una caracterstica o variable cualitativa que pueda interesar en este
estudio puede ser la valoracin que hace del servicio que presta otro
departamento (calificndolo como muy bueno, bueno, regular, malo o
muy malo), o el departamento para el cual labora el funcionario que
contesta el cuestionario, entro muchas otras respuestas posibles.
4. Dada la definicin que se hizo en la pregunta 1 de la unidad de estudio,
la poblacin correspondera al conjunto de empleados que ocupen
puestos de jefatura en el periodo en el cual se va a realizar el estudio.
5. Una poblacin est compuesta por 350 personas no es demasiado
grande, por lo que podra emplearse la poblacin. Sin embargo puede
ser que las oficinas se encuentren distribuidas a lo largo de todo el pas,
y que por aspectos de costo y tiempo sea mejor emplear una muestra.
6. Si se aplica el cuestionario a la poblacin, entonces no habr error de
muestreo a la hora de hacer la estimacin de los parmetros
investigados. Este error aparece solo cuando se utiliza una muestra en
el estudio.
7. Existen muchos posibles sesgos, pero uno muy frecuente es el diseo
inadecuado del cuestionario. Por ejemplo, que contenga preguntas mal
redactadas, que sugieran la respuesta, etc.

Ejercicio Un investigador est interesado en conocer el impacto de las relaciones


entre padres e hijos sobre el desempeo acadmico de los nios en edad
de escolar. Para realizar su estudio ha diseado un cuestionario que desea
revisin aplicar a una muestra de nios en varias escuelas de la ciudad capital. Con
respecto a esta situacin indique:

1. Cul es la unidad estadstica?


2. Cul puede ser un ejemplo de una caracterstica o variable cuantitativa
que pueda interesar en este estudio?
3. Cul puede ser un ejemplo de una caracterstica o variable cualitativa
que pueda interesar en este estudio?
4. Cul es la poblacin?
5. Vale la pena emplear una muestra o es mejor aplicar el cuestionario a
toda la poblacin?
6. Cules ventajas y desventajas tendra realizar el estudio empleando
una muestra no aleatoria?
7. Cules ventajas y desventajas tendra realizar el estudio empleando
una muestra aleatoria?
8. D un ejemplo de un posible sesgo que podra presentarse en un estudio
de este tipo.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
23

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

En el captulo 8 se ampliar el tema del muestreo, y por tanto los conceptos de error de
muestreo, sesgo y otros aspectos relacionados, como el tamao de muestra, la seleccin de la
muestra, etc.

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es un complemento
audiovisual a este texto. Puede hallar este material dentro del tema 1: Introduccin a
la estadstica.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Fases de una investigacin estadstica


La realizacin de una investigacin estadstica es un proceso planeado que requiere efectuar
una serie de etapas o fases claramente establecidas. A continuacin se exponen las etapas
bsicas para el desarrollo de una investigacin estadstica.

I. Planteamiento del problema de investigacin


La primera fase comienza con el descubrimiento o planteamiento deliberado de un problema
relacionado con el campo de actividad del investigador, y cuya solucin es de inters para l
individualmente, para el equipo con el que trabaja o para una institucin en particular. Para
poder efectuar el planteamiento del problema se debe aclarar previamente lo que se entiende
por objeto de estudio en una investigacin, o sea, la unidad estadstica, y lo que se entiende
por problema.

II. Diseo y seleccin de la muestra


En la mayora de los estudios se necesita emplear una muestra, pues trabajar con toda la
poblacin generalmente resulta ms costoso, puede demandar mucho tiempo, resultar
imposible e inclusive innecesario (pues con una muestra se pueden obtener resultados
suficientemente buenos y es posible supervisar mejor el trabajo). Disear y seleccionar la
muestra es una fase clave, pues es necesario determinar el tamao apropiado de la muestra y
la tcnica de muestreo adecuada, para que evitar sesgos en el estudio y que se pueda llegar a
conclusiones tiles.

III. Diseo de instrumentos de recoleccin


Con frecuencia los datos no existen, es necesario emplear un instrumento para recolectarlos.
Esta fase es importantsima para una investigacin, pues es fundamental el diseo adecuado
de los instrumentos de recoleccin de los datos. Se requiere que un instrumento de
recoleccin de datos sea vlido y confiable. Cuando el instrumento no est bien diseado, los

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
24

datos obtenidos estarn sesgados, afectando las conclusiones que se obtengan a partir de ellos.
En la seccin 1.6 se ampla este tema.

IV. Presentacin de los datos finales


Los investigadores deben presentar en sus informes los datos obtenidos de manera sinttica,
clara y ordenada. Las formas ms comunes son los cuadros o tablas y las grficas.

Cuadros: La presentacin tabular o en forma de cuadro o tabla se usa cuando el nmero


de datos que se quiere presentar es relativamente grande. Un cuadro sirve para dar nfasis
a ciertas cifras, hacer comparaciones, facilitar el anlisis de los datos y como fuente de
informacin.
Grficos: Los grficos son figuras que sirven para representar mediante elementos
geomtricos a un conjunto de datos estadsticos. Tienen como ventaja el ser ms eficaces
para llamar la atencin que las otras formas de presentacin de datos. Si estn bien
construidos son ms fciles de comprender que un cuadro y facilitan las comparaciones.
En general permiten una comprensin ms clara y rpida de lo que presentan los datos, lo
cual favorece el anlisis.

V. Anlisis cuantitativo e interpretacin de los datos


El anlisis cuantitativo de los datos finales consiste en el tratamiento matemtico de la
informacin que permita realizar comparaciones y establecer relaciones. Para ello se pueden
emplear simples tcnicas descriptivas, o bien anlisis propios de la estadstica inferencial.

El anlisis descriptivo consiste en el clculo de medias, medianas, varianzas, entre otras


medidas que ayudan a describir el comportamiento de las variables estudiadas.
El anlisis estadstico inferencial se emplea cuando los datos provienen de una muestra,
y se requiere efectuar una inferencia con respecto a la poblacin, obteniendo a su vez una
medida de la probabilidad de error implcito en dicha inferencia. En este sentido hay dos
resultados principales que se espera llevar a cabo, que son la diferencia entre grupos y la
correlacin entre variables.

VI. Presentacin del informe final de una investigacin


En el informe final de la investigacin se busca comunicar principalmente los siguientes
aspectos:

Problema que dio origen a la investigacin.


Las hiptesis planteadas y cmo se pusieron a prueba.
Metodologa empleada en la recoleccin y anlisis de los datos.
Resultados obtenidos.
Conclusiones finales.

Fuentes de informacin o conocimiento


Cuando se realiza una investigacin es posible que la informacin ya exista, como es el caso
en el cual se ha efectuado alguna investigacin previa sobre el tema, o bien, como cuando
alguna institucin del gobierno recopila peridicamente los datos de inters. En estos casos se
dice que se emplea una fuente de informacin. Las fuentes consisten en documentos, obras o
elementos que proveen informacin o datos que ya han sido recopilados.

Segn la relacin con la investigacin las fuentes de informacin pueden ser:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
25

Fuentes primarias: Es aquel documento, obra o elemento publicado o creado por una
persona o una institucin mediante el cual proporciona datos que han sido recopilados por
ella misma. Por ejemplo, en la mayora de los pases existe un instituto de estadstica que
determina datos como los niveles de desempleo, de pobreza y otras variables. Cuando se
consulta un informe de uno de estos institutos de estadstica, entonces se est consultando
una fuente primaria.
Fuentes secundarias: Es aquel documento, obra o elemento publicado o creado por una
persona o una institucin mediante el cual proporciona datos que no han sido recopilados
por ella misma. Con respecto al mismo ejemplo dado en el caso de las fuentes primarias,
si los datos del desempleo se consultan en un medio de comunicacin, como un peridico,
entonces este medio es una fuente secundaria, pues el peridico no determina el nivel de
desempleo en el pas, sino que obtiene sus datos de otra fuente (un informe del instituto de
estadstica, por ejemplo).

Ejercicio Clasifique las siguientes fuentes de informacin como primarias o


secundarias:
de
revisin 1. Artculo de un peridico sobre el crecimiento de las exportaciones del
pas.
2. Reporte del instituto de estadstica del pas sobre la evolucin del
desempleo a nivel nacional.
3. Informe del Fondo Monetario Internacional sobre las tasas de inflacin
de los pases de Amrica Latina.
4. Estado de prdidas y ganancias de una compaa entregado a sus
accionistas.
5. Folleto de la Organizacin Panamericana de la Salud sobre la
prevalencia de las enfermedades cardiovasculares en los pases de
Amrica Latina.
6. Artculo de una revista cientfica en que un investigador presenta los
hallazgos que obtuvo sobre la salud bucodental de una comunidad rural
del pas.
7. Anuario estadstico del Banco Interamericano de Desarrollo sobre la
infraestructura vial en los pases de Amrica Latina.
8. Anuario estadstico del Ministerio de Hacienda sobre la recaudacin
fiscal.
9. Reporte sobre el control de la calidad de una lnea de produccin.
10. Informe sobre las mercaderas en existencia de una tienda.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Mtodos e instrumentos de recoleccin de informacin


Los mtodos e instrumentos de recoleccin de informacin se emplean cuando la informacin
no ha sido recopilada, por ejemplo, si se desea determinar la demanda de un nuevo producto,
esa informacin no se va a encontrar en ningn documento de una institucin o en alguna
pgina de internet. Es decir, se habla de mtodos e instrumentos de recoleccin de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
26

informacin cuando los datos requeridos no existen, y por tanto, deben ser recopilados.
Cuando los datos existen, entonces se dice que se obtienen de una fuente de informacin, tal
como se describi en la seccin anterior.

Los principales mtodos de recoleccin de informacin son los siguientes:

Observacin. Este mtodo consiste en que el investigador recopila los datos observando
(ya sea midiendo o contando) aquellas caractersticas que son de inters para los objetivos
de su investigacin. lo que le interesa y anotando las observaciones. Normalmente se va a
apoyar en algn instrumento de medicin y va a registrar las observaciones en un registro
apropiado.
Entrevista personal. Este mtodo se emplea principalmente en las ciencias sociales y las
ciencias econmicas. El investigador visita a las unidades de estudio, tales como
empleados de una empresa, familias de una zona, pacientes de un hospital, etc. (o a las
unidades de informacin, pues en algunos casos la unidad estadstica no puede suministrar
la informacin, tal como en el caso de un nio, por lo que la unidad de informacin podra
ser alguno de sus padres) y les plantea una serie de preguntas, las cuales se registran en un
cuestionario previamente diseado para este fin.
Entrevista telefnica. Es similar al mtodo anterior, pero la diferencia es que los
informantes son contactados por medio de una llamada telefnica. Tiende a ser ms
econmico que la entrevista personal.
Correo. En este caso tambin se emplea un cuestionario, pero se enva por correo, ya sea
correo postal o correo electrnico. El cuestionario luego se devuelve por la misma va.
Actualmente existe software que facilita la aplicacin de encuestas a travs de internet.
Tiende a ser un mtodo bastante econmico.
Registro. Si usted desea saber cuntas personas han contrado matrimonio durante el
ltimo ao o cunto ha exportado el pas durante este semestre, no va a necesitar ir a
aplicar alguno de los mtodos anteriores, ya que en la mayora de los pases existe alguna
institucin que registra dichos eventos.
Test. Es una tcnica derivada de la entrevista y la encuesta. Tiene como objeto lograr
informacin sobre rasgos definidos de la personalidad, la conducta o determinados
comportamientos y caractersticas individuales o colectivas (inteligencia, inters,
actitudes, aptitudes, rendimiento, memoria, manipulacin, etc.).
Otros mtodos pueden ser: panel, estudios de caso, estudios histricos, anlisis de
contenido, investigacin accin, investigacin participativa, entrevistas en profundidad,
grupos de discusin y los diseos noexperimentales.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
27

De alguna manera el investigador debe garantizarse que el instrumento de medicin que est
empleando muestra lo que realmente se desea saber. En este sentido se evala la calidad de
los instrumentos de medicin considerando dos aspectos:

Confiabilidad: Se relaciona con la capacidad del instrumento de dar medidas certeras,


es decir, que se acerquen a la verdadera medida de la variable considerada.
Validez: Se refiere a que el instrumento mida realmente lo que se quiere medir. Para que
un instrumento sea vlido debe ser confiable, sin embargo podra ser confiable sin ser
vlido.

Aplicacin Psicometra
Posiblemente en algn momento de nuestra vida hemos realizado algn
test de personalidad o algn otro tipo de prueba psicomtrica, por ejemplo,
un test sobre nuestro estilo de aprendizaje.

Estas pruebas tienen por objetivo la medicin de alguna variable o


conducta psicolgica. Claro est que estas variables son no fcilmente
observables, por lo que la elaboracin y aplicacin de estos test no es tarea
sencilla. Precisamente de eso se encarga la psicometra, la cual busca cmo
construir mecanismos vlidos y confiables de medicin de estas variables
psicolgicas. As, se han desarrollado pruebas relacionadas con la
medicin de la inteligencia, rasgos de personalidad, habilidades, actitudes,
creencias, problemas de aprendizaje, entre muchos otros aspectos.

La psicometra se apoya en una serie de teoras sobre el proceso de


medicin, el diseo de escalas y la elaboracin de test. La finalidad es
poder crear herramientas de medicin vlidas y confiables, o sea, que
midan los que se supone que deben medir (validez) y que lo midan bien
(confiabilidad). Por ejemplo, cuando se desarrolla un instrumento sobre
estilos de aprendizaje, la validez y la confiabilidad consistiran en que
dicho instrumento realmente sea capaz de determinar cul o cules son los
estilos de aprendizaje que una persona posee.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
28

Elaboracin del cuestionario


El cuestionario es uno de los mtodos que ms se emplea en las ciencias sociales y las
ciencias econmicas, e incluso tambin en las ciencias de la salud y otros campos. Tiene la
ventaja de que puede ser ms econmico y que permite obtener informacin que sera muy
difcil o imposible obtener por otros medios. Ahora bien, el cuestionario debe estar muy bien
confeccionado para que sea un instrumento vlido y confiable. La validez consiste en que el
instrumento mida lo que se supone que debe medir. Por ejemplo, si una empresa desea saber
si sus empleados han llegado a convertir los valores organizacionales en parte integral de su
vida (al menos en la empresa), entonces podra aplicar un cuestionario para preguntarles al
respecto. Pero qu pasara si el cuestionario se limita a preguntar: "Conoce usted los valores
organizacionales?". En este caso la pregunta se refiere a si conoce los valores
organizacionales, no si los "vive" o los aplica en su trabajo. Este no sera un cuestionario
vlido, pues no est midiendo lo que se espera que mida. Por otro lado, adems de vlido, el
instrumento debe ser confiable. La confiabilidad consiste en que el instrumento mida bien.
Suponiendo que la empresa anterior solo desee saber si sus empleados conocen los valores
organizacionales, entonces la pregunta anterior tampoco sera confiable, pues muy
probablemente los empleados respondan que s los conocen, aunque no sea cierto.

Para lograr que un cuestionario sea vlido y confiable debe confeccionarse muy bien su
estructura y su contenido, es decir, el orden de las preguntas (generalmente las ms sencillas
primero), los temas o contenidos a que hacen referencia, el vocabulario que emplean
(preferiblemente palabras sencillas y claras) de modo que se eviten ambigedades, que no
sugieran las respuestas y que no influyan en los entrevistados para dar ciertas respuestas.

Otro detalle es la extensin del cuestionario, pues si es demasiado extenso las personas no van
a querer contestarlo, por lo que el investigador debe elegir preguntar aquello que es lo ms
importante y necesario para su investigacin. Finalmente, tambin es importante el formato de
las preguntas. En este sentido existen preguntas abiertas y preguntas cerradas:

Pregunta cerrada: Este tipo de pregunta limita la respuesta del entrevistado a un


conjunto de opciones previamente establecidas por el investigador. Las opciones deben
ser diseadas de manera que no sugieran la respuesta. Estas preguntas pueden tener solo
dos opciones, como las preguntas de S o No, o bien, varias opciones, e incluso ser de
mltiple escogencia. Una ventaja de este tipo de preguntas es que es ms fcil tabular los
resultados.
Pregunta abierta: Este tipo de pregunta no limita la respuesta a un conjunto de opciones
definidas por el investigador, por lo cual dan la posibilidad de obtener datos que no se
hayan previsto. Pero su desventaja es que es ms difcil tabular las respuestas y que a la
hora de interpretar las respuestas podran aparecer algunos sesgos.

Aplicacin Estudios de intencin de voto


Con mucha frecuencia los medios de comunicacin publican los resultados
de las distintas encuestas de intencin de voto que se realizan durante los
periodos electorales. Generalmente estos estudios aplican cuestionarios a
una muestra de electores. La metodologa es en realidad la misma que se
utilizara en un estudio de mercado o cualquier otra investigacin social,
pues al igual que en cualquier otro estudio, debe definirse la poblacin y la
unidad estadstica para el anlisis, determinar las variables que se requiere

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
29

conocer, la tcnica de encuesta (personal, por telfono, etc.), el tipo de


muestreo y el tamao de la muestra, y el tipo anlisis estadstico a realizar.

Ahora bien, las encuestas sobre temas polticos muchas veces generan
importantes polmicas, pues los partidos polticos o los candidatos no
reconocen los resultados, especialmente cuando no les favorecen, e incluso
algunos aseguran que se emplean para manipular la opinin pblica e
influir sobre los resultados de las elecciones.

En otras ocasiones los pronsticos efectuados por las encuestas se alejan


de los verdaderos resultados de las elecciones, e incluso encuestas
realizadas por distintas firmas de investigacin se contradicen. Sin
embargo, hay que ser cauteloso a la hora de juzgar los resultados de estos
estudios, pues hay muchos factores que pueden influir en ellos:

La metodologa del estudio: Es importante conocer cmo se realiz el


estudio, especialmente en los factores que pueden elevar el margen de
error, como el tamao de la muestra, o introducir posibles sesgos,
como el tipo de cuestionario empleado, la aplicacin del cuestionario,
el momento en que se realizaron las encuestas, etc.
La naturaleza del estudio: En las ciencias sociales los fenmenos que
se estudian son de carcter inmaterial, o sea, no son observables,
cambian rpidamente y estn muy relacionados con muchos otros
elementos sociales. Si bien, las encuestas son el principal instrumento
empleado, hay muchos aspectos de estas variables que son difciles de
captar por medio de cuestionarios.

Escalas de medida
Se ha mencionado que las variables pueden ser cuantitativas o cualitativas, lo cual implica la
necesidad de asignarles valores numricos, y para tal fin se emplean distintos tipos de escalas,
por ejemplo, la escala nominal.

ESCALA NOMINAL Nombres o clasificaciones que se utilizan para datos


cualitativos en categoras no ordenadas distintas y separadas.

Estas se emplean, por ejemplo, al hablar del sexo de las personas, donde se podra codificar
como 1 si es masculino y 2 si es femenino. Pero puede observarse en este caso que ese 2
no es el doble del 1, ni tampoco tendra sentido realizar operaciones matemticas con esos
valores.

Esta escala nominal tambin puede usarse para procesar datos como: marcas, productos,
zonas geogrficas, etc.

Propiedades de la escala nominal


Solo se realiza conteo, no se da ningn tipo de medicin. Por ejemplo, se cuenta cuntos
hombres o cuntas mujeres fueron entrevistadas.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
30

Las categoras no poseen un orden natural, ya sea de mejor o peor, ni de mayor a menor,
etc. As, si 1 si es masculino y 2 si es femenino, no puede decirse que ese 2 sea
mayor o mejor que el 1.
Al emplearse en variables cualitativas, entonces no existe diferencia cuantitativa entre una
categora y otra.
No se puede realizar operaciones matemticas.

ESCALA ORDINAL Clasifican las observaciones en categoras con un orden natural


o un orden significativo.

Por otro lado, las mediciones de escala ordinal indican un orden de preferencia o una
secuencia de datos. Por ejemplo, si se le preguntara a alguien evaluar un servicio como 1.
Excelente, 2. Bueno, 3. Regular y 4. Malo. Puede observarse que 2 no es la mitad de 4 y que
no tiene sentido realizar operaciones con estos nmeros.

Propiedades de la escala Ordinal


Solo se realiza conteo, no se da ningn tipo de medicin. Por ejemplo, se cuenta cuntas
personas responden "excelente", "bueno", etc.
Las categoras poseen un orden natural, ya sea de mejor o peor, ni de mayor a menor, etc.
En otras palabras, existe una relacin de orden entre las categoras, es decir, relaciones se
pueden expresar en trminos algebraicos de desigualdades (mayor que o menor que). As,
si 1 si es excelente y 2 si es bueno, puede decirse que ese 1 es mayor o mejor que el
2.
Al emplearse en variables cualitativas, entonces no existe diferencia cuantitativa entre una
categora y otra.
No se puede realizar operaciones matemticas.

Aplicacin Medicin de la satisfaccin del cliente


Para las empresas que desean mejorar cada da es fundamental poder medir
qu tan satisfechos estn sus clientes con sus productos o servicios.
Incluso, la medicin de la satisfaccin del cliente se incluye en normas de
gestin de la calidad, como ISO 9000.

Lo ms comn es que, con cierta periodicidad, se aplique un cuestionario


en el cual el cliente expresa su satisfaccin con respecto a diferentes
aspectos del producto o del servicio. Por ejemplo, en el caso de un servicio
se puede preguntar si en trato fue amable, si la persona que atendi estaba
preparada, si las instalaciones de la empresa le parecen adecuadas, entre
otros.

Existen diversas formas de medir la satisfaccin del cliente, pero en el caso


de los cuestionarios, se plantean una serie de afirmaciones (reactivos) con
respecto a los cuales el cliente debe indicar su opinin (o reaccin). Por
ejemplo, se plantea la afirmacin: Al llegar a la caja fui atendido con
amabilidad. Y entonces se presentan opciones en una escala ordinal, tales
como: Muy de acuerdo, De acuerdo, Ni de acuerdo ni en
desacuerdo, En desacuerdo y Muy en desacuerdo.

Cuando se procesa esta informacin es importante tener presente que esta

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
31

es una escala ordinal, o sea, que es cualitativa y tiene un orden natural, y


que por tanto tiene la limitacin de que no se puede efectuar operaciones
matemticas con los datos recopilados, es decir, no tendra sentido calcular
un promedio u otros resultados. A pesar de estas limitaciones, la escala
ordinal es la ms adecuada para este tipo de variable.

ESCALA DE INTERVALO Medidas en una escala numrica en la cual el valor de


cero es arbitrario pero la diferencia entre valores es importante.

Tal como la definicin lo indica, en la escala de intervalo las diferencias de valores son
importantes, pero el cero es un valor arbitrario. Un buen ejemplo es el caso de las
temperaturas, las cuales son medidas en grados centgrados. As una temperatura de 40 es
mayor que una de 20, pero eso no indica que 40 sea el doble de 20, ya que la temperatura 0
es arbitraria y no indica cero calor o ausencia de temperatura.

Propiedades de la escala de Intervalo:


Al aplicarse en variables cuantitativas, entonces implica la cuantificacin de los datos.
Se emplean unidades de medicin (como los grados Fahrenheit o centgrados) los cuales
producen intervalos iguales entre puntos de la escala.
Las mediciones en esta escala generan valores que indican diferencias entre las unidades
(individuos u objetos) medidos.
El punto cero y la unidad de medida son arbitrarios.
Al ser una variable cuantitativa se pueden aplicar diferentes operaciones matemticas, de
modo que se pueden calcular las principales medidas estadsticas.

ESCALA DE RAZN Medidas numricas en las cuales cero es un valor fijo en


cualquier escala y la diferencia entre valores es importante.

Esta es la nica medida en la que el cero es significativo, lo cual implica que los datos pueden
ser manipulados empleando cualquier operacin matemtica. Tal es el caso de variables como
tiempo, ingreso, participacin de mercado, distancia, etc.

Propiedades de la escala de razn:


La distancia o diferencia entre los nmeros es conocida y constante.
Tiene un punto cero absoluto, no arbitrario.
Dado su carcter cuantitativo y que posee un cero absoluto, entonces puede efectuarse
cualquier tipo de clculo y prueba estadstica.
Se pueden hacer comparaciones entre los nmeros tanto por su diferencia como por su
razn, o sea, s es vlido decir que si una cuerda mide de longitud 40 cm, entonces mide
el doble de otra cuya longitud es de 20 cm.

Resumen de las escalas de medicin de las variables

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
32

Ejercicio Clasifique las siguientes variables segn su nivel de medicin (nominal,


ordinal, de intervalo o de razn):
de
revisin 1. Marca de un refresco producido en el pas.
2. Grado acadmico de un profesional.
3. Ingreso mensual familiar.
4. Nmero de hijos.
5. Talla de una camiseta (pequea, mediana, grande).
6. Nmero de la talla de un pantaln (10, 12, etc.).
7. Tiempo de espera en una fila para recibir un servicio.
8. Ciudad de residencia.
9. Calidad de un producto (sin defectos, con defectos menores o con
defectos mayores).
10. Peso de un paquete de harina.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Aplicacin Software estadstico


Existen en la actualidad una serie de distintas aplicaciones creadas
especialmente para resolver problemas estadsticos. Sin duda estos
programas son de gran utilidad, pues permiten el procesamiento y
almacenamiento de grandes cantidades de informacin, facilitan la
realizacin de procedimientos complejos, efectuar gran cantidad de
operaciones en poco tiempo y ayudan a mejorar el aprendizaje y la
comprensin de los conceptos estadsticos.

Algunos de los paquetes estadsticos ms importantes en la actualidad son


Minitab, SPSS, Statistica, Stata, Systat, SAS, R, e incluso Excel, que
aunque no es una aplicacin exclusivamente estadstica, s es sumamente
til en el manejo de datos y en la realizacin de muchos clculos
estadsticos. Incluso, existen algunos programas estadsticos que corren
sobre Excel, como XLStat.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
33

Existe software libre de calidad que tambin se puede emplear, como es el


caso de R, Calc (OpenOffice), entre otros.
En este texto se van a describir procedimientos para Excel y Minitab, que
son dos herramientas especialmente tiles para el aprendizaje de la
estadstica.

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales.
tecnologa
Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se formulan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

1. A continuacin se presenta una lista de investigaciones, en cada caso indique cul


considera usted que es la unidad de estudio, y tambin identifique dos posibles variables en
cada caso:
a. En un hospital se desea determinar el tiempo medio de espera de los pacientes en el
servicio de consulta externa.
b. Se desea conocer la efectividad de un programa de prevencin de enfermedades
cardiovasculares aplicado en la poblacin de la ciudad capital de julio a noviembre del
ao 2012.
c. Un laboratorio farmacutico ha desarrollado un nuevo medicamento y desea evaluar
la posible interaccin con otras sustancias, para lo cual posee una muestra de ratas en
las cuales va a efectuarse el experimento.
d. Un investigador est preocupado por el continuo uso de computadoras, televisores y
otros aparatos y su efecto en la agudeza visual de los nios de 6 a 12 aos. El estudio
se realizar a nivel nacional.
e. Como consecuencia del calentamiento global se considera que cierto tipo de ranas
han ido desapareciendo, por lo que se requiere conocer cuntas ranas habitan aun en
las zonas montaosas del pas.
f. Se requiere conocer qu porcentaje de la poblacin del pas alcanza ciertos niveles
de peso, para saber cunta es la prevalencia de la obesidad en el pas durante el ltimo
ao.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
34

g. Se va a determinar el estado de las viviendas del pas. El estudio se efectuar de


enero a marzo del prximo ao.
h. En un proceso de produccin se requiere saber la proporcin de artculos
defectuosos, adems de conocer las posibles causas de los defectos.
i. Se desea saber la resistencia de determinados componentes electrnicos ante ciertas
circunstancias extremas (sobrecargas, calentamiento, etc.).
j. Se va a realizar un estudio sobre las medidas de seguridad informtica que las
empresas financieras implementan. Para esto se va a efectuar una encuesta a los
gerentes de tecnologas de informacin de bancos, cooperativas, mutuales, etc.
k. Ante el lanzamiento al mercado de un nuevo sistema operativo se va a estimar la
proporcin de empresas que estn dispuestas a implementar este nuevo sistema en el
transcurso de los prximos doce meses.
l. Un inversionista est buscando nuevas opciones para colocar su capital, por lo que
decide invertir en la Bolsa de Valores de Nueva York. Ha reunido informacin de
distinta empresas para conocer cmo han variado los precios de sus acciones y los
pagos de dividendos.
m. Una nueva empresa de telecomunicaciones est efectuando un estudio de mercado
para conocer las preferencias de los consumidores nacionales en lo que respecta al uso
del telfono celular, uso de internet, etc.
n. El encargado de recursos humanos de una empresa va a estimar el nivel de
satisfaccin de los empleados de la empresa para la cual labora.
o. En una auditora se van a examinar las cuentas por cobrar de una empresa.
p. Se requiere conocer cmo afectara un nuevo paquete de impuestos a los diferentes
sectores productivos del pas. Para tal fin se efectuar una encuesta entre empresarios,
lderes de organizaciones empresariales y expertos en el tema.
q. El gobierno desea saber qu tan efectiva ha sido una campaa para promocionar al
pas como destino turstico. Para ello se aplicar un cuestionario a turistas que ingresan
al pas por los distintos aeropuertos y fronteras terrestres.
r. Una educadora est investigando el impacto de las tecnologas de la informacin y
la comunicacin en los hbitos de estudio de los estudiantes de secundaria del pas.
s. Un psiclogo en una empresa aplica un test para identificar distintos tipos de
personalidad de los candidatos a una serie de puestos vacantes en la empresa.
t. Se est investigando el efecto que tienen las redes sociales en internet en las
relaciones familiares, para esto se tomar una muestra de familias del rea
metropolitana durante los prximos 6 meses.
u. Un investigador de una institucin desea conocer el estado general (salud,
emocional, etc.) de los nios dados en adopcin durante el ltimo ao en el pas.
v. El gobierno est analizando el efecto que han tenido algunas manifestaciones
estudiantes en su imagen. Para esto va a realizar una encuesta a nivel de las zonas
urbanas del pas entre personas mayores de 18 aos.
w. Un periodista est preocupado porque considera que algunas acciones del gobierno
afectan la libertad de prensa. Va a realizar una encuesta aplicado a una muestra
representativa de sus colegas para valorar la percepcin que tiene de esos mismos
sucesos.
x. Para determinar la efectividad de una campaa publicitaria, se va a evaluar la
exposicin mensual de los consumidores a los comerciales pautados y el volumen
mensual de ventas de la compaa en el mismo periodo. Se tomar una muestra de
consumidores del rea metropolitana.

2. A continuacin se da una lista de variables:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
35

a. Clasifique las siguientes variables como cualitativas o cuantitativas:


Gnero (sexo)
Estatura de una persona
Nota en el examen de estadstica
Ciudad de residencia
Nmero de habitaciones de la casa
Nmero de la camiseta de un jugador
b. Clasifique las siguientes variables cuantitativas como discretas o continuas:
Temperatura del horno
Nmero de hijos
Nmero de materias matriculadas por un estudiante
Distancia de la casa al trabajo
c. Con respecto a las siguientes variables, indique su nivel de medicin (nominal,
ordinal, de intervalo, de razn):
Gnero (sexo)
Estatura de una persona
Nota en el examen de estadstica
Ciudad de residencia
Nmero de habitaciones de la casa
Nmero de la camiseta de un jugador
Temperatura del horno
Distancia de la casa al trabajo

3. Un mdico est interesado en la relacin que tiene la tasa de mortalidad infantil con
distintos aspectos de la atencin prenatal.
a. Indique cules podran ser 5 variables de este estudio (clasifquelas por su
naturaleza y segn su nivel de medicin).
b. Seale dos posibles fuentes de informacin que podra utilizar.

4. El siguiente es un extracto de un estudio estadstico:


El fenmeno de la migracin de trabajadores/as de la salud en Costa Rica debe
entenderse en el contexto ms amplio de los cambios que ha experimentado la
economa mundial y no como una simple relacin de oferta y demanda, concluye el
estudio "Trabajadores de la salud y migraciones en Costa Rica". Los responsables de
la investigacin sealaron que, adems de las razones individuales de las personas
migrantes, "entre los factores que la explican la migracin de los profesionales de la
salud, se cuenta la nueva dinmica econmica internacional y sus implicaciones en el
campo de la salud, que han llevado a la adopcin de las tendencias industriales en el
servicio de salud, como son la incorporacin de nueva tecnologa, el ahorro de
personal y el aumento de las cargas de trabajo dentro de una lgica de costobeneficio,
llevando al desplazamiento de personal, sobre todo de enfermera".
El estudio fue efectuado por la Organizacin Internacional del Trabajo (OIT) y publicado en
http://dwt.oit.or.cr/index.php?option=com_content&view=article&id=470:estudiodeoit
sobretrabajadoresdelamedicinaylaenfermeria&catid=198:noticias&Itemid=347
Con relacin a la informacin anterior, conteste:
a. Cul es la unidad estadstica del estudio?
b. En el estudio se aplic un cuestionario a 1.200 profesionales. Cul pudo haber sido
la principal razn para emplear una muestra en vez de la poblacin? Explique.
c. Mencione una posible variable cuantitativa que se haya medido en el estudio.
d. Mencione una posible variable medida en una escala ordinal en el estudio.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
36

5. El siguiente es un extracto del resumen del proyecto de investigacin titulado Estrs


laboral en profesionales de Enfermera: Estudio sobre evaluacin cognoscitiva y
afrontamiento elaborado por Mara de los ngeles MezaBenavides (Escuela de Enfermera
de la Universidad de Costa Rica):
Se presentan los resultados de la investigacin sobre estrs laboral en enfermeras,
centrada en el establecimiento de la relacin entre evaluacin cognoscitiva y
afrontamiento del estrs, de acuerdo con la teora de Lazarus y Folkman. Adems, se
examina esta relacin con las manifestaciones psicolgicas y psicofisiolgicas del
estrs. Para dicho estudio, se elaboraron dos instrumentos de medicin: uno explora la
evaluacin cognoscitiva de las situaciones de estrs en el trabajo de los y las
enfermeras (os) y el otro obtiene informacin sobre varias estrategias de
afrontamiento.
Con relacin a la informacin anterior, conteste:
a. Cul es la unidad estadstica?
b. Cul pudo haber sido la principal razn para emplear una muestra en vez de la
poblacin en este estudio? Explique con detalle
c. Mencione una posible variable cuantitativa que se haya medido en el estudio.
d. Mencione una posible variable medida en una escala nominal en el estudio.
e. Una posible variable de inters que se mida en una escala de razn. Explique.
f. Un posible sesgo que podra presentarse en este estudio. Explique.
g. El mtodo de recoleccin de datos a emplear. Justifique su eleccin.

6. La siguiente informacin fue publicada en el peridico La Nacin el 18 de setiembre de


2012:

CCSS mostr proceso de control de calidad de medicamentos


Antes de que los medicamentos que le recetan a usted en un Ebais u hospital pblico lleguen a
sus manos, stos pasan entre dos y 20 das de anlisis de control de calidad para cerciorarse de
que el medicamento no producir efectos adversos mayores y adems tendr la eficacia
esperada para tratar determinado dolor o enfermedad.
Funcionarios de la Caja Costarricense de Seguro Social (CCSS) mostraron esta maana cules
son los procedimientos con los que se evala los frmacos.
De cada lote se toma una muestra representativa y se le pasa por varios tipos de anlisis.
Primero se les hace un estudio fsico en donde se ven diferencias en forma, color,
composicin y si tienen algn tipo de mancha, o estn ms duras o suaves de lo esperado.
Tambin se les pone en lupas y mquinas especiales para determinar la cantidad de partculas
y el tamao de stas. Si no se pasa este anlisis el medicamento es rechazado y el lote es
devuelto al proveedor. Si el medicamento aprueba esta fase, pasa a una fase de pruebas
qumicas.
Aqu, en varias mquinas se les hacen pruebas de disolucin de qumicos, de impurezas, un
anlisis de a nivel de tomos, otro a nivel de luz, y finalmente se coloca en un simulador del
comportamiento del frmaco en el organismo humano y suponer cmo se diluye y absorbe en
el cuerpo humano.
Fuente: http://www.nacion.com/2012-09-18/AldeaGlobal/ccss-mostro-proceso-de-control-de-
calidad-de-medicamentos.aspx

Con base en esta lectura determine, con respecto al control de calidad de los medicamentos
descrito, indique:
a. Cul sera la unidad estadstica?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
37

b. Indique cuatro variables que satisfagan las siguientes condiciones:


Una variable cualitativa que se mida en escala ordinal.
Una variable cuantitativa discreta.
Una variable cualitativa que se mida en escala nominal.
Una variable continua que se mida en escala de razn.
c. Cul es el mtodo de recoleccin de la informacin y cul sera un instrumento de
recoleccin de la informacin? Explique.

7. Una institucin est interesada en conocer el efecto de distintos tipos de frmacos en


pacientes geritricos, dado que esta poblacin ha experimentado un mayor crecimiento en
aos recientes. En la investigacin se tom una muestra de adultos mayores y se estudiaron
variables como: edad (en aos), peso (en kilogramos), estado nutricional (categorizado como
muy adecuado, adecuado, inadecuado, o muy inadecuado), tipo de frmacos que emplea con
regularidad (analgsicos, anticoagulantes, psicofrmacos, etc.), masa corporal magra (en
porcentaje), y si tiene algn padecimiento heptico (si o no). Clasifique todas las variables
anteriores como cualitativas o cuantitativas. Las variables cuantitativas clasifquelas como
discretas o continuas. Adems, indique el nivel de medicin de cada una de las variables.

8. Cada vez ms personas recurren al quirfano para librarse de las gafas. Se desea realizar un
estudio para determinar cules instituciones estn ofreciendo ese servicio, qu tcnicas
emplean, cules son las calificaciones del personal que realiza estos servicios y cules son los
costos que tienen para los pacientes. Identifique cul es la unidad de estudio en es esta
situacin y seale cuatro variables de inters.

9. Una empresa de desarrollos habitacionales est estudiando la posibilidad de construir un


condominio en una zona urbana. Se sabe que es necesario conocer la disponibilidad de
diversos servicios, como el agua, la electricidad, etc. Indique cules podran ser 4 variables de
inters para un estudio de este tipo. Clasifique esas variables e indique sus niveles de
medicin.

10. Una empresa ha estado recibiendo quejas y devoluciones de sus clientes, dado que el
producto tena algn defecto de fabricacin. El ingeniero a cargo del proceso de produccin
decide que debe realizar algunas mejoras y que debe hacer un estudio estadstico para obtener
informacin al respecto. Cul es la unidad estadstica en este caso? Es la poblacin finita o
infinita? Cules podran ser tres variables del estudio (clasifquelas segn su naturaleza)?
Deber emplearse la poblacin o una muestra para realizar el estudio?

11. Una empresa electrnica toma una muestra de cuatro tipos de componentes electrnicos
para determinar su tiempo de funcionamiento hasta que fallen. Con respecto a este problema,
cul es la unidad de estudio? Seale dos variables de inters y clasifquelas como cualitativas
o cuantitativas.

12. La presencia de manganeso en la gasolina puede significar un problema, pues genera


ciertos daos a los vehculos, a la salud de las personas y al ambiente. Ante la duda de altas
concentraciones de esta sustancia en la gasolina vendida en el pas se toman muestras en los
distintos planteles de la compaa refinadora de petrleo para que vaya a ser estudiadas en un
laboratorio. Cuatro personas discuten sobre esta situacin e indican lo siguiente:
Luis: En este problema especfico del manganeso la unidad de estudio es la compaa
petrolera y la variable de estudio seran sus prcticas ambientales.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
38

Ana: En mi opinin, la unidad de estudio sera cada plantel, y la variable sera la


concentracin de manganeso en cada plantel.
Marcela: Yo considero que lo que interesa estudiar es la gasolina, y la variable es la
ausencia o presencia de manganeso en cada caso.
Roberto: La unidad de estudio es el manganeso, y la variable es la concentracin de
manganeso en la gasolina.
En cada caso analice la afirmacin de cada persona e indique en cules aspectos tiene la razn
y en cules no.

13. Una institucin financiera desea conocer con detalle el comportamiento de sus clientes
actuales (que han realizado al menos una transaccin al mes durante los ltimos 12 meses), y
entonces se va a realizar un estudio estadstico que permita obtener datos sobre aspectos como
sus hbitos de consumo y ahorro, los servicios financieros que ms emplean, utilizacin de
servicios de la competencia y qu tan satisfechos se sienten con la oferta actual de la
compaa, para as contar con la informacin necesaria que les permita lograr un crecimiento
importante en el mercado. Los aspectos anteriores desea clasificarlos segn el sexo del
cliente, su nivel de ingresos, la edad, el estado civil, su grado acadmico, la actividad a la que
se dedica y el volumen de operaciones que maneja en la institucin.
Con base en esta informacin defina:
a. Cul es la unidad estadstica?
b. Cul es la poblacin?
c. Con respecto a las variables bajo estudio, seale:
- Dos variables cualitativas
- Dos variables cuantitativas
- Una variable cuantitativa discreta
- Dos variables cuantitativas continuas
- Dos variables cualitativas que se midan en escala nominal
- Dos variables cualitativas que se midan en escala ordinal
- Dos variables cuantitativas que se midan en escala de razn
d. Qu sera ms conveniente, realizar el estudio entre toda la poblacin o emplear
una muestra? Explique.

14. En una empresa se desea efectuar un estudio de clima organizacional. El departamento de


recursos humanos est a cargo y debe definir aspectos como la poblacin bajo estudio, el tipo
de instrumento a utilizar, si se debe emplear una muestra o no, y las variables que se van a
incluir en el estudio (indique al menos 6 variables, clasifquelas e indique el nivel de medicin
de cada una).

15. Una empresa productora de jabones para el hogar est estudiando la posibilidad de lanzar
al mercado un jabn especial para nios. Desea efectuar un estudio estadstico para
determinar si el citado producto tendr la aceptacin suficiente. Con base en esta informacin
responda lo siguiente:
a. Cul es la unidad estadstica de la investigacin que se llevar a cabo?
b. Cite tres caractersticas de la unidad estadstica citada, de modo que una de ellas sea
una variable continua, otra una variable discreta y otra un atributo.
c. D un ejemplo de una posible observacin para cada una de las caractersticas
citadas.
d. Mencione y explique brevemente dos de las fases del estudio estadstico que ser
necesario realizar en este caso.
e. Describa un mtodo que podra emplear la empresa para recolectar la informacin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
39

f. Explique las ventajas y desventajas del mtodo citado en el inciso e.


g. Un gerente de la empresa propone que el muestreo debera hacerse en un barrio
cercano a la fbrica, ya que esas personas conocen el producto, conocen la empresa y
adems se minimizaran los costos. Cul es su opinin al respecto: en favor o en
desacuerdo? Explique por qu. Si est en desacuerdo Qu tipo de muestreo
propondra y por qu?

16. Un contador est realizando una auditora. Necesita analizar los cheques emitidos por una
compaa para verificar la exactitud de sus registros contables. Cul es la unidad estadstica
en este caso? Cules podran ser cuatro variables del estudio (clasifquelas segn su
naturaleza e indique su nivel de medicin)? Deber emplearse la poblacin o una muestra
para realizar el estudio?

17. Un economista est tratando de determinar la relacin que existe entre el ingreso familiar
y los gastos en alimentacin de las familias del pas. Determine qu tipo de muestreo podra
emplearse (aleatorio o no aleatorio), e indique las ventajas y desventajas que podra tener cada
tipo de muestreo. Adems, seale cules podran ser algunas fuentes de informacin que se
podran emplear. Indique si son fuentes primarias o secundarias.

18. La cmara de empresas tursticas local est efectuando un estudio sobre las expectativas
de estos empresarios. Se aplica un cuestionario entre una muestra de empresas relacionadas
con el turismo en el pas. En el cuestionario se preguntaron a los gerentes de las empresas
aspectos como el grado de satisfaccin con la rentabilidad de su negocio, sus planes de
contratacin de personal para los prximos meses, su percepcin de la demanda del servicio
que presta, el tipo de negocio (hotel, restaurante, operador de tours, etc.). a. Una persona
comenta que en este estudio la unidad estadstica es el gerente de cada empresa, pero otra
persona le contradice y afirma que la unidad estadstica es la empresa. Cul de los dos cree
usted que tiene la razn? b. Anteriormente se mencionaron 4 variables del estudio.
Clasifquelas como cualitativas o cuantitativas e indique su escala de medicin.

19. Una educadora desea conocer la efectividad de un nuevo mtodo de enseanza de la lecto-
escritura. Decide que debe realizar un estudio estadstico para comparar un mtodo tradicional
con el mtodo nuevo. Cul es la unidad estadstica en este caso? Cules podran ser cuatro
variables del estudio (clasifquelas segn su naturaleza e indique su nivel de medicin)?
Deber emplearse la poblacin o una muestra para realizar el estudio? Cul mtodo debera
emplear para recopilar la informacin? Cul podra ser un sesgo que se cometa en este
investigacin y qu debera hacer la educadora para prevenirlo?

20. El fenmeno de la drogadiccin entre estudiantes de secundaria es un problema grave. Un


psiclogo est interesado en conocer el papel que juegan las familias, por lo que desea
investigar ms sobre el asunto, por lo que desea conocer cmo podra relacionarse este
problema con aspectos especficos como si la madre trabaja, si los jvenes viven tanto con su
padre como su madre, o solo uno de ellos u otro familiar, el nivel de escolaridad de los padres,
la cantidad de tiempo que los padres dedican a atender a sus hijos, el nmero de miembros del
hogar y el ingreso neto total del hogar. Clasifique las caractersticas anteriores como
cualitativas o cuantitativas. Las que sean cuantitativas indique si son discretas o continuas.

21. Segn un estudio realizado por la Escuela de Negocios de la Universidad de Edimburgo,


en el Reino Unido, conforme ms amigos tiene una persona en la red social Facebook, mayor
podra ser el nivel de estrs al que se vea sometido. Los investigadores realizaron el estudio en

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
40

ms de 300 personas que utilizan esta red social a diario. Uno de los hallazgos fue que los
niveles de ansiedad en las personas aumentan cuando su jefe o sus padres les enven una
solicitud de amistad, principalmente cuando el usuario presenta en Facebook una imagen de s
mismo que podra no ser aceptable para algunos de sus esos amigos, como cuando dicen
malas palabras o publican fotografas fumando, tomando licor, etc. Con base en esta situacin
identifique: a. La unidad estadstica en el estudio. b. Tres variables del estudio. c. Clasifique
las variables como cualitativas o cuantitativas. d. Indique el nivel de medicin de las
variables. e. Por qu es necesario emplear una muestra en un estudio de este tipo? f. Cul es
el instrumento de medicin empleado?

22. Una trabajadora social requiere analizar las condiciones en que se encuentran las personas
que estn albergadas en hogares de ancianos de la ciudad capital. Para formular su
investigacin debe determinar cul es la unidad estadstica y su poblacin, definir las
variables de su estudio (una variable cualitativa que se mida en escala nominal, una variable
cualitativa que se mida en escala ordinal, una variable cuantitativa discreta y una variable
cuantitativa continua), y, finalmente, decidir si realiza su estudio visitando toda la poblacin o
si emplea una muestra.

23. Un politlogo est interesado en conocer ms sobre el fenmeno del abstencionismo en


las elecciones presidenciales del pas. Desea realizar un estudio por muestreo en el que se
pregunte a las personas su edad (en aos), la zona en que reside (urbana o rural), si vot en la
ltima eleccin (si o no), la razn por la cual vot o por la que no vot (se da una lista de
opciones en cada caso), su nivel de escolaridad (primaria incompleta, primaria completa,
secundaria incompleta, etc.). Clasifique las variables anteriores segn su naturaleza e indique
el nivel de medicin de cada una.

24. Una empresa desea monitorear la publicidad que estn haciendo las empresas de
telecomunicaciones del pas. Cules podran ser cuatro variables del estudio (clasifquelas
segn su naturaleza e indique el nivel de medicin de cada una)? Cul mtodo debera
emplear para recopilar la informacin? Cul podra ser un sesgo que se cometa en este
investigacin y qu debera hacer la educadora para prevenirlo?

25. Una compaa est preocupada por su imagen ante clientes, proveedores, acreedores y la
comunidad donde opera la empresa. Antes de implementar algn tipo de medida en este
sentido desea conocer ms informacin sobre la imagen que tiene ante cada uno de estos
grupos. En una reunin en que se espera definir detalles sobre la investigacin que se debe
realizar, un ejecutivo expresa que el estudio tendr una sola poblacin y que estar compuesta
por todas aquellas personas que sean sus clientes, miembros de alguna empresa proveedora o
acreedora, o que resida en la comunidad aledaa a la empresa. Otro ejecutivo considera que
en realidad son 4 poblaciones distintas, y que no todas estn compuestas por personas. Cul
de los dos considera usted que tiene razn?

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html):

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
41

1. La estadstica es un conjunto de ___________ aplicadas a la recoleccin, descripcin y


anlisis de datos, los cuales constituyen evidencia numrica para la toma de decisiones en
condiciones de __________. La opcin que mejor completa la frase anterior:
( a ) sistemas; incertidumbre
( b ) mtodos y teoras; incertidumbre
( c ) mtodos y teoras; certidumbre
( d ) mtodos y teoras; riesgo

2. Una _____________ es una parte representativa de la poblacin que se selecciona para ser
estudiada ya que la poblacin es demasiado grande para ser estudiada en su totalidad. La
opcin que mejor completa la frase anterior es:
( a ) Caracterstica
( b ) Muestra
( c ) Observacin
( d ) Poblacin

3. Considere el siguiente concepto: "unidad de inters en el campo bajo estudio, sobre la cual
recae la observacin y de la cual se derivan los datos para el anlisis". Esto corresponde al
concepto de:
( a ) Unidad estadstica
( b ) Caracterstica
( c ) Muestra
( d ) Poblacin

4. De las siguientes, no es una razn para trabajar con muestras en vez de la poblacin es:
( a ) La poblacin se destruye al estudiarla
( b ) El costo de estudiar la poblacin es muy alto
( c ) La poblacin es muy grande
( d ) Ninguna de las anteriores

5. Con respecto a la variable estatura es falso que:


( a ) Se mide en una escala de razn
( b ) Es una variable cuantitativa discreta, pues la gente siempre la da como un nmero entero
( c ) No se puede medir en una escala ordinal, o sea, como grande, mediano, pequeo
( d ) No es una caracterstica de la unidad estadstica

6. Un ingeniero debe estimar si las varillas de construccin que la compaa ha comprado


satisfacen los requerimientos establecidos en cuanto al dimetro de las mismas. Para ello se
formula lo siguiente:

A. La unidad estadstica es el dimetro de las varillas, pues es lo que le interesa saber.


B. Dado que se han comprado miles de varillas, lo mejor ser tomar una muestra de al
menos la mitad de las varillas para tener una muestra representativa.

De las anteriores, con toda certeza, son correctas:


( a ) Ambas afirmaciones
( b ) Solo la afirmacin A
( c ) Solo la afirmacin B
( d ) Ninguna de las afirmaciones

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
42

7. Considere las dos siguientes afirmaciones:

A. En algunos casos es necesario emplear una muestra porque la poblacin se


destruira al estudiarla.
B. La principal razn para estudiar una muestra en vez de la poblacin es reducir los
costos.

Con respecto a las dos afirmaciones anteriores, es correcto que:


( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas

8. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parmetros establecidos por la compaa. Para ello se formula lo
siguiente:

A. La unidad estadstica es el tiempo promedio, pues es lo que le interesa saber.


B. Dado que se han contratado cientos de operarios, lo mejor ser tomar una muestra
de al menos el 80% de los operarios para tener una muestra representativa.

De las anteriores, son correctas con toda certeza:


( a ) Ambas afirmaciones ( b ) Solo la afirmacin A
( c ) Solo la afirmacin B ( d ) Ninguna de las afirmaciones

9. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parmetros establecidos por la compaa. La caracterstica tiempo
de realizacin de la actividad es una variable que se mide en una escala:
( a ) De razn ( b ) Ordinal
( c ) De intervalo ( d ) Nominal

10. Un ingeniero requiere determinar si los tiempos que duran los operarios en realizar una
actividad se ajustan a los parmetros establecidos por la compaa. Si la caracterstica grado
acadmico del operario se evala como Primaria incompleta, primaria completa, secundaria
incompleta, secundaria completa, entonces la variable se mide en una escala:
( a ) De razn ( b ) Ordinal
( c ) De intervalo ( d ) Nominal

11. El gerente de un centro de llamadas desea evaluar el desempeo del sistema y para ello
decide basarse en los tiempos de espera de los clientes para ser atendidos (medido en
segundos) y el grado de satisfaccin que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tom una muestra de 12 llamadas
por da de lunes a mircoles. Los siguientes son los tiempos de las muestras tomadas de lunes
a mircoles:

Nmero de muestra (tiempo en segundos)


1 2 3 4 5 6 7 8 9 10 11 12
13 15 15 16 16 16 16 17 17 19 11 21
12 15 15 16 16 15 16 18 15 20 30 40
30 40 45 45 50 50 45 35 60 50 80 100
Las preguntas de la 11 a la 17 se basan en la informacin anterior.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
43

Una variable medida en escala nominal puede ser:


( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendi
( c ) Grado de satisfaccin del cliente ( d ) Nmero de llamadas hechas por el cliente

12. Con base en la informacin de la pregunta 11, una variable medida en escala ordinal
puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendi
( c ) Grado de satisfaccin del cliente ( d ) Nmero de llamadas hechas por el cliente

13. Con base en la informacin de la pregunta 11, una variable medida en escala de razn
puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendi
( c ) Grado de satisfaccin del cliente ( d ) Ninguna de las anteriores

14. Con base en la informacin de la pregunta 11, una variable cualitativa puede ser:
( a ) Tiempo de espera ( b ) Nmero de llamadas atendidas por da
( c ) Grado de satisfaccin del cliente ( d ) Nmero de llamadas hechas por el cliente

15. Con base en la informacin de la pregunta 11, una variable continua puede ser:
( a ) Tiempo de espera ( b ) Nmero de llamadas atendidas
( c ) Grado de satisfaccin del cliente ( d ) Nmero de llamadas hechas por el cliente

16. Con base en la informacin de la pregunta 11, una variable discreta puede ser:
( a ) Tiempo de espera ( b ) Nombre del agente de servicio que atendi
( c ) Grado de satisfaccin del cliente ( d ) Ninguna de las anteriores

17. Con base en la informacin de la pregunta 11, considere las dos siguientes afirmaciones:

A. Si el centro de llamadas tiene un sistema que registra los tiempos de todas las
llamadas, es mejor hacer un censo.
B. Dado que son muchas las llamadas, es necesario tomar una muestra muy grande.

Con respecto a las dos afirmaciones anteriores, es correcto con toda certeza que:
( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas

Respuestas a los ejercicios de seleccin mltiple:

1. b 2. b 3. a 4. d
5. b 6. d 7. a 8. d
9. a 10. b 11. b 12. c
13. a 14. c 15. a 16. d
17. b

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
44

2 .

Presentacin de la informacin
estadstica
OBJETIVOS:
Al concluir el captulo, ser capaz de:
Identificar las formas principales de presentar la informacin estadstica.
Presentar apropiadamente la informacin estadstica en un formato textual.
Elaborar cuadros estadsticos.
Construir grficos adecuados segn el tipo de datos.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
45

Presentacin de los datos


En una investigacin estadstica, una vez que se tiene la informacin recopilada, por ejemplo
cuestionarios ya contestados, es necesario ordenar los datos y clasificarlos adecuadamente (lo
que se conoce como procesamiento de la informacin) para luego presentar estos datos en
forma resumida, lo cual puede hacerse en forma textual (o sea, dentro de un texto) o
empleando cuadros y grficos.

Material En la pgina de internet de este texto


podr encontrar una presentacin de
audiovisual diapositivas que expone este tema y es un
complemento a este texto.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Presentacin textual
En este mtodo de presentacin de la informacin se emplean palabras y cifras combinadas en
el texto, con el fin de informar los datos obtenidos. Observemos el siguiente ejemplo:

De acuerdo con la encuesta aplicada, el 30% de los entrevistados estudia en una


universidad privada, mientras que el restante 70% estudia en una universidad pblica. A
su vez, el 40% de estos estudiantes de universidades privadas estudia alguna carrera del
rea de los negocios, un 30% una carrera de ingeniera, un 15% estudian carreras de
ciencias sociales, un 10% carreras de educacin, mientras que solo el 5% de los
estudiantes de universidades privadas entrevistados estudia una carrera relacionada con
las ciencias de la salud.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
46

Este mtodo, desde la perspectiva del lector, puede ser ms engorroso, pues la presentacin
de muchos datos puede ser muy extensa. Para el redactor, este mtodo tiene la ventaja de que
puede explicar los datos y las conclusiones a la que llega, y se emplea principalmente cuando
la cantidad de datos es poca.

Cuadros estadsticos

Caractersticas de los cuadros


La presentacin tabular, o sea, en forma de cuadros o tablas, se utiliza principalmente cuando
la cantidad de datos que se quiere presentar es grande. Por ejemplo, si se tienen los datos de
poblacin de todos los pases de Amrica Latina para tres aos distintos. Esta gran cantidad
de datos presentados de forma textual produciran un texto extenso y poco agradable, mientras
que a travs de un cuadro va a ser fcil comparar unos pases con otros o comparar unos aos
con otros.

CUADRO ESTADSTICO Es una forma de presentacin de la informacin


estadstica que utiliza una filas y columnas en las que se incluyen los datos que se desea
presentar.

Al construir las tablas es posible dar nfasis a ciertas cifras y analizar con detalle los
componentes de un total, por lo que los cuadros son sumamente tiles y muy utilizados en los
informes estadsticos.

Construccin de cuadros
Las partes esenciales de un cuadro o tabla bien diseado son:

Ttulo: se ubica en la parte superior central del cuadro, debe estar redactado con claridad,
y responder a cuatro preguntas bsicas:
o Dnde? Indicar el pas, regin, empresa, institucin, etc. donde sucedi el evento
con el que se relacionan los datos del cuadro.
o Qu? Indicar cul variable o caracterstica es a la que corresponden los datos del
cuadro.
o Cundo? Esto es mostrar la fecha o periodo al que corresponden las cifras del
cuadro.
o Cmo? Debe indicarse con claridad la forma en que vienen expresados los datos,
por ejemplo si son cifras en unidades monetarias, en millones, si son cifras
relativas, etc. Para esto a veces se emplea una nota introductoria, generalmente
entre parntesis, para indicar estos aspectos que son importantes para comprender
adecuadamente los datos mostrados.
Columna matriz: esta es la primera columna a la izquierda del cuadro. En esta columna
se indica cules son las partidas o componentes presentados horizontalmente en el cuadro,
por ejemplo, pases, empresas, productos, etc. Dependiendo de tipo de dato la columna
matriz va a tener un orden particular, por ejemplo:
o Alfabtico: Se usa, por ejemplo, para ordenar pases.
o Cronolgico: Cuando la columna matriz contiene aos, meses, etc.
o Por magnitud: Ciertos datos se ordenan de mayor a menor, o viceversa. Por
ejemplo, cuando se muestra la cantidad de personas segn su estado civil.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
47

o Numrico: Cuando los datos de la columna matriz corresponden a una variable


cuantitativa, como pesos, distancias, etc.
o Orden usual: Algunas variables tienen un orden "acostumbrado". Por ejemplo,
generalmente las provincias o estados de un pas tienen un orden usual.
Encabezados: muestran cmo se presentan verticalmente los datos en el cuadro. Por
ejemplo, por ao, por sexo, etc. En ocasiones puede ser compuestos, por ejemplo, si los
datos aparecen por sexo, y a su vez en trminos absolutos y relativos.
Cuerpo del cuadro: es propiamente donde aparecen los datos del cuadro.
Notas al pie: son opcionales y se usan cuando es necesario aclarar algn dato. Por
ejemplo, cuando una cifra es una estimacin. Generalmente tiene un tamao de letra ms
pequeo que el resto del cuadro.
Fuente: cuando los datos del cuadro no han sido elaborados por el investigador, entonces,
por honestidad intelectual, debe indicarse de dnde procede la informacin. En este
sentido se debe indicar: nombre del autor original de los datos, ao de publicacin,
nombre de la obra, editorial, pas, pginas donde se encuentran los datos. Generalmente
tiene un tamao de letra ms pequeo que el resto del cuadro.

Nmero de cuadro
Ttulo del cuadro: dnde? qu?
cundo? cmo?

Encabezados

Columna
matriz Cuerpo del cuadro

Notas al pie:
Fuente:

Un detalle importante es que siempre debe indicarse la unidad de medida en que estn
expresadas las cifras, ya sea como nota introductoria en el ttulo, en el encabezado de las
columnas o en la clasificacin correspondiente en la columna matriz. Igualmente, para
facilitar el anlisis pueden incluirse en el cuerpo del cuadro ndices, porcentajes, promedios u
otros datos tiles.

Adems normalmente no se emplea el rayado vertical, salvo que sea necesario para separar las
columnas. El rayado horizontal solo se usa en los encabezados y en la ltima fila, o en la fila
de totales. El cuadro debe tener proporciones adecuadas, o sea, que no sea excesivamente
ancho o demasiado alto.

Ejemplos:

Cuadro #1
Centroamrica: matrcula inicial en los primeros niveles,
segn nivel educativo, por pases.
1997

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
48

(Datos en miles)

Nivel
Pas Preescolar Primaria Secundaria Total
Costa Rica 71.1 525.3 220.2 816.5
El Salvador 179.0 1191.1 152.5 1522.6
Guatemala 221.8 1539.5 317.4 2078.6
Honduras 86.1 1055.0 271.1 1412.1
Nicaragua 133.1 777.9 270.5 1811.5
Panam 45.3 377.9 223.2 646.4
Total 736.4 5466.6 1451.7 7657.7
Fuente: Informe Estado de la Regin en Desarrollo Humano Sostenible.
Proyecto Estado de la Regin. San Jos, C.R.: 1999, pg. 169.

Cuadro #2
MERCOSUR: Tasa de desempleo abierto trimestral, 20071/
(Como porcentaje de la PEA)

Pases Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


Argentina 2/ 9.8 8.5 8.1 7.5
Brasil 3/ 9.8 10,0 9.3 8.1
Uruguay 2/ 10.4 10.1 9.4 8.6
Venezuela 4/ 10.3 8.4 8.5 6.7
Notas: 1/ No se obtuvo el dato para Paraguay. 2/ Tasa de desempleo abierto en zonas urbanas. 3/ Incluye solo seis
reas metropolitanas. 4/ Total nacional.
Fuente: CEPAL. CEPALSTAT Bases de datos. Recuperado el 2 de octubre de 2012 de
http://websie.eclac.cl/sisgen/ConsultaIntegrada.asp?idAplicacion=6&idTema=359&idioma=e

Ejercicio Con base en los datos proporcionados elabore un cuadro estadstico


completo que incluya todas las partes de un cuadro:
de
revisin Considere la siguiente informacin que se obtuvo del estudio
Comportamiento Clnico y Epidemiolgico de las Infecciones
Nosocomiales en la Unidad de Cuidados Intensivos Neonatales del
Hospital Dr. Oscar Danilo Rosales Argello.

Al momento de su egreso fallecieron 61.4% de los recin nacidos.


De ellos el 67.4% fue por enterobacter y 16.2 por pseudomonas
aeruginosa. Un 31.4% de los recin nacidos fue dado de alta y
abandonaron el centro hospitalario un 7.1% en muy malas
condiciones.
El proyecto fue elaborado por la Dra. Juana Mara Membreo
Sequeira en el perodo comprendido de octubre 2002 a enero 2004
y fue publicado en
http://www.minsa.gob.ni/enfermeria/PDF/327.pdf en marzo de
2004.

Ver solucin de este ejercicio en la pgina de internet de este texto:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
49

www.auladeeconomia.com/raeep.html

Representacin grfica

Caractersticas de los grficos


Los grficos son de las principales formas de presentar informacin estadstica, ya que
tienden a ser ms atractivos y fciles de comprender.

GRFICA Conjunto de figuras geomtricas que se emplean para representar un


conjunto de datos estadsticos.

La principal ventaja de los grficos es que permiten llamar la atencin ms que las otras
formas de presentacin de datos, adems de que tienden a ser ms fciles y rpidos de
comprender que un cuadro y facilitan las comparaciones. La principal desventaja es que no se
puede presentar tanto detalle en la informacin como si se puede hacer en un cuadro.

Construccin de grficos
Un grfico de cualquier tipo tiene las siguientes partes, y stas siguen las mismas
consideraciones hechas para el caso de los cuadros:

Ttulo: se ubica en la parte superior central del grfico, debe estar redactado con claridad,
sealar qu datos se presentan en el cuadro, el lugar donde ocurri el evento al que se
refieren los datos, la fecha o periodo al que corresponden y la forma en que vienen
expresados los mismos. Muchas veces el ttulo incluye una nota introductoria, para
explicar algn aspecto importante relacionado con las cifras presentadas. En resumen se
puede decir que un buen ttulo de un grfico debe responder a las preguntas: qu?,
dnde?, cundo? Y cmo?, con su respectiva nota introductoria si es necesario.
Escalas y leyendas: las leyendas indican el concepto o variable que se representa en cada
coordenada y las unidades de medida empleadas.
Las figuras geomtricas, las cuales representan los datos.
Notas al pie: es opcional y se emplea cuando es necesario aclarar algunas cifras del
cuadro.
Fuente: cuando el autor del grfico no sea el productor original de los datos presentados
en la grfica.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
50

Apoyo En la pgina de internet www.auladeeconomia.com/raeep.html podr


encontrar una presentacin con cuatro pasos esenciales para construir un
audiovisual grfico. Adicionalmente puede encontrar algunos videos explicativos
y uso de la sobre la construccin de grficos en Excel y otros programas como
tecnologa Minitab.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Material En la pgina de internet de este texto


podr encontrar un video que expone
audiovisual cmo crear grficos en Excel. Tambin
hay videos sobre la creacin de grficos
en Minitab.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
51

Clases de grficos
Grficos de barras
Este tipo de grficos se emplean principalmente se utilizan para hacer comparaciones, ya sea
entre distintas partidas, como pases, productos, etc., o a lo largo del tiempo. Se usan barras
verticales para representar series de tiempo (series cronolgicas) o datos cuantitativos (en el
caso de distribuciones de frecuencia). Las barras horizontales se emplean cuando los datos
estn clasificados de acuerdo con una caracterstica cualitativa, como lo son datos segn pas,
segn servicio o producto, departamento, etc.

GRFICO DE BARRAS Representacin grfica en que emplea un conjunto de


rectngulos colocados paralelamente de forma que la extensin de cada uno es
proporcional a la magnitud que representa.

Por lo general, se recomienda que las barras no sean demasiado angostas ni demasiado
anchas, y que entre barra y barra debe dejarse un espacio apropiado, excepto en los
histogramas, los cuales se estudiarn en el captulo 4 en el tema de distribuciones de
frecuencias.

Grfico de barras simples


En el caso de las barras horizontales simples es un conjunto de barras horizontales, todas de
un mismo ancho, que presentan datos clasificados de acuerdo con una caracterstica
cualitativa. El siguiente es un ejemplo del uso de las barras horizontales en datos clasificados
geogrficamente:

Costa Rica: Valor de las exportaciones tradicionales por tipo de producto, 2011
(Valor FOB en millones de US$)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
52

Banano

Caf

Azcar

Carne

0,0 100,0 200,0 300,0 400,0 500,0 600,0 700,0 800,0


En millones de US$

Fuente: Banco Central de Costa Rica (2012). Exportaciones FOB por tipo de producto. Recuperado el 12 de octubre de 2012,
http://indicadoreseconomicos.bccr.fi.cr/indicadoreseconomicos/Cuadros/frmVerCatCuadro.aspx?CodCuadro=479&Idioma=1
&FecInicial=1997/01/31&FecFinal=2012/12/31&Filtro=0&Jump=1

Aplicacin Grficas de Gantt


Un proyecto est compuesto por una serie de actividades secuenciales, o
sea, que es necesario concluir unas actividades para poder iniciar otras. Por
ejemplo, al construir una casa, es necesario haber terminado las paredes
para poder construir los techos, y mientras los techos no estn terminados
no se va realizar la instalacin elctrica. Adems, cada actividad tiene una
duracin estimada.

La grfica de Gantt es un tipo de grfica de barras que se ha convertido en


una herramienta que ayuda al gestor de un proyecto a visualizar la
secuencia de actividades a lo largo del tiempo. Por ejemplo, la siguiente
grfica correspondera a un proyecto compuesto por 6 actividades. La
actividad A es la primera y las actividades B y C pueden iniciar cuando la
actividad A est concluida.

El encargado del proyecto podra agregar las fechas de inicio y


terminacin de las actividades del proyecto en el eje horizontal, y as la
grfica sera una herramienta til en la programacin y control de la
ejecucin del proyecto. Existe software que permite crear estas grficas
con facilidad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
53

Cuando la serie es cronolgica, entonces se puede construir un grfico de barras verticales. En


el eje horizontal siempre va a aparecer el tiempo, expresado en aos, meses, das, etc., y en el
eje vertical el valor de la variable en cuestin. La siguiente grfica es un ejemplo del uso de la
grfica de barras verticales. El siguiente es un ejemplo de la utilizacin de las barras verticales
simples:

Mxico: Distribucin del ingreso 2000 a 2010


(ndice de concentracin de Gini)
0,550
0,540
0,530
0,520
0,510
0,500
0,490
0,480
0,470
0,460
0,450
2000 2002 2004 2006 2008 2010
Fuente: CEPAL. CEPALSTAT, Estadsticas e indicadores sociales. Recuperado el 3 de octubre de 2012 de
http://websie.eclac.cl/sisgen/ConsultaIntegrada.asp?idAplicacion=1&idTema=363&idioma=e

Aplicacin Grficas de velas


En los mercados burstiles, de divisas (Forex) y de otros activos se
emplean las grficas de velas (candelas o velas japonesas), las cuales
proveen informacin al inversionista sobre los precios de apertura, cierre,
mnimo y mximo de cada sesin o periodo de transacciones en el
mercado.

La grfica consiste en un rectngulo que indica los precios de apertura y


cierre, y dos lneas que indican los precios mximo y mnimo.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
54

Mximo
23

22
Cierre
21

20 Apertura

19 Mnimo

Por ejemplo, suponga que la grfica siguiente representa el precio de una


accin de una empresa, cuyo precio de apertura en una determinada sesin
de la bolsa de valores fue de $20, por eso la base del rectngulo inicia al
nivel de $20 con respecto al eje vertical. Durante esa sesin el precio de la
accin baj hasta $19, por eso sale una lnea que llega hasta ese valor.
Tambin, durante esa sesin el precio lleg a subir hasta $23, como lo
indica la lnea en la parte superior del rectngulo. Al final de la sesin, el
precio cerr en $21,50 como lo seala el lado superior del rectngulo.

Estas grficas son elaboradas empleando sistemas informticos. Cuando el


precio sube, segn el sistema que genera la grfica, la vela es,
generalmente, de color verde o azul, pero cuando el precio baja, lo usual es
que sea roja. Observe el siguiente grfico que muestra un conjunto de vela
a lo largo de varios das y cmo ayudan a observar la tendencia en los
precios de los activos transados.

25

24

23

22

21

20

19

18

17

16
1/10 8/10 13/10 20/10

Grfico de barras comparativas


Este tipo de barras se emplean para comparar (de ah su nombre) varias series, ya sean
cualitativas o cronolgicas. Cuando lo que se desea es comparar varias categoras cada una de
las cuales se divide en varias partes, entonces se pueden usar barras horizontales
comparativas, como en el siguiente grfico, en el cual se compara de pas a pas, pero cada
una de las categoras (los pases) se dividen en poblacin urbana y poblacin rural.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
55

Amrica del Sur: Porcentaje de poblacin urbana y rural, por pas,


2000

Venezuela

Uruguay

Per

Paraguay

Ecuador

Rural
Colombia
Urbana

Chile

Brasil

Bolivia

Argentina

0,0 20,0 40,0 60,0 80,0 100,0


Porcentaje

Fuente: Base de datos DEPUALC, 2009. CELADEDivisin de poblacin de la CEPAL. www.cepal.org/celade/depualc

Cuando la finalidad es comparar varias series cronolgicas, entonces se pueden usar las barras
verticales comparativas. Por ejemplo, en el siguiente grfico se muestra la evolucin del
porcentaje de hogares con acceso a servicios de telefona celular y el porcentaje de hogares
con computadora en Colombia en el periodo que va del ao 2006 al 2009.

Colombia: Porcentaje de hogares que tienen telfono celular mvil


y porcentaje de hogares que tienen computadora,
2006 2009

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
56

90,0
80,0
70,0
60,0
50,0
40,0
30,0
20,0
10,0
0,0
2006 2007 2008 2009

Hogares que tienen telfono celular Hogares que tienen computadora

Fuente: CEPAL (2012). CEPAL STAT Indicadores de tecnologas de informacin: Acceso a TIC en los hogares.
Recuperado el 9 de octubre de 2012 de http://websie.eclac.cl/sisgen/ConsultaIntegrada.asp?idAplicacion=16&idioma=e

Grfico de barra 100 %


Cuando interesa mostrar las partes en que se divide un todo o la estructura que compone un
todo (igual que la grfica circular o de pastel), se puede usar la barra 100%. Para construir
este tipo de grfico las partes se presentan, presentando abajo la mayor y de ah hasta la
menor (o de izquierda a derecha, si se hace horizontal), de modo que cada parte se
proporcional a la cifra que representa, la cual se muestra como porcentaje del total. Si ese
total se divide en muchas partes o si hay partes muy pequeas, entonces no se recomienda el
uso de este tipo de grfico, excepto que sea posible fusionar algunas de esas partes,
generalmente en una categora denominada "otros".

El siguiente es un ejemplo de la aplicacin de este tipo de grfica:

Argentina: Gasto en Investigacin y Desarrollo (I+D)


por sector de financiamiento, 2004

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
57

100%
90%
80%
70%
Otras fuentes nacionales
60%
Extranjero
50%
Empresa
40%
Gobierno
30%
20%
10%
0%
Fuente: CEPAL (2012). InfoData: Indicadores de composicin de gasto en I+D.
Recuperado el 26 de setiembre de 2012 de http://www.eclac.cl/iyd/website/default_002.asp

Grfico de barras compuestas


Este tipo de barras se emplea para representar la composicin o estructura de las partes que
componen una serie de totales. Segn si la serie es cualitativa o cronolgica pueden ser
horizontales o verticales, respectivamente. Adems, podran confeccionarse con las cifras
absolutas o relativas. En este ltimo caso, sera equivalente a tener varias grficas de barra
100% juntas. El siguiente grfico es un ejemplo de barras horizontales compuestas.

Centroamrica: Ingresos tributarios generados por


impuestos indirectos por pas, 2010
(en millones de dlares)
0 200 400 600 800 1000 1200

Costa Rica

El Salvador

Guatemala

Honduras

Nicaragua

Impuestos generales sobre bienes y servicios


Impuestos especficos sobre bienes y servicios

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
58

Fuente: CEPAL (2012). InfoData: Indicadores fiscales. Recuperado el 10 de octubre de 2012 de


http://websie.eclac.cl/sisgen/ConsultaIntegrada.asp?idAplicacion=6&idTema=140&idioma=e

La siguiente grfica es un ejemplo de una grfica de barras horizontales compuestas, pero en


este caso los datos estn expresados en trminos relativos, por lo cual la longitud de todas las
barras es la misma, es decir, todas llegan al 100%. En la grfica cada barra muestra cmo se
compone la poblacin de cada pas entre poblacin urbana y rural para cada uno de los pases
de Amrica del Sur.

Amrica del Sur: Porcentaje de poblacin urbana y rural, por pas,


2000

Venezuela

Uruguay

Per

Paraguay

Ecuador

Urbana
Colombia
Rural

Chile

Brasil

Bolivia

Argentina

0% 20% 40% 60% 80% 100%


Porcentaje

Fuente: Base de datos DEPUALC, 2009. CELADEDivisin de poblacin de la CEPAL. www.cepal.org/celade/depualc

Las barras compuestas tambin pueden ser verticales, esto cuando la serie sea cronolgica,
como en el ejemplo siguiente, el cual muestra cmo se componen los ingresos por impuestos
indirectos de Nicaragua en el periodo 2007 a 2010.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
59

Nicaragua: Ingresos tributarios generados por


impuestos indirectos, 2007 2010
(en millones de dlares)
14 000,00
12 000,00
10 000,00
8 000,00
6 000,00
4 000,00
2 000,00
0,00
2007 2008 2009 2010

Impuestos generales sobre bienes y servicios


Impuestos especficos sobre bienes y servicios
Comercio y transacciones internacionales
Fuente: CEPAL (2012). InfoData: Indicadores fiscales. Recuperado el 10 de octubre de 2012 de
http://websie.eclac.cl/sisgen/ConsultaIntegrada.asp?idAplicacion=6&idTema=140&idioma=e

Grfico de barras de doble direccin


Este grfico se utiliza para representar las variaciones, o sea, los aumentos y las
disminuciones que una serie podra presentar. Por ejemplo, la grfica siguiente muestra los
saldos de la balanza comercial de Costa Rica para varios aos. Cuando la serie es cualitativa,
entonces estas barras son horizontales, y cuando es cronolgica, entonces son verticales.

Costa Rica: Saldo de la balanza comercial


1995 2004
(en millones de US$)

1995 1996 1997 1998 1999 2000 2001 2002 2003 2004
500,0

0,0

-500,0

-1.000,0

-1.500,0

-2.000,0

-2.500,0

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
60

Fuente: Banco Central de Costa Rica (2012). Balance comercial. Recuperado el 12 de octubre de 2012 de
http://indicadoreseconomicos.bccr.fi.cr/indicadoreseconomicos/Cuadros/frmVerCatCuadro.aspx?CodCuadro=448&Idioma=1
&FecInicial=1995/01/31&FecFinal=2005/12/31&Jump=1

Resumen sobre el uso de grficos de barras:

Grfico circular
El grfico circular es la forma ms empleada para representar la estructura de un todo, o sea,
para mostrar las partes en que se divide un todo. Se emplea en los mismos casos que la barra
100%. En este tipo de grfico cada uno de los componentes del todo es representado por un
sector circular de rea, de manera que cada sector es proporcional a la magnitud de la parte
que representa.

GRFICO CIRCULAR Es un grfico en el cual las partes de un todo son


representadas de manera proporcional como sectores de un crculo.

Se recomienda ordenar los sectores de acuerdo con su magnitud y no es conveniente utilizarlo


cuando el nmero de partes es grande, o bien, cuando hay partes muy pequeas.

Costa Rica: Distribucin de los hogares con acceso a internet


segn categora ocupacional principal, 2009

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
61

Na/Nr, 18%

Empleado Empleador,
asalariado, 52% 13%

Cuenta propia,
16%

Fuente: Encuesta de Hogares de Propsitos Mltiples, 2009.


Recuperado el 26 de setiembre de 2012 de http://www.eclac.cl/tic/flash/.

Aplicacin Diagrama de rea polar


Florence Nightingale fue precursora de la prctica de la enfermera, pero
tambin hizo algunas contribuciones importantes a la estadstica. Durante
la Guerra de Crimea trabaj como enfermera en un hospital de la campaa.
Ella observ que las condiciones higinicas del hospital eran muy pobres y
que en determinados momentos se daban ms muertes por enfermedades
infecciosas que por la guerra misma. Entonces cre un tipo de grfico que
mostrara el nmero de muertes mensuales segn su causa, llamado grfico
de rea polar.

El grfico de rea polar consiste en un crculo que ha sido dividido en


sectores, cada uno del mismo ngulo. Cada uno de estos sectores tiene un
radio diferente, y corresponde a un mes determinado y que muestra en
colores distintos el tipo de causa de muerte. El tamao del sector es
proporcional al nmero de muertes.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
62

En la grfica las zonas azules simbolizan el nmero de muertes por


enfermedades infecciosas, las rojas, muertes por heridas y las negras,
muertes por otras causas.

Nightingale introdujo una serie de mejoras en las condiciones higinicas


que ayudaron a reducir el nmero de muertes por enfermedades
infecciosas.

Grficas lineales
Los grficos lineales se emplean, principalmente, para representar series cronolgicas de
datos, o sea, valores anuales, mensuales, etc.

GRFICA LINEAL Es una representacin de datos en coordenadas cartesianas,


generalmente numricos, mediante lneas, para observar su comportamiento,
frecuentemente a lo largo del tiempo.

El grfico lineal se emplea en los mismos casos que la grfica de barras verticales, pero,
generalmente se prefiere el grfico lineal cuando el nmero de perodos es grande, ya que la
grfica de barras quedara con muchas barras muy delgadas, y entonces no sera atractiva. El
grfico lineal es especialmente til para mostrar la tendencia de una variable a lo largo del
tiempo, o sea, presentar cmo se han comportado en un plazo determinado y cul ha sido su
crecimiento o decrecimiento "absoluto".

En el ejemplo siguiente se observa la relacin produccin / consumo interno en la refinacin


de hidrocarburos en Guatemala, en el periodo 1990 a 1996. Se observa claramente una
tendencia a la baja a partir de 1991.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
63

Guatemala: Refinacin de Hidrocarburos: relacin


produccin/consumo interno. 1990-1996
44
42
40
38
36
34
32
30
1990 1991 1992 1993 1994 1995 1996

Fuente: Informe Estado de la Regin en Desarrollo Humano Sostenible.


Proyecto Estado de la Regin. San Jos, C.R.: 1999.

Al construir grficos es necesario ser muy cuidadoso con el eje vertical, ya que fcilmente
podra construirse un grfico engaoso, como en el caso siguiente, en el cual pareciera que la
variable tiene un fuerte crecimiento, sin embargo su variacin es mnima. Esto se da porque
no se ha incluido el cero en el eje vertical.

71

70,8

70,6

70,4

70,2

70
2009 2010 2011 2012

Para evitar estos problemas con la escala es importante considerar los siguientes aspectos:

En el eje vertical el cero es necesario, pues de otro modo la impresin visual que causa
podra ser distorsionada.
La escala empleada debe facilitar la comparacin, por lo que se recomienda que sea
sencilla, fcil de interpretar.
Cuando se grafican datos de gran magnitud, la curva podra quedar muy arriba en el
grfico, entonces es difcil comenzar la escala con cero, por lo que en estos casos podra
interrumpirse la escala y no mostrar el cero. Cuando se representan nmeros ndices,
tampoco es necesario incluir el cero (pero s es importante la base del ndice).

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
64

Aplicacin Grficas de control


Las empresas preocupadas por el mejoramiento continua realizan un
control estadstico de la calidad. Una de las herramientas que se emplean
en esa gestin de la calidad es la elaboracin de grficas de control. Estas
grficas son un tipo de grfica lineal que permiten llevar estadsticas de un
proceso a lo largo del tiempo y del anlisis de dichas grficas se puede
determinar si el proceso est bajo control o si est fuera de control.

Todo proceso tiene cierta variabilidad, o sea, si, por ejemplo, se llenan
botellas de refresco, van a haber algunas botellas con un poco ms de
refresco y otras con un poco menos. Cuando esas variaciones son pequeas
con respecto a lo especificado, generalmente no representan un problema,
y normalmente son inevitables, y se les denomina causas comunes. Pero
existen otras variaciones que si es posible controlar, por ejemplo, si la
mquina que llena las botellas no ha recibido el mantenimiento adecuado,
el operario es descuidado en el manejo de la mquina o las botellas no se
ajustan bien, entre muchas otras posibles causas especiales o asignables.
Las causas asignables son aquellas que se pueden controlar, y por tanto
deben ser eliminadas. Un proceso est bajo control cuando la variacin se
debe solo a las causas comunes y no a las asignables.

Un grfico de control es como el siguiente. Hay un lmite superior de


control (LSC) y un lmite inferior de control (LIC) y una media o
proporcin, y los valores de la variable controlada fluctan alrededor de
dicha media.

12

LSC 10

Media 6

LIC 2

0
1 2 3 4 5 6 7 8 9 10

En trminos del grfico, un proceso est bajo control cuando todos los
puntos se encuentran dentro de los lmites de los lmites de control (LIC y
LSC) y adems, cuando los puntos no muestran patrones no aleatorios, aun
cuando estn los puntos dentro de los lmites de control. Por ejemplo, en la
siguiente grfica, el tercer punto est fuera de los lmites de control, y

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
65

luego hay otra situacin fuera de control, pues todos los puntos siguientes
estn debajo de la media, lo cual indicara que las variaciones no son
aleatorias, y por tanto ese patrn indicara que no solo las causas comunes
estn provocando variacin en el proceso.

12

LSC 10

Media 6

LIC 2

0
1 2 3 4 5 6 7 8 9 10

Pictogramas
Los pictogramas son similares a los grficos de barras, pero sustituyen las barras por varias
figuras pequeas del mismo tamao. Se utilizan, generalmente, con el objeto de realizar
comparaciones. Generalmente las figuras empleadas se relacionan con la variable graficada.
Por ejemplo, si el dato graficado es produccin de automvil, podran dibujarse pequeos
automviles. Mientras ms automviles aparezcan, es porque se da una mayor produccin.

PICTOGRAMA Es un diagrama que utiliza algn tipo de imagen o smbolo para


mostrar los datos a fin de lograr una rpida comprensin de los mismos.

El siguiente es un ejemplo que se relaciona con los principales productores mundiales de


automviles, por eso en el pictograma, en vez de barras, se dibujan pequeas figuras de
automviles.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
66

Diagrama de dispersin
En muchos casos se desea establecer la relacin que existe entre dos variables de la misma
unidad de estudio. Por ejemplo, el ingreso y el consumo de las personas, la cantidad de tabaco
fumado y la incidencia del cncer, etc.

DIAGRAMA DE DISPERSIN Es un tipo de diagrama que utiliza coordenadas


cartesianas para mostrar los valores de dos variables para un conjunto de datos, de
manera que los datos se presentan como un conjunto de puntos, donde cada uno de
ellos muestra el valor de una variable en el eje horizontal y el valor de la otra variable
en el eje vertical.

Estos diagramas son base de muchos anlisis en los que se puede establecer la correlacin
entre variables.

Amrica Latina: gasto pblico social real en relacin con el PIB,


segn gasto pblico social real per cpita. 1990, 2001

26
Gasto social en relacin con el PIB

24
22
20
18
16
14
12
10
8
6
4
2
0
0 200 400 600 800 1000 1200 1400 1600 1800

Gasto social real per cpita

Fuente: CEPAL, 2004.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
67

Ejercicio Indique qu tipo de grfico empleara para presentar los siguientes datos.
Explique en cada caso:
de
revisin a. Porcentaje de nios de un ao vacunados contra el sarampin para los
pases de Amrica Central en el 2009.
b. Porcentaje de nios de un ao vacunados contra el sarampin para
Costa Rica y Panam del ao 2000 al 2009.
c. Tasa de prevalencia del VIH entre la poblacin de 15 a 49 aos de
edad por sexo para Costa Rica en el 2009.
d. Relacin entre el porcentaje de cobertura de atencin prenatal y la
razn de mortalidad materna por cada 100.000 nacidos vivos para 10
pases de Amrica Latina en el 2006.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Apoyo En la pgina de internet www.auladeeconomia.com/raeep.html podr


encontrar una presentacin de diapositivas que expone este tema y es una
audiovisual parte importante de este texto. Esta presentacin presenta el tema en
y uso de la forma visual, pues emplea fotografas, esquemas u otros recursos
tecnologa visuales.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Ejercicios:
Ejercicios de desarrollo:
Conteste cada una de las preguntas que a continuacin se formulan (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. A continuacin se presenta una lista de variables obtenidas en distintas investigaciones, en


cada caso indique cul tipo de grfico debera efectuarse para representar en forma adecuada
los datos:
a. Tiempo medio de espera de los pacientes de un hospital en el servicio de consulta
externa obtenido mes a mes durante un ao.
b. Prevalencia de enfermedades cardiovasculares por sexo y segn rango de edad.
c. Porcentaje de ratas que presentaron interacciones de un nuevo medicamento con
otras sustancias segn cada tipo de sustancia.
d. Nmero de horas promedio de uso continuo de computadoras de los nios de 6 a 12
aos segn su sexo.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
68

e. Poblacin estimada de ranas en peligro de extincin en las zonas montaosas del


pas para los ltimos 5 aos.
f. Distribucin porcentual de la poblacin del pas segn niveles de peso (delgadez,
normal, obesidad) en el pas durante el ltimo ao.
g. Nmero de viviendas del pas segn su estado y por zona (urbana o rural).
h. Nmero de artculos defectuosos por da en el proceso de produccin de una
empresa para el ltimo mes.
i. Tiempo de fusin de determinados componentes electrnicos segn distintas
sobrecargas.
j. Tipos de medidas de seguridad informtica que las empresas financieras
implementaron en el ltimo semestre segn tipo de entidad (banco, cooperativa,
mutual, etc.).
k. Proporcin de empresas que estn dispuestas a implementar un nuevo sistema
operativo en el transcurso de los prximos doce meses segn tipo de empresa
(pequea, mediana, grande).
l. Rendimiento sobre la inversin promedio de las empresas que cotizan en la Bolsa de
Valores de Nueva York segn su sector de actividad econmica (industria, servicios,
etc.) para los ltimos 10 aos.
m. Porcentaje de habitantes del pas que poseen un telfono "inteligente" segn su
sexo.
n. Distribucin porcentual de los distintos niveles de satisfaccin de los empleados de
una empresa por departamento de la empresa (finanzas, ventas, etc.).
o. Monto promedio mensual de las cuentas por cobrar de una empresa para los ltimos
seis meses.
p. Distribucin porcentual de la percepcin del impacto de un nuevo paquete de
impuestos segn sector productivo del pas.
q. Nmero de turistas que visitan el pas debido a la campaa efectuada por el
gobierno para promocionar al pas como destino turstico segn pas de origen del
turista.
r. Porcentaje de estudiantes de secundaria del pas que emplean con regularidad
internet para efectuar sus tareas segn rango de edad.
s. Nmero de personas que aplicaron para el puesto de gerente financiero segn su tipo
de personalidad de acuerdo con un test aplicado a los candidatos.
t. Distribucin porcentual de la opinin de los jefes del hogar sobre el efecto que
tienen las redes sociales en internet en las relaciones familiares segn rango de edad
del jefe del hogar.
u. Proporcin nios dados en adopcin segn la evaluacin de su estado general de
salud efectuada en el ltimo semestres.
v. Nmero de adultos segn su opinin sobre el efecto de las manifestaciones
estudiantiles en la imagen del gobierno.
w. Composicin porcentual de la opinin de los periodistas del pas segn su grado de
percepcin del respeto a la libertad de prensa que se da en el pas segn grado
acadmico.
x. Volumen mensual de ventas de una compaa segn la exposicin mensual de los
consumidores a los comerciales pautados por la misma empresa para los ltimos 12
meses.

2. Considere la siguiente informacin:


En un estudio sobre la prevalencia del asma en varios pases de Amrica Latina, en el
grupo etario de 6 a 7 aos, medida por el porcentaje de nios con diagnstico mdico

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
69

de la enfermedad con la presencia de los principales sntomas respiratorios sugestivos


de asma. En Brasil esa tasa fue de 11,3%, en Chile de 12,5%, en Costa Rica de 26,9%
y en Panam de 19,3%.
El proyecto fue elaborado por Dr. Manuel SotoMartnez y Dr. Manuel SotoQuirs PhD,
publicado en 2004 en la Revista Mdica del Hospital Nacional de Nios Dr. Carlos Senz
Herrera.
Construya un cuadro estadstico que muestre la tasa de prevalencia del asma mencionada en
los cuatro pases citados. El cuadro debe contener todos los elementos estudiados.

3. Una farmacia comunitaria vende, adems de distintos frmacos, otras lneas de productos,
como productos de belleza, productos de cuidado personal, etc. Se ha reunido informacin de
las ventas de los ltimos 3 aos segn los distintos tipos de productos. En cada caso indique el
tipo de grfico que se podra construir para representar la informacin del modo adecuado:
a. Ventas mensuales totales para los ltimos 36 meses por tipo de producto.
b. Importancia relativa anual de las distintas lneas de producto para los ltimos 3
aos.
c. Comparacin de los montos de ventas totales del ltimo ao por tipo de producto y
segn forma de pago (efectivo o tarjeta).

4. En un peridico se publicaron los siguientes datos sobre las ventas de telfonos celulares
segn su marca: "En el 2011 del 6% de las ventas eran de telfonos marca Samsung, pero para
el 2012 su participacin alcanz el 18%. En ese mismo periodo, la participacin de mercado
de Nokia cay del 69% al 43%. Por otro lado, Apple se mantiene en ambos periodos en un
15% del total. Sony ha perdido un poco de participacin, pasando del 16% al 12%".
a. Construya una tabla que muestre los datos presentados anteriormente.
b. Construya una grfica que muestre los datos anteriores.
c. Cul de los dos modos de presentar la informacin estadstica (cuadro o grfica)
preferira usted en este caso?

5. La presencia de manganeso en la gasolina puede significar un problema, pues genera


ciertos daos a los vehculos, a la salud de las personas y al ambiente. Ante la duda de altas
concentraciones de esta sustancia en la gasolina vendida en el pas se toman muestras en los
distintos planteles de la compaa refinadora de petrleo para que vaya a ser estudiadas en un
laboratorio. Los siguientes son datos recopilados para los 4 planteles que posee la refinadora y
corresponden a 3 mediciones realizadas a lo largo del ao (los datos se refieren a la
concentracin promedio obtenida en cada ocasin en mg/L de gasolina):

Plantel Febrero Mayo Agosto


A 5 7 4
B 1,2 3,5 0,7
C 0,4 0,3 0,5
D 18 20 15

Indique cul tipo de grfico construira en cada caso si se desea:

a. Mostrar los niveles de manganeso en el plantel A en las tres mediciones efectuadas.


b. Comparar los niveles de manganeso para los cuatro planteles en la medicin de
agosto.
c. Comparar el comportamiento de los niveles de manganeso a lo largo de las tres
mediciones para los planteles B y C.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
70

6. Un contador est realizando una auditora de los cheques extendidos por una compaa. En
cada caso indique el tipo de grfico adecuado para presentar los datos:
a. Nmero de cheques extendidos por mes durante el ltimo ao.
b. Monto promedio de los cheques extendidos cada mes durante el ltimo ao.
c. Nmero de cheques extendidos durante el ltimo mes segn tipo de gasto.

7. Con base en la informacin que se le brinda a continuacin, elabore un grfico de barras


horizontales, un grfico de barras verticales, un grfico lineal y un grfico circular. Escoja el
grfico apropiado en cada caso.
a. El ndice de precios al consumidor (IPC) para Imaginalandia ha tenido la siguiente
evolucin: fue 1215,36 en 1999; 1369,87 en 2000; 1502,56 en 2001; 1672,14 en 2002;
1802,35 en 2003; 1963,87 en 2004; 2135,98 en 2005; 2218,78 en 2006. Muestre
grficamente la tendencia que ha tenido el IPC.
b. Los siguientes de datos corresponden a las tasas de desempleo en zonas rural y
urbana en Imaginalandia de 2001 a 2005. Elabore una grfica que compare ambas
tasas por ao.
Zona 2001 2002 2003 2004 2005
Rural 15,6 15,5 15,3 14,9 14,9
Urbana 11,3 11,1 10,8 10,5 10,3

c. En 2006 haba en Imaginalandia un dficit de 155659 Km. de carreteras, el 61,3%


era en las zonas costeras y el resto en el interior del pas. Muestre grficamente la
distribucin del dficit segn la zona.
d. En 2005 el total de las exportaciones de Imaginalandia se compuso del modo
siguiente (en millones de US$):
Tipo de actividad Valor de las exportaciones
Pecuario y pesca 262,3
Agrcola 578,4
Textiles 674,4
Industria alimentaria 323,0

e. Con base en la informacin del ltimo punto de la pregunta anterior, relacionado


con las exportaciones, elabore un cuadro estadstico, con todos sus elementos, que
muestre las cifras absolutas y tambin las relativas.

8. Cada trimestre la cmara de empresas tursticas local efecta un estudio sobre las
expectativas de los empresarios afiliados. Se aplica un cuestionario entre una muestra de
empresas relacionadas con el turismo en el pas. En el cuestionario se pregunta a los gerentes
de las empresas aspectos como el grado de satisfaccin con la rentabilidad de su negocio, sus
planes de contratacin de personal para los prximos meses, su percepcin de la demanda del
servicio que presta, el tipo de negocio (hotel, restaurante, operador de tours, etc.).
a. Indique qu tipo de grfico empleara en cada caso:
a.1. Nmero de empresarios segn el grado de satisfaccin con la rentabilidad
de su negocio segn los resultados de este ao.
a.2. Distribucin porcentual para este ao de los empresarios de acuerdo con
sus planes de contratacin de personal para los prximos meses.
a.3. Percepcin de la demanda del servicio que presta segn tipo de negocio
para los ltimos tres aos.
b. Construya una grfica que muestre los datos siguientes:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
71

b.1. Un 7% de los empresarios consider la rentabilidad de su empresa como


muy buena, un 19% como buena, un 39% como regular, un 25% como mala y
solo un 10% la consider muy mala.
b.2. Los resultados de expectativa con respecto al empleo fue que un 59%
afirm que mantendr su planilla igual en el 2013, un 20% dijo que la
aumentar y un 21% anunci que la bajar. El ao pasado esto datos fueron
48%, 36% y 16% respectivamente.
b.3 En lo referente a la demanda, en el caso de los hoteles un 70% consider
que en el 2013 la demanda ser menor que en el 2012, un 20% creen que
seguir igual y el resto piensan que aumentar. Entre los restaurantes, un 40%
piensan que la demanda descender, un 45% consideran que seguir igual y el
resto creen que aumentar. Con respecto a las empresas relacionadas con el
transporte de turistas, un 50% consideran que la demanda descender, un 40%
que seguir igual y el resto estiman que bajar.

9. Con base en la informacin que se le brinda a continuacin, elabore un grfico de barras


horizontales, un grfico de barras verticales, un grfico lineal y un grfico circular. Escoja el
grfico apropiado en cada caso.
a. El ndice de desarrollo humano (IDH) para un pas llamado ha tenido la siguiente
evolucin durante la dcada pasada: fue 0,916 en 1990; 0,876 en 1991; 0,842 en 1992;
0,852 en 1993; 0,848 en 1994; 0,883 en 1995; 0,884 en 1996; 0,889 en 1997. Muestre
grficamente la tendencia que ha tenido el IDH.
b. Los siguientes de datos corresponden a las tasas de repitencia en primaria y
secundaria en Costa Rica de 1993 a 1997. Elabore una grfica que compare ambas
tasas por ao.
Ao 1993 1994 1995 1996 1997
Primaria 8,6 9,3 9,8 10,1 9,1
Secundaria 30,5 33,6 37,4 35,8 32,4

c. En 1994 haban en la Repblica de Santa Marta un dficit de 58740 viviendas, el


31,3% de ellas era en rea urbana y el 68,7% en reas rurales. Muestre grficamente la
distribucin del dficit de viviendas segn la zona.
d. Con base en la informacin del punto c de la pregunta anterior, relacionado con la
vivienda en la Repblica de Santa Marta, elabore un cuadro estadstico, con todos sus
elementos, que muestre las cifras absolutas y relativas descritas.

10. La Escuela de Negocios de la Universidad de Edimburgo, en el Reino Unido, realiz un


estudio sobre el uso que las personas realizan en la red social Facebook. Segn esta
investigacin la mayor parte de los usuarios de Facebook tienen amigos que proceden de sus
diferentes crculos sociales. El 97% de los usuarios afirma que conoce presencialmente a sus
amigos de Facebook y no por Internet. Un 81% indica tener relacin con primos y otros
familiares lejanos. El 80% seala tener como amigos a sus hermanos, un 69% dice que tiene
relacin con los amigos de sus amigos y el 65% se relaciona con sus colegas. Construya un
grfico apropiado para representar toda la informacin anterior.

11. Con base en la siguiente tabla efecte lo que a continuacin se le solicita:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
72

Poblacin total del Pas X


Por provincias
A Octubre de 1998

Provincia Poblacin %
Provincia A 450.000
Provincia B 300.000
Provincia C 100.000
Total

a. Complete la tabla.
b. Elabore una grfica que muestre la poblacin por provincias.
c. Elabore una grfica que muestre la distribucin porcentual de la poblacin por
provincias.

12. Analice el siguiente grfico:

a. Identifique al menos 2 errores en el grfico anterior. Explique cada uno.


b. Exponga una conclusin a la que usted podra llegar al estudiar el grfico anterior.
Explique.

13. Analice el siguiente grfico:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
73

a. Identifique al menos 3 errores en el grfico anterior. Explique cada uno.


b. Con base en los datos una persona efectu los siguientes comentarios, analice cada
frase e indique si es verdadera o falsa, tomando como base los datos de la grfica.

A De acuerdo con esta grfica, durante la ltima dcada la tasa de fecundidad


promedio en Centroamrica se han mantenido, pues la relacin entre los pases
sigue siendo la misma
B Tal como queda claro en la grfica, la poblacin de los pases centroamericanos
ha disminuido en estos aos, pues la mujeres tienen cada vez menos hijos

9. Analice el siguiente grfico de la Repblica de Santa Mnica:

a. Identifique al menos 3 errores en el grfico anterior. Explique cada uno.


b. Con base en los datos el Ministro de Salud de Santa Mnica efectu, a inicios de 2004,
los siguientes comentarios, analice cada frase e indique si es verdadera o falsa, tomando
como base los datos de la grfica.

A De acuerdo con esta grfica, desde 1950, excepto algunos periodos, la


tendencia del gasto per cpita en salud en nuestro pas es creciente,
especialmente durante la ltima dcada

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
74

B Tal como queda claro en la grfica, el gasto per cpita en salud excede al
producto interno bruto per cpita (PIB per cpita) desde hace ya muchos aos
C Hasta antes de la crisis de finales de la dcada de los 70s e inicios de los
80s, el gasto per cpita en salud creca ms aceleradamente que el PIB per
cpita, tal como se muestra claramente en la grfica

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. Si se quiere representar la composicin de un todo, el tipo de grfico adecuado para


representar esos datos es:
( a ) Grfica de barras horizontales
( b ) Grfica de barras verticales
( c ) Grfica circular
( d ) Pictograma

2. Si se tiene una serie cronolgica, el tipo de grfico adecuado para representarla es:
( a ) Grfica de barras horizontales
( b ) Grfica de barras verticales
( c ) Histograma
( d ) Diagrama de dispersin

3. Si se tiene una serie cualitativa, el tipo de grfico adecuado para representarla es:
( a ) Grfico circular
( b ) Grfico lineal
( c ) Grfico de barras verticales
( d ) Grfico de barras horizontales

4. Qu tipo de grfico utilizara para representar el porcentaje de nios de un ao vacunados


contra el sarampin para los pases de Amrica Central en el 2009?
( a ) Grfico circular
( b ) Grfico lineal
( c ) Grfico de barras verticales
( d ) Grfico de barras horizontales

5. Qu tipo de grfico utilizara para representar el porcentaje de nios de un ao vacunados


contra el sarampin para Costa Rica y Panam del ao 2000 al 2009?
( a ) Grfico de barras horizontales comparativas
( b ) Grfico de barras horizontales compuestas
( c ) Grfico de barras verticales comparativas
( d ) Grfico de barras verticales compuestas

6. Qu tipo de grfico utilizara para representar la distribucin porcentual del nmero de


personas afectadas por el VIH entre la poblacin de 15 a 49 aos de edad por sexo para Costa
Rica en el 2009?
( a ) Grfico circular
( b ) Grfico lineal

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
75

( c ) Grfico de barras verticales


( d ) Grfico de barras horizontales

7. Qu tipo de grfico utilizara para representar la relacin entre el porcentaje de cobertura


de atencin prenatal y la razn de mortalidad materna por cada 100.000 nacidos vivos para 10
pases de Amrica Latina en el 2006?
( a ) Grfico circular
( b ) Diagrama de dispersin
( c ) Pictograma
( d ) Grfico de barras horizontales

8. Si usted va a representar las exportaciones anuales de un pas en el periodo 2009 2011,


cul tipo de grfico es ms apropiado?
( a ) Grfico circular
( b ) Grfico lineal
( c ) Grfico de barras verticales de doble direccin
( d ) Grfico de barras horizontales

9. Si usted va a representar las exportaciones anuales de un pas en el 2011 clasificadas por


tipo de producto, cul tipo de grfico es ms apropiado?
( a ) Grfico circular
( b ) Grfico lineal
( c ) Grfico de barras verticales de doble direccin
( d ) Grfico de barras horizontales

10. Si usted va a representar las exportaciones anuales de un pas en el periodo 2009 2011
por tipo de producto, cul tipo de grfico es ms apropiado?
( a ) Grfico de barras horizontales comparativas
( b ) Grfico de barras horizontales compuestas
( c ) Grfico de barras verticales comparativas
( d ) Grfica de dispersin

11. Qu tipo de grfico utilizara para representar el monto de las ventas (en dlares) de una
empresa por tipo de producto para el ao 2012?
( a ) Grfico circular
( b ) Grfico lineal
( c ) Grfico de barras verticales
( d ) Grfico de barras horizontales

12. Qu tipo de grfico utilizara para representar el monto de las ventas (en dlares) de una
empresa por ao del 2007 al 2012?
( a ) Grfico circular
( b ) Barra 100%
( c ) Grfico de barras verticales
( d ) Grfico de barras horizontales

13. Qu tipo de grfico utilizara para representar la distribucin porcentual de las ventas de
una empresa por tipo de producto para el ao 2012?
( a ) Grfico circular
( b ) Grfico lineal

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
76

( c ) Grfico de barras verticales


( d ) Grfico de barras horizontales

14. Qu tipo de grfico utilizara para representar la distribucin porcentual de las ventas de
una empresa por tipo de producto y segn tipo de cliente para el ao 2012?
( a ) Grfico de barras horizontales comparativas
( b ) Barra 100%
( c ) Grfico de barras verticales compuestas
( d ) Grfico de barras horizontales compuestas

15. Qu tipo de grfico utilizara para comparar el monto de las ventas de una empresa (en
miles $) por tipo de producto y segn tipo de cliente para el ao 2012?
( a ) Grfico de barras horizontales comparativas
( b ) Barra 100%
( c ) Grfico de barras verticales compuestas
( d ) Grfico de barras horizontales compuestas

16. Qu tipo de grfico utilizara para comparar el monto de las ventas de una empresa (en
miles $) por tipo de producto para el periodo 2007 al 2012?
( a ) Grfico de barras horizontales comparativas
( b ) Grfico de barras verticales comparativas
( c ) Grfico de barras verticales compuestas
( d ) Grfico de barras horizontales compuestas

17. El gerente de un centro de llamadas desea evaluar el desempeo de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfaccin que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tom una muestra de 12 llamadas
por da de lunes a mircoles y 20 llamadas el jueves y el viernes. Los siguientes son los
tiempos de las muestras tomadas de lunes a mircoles. El lunes y el martes se tomaron
tiempos de llamadas atendidas y el mircoles solo de llamadas no atendidas:

Nmero de muestra (tiempo en segundos)


Da 1 2 3 4 5 6 7 8 9 10 11 12
Lunes 13 15 15 16 16 16 16 17 17 19 11 21
Martes 12 15 15 16 16 15 16 18 15 20 30 40
Mircoles 30 40 45 45 50 50 45 35 60 50 80 100

El tipo de grfico apropiado para representar la distribucin porcentual de las llamadas segn
el agente que contest es:
( a ) Grfico lineal
( b ) Grfico de barras verticales
( c ) Grficos de barras horizontales
( d ) Grfico circular

18. Con base en los datos de la pregunta 17, el tipo de grfico apropiado para representar el
nmero de llamadas recibidas por mes durante los ltimos 12 meses es:
( a ) Grfico lineal
( b ) Diagrama de dispersin
( c ) Grficos de barras horizontales

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
77

( d ) Barra 100%

Apoyo En la pgina de internet www.auladeeconomia.com/raeep.html podr


encontrar una presentacin de diapositivas que expone este tema y es un
audiovisual complemento a este texto. Puede hallar este material dentro del tema 2:
y uso de la Presentacin de la informacin estadstica.
tecnologa
Excel es una poderosa herramienta para procesar y presentar informacin
estadstica. En nuestra web podr encontrar videos que le permitirn
aprender algunos aspectos importantes del sobre la construccin de
cuadros y la elaboracin de grficos, adems del uso de tablas dinmicas,
y el uso de Minitab.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Respuestas a los ejercicios de opcin mltiple:

1. c 2. b 3. d 4. d
5. c 6. a 7. b 8. b
9. d 10. c 11. d 12. c
13. a 14. d 15. a 16. b
17. d 18. a

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
78

3 .

Anlisis descriptivo de la
informacin estadstica
OBJETIVOS:
Al concluir el captulo, ser capaz de:
Reconocer la importancia y utilidad de las medidas de posicin central.
Calcular e interpretar las principales medidas de posicin en datos no agrupados.
Calcular e interpretar las principales medidas de variabilidad en datos no agrupados.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
79

Anlisis descriptivo de la informacin


Medidas de posicin
Las medidas de posicin corresponden a estadsticos que se emplean para describir un cierto
conjunto de datos, ya sea que correspondan a la poblacin o a la muestra. De las medidas ms
conocidas est la media aritmtica, o promedio, la cual es muy empleada para describir el
comportamiento de los datos. Ahora bien, a parte del promedio existen muchas otras medidas,
de las cuales se estudiarn a continuacin algunas de las ms importantes.

Se recomienda que antes de iniciar la lectura de este tema se estudie el apndice de este
captulo, el cual ayudar a la comprensin de las frmulas y los conceptos expuestos.

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video de diapositivas que exponen tanto
los conceptos como los clculos de este
tema.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Medidas de posicin central


Cuando se desea describir un conjunto de datos resulta til emplear medidas de posicin
central, tal como el promedio. Por ejemplo, suponga que en un aula hay un grupo de jvenes
de 15 a 18 aos. Si se calcula la edad promedio, y da 16 aos, una persona que no se
encuentre en dicho sitio puede saber con facilidad qu tipo de personas hay en ese lugar (con
respecto a su edad solamente), es decir, sabra que son adolescentes. Es por eso que se dice
que un valor medio es, en cierto sentido, un valor representativo de un conjunto de datos.

MEDIDAS DE POSICIN CENTRAL Son valores representativos de un conjunto


de datos, de modo que cuando el conjunto de datos se ordena ascendentemente, estos
valores tienden a localizarse hacia el centro del conjunto.

Las medidas de posicin central ms conocidas son la media aritmtica o promedio, la


mediana y la moda.

El objetivo bsico de calcular estas medidas es poder reducir los datos, sustituyndolos por
algunas pocas medidas que los describan. Por supuesto que cada medida posee sus ciertas
ventajas y desventajas que luego se mencionarn.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
80

Material Antes de iniciar este tema recomendamos


ver el video sobre notacin de sumatoria
audiovisual en la pgina de internet de este texto.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

La media aritmtica
La media aritmtica, tambin llamada media o promedio, se denota por , cuando
corresponde a una poblacin y por x cuando se refiere a una muestra. Se trata del valor
medio de todos los valores que toma la variable estadstica de una serie de datos. La media
aritmtica es la medida de posicin de ms importancia en estadstica y la de ms uso,
principalmente por su fcil clculo e interpretacin.

MEDIA ARITMTICA La media aritmtica de un conjunto de datos es la suma de


los datos entre el nmero de datos.

Para una serie de n valores de una variable x1 , x 2 , x3 , ..., x n , es el cociente de dividir la


sumatoria de todos los valores que toma la variable x i , entre el nmero total de datos. Esto se
puede expresar como una frmula de la siguiente manera.

Media aritmtica poblacional: Se representa con la letra griega y se calcula como:

X i
i 1

Media aritmtica muestral: Se representa como equis barra y se calcula como:

x i
x i 1

Ejemplo Suponga que se tienen los siguientes datos correspondientes a las ventas
mensuales que ha realizado un vendedor durante los ltimos siete meses
(en millones de dlares):

20, 33, 42, 40, 19, 23, 28

Calcule la media aritmtica.

Solucin El clculo de la media sera:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
81

20 33 42 40 19 23 28
x 29.29
7

Segn ese resultado, sus ventas mensuales promedio son de 29.29 millones
de dlares.

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Calcule la media aritmtica.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para el clculo de la media aritmtica

Ejemplo Utilice Excel y Minitab para resolver el ejercicio: Suponga que se tienen
los siguientes datos correspondientes a las ventas mensuales que ha
realizado un vendedor durante los ltimos siete meses (en millones de
dlares):

20, 33, 42, 40, 19, 23, 28

Calcule la media aritmtica.

Solucin En Excel, se introducen los datos, bien sea en una fila o una columna. En
este caso los datos se encuentran en el rango de celdas de A1 hasta A7:

Luego se elige una celda para determinar el resultado, por ejemplo la celda
B8, y en ella se ingresa la siguiente funcin de Excel:

=PROMEDIO(A1:A7)

Luego se presiona Enter (o Intro) y se obtiene el resultado de 29,29,

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
82

aproximadamente:

En Minitab, se introducen los datos en una columna, por ejemplo la


columna C1:

Luego se da clic en el men Estadsticas, se elige Estadstica bsica y ah


selecciona Mostrar estadsticas descriptivas. Ah completa el cuadro de
dilogo seleccionando la variable, que en este caso se encuentra en la
columna C1:

Luego en el botn Estadsticas selecciona la Media:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
83

Luego de dar clic en Aceptar en cada cuadro, se obtiene el resultado en la


ventana Sesin:

Material En la pgina de internet de este texto


podr encontrar videos que exponen el
audiovisual uso de Excel y Minitab para calcular estas
medidas descriptivas.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Caractersticas principales de la media aritmtica:


Un conjunto de datos posee una media nica, o sea, que un conjunto de datos no posee
dos medias distintas simultneamente.
El valor de la media se obtiene a travs de la suma de todos y cada uno de los valores de
la serie de datos, por lo que depende de cada uno de ellos.
Los valores extremos afectan fuertemente a la media aritmtica, lo cual es su principal
desventaja.
La media resume o representa a un conjunto de datos a travs de un solo valor.

La media ponderada
a. Caso de valores repetidos:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
84

Muchas veces se tienen conjuntos de datos con observaciones que se repiten varias veces. Si
los valores distintos del conjunto son x1 , x 2 , x3 , ..., x k , los cuales aparecen f 1 , f 2 , f 3 , ...,
f k veces, respectivamente, entonces la media ponderada ser:

x i fi
x i 1

Ejemplo Suponga que una empresa posee quince vendedores de un determinado


producto. Cuatro de los vendedores lograron vender 50 unidades, 6
vendieron 40 unidades, tres vendieron 35 unidades y 2 vendieron 20
unidades. Cul es el nmero de unidades promedio de cada vendedor?

Solucin Dado que existen valores repetidos, entonces se aplica la frmula:

x i fi
4 50 6 40 3 35 2 20
x i 1
39
n 15

Es decir, el nmero de unidades promedio vendidas por cada vendedor es


de 39 unidades.

Ejercicio En un muelle hay 20 contenedores que pesan 15 toneladas cada uno, 25


que pesan 20 toneladas cada uno y 10 que pesan 25 toneladas cada uno.
de Cul es el peso promedio de los contenedores?
revisin
Ver solucin de este ejercicio en la pgina de internet de este texto:
www.auladeeconomia.com/raeep.html

b. Caso de valores con diferente importancia:


En ocasiones es necesario calcular la media de una serie de valores x1 , x 2 , x3 , ..., x k , pero
estos valores tienen diferente importancia o peso relativo. Por ejemplo, cuando se calcula la
nota final de un curso puede tener ms peso la nota de un examen que la nota de una tarea. En
estos casos es necesario determinar un factor de ponderacin para cada observacin w1 , w2 ,
w3 , ..., wk , respectivamente, el cual indica la importancia o peso relativo que se otorga a cada
valor. De ese modo la media sera:

x w i i
x i 1
k

w
i 1
i

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
85

Ejemplo Una empresa obtiene distintos mrgenes de utilidad segn los diferentes
productos que vende. Suponiendo que vende 3 productos diferentes A, B y
C, de acuerdo con los siguientes datos:

Volumen de ventas
Producto Margen de utilidad (en millones de dlares)
A 20% 200
B 30% 100
C 40% 60
Total: $ 360

Cul es el margen de utilidad promedio?

Solucin Para responder a esta pregunta es necesario calcular la media ponderada,


ya que el volumen de ventas de cada producto es distinto, y eso afecta al
promedio. El clculo debe ser el siguiente:

x w i i
20% 200 30% 100 40% 60
x i 1
k
26.11%
w
360
i
i 1

El margen de utilidad promedio es de 26.11%. Obsrvese que los pesos (


wi ) corresponde a las ventas de cada producto, y entonces se divide entre
el total de ventas.

Ejercicio En un curso universitario se realizan tres exmenes. El segundo examen


tiene un valor que es el doble del primero y el tercer examen tiene un valor
de que es el triple del segundo. Si un estudiante obtiene una nota de 8 en el
revisin primer examen, un 9 en el segundo y un 6 en el tercero (todas estas notas
estn en una escala de 0 a 10), calcule su calificacin promedio.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

La media geomtrica
En muchos casos no es apropiado determinar la media aritmtica, por ejemplo, cuando se
necesita calcular la tasa de crecimiento promedio del ndice de precios al consumidor. En
estas situaciones se debe calcular la media geomtrica.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
86

MEDIA GEOMTRICA Es la raz ensima del producto de las n observaciones que


componen un conjunto de datos.

Algebraicamente se expresa:

Mg n x1 x2 ... xn

La media geomtrica se emplea cuando se desea calcular el promedio de razones, tasas de


variacin promedio, tasas de crecimiento promedio, etc.

Ejemplo El precio de un cierto producto se increment un 5,5% durante 1999, un


7,4% durante el 2000, un 3,7% en el 2001, un 9,85% en el 2002 y un 10%
en el 2003. Cul ha sido el incremento promedio en el precio de ese
producto?

Solucin Para responder a la pregunta conviene ordenar la informacin de la manera


siguiente:

Ao Incremento porcentual En forma decimal


1999 5,50% 1,055
2000 7,40% 1,074
2001 3,70% 1,037
2002 9,85% 1,0985
2003 10,00% 1,10

Aplicando la frmula de la media geomtrica:

Mg n x1 x2 ... xn 5 1,055 1,074 1,037 1,0985 1,10 1,0726

Esto quiere decir que el incremento promedio del precio es de 7,26%.

Ejercicio Un pas tuvo una tasa de inflacin de 5% durante el ao 2009, un 4% en


2010, un 6% en 2011 y 3% en 2012. Cul es la tasa de inflacin promedio
de en estos 4 aos?
revisin
Ver solucin de este ejercicio en la pgina de internet de este texto:
www.auladeeconomia.com/raeep.html

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
87

Uso de Excel y Minitab para calcular la media geomtrica

Ejemplo Utilice Excel y Minitab para calcular la media geomtrica del conjunto de
datos siguiente:

1,055 - 1,074 - 1,037 - 1,0985 - 1,10

Solucin En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A5:

Luego, en la celda en la cual se desea el resultado, se introduce la siguiente


funcin:

=MEDIA.GEOM(A1:A5)

Y as se obtiene el resultado de 1,0726.

En Minitab, primero se introducen los datos en una columna, por ejemplo,


en la columna C1:

Luego, en el men Calc, se selecciona Calculadora y se completa el cuadro


de dilogo:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
88

Es necesario indicar dnde se desea almacenar el resultado, en este caso en


la columna C2. Luego en el campo Expresin se indica la siguiente
funcin:

GMEAN(C1)

Y as se obtiene el resultado de 1,0726 en la hoja de trabajo de Minitab, y


no en la ventana Sesin.

Cuando los valores x1 , x 2 , x3 , ..., x k , se repiten f 1 , f 2 , f 3 , ..., f k veces respectivamente,


entonces la media geomtrica sera:

Mg n x1 1 x2 2 ... xk
f f fk

La moda
Cuando se est interesado en tener una cierta idea de dnde se concentra la mayor parte de los
datos de una serie de valores, entonces resulta til la moda. La moda, o modo, es simplemente
la medida de posicin que indica el valor que ms se repite en el conjunto de datos, o sea, el
valor que se presenta con ms frecuencia en una serie de datos. La moda se designa como M o
.

MODA La moda es el valor que ms se repite en el conjunto de datos.

La moda se puede obtener por una simple observacin de los datos, es decir, se determina
con gran facilidad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
89

Un conjunto de datos podra no tener moda, si ningn valor aparece ms de una vez, pero
tambin puede tener una o varias modas. Cuando tiene una moda, se dice que es unimodal. Si
el conjunto de datos posee dos modas, y entonces se dice que el conjunto es bimodal.
Tambin es posible que el conjunto tenga ms de dos modas, y entonces se le llama
multimodal.

Ejemplo Con base en los siguientes conjuntos de datos, obtenga la moda:

Conjunto 1:
12, 14, 14, 15, 18, 18, 18, 22, 25

Conjunto 2:
12, 14, 14, 14, 15, 18, 18, 18, 22, 25

Conjunto 3:
12, 14, 15, 18, 22, 25

Conjunto 4:
12, 14, 14, 15, 18, 18, 18, 22, 2500

Solucin 1. El dato que ms veces aparece es el 18, por tanto la moda es 18.

2. El dato que ms veces aparece es el 14 y el 18, por tanto la moda es 14 y


18. Este es un conjunto bimodal.

3. No tiene moda.

4. El dato que ms veces aparece es el 18, por tanto la moda es 18.


Observe que el valor extremo 2500 no afect el resultado, pues el conjunto
1 y el 4 son iguales excepto por ese valor.

Caractersticas principales de la moda:


A diferencia de la media aritmtica, el valor de la moda no se afecta por la presencia de
valores extremos.
Cuando el conjunto de datos es pequeo o no ofrece una cierta tendencia central, entonces
la moda podra ser un dato de poca utilidad.
La moda se puede determinar en datos cualitativos y no solo cuantitativos, y en cualquier
escala de medicin (nominal, ordinal, de intervalo o de razn).
Cuando se calcula en datos agrupados (distribucin de frecuencias), no se obtiene con
exactitud, sino solo una aproximacin.

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
90

revisin
Calcule la moda o modo.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar videos que exponen el
audiovisual uso de Excel y Minitab para calcular estas
medidas descriptivas.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

La mediana
La mediana, denotada Med, es una medida de posicin que tiene diversas aplicaciones. Para
calcularla es necesario ordenar el conjunto de datos en forma ascendente, pues la mediana
divide el conjunto de datos en dos partes, de manera que haya igual cantidad de valores de un
lado que de otro.

MEDIANA Es una medida de posicin que divide a la serie de valores en dos partes
iguales, un cincuenta por ciento que es mayor o igual a la mediana y otro cincuenta por
ciento que es menor o igual que ella.

Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es
ordenar los datos en una forma creciente y luego se ubica la posicin que esta ocupa en esa
serie de datos; para ello hay que determinar si la serie de datos es par o impar.

Si el nmero N es el nmero de datos de la serie, entonces la posicin de la mediana ser:

N 1
PMed
2

Luego el nmero que se obtiene indica el lugar o posicin que ocupa la mediana en la serie de
valores, y entonces la mediana ser el nmero que ocupe el lugar de la posicin encontrada.

Cuando el nmero N de datos es una cantidad par, se requerir obtener el punto medio para
poder obtener la mediana.

Ejemplo Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los aos de servicios de un
grupo de trabajadores. Cul es la mediana?

Solucin Lo primero que se hace es ordenar los datos en forma creciente o

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
91

decreciente:

5, 6, 7, 8, 9, 10, 12

Dado que se tienen 7 datos, una cantidad impar de datos, se aplica la


formula:

N 1 7 1
PMed 4
2 2

Ese resultado indica que la mediana ser el cuarto dato de la serie, es decir,
la mediana ser 8, Med = 8.

Ejemplo Sean los siguientes datos, 5, 12, 7, 8, 11, 10, 6, y 9, los aos de servicios
de un grupo de trabajadores. Cul es la mediana?

Solucin Lo primero que se hace es ordenar los datos en forma creciente o


decreciente:

5, 6, 7, 8, 9, 10, 11, 12

Dado que se tienen 8 datos, una cantidad par de datos, se aplica la formula:

N 1 8 1
PMed 4.5
2 2

Ese resultado indica que la mediana estar entre el cuarto y el quinto dato
de la serie, y por tanto ser necesario calcular el punto medio entre 8 y 9,
es decir, la mediana ser (8+9)/2, Med = 8.5.

Ejercicio Con base en los siguientes conjuntos de datos:


de Conjunto 1: 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Conjunto 2: 85, 110, 125, 130, 90, 100, 140

Calcule la mediana en cada caso.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Caractersticas principales de la mediana:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
92

Al igual que la moda, la mediana no se afecta por la presencia de valores extremos en la


serie de datos.
Cuando se calcula en datos agrupados (distribucin de frecuencias), no se obtiene con
exactitud, sino solo una aproximacin.
La suma de los valores absolutos de las desviaciones de los datos individuales con
respecto a la mediana siempre es mnima, lo cual la hace til para resolver ciertos
problemas.

Material En la pgina de internet de este texto


podr encontrar videos que exponen el
audiovisual uso de Excel y Minitab para calcular estas
medidas descriptivas.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Interpretacin y uso de las medidas de posicin central


Con respecto a las medidas de posicin central estudiadas es posible realizar las siguientes
observaciones:

En grupos pequeos la moda puede ser una medida muy inestable, ya que al cambiar
alguno de los datos, la moda podra variar drsticamente.
La moda y la mediana puede ser consideradas medidas ms robustas que la media
aritmtica, ya que no se ven afectas por los valores extremos, mientras que la media s.
Cuando hay valores extremos, generalmente es mejor usar la mediana que la media.
La media aritmtica es la medida de posicin central que es ms estable de muestra a
muestra.
Cuando los datos se han obtenido aleatoriamente, la media aritmtica tiende a ser el mejor
descriptor del conjunto de valores original.

En ciertos conjuntos de datos la media, la mediana y la moda tienden a ser iguales o muy
similares. Esto ocurre en la medida que la distribucin de los datos sea simtrica, en cuyo
caso seran las tres medidas iguales.

SIMETRA Una distribucin es simtrica si existe la misma cantidad de valores a la


derecha que a la izquierda de la media y, por tanto, hay igual cantidad de desviaciones
positivas como negativas.

La existencia de valores extremos en un solo sentido, provocando una asimetra, afecta


principalmente al promedio. Entonces, el promedio ser mayor que la mediana y la mediana
mayor que la moda.

ASIMETRA POSITIVA Una distribucin es asimtrica positiva, o a la derecha, si


la cola derecha con respecto a la media es ms larga que la de la izquierda.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
93

Esta asimetra puede ser positiva, cuando los valores extremos son mayores a la media, o
negativa, cuando sean menores. Entonces, el promedio ser menor que la mediana y la
mediana menor que la moda.

ASIMETRA NEGATIVA Una distribucin es asimtrica negativa, o a la izquierda,


si la cola izquierda con respecto a la media es ms larga que la de la derecha.

Existen medidas sobre el grado de simetra o asimetra de una distribucin, las cuales no se
consideran en este texto, sin embargo, es posible mostrar esas simetras o asimetras en forma
grfica, y la relacin que sea con la moda, la mediana y la media del modo siguiente.

En una distribucin simtrica, la media, la moda y la mediana sern iguales. En una


distribucin asimtrica positiva, la media ser mayor que la mediana, y a su vez, la mediana
ser mayor que la moda. En una distribucin asimtrica negativa, la media ser menor que la
mediana, y a su vez, la mediana ser menor que la moda.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
94

Ejemplo Suponga que se tienen tres conjuntos de datos y para cada uno de ellos se
conoce la media, mediana y moda:

Conjunto 1: Media: 20, Mediana: 20, Moda: 20


Conjunto 2: Media: 30, Mediana: 40, Moda: 50
Conjunto 3: Media: 120, Mediana: 80, Moda: 70

Cul de los tres conjuntos presenta distribucin simtrica, distribucin


asimtrica positiva y distribucin asimtrica negativa?

Solucin El primer conjunto presenta una distribucin simtrica, pues la media, la


moda y la mediana son todas iguales.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
95

El segundo conjunto muestra una distribucin asimtrica negativa, dado


que la media es menor que la mediana, y a su vez, la mediana es menor
que la moda.

El tercer conjunto muestra una distribucin asimtrica positiva, pues la


media es mayor que la mediana, y la mediana es mayor que la moda.

Ejemplo A continuacin se presentan tres conjuntos de datos. En cada caso, calcule


la media aritmtica, la mediana y la moda del siguiente conjunto de datos:

Conjunto 1:
12, 13, 14, 14, 15, 15, 15, 16, 16, 16,
16, 16, 17, 17, 17, 18, 18, 19, 20

Conjunto 2:
12, 13, 14, 15, 15, 16, 16, 17, 17, 17, 18,
18, 18, 19, 19, 19, 19, 19, 20, 20, 20

Conjunto 3:
12, 12, 12, 13, 13, 13, 13, 13, 14, 14,
14, 15, 15, 16, 16, 17, 17, 18, 19, 20

Adems en cada caso, construya una grfica (histograma) para representar


a este conjunto de datos.
Observe la grfica y la relacin entre la media, la mediana y la moda. Qu
puede decirse de la simetra o asimetra de cada conjunto?

Solucin Conjunto 1:
Media = 16
Mediana = 16
Moda = 16
La media, la mediana y la moda son iguales, lo que indica una distribucin
simtrica, lo cual se observa claramente en la grfica siguiente.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
96

Frecuencia
3

0
12 14 16 18 20
C1

Conjunto 2:
Media = 17,19
Mediana = 18
Moda = 19
La media es menor que la mediana, y a su vez la mediana es menor que la
moda, lo que indica una distribucin asimtrica negativa, lo cual se
observa claramente en la grfica siguiente.

4
Frecuencia

0
12 14 16 18 20
C2

Conjunto 3:
Media = 14,8
Mediana = 14
Moda = 13
La media es mayor que la mediana, y a su vez la mediana es mayor que la
moda, lo que indica una distribucin asimtrica positiva, lo cual se observa
claramente en la grfica siguiente.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
97

Frecuencia
3

0
12 14 16 18 20
C3

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Determine qu tipo de simetra o asimetra se presenta.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Los cuantilos
Los cuantilos son medidas de posicin que dividen al conjunto ordenado de datos en una
determinada cantidad de partes iguales, de tal manera que superan a una cierta proporcin de
las observaciones , pero son superados por la proporcin complementaria,

Las principales de estas medidas son:


Cuartiles: Son tres valores que dividen al conjunto ordenado de datos en 4 partes iguales.
Percentiles: Son 99 valores que dividen al conjunto ordenado de datos en 100 partes
iguales.
Deciles: Son nueve valores que dividen al conjunto ordenado de datos en 10 partes
iguales.
Quintiles: Son cuatro valores que dividen al conjunto ordenado de datos en 5 partes
iguales.

Cuartiles o cuartilos:
Cada serie de datos posee tres cuartilos, los cuales dividen al conjunto de datos en cuatro
partes iguales.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
98

CUARTIL Los cuartiles son los tres valores que dividen a un conjunto ordenado de
datos en cuatro partes iguales.

El primer cuartil, denotado Q1 , se definira como aquel valor que supera a la cuarta parte de
los datos, pero es menor que las restantes tres cuartas partes. El segundo cuartil es la misma
mediana. A su vez, el tercer cuartil, denotado como Q3 , se definira como el valor que es
mayor que las tres cuartas partes de los datos, pero menor a la cuarta parte de ellos.

Ahora bien, los cuartiles pueden ser expresados como percentiles 25 y 75, y por tanto ser
calculados usando la frmula de los percentiles, tal como se expone ms adelante.

Deciles:
Cada serie de datos posee nueve deciles, los cuales dividen al conjunto de datos en diez partes
iguales.

DECIL Los deciles son los nueves valores que dividen a un conjunto ordenado de
datos en diez partes iguales.

El primer decil, denotado D1, se definira como aquel valor que supera a la dcima parte de
los datos, pero es menor que las restantes nueve dcimas partes. El segundo decil es aquel
valor que supera a dos dcimas partes de los datos, pero es menor que las restantes ocho
dcimas partes. As sucesivamente se pueden definir los dems deciles.

Ahora bien, los deciles pueden ser expresados como percentiles 10, 20, ..., y 90, y por tanto
ser calculados usando la frmula de los percentiles, tal como se expone ms adelante.

Quintiles:
Cada serie de datos posee cuatro quintiles, los cuales dividen al conjunto de datos en cinco
partes iguales.

QUINTIL Los quintiles son los cuatro valores que dividen a un conjunto ordenado de
datos en cinco partes iguales.

El primer quintil, denotado K1, se definira como aquel valor que supera a la quinta parte de
los datos, pero es menor que las restantes cuatro quintas partes. El segundo quintil es aquel
valor que supera a dos quintas partes de los datos, pero es menor que las restantes tres quintas
partes. As sucesivamente se pueden definir los dems quintiles.

Ahora bien, los quintiles pueden ser expresados como percentiles 20, 40, 60 y 80, y por tanto
ser calculados usando la frmula de los percentiles, tal como se expone ms adelante.

Percentiles:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
99

Una serie de datos tiene 99 percentiles, los cuales dividen a un conjunto de datos en 100
partes iguales. Los percentiles son un concepto similar al de los cuartiles. Por ejemplo, el
percentil 57, denotado por P57 , corresponder a aquel valor tal que es superior al 57% de las
observaciones y menor al restante 43%.

PERCENTIL Los percentiles son los 99 valores que dividen a un conjunto ordenado
de datos en 100 partes iguales.

Como se mencion anteriormente, los cuartiles, deciles y quintiles pueden ser expresados en
trminos de percentiles, como se ilustra a continuacin:

Para datos sin agrupar, en un conjunto de datos ordenados de acuerdo con su magnitud, el
percentil m, denotado Pm , ser el 100
m
n 1 trmino.

Ejemplo El nmero de unidades de un cierto producto vendidas por 10 vendedores


el mes pasado son:

120, 100, 20, 70, 100, 140, 120,150, 100, 40

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
100

Determine el primer cuartil, el tercer cuartil, el decil 4 y el 80 percentil.

Solucin Primer cuartil:


Paso 1: El primer paso es ordenar la serie de datos:

20, 40, 70, 100, 100, 100, 120, 120, 140, 150

Paso 2: El primer cuartil equivale al percentil 25, por lo que m = 25 y se


tienen 10 datos, por lo que n = 10. Entonces se sustituye en la frmula:

Pm 100
m
n 1 100
25
10 1 2,75
Paso 3: La frmula anterior no da el valor del percentil, sino que da la
posicin del percentil 25. Hay que buscar el dato en la posicin 2,75.
Como no se tiene un valor en la posicin 2,75, quiere decir que el valor del
percentil va a estar entre el segundo valor y el tercero, entonces se realiza
una interpolacin. Esto es, se toma el segundo dato en la serie ordenada,
que es 40, y se le suma el producto de la parte decimal del resultado de la
frmula, que es 0,75 por la diferencia entre el segundo y el tercer dato, que
es 70 40 = 30. O sea, el percentil equivale a:

Q1 = P25 = 40 + 0,75 * 30 = 62,5

Tercer cuartil:
Paso 1: El primer paso es ordenar la serie de datos:

20, 40, 70, 100, 100, 100, 120, 120, 140, 150

Paso 2: El tercer cuartil equivale al percentil 75, por lo que m = 75 y se


tienen 10 datos, por lo que n = 10. Entonces se sustituye en la frmula:

Pm 100
m
n 1 100
75
10 1 8,25
Paso 3: La frmula anterior no da el valor del percentil, sino que da la
posicin del percentil 75. Hay que buscar el dato en la posicin 8,25.
Como no se tiene un valor en la posicin 8,25, quiere decir que el valor del
percentil va a estar entre el octavo valor y el noveno, entonces se realiza
una interpolacin. Esto es, se toma el octavo dato en la serie ordenada, que
es 120, y se le suma el producto de la parte decimal del resultado de la
frmula, que es 0,25 por la diferencia entre el octavo y el noveno dato, que
es 140 120 = 20. O sea, el percentil equivale a:

Q3 = P75 = 120 + 0,25 * 20 = 125

Decil 4:
Paso 1: El primer paso es ordenar la serie de datos:

20, 40, 70, 100, 100, 100, 120, 120, 140, 150

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
101

Paso 2: El decil 4 equivale al percentil 40, por lo que m = 40 y se tienen 10


datos, por lo que n = 10. Entonces se sustituye en la frmula:

Pm 100
m
n 1 100
40
10 1 4,4
Paso 3: La frmula anterior no da el valor del percentil, sino que da la
posicin del percentil 40. Hay que buscar el dato en la posicin 4,4. Como
no se tiene un valor en la posicin 4,4, quiere decir que el valor del
percentil va a estar entre el cuarto valor y el quinto, entonces se realiza una
interpolacin. Esto es, se toma el cuarto dato en la serie ordenada, que es
100, y se le suma el producto de la parte decimal del resultado de la
frmula, que es 0,4 por la diferencia entre el cuarto y el quinto dato, que es
100 100 = 0. O sea, el percentil equivale a:

D4 = P40 = 100 + 0,4 * 0 = 100

Percentil 80:
Paso 1: El primer paso es ordenar la serie de datos:

20, 40, 70, 100, 100, 100, 120, 120, 140, 150

Paso 2: Se desea calcular el percentil 80, por lo que m = 80 y se tienen 10


datos, por lo que n = 10. Entonces se sustituye en la frmula:

Pm 100
m
n 1 100
80
10 1 8,8
Paso 3: La frmula anterior no da el valor del percentil, sino que da la
posicin del percentil 80. Hay que buscar el dato en la posicin 8,8. Como
no se tiene un valor en la posicin 8,8, quiere decir que el valor del
percentil va a estar entre el octavo valor y el noveno, entonces se realiza
una interpolacin. Esto es, se toma el octavo dato en la serie ordenada, que
es 120, y se le suma el producto de la parte decimal del resultado de la
frmula, que es 0,8 por la diferencia entre el octavo y el noveno dato, que
es 140 120 = 20. O sea, el percentil equivale a:

P80 = 120 + 0,8 * 20 = 136

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Calcule el primer cuartil, el tercer cuartil, el decil 4, el quintil 3 y el
percentil 65.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
102

Uso de Excel y Minitab para el clculo de percentiles

Ejemplo Utilice Excel y Minitab para resolver el ejercicio: El nmero de unidades


de un cierto producto vendidas por 10 vendedores el mes pasado son:

20, 40, 70, 100, 100, 100, 120, 120, 140, 150

Determine el primer cuartil, el tercer cuartil y el 80 percentil.

Solucin En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A10:

Para obtener el primer cuartil, en la celda en la cual se desea el resultado,


se introduce la siguiente funcin:

=CUARTIL(A1:A10;1)

En la funcin, dentro del parntesis, primero se indica el rango de datos, y


luego (generalmente separado por punto y coma) se indica el nmero del
cuartil, que en este caso es 1. Y as se obtiene el resultado de 77,5. Este
resultado cambia con respecto al anterior, calculado manualmente, porque
se est empleando un algoritmo distinto para el clculo del cuartil. Esto
mismo suceder en los clculos siguientes.

Para obtener el tercer cuartil, en la celda en la cual se desea el resultado, se


introduce la siguiente funcin:

=CUARTIL(A1:A10;3)

En la funcin, dentro del parntesis, primero se indica el rango de datos, y


luego (generalmente separado por punto y coma) se indica el nmero del
cuartil, que en este caso es 3. Y as se obtiene el resultado de 120.

Para obtener el percentil 80, en la celda en la cual se desea el resultado, se


introduce la siguiente funcin:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
103

=PERCENTIL(A1:A10;0,80)

En la funcin, dentro del parntesis, primero se indica el rango de datos, y


luego (generalmente separado por punto y coma) se indica el nmero del
percentil, pero indicado en forma decimal, que en este caso es 0,80. Y as
se obtiene el resultado de 124.

En Minitab, primero se introducen los datos en una columna, por ejemplo,


en la columna C1:

Luego se da clic en el men Estadsticas, se elige Estadstica bsica y ah


selecciona Mostrar estadsticas descriptivas. Ah completa el cuadro de
dilogo seleccionando la variable, que en este caso se encuentra en la
columna C1:

Luego en el botn Estadsticas selecciona primer cuartil y tercer cuartil.


Luego de dar clic en Aceptar en cada cuadro, se obtiene el resultado en la
ventana Sesin:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
104

Este resultado cambia con respecto al anterior, calculado manualmente y al


obtenido en Excel, porque se est empleando un algoritmo distinto para el
clculo del cuartil.

Para obtener el percentil se da clic en el men Calc y se selecciona


Calculadora. Ah se completa el cuadro de dilogo siguiente:

Se debe indicar en cul columna se almacenar el resultado, por ejemplo


en la columna C2. Luego en expresin debe seleccionarse la funcin:

PERCENTILE(nmero.probabilidad)

En esta funcin nmero corresponde a la columna que almacena los datos,


en este caso C1, y probabilidad es el nmero del percentil expresado en
forma decimal, que sera 0,80:

PERCENTILE(C1.0,80)

Observe que los datos de entrada de la funcin se separan por medio de un


punto. Luego se da clic en Aceptar y el resultado se obtiene en la hoja de
trabajo, no en la sesin. Segn Minitab el percentil 80 es 136.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
105

Material En la pgina de internet de este texto


podr encontrar videos que exponen el
audiovisual uso de Excel y Minitab para calcular estas
medidas descriptivas.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Aplicacin Administracin de salarios


Muchas empresas emplean distintas tcnicas estadsticas para disear sus
polticas salariales, y, en este sentido, los percentiles son bastante
utilizados.

El objetivo de una poltica salarial es poder dar una remuneracin a los


empleados de manera que se incentive el buen desempeo y se puede
retener a los mejores colaboradores en la empresa, a la vez que no se
excedan los costos que sean sostenibles para la empresa. Para esto es
necesario disear un sistema que satisfaga criterios de equidad, a lo interno
(para que puestos del mismo nivel tengan los mismos salarios, por
ejemplo) y a lo externo (de manera que los salarios sean competitivos, o
sea, que no sean muy bajos con respecto a lo que pagan otras empresas).
Con relacin a este ltimo punto, se puede decir que a una empresa no le
interesa pagar los salarios ms altos de su industria, pues eso elevara
mucho los costos. Lo que busca es que los salarios que paga sean
competitivos.

Cmo se determina si un salario es competitivo? Se realizan encuestas


salariales, en las cuales se investigan los salarios que pagan las empresas
para determinados puestos. Una vez que se tienen los datos de estas
encuestas se determinan los percentiles. Generalmente las empresas que
desean pagar un salario competitivo buscan que sus remuneraciones se
encuentren alrededor del tercer cuartil o del percentil 80. Un salario as le
indica al trabajador que esa compensacin no la obtiene en cualquier otra
empresa, que un porcentaje muy alto de los empleadores (un 75% o un
80%) pagan montos inferiores.

Aplicacin Antropometra
Cuando nace un nio, el mdico o la enfermera mide su talla, la
circunferencia ceflica, entre otras dimensiones. Conforme crecemos en
algn momento tambin nos sometemos a algunas mediciones similares
relacionadas con nuestro cuerpo. Cuando usamos un automvil, los
ingenieros emplearon datos sobre las medidas de los seres humanos para
determinar las dimensiones de distintas partes del vehculo, como los
asientos, la distancia entre el asiento y el volante, entre otros. De igual

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
106

manera en el diseo de vestuarios, mquinas, edificios y muchos otros


artculos. As, la antropometra ha llegado a ser importantsima en muchas
reas.

La antropometra es la ciencia que se encarga del estudio de las


dimensiones del cuerpo humano. Para ello se realizan estudios estadsticos
con la finalidad de poder determinar las medidas promedio y diferentes
percentiles. Es importante saber si la talla de un nio se encuentra dentro
de los parmetros considerados como normales, los cuales se definen
empleando, generalmente los percentiles 5 y 95.

La antropometra ha desarrollado una serie de procedimientos para realizar


las mediciones de forma adecuada, adems de cuestionarse sobre cules
son las mediciones que vale la pena realizar, o sea, aquellas que vayan a
ser de utilidad en el ciencias biomdicas, la ingeniera, la arquitectura, etc.
As, se estudian medidas estructurales, tales como la cabeza, las
extremidades y el tronco, y otras son medidas funcionales, como lo son
movimientos especficos realizados por el cuerpo de las personas.

Grfica de caja, rango intercuartil y desviacin cuartil


La grfica de caja es un grfico bastante til para explorar y visualizar el comportamiento de
un conjunto de datos. Esta grfica est compuesta por un rectngulo, llamado caja, y por dos
lneas llamadas brazos o bigotes, por eso tambin se le conoce a esta grfica como diagrama
de caja y bigotes.

La caja de la grfica se construye con base en el primer cuartil Q1 y el tercer cuartil Q3, los
cuales definen los lmites de la caja. La caja tiene una lnea que la cruza que corresponde a la
mediana. Los bigotes salen de la caja y llegan hasta el valor mnimo y mximo, o bien, dos
valores a y b que se trazan hasta 1,5 veces la altura de la caja, o sea, que el bigote inferior
llega hasta a = Q1 1,5 (Q3 Q1) y el bigote superior llega hasta b = Q3 + 1,5 (Q3 Q1). Otros
autores trazan los bigotes hasta dos veces el rango intercuartil (Q3 Q1), o sea, que el bigote
inferior llega hasta Q1 2 (Q3 Q1) y el bigote superior llega hasta Q3 + 2 (Q3 Q1). Tambin
hay autores que trazan simplemente los bigotes hasta el mnimo y el mximo. En este texto se
emplear la primera forma, ya que as lo construye el software Minitab. Los valores que
quedan fuera de esos lmites establecidos por los bigotes se consideran valores extremos o
atpicos.

La grfica de caja es til para valorar la existencia de valores extremos o atpicos y para
analizar la simetra o asimetra de la distribucin de los datos.

Ejemplo Se tiene un conjunto de datos con respecto al cual se conoce la siguiente


informacin:

Primer cuartil: 20
Tercer cuartil: 36
Mediana: 30

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
107

Mnimo: 8
Mximo: 42

Construya la grfica de caja.

Solucin La grfica de caja puede construir horizontal o vertical. En este caso se va


a hacer horizontal, por lo que se construye un eje horizontal. Luego se
realizan los siguientes pasos:

Paso 1: Determinar los cuartiles. La caja queda delimitada por el primer


cuartil que es 20 y el tercer cuartil que es 36. En este caso ya estn
calculados, pero de otro modo habra que calcularlos, por lo que se dibuja
la caja, la cual inicial en el primer cuartil y finaliza en el tercer cuartil:

Paso 2: Determinar la mediana. En este caso ya est calculada la


mediana. Si no, se calcula. Entonces se traza la lnea que representa la
mediana, la cual es 30.

Paso 3: Determinacin de los bigotes. Se calculan los valores a y b:

a = Q1 1,5 (Q3 Q1) = 20 - 1,5 (36 - 20) = -4


b = Q3 + 1,5 (Q3 Q1) = 36 + 1,5 (36 - 20) = 60

Si el valor de a es menor que el mnimo, entonces el bigote izquierdo llega


hasta el mnimo, pero si a fuera mayor que el mnimo, entonces el bigote
izquierdo llega hasta a. En este caso, como a = -4 y el mnimo es 8,
entonces el bigote izquierdo llegar hasta 8.

Si el valor de b es mayor que el mximo, entonces el bigote derecho llega

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
108

hasta el mximo, pero si b fuera menor que el mximo, entonces el bigote


derecho llega hasta b. En este caso, como b = 60 y el mximo es 42
entonces el bigote derecho llegar hasta 42.

Finalmente se traza el brazo o bigote izquierdo, el cual parte de la caja


hasta el punto mnimo, que es 8, y se traza el brazo o bigote derecho, el
cual parte de la caja hasta el punto mximo, que es 42. No hay valores
atpicos en este caso.

Mn Q1 Med Q3 Mx
8 20 30 36 42

0 10 20 30 40 50

Ejemplo Se tiene el siguiente conjunto de datos:

24, 25, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35, 40

Construya la grfica de caja usando Minitab.

Solucin Paso 1: Determinar los cuartiles. Se calculan los dos cuartiles:

Q1 = 27
Q3 = 31,5

La caja queda delimitada por el primer cuartil que es 27 y el tercer cuartil


que es 31,5, por lo que se dibuja la caja, la cual inicial en el primer cuartil
y finaliza en el tercer cuartil:

Paso 2: Determinar la mediana. Se calcula la mediana, la cual es 30.


Entonces se traza la lnea que representa la mediana, la cual es 30.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
109

Paso 3: Determinacin de los bigotes. Se calculan los valores a y b:

a = Q1 1,5 (Q3 Q1) = 27 - 1,5 (31,5 - 27) = 20,25


b = Q3 + 1,5 (Q3 Q1) = 31,5 + 1,5 (31,5 - 27) = 38,25

Si el valor de a es menor que el mnimo, entonces el bigote izquierdo llega


hasta el mnimo, pero si a fuera mayor que el mnimo, entonces el bigote
izquierdo llega hasta a. En este caso, como a = 20,25 y el mnimo es 24,
entonces el bigote izquierdo llegar hasta 24.

Si el valor de b es mayor que el mximo, entonces el bigote derecho llega


hasta el mximo, pero si b fuera menor que el mximo, entonces el bigote
derecho llega hasta b. En este caso, como b = 38,25 y el mximo es 40,
entonces el bigote derecho llegar hasta 38,25 y el valor de 40 se marcar
con un asterisco, pues se considera como valor atpico.

Uso de Minitab para construir una grfica de caja

Ejemplo Se tiene el siguiente conjunto de datos:

20, 24, 25, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35, 40, 45

Construya la grfica de caja usando Minitab.

Solucin Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al men Grafica y se elige Grfica de caja. En el cuadro se
escoge Una Y Simple, y se da clic en Aceptar. En el cuadro de dilogo que
aparece se selecciona la columna que contiene los datos, que en este caso
es la columna C1, y se da clic en Aceptar. Se obtiene la grfica siguiente:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
110

Grfica de caja de C1

45

40

35
C1

30

25

20

Como se observa, Minitab hace la grfica vertical y no horizontal como se


expuso en el ejemplo anterior, sin embargo representa los mismos datos.

La grfica de caja puede facilitar la identificacin de valores atpicos o valores extremos, es


decir, observaciones inusualmente grandes o pequeas con respecto a los dems datos del
conjunto de valores. Los paquetes de cmputo como Minitab trazan los valores atpicos como
asteriscos, los cuales se van a observar ubicados ms all de los bigotes.

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Construya la grfica de caja.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Ejemplo Se tiene el siguiente conjunto de datos:

15, 24, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35

Construya la grfica de caja usando Minitab e identifique la presencia de


valores atpicos.

Solucin Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al men Grafica y se elige Grfica de caja. En el cuadro se

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
111

escoge Una Y Simple, y se da clic en Aceptar. En el cuadro de dilogo que


aparece se selecciona la columna que contiene los datos, que en este caso
es la columna C1, y se da clic en Aceptar. Se obtiene la grfica siguiente:

Grfica de caja de C1

35

30

25
C1

20

15

Minitab ha dibujado la grfica, pero ha colocado en la parte inferior un


asterisco, el cual representa un valor atpico, o sea, un valor muy grande o
muy pequeo con respecto a los dems datos del conjunto.

La grfica de caja tambin es til porque muestra, en cierto grado, la dispersin del conjunto
de datos, pues se puede observar la diferencia entre el valor mximo y el mnimo, que se
conoce como el rango, recorrido o amplitud del conjunto de datos. Tambin, en este mismo
sentido, muestra el rango intercuartil o rango intercuartlico (RIC), el cual corresponde a la
diferencia entre el tercer cuartil y el primer cuartil:

RIC = Q3 Q1

El rango intercuartil indica el rango en el cual se concentra la mitad de los datos alrededor
de su mediana, por lo que un rango intercuartil pequeo indicara que ese 50% de los datos se
aleja poco de su mediana, mientras que un rango intercuartil elevado indicara que esos
valores que se hallan entre el primer cuartil y el tercer cuartil fluctan en un rango grande. En
la grfica de caja, el rango intercuartil se observa en la longitud de la caja (o su altura, si la
caja es vertical).

Cuando se divide el rango intercuartil entre 2, se obtiene la desviacin cuartil, Q, que es una
medida de la dispersin estadstica:

Q = RIC / 2

O bien, se expresa como:

Q = (Q3 Q1) / 2

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
112

Ejemplo Se tiene el siguiente conjunto de datos:

15, 24, 26, 28, 29, 30, 30, 30, 31, 31, 32, 35

Calcule, usando Minitab, el primer cuartil, el tercer cuartil y el rango


intercuartil.

Solucin Para realizar este ejercicio en Minitab se requiere introducir los datos en
una columna de la hoja de trabajo, por ejemplo en la columna C1. Luego
se da clic al men Estadsticas y se elige Mostrar estadsticas descriptivas.
En el cuadro de dilogo se selecciona la variable, en este caso en la
columna C1, y en el botn estadsticas se marca primer cuartil, tercer
cuartil y rango intercuartil, y se da clic en Aceptar.

El resultado se obtiene en la ventana Sesin, e indica que el primer cuartil


es 26,5, el tercer cuartil 31, y el rango intercuartil (RIC = IQR) es 4,5, que
es la diferencia Q3 Q1 = 31 26,5 = 4,5.

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Calcule el rango intercuartil y la desviacin cuartil.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Adicionalmente, a travs del anlisis de la grfica de caja puede observar que tan simtrica es
la distribucin de los datos, pues si se tiene que la mediana est exactamente en la mitad de la
caja y que los bigotes izquierdo y derecho (o superior e inferior) son de igual longitud,
entonces indicar una distribucin simtrica. Conforme el bigote izquierdo sea ms largo que
el derecho (o el inferior ms largo que el superior) y ms cercana est la mediana del tercer
cuartil que del primero, entonces la distribucin ser ms asimtrica positiva o sesgada hacia
la derecha. Pero, en la medida que el bigote derecho sea ms largo que el izquierdo (o el
superior ms largo que el inferior) y ms cercana est la mediana del primer cuartil que del
tercero, entonces la distribucin ser ms asimtrica negativa o sesgada hacia la izquierda.

Ejemplo Se tiene dos conjuntos de datos, el primero corresponde a la estatura de 8


futbolistas, y el segundo corresponde a la estatura de 6 basquetbolistas:

Futbolistas: 1.83, 1.73, 1.75, 1.69, 1.94, 1.83, 1.81, 2.01


Basquetbolistas: 2.01, 2.15, 1.90, 2.28, 1.83, 2.15

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
113

Utilice Minitab para elaborar una grfica de caja para cada conjunto de
datos.

Solucin Primero que todo se introducen los datos en la hoja de trabajo, cada
conjunto en una columna distinta, en este caso C1 para los futbolistas y C2
para los basquetbolistas. Luego se da clic en el men Grfica y se elige
Grfica de caja. En el cuadro de dilogo se selecciona Mltiples Y.
Despus se seleccionan las dos variables y se da clic en Aceptar.

Grfica de caja de C1. C2


2,3

2,2

2,1
Datos

2,0

1,9

1,8

1,7

C1 C2

Al comparar las dos grficas, se observa que las estaturas de los futbolistas
tienden a ser menores que las de los basquetbolistas, y que el tercer cuartil
de los primeros es, apenas, un poco superior que el primer cuartil de los
segundos.

Adems, las estaturas de los futbolistas tienden a ser bastante simtricas,


tal vez con una ligera asimetra positiva, pues la mediana est apenas un
poco abajo de la mitad de la caja y el bigote superior es ms largo que el
inferior. Al contrario, las estaturas de los basquetbolistas presentan una
cierta asimetra negativa, pues la mediana est ms arriba de la mitad de la
caja, a pesar de que el bigote superior es ms largo que el inferior.

Aplicacin ndice endmico


Los cuartiles, la mediana y el rango intercuartil son tiles para determinar
el llamado ndice endmico y poder construir una grfica que facilite
descubrir en forma oportuna un nmero inusual de casos de alguna
enfermedad.

Para determinar este ndice es necesario reunir informacin de los casos


mensuales ocurridos en los ltimos 7 aos. Luego se toman los datos para
cada mes y se calcula el primer cuartil, la mediana y el tercer cuartil.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
114

60

50

40

30

20

10

0
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic

Primer cuartil Mediana Tercer cuartil

Luego se registran los casos nuevos que van ocurriendo cada mes. Si el
nmero mensual de casos se encuentra por debajo del primer cuartil,
indicara que las medidas de control han sido exitosas, pero si se
encuentran entre el primer cuartil y la mediana, entonces la situacin es
normal. La alarma se enciende si el nmero de casos supera la media, y se
considera que hay una epidemia si supera al valor del tercer cuartil.

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso ejercicios resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Medidas de variabilidad
La dispersin o variabilidad en un conjunto de datos se refiere a que los valores son distintos
unos de otros. Ahora bien, la idea es establecer algn tipo de medida de esta variabilidad, que
permita saber qu tan homogneo o qu tan heterogneo es el conjunto de datos. Un modo de
definir esa medida es determinar qu tanto se alejan los datos de un valor tpico, como el
promedio. As, mientras ms heterognea sea la serie de datos, habr diferencias mayores de
los datos con respecto a su media. Lo contrario sucedera en una serie ms homognea, pues
los valores seran ms parecidos entre s, y entonces esas diferencias con respecto a la media
seran menores. En trminos generales, la variabilidad o dispersin de los datos, es el grado en

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
115

que los valores de una distribucin o serie numrica tienden a acercarse o alejarse alrededor
de un promedio.

El problema de la variabilidad
La variabilidad es un aspecto esencial de la estadstica. Si no hubiera variabilidad, no existira
el problema del muestreo, por ejemplo. Dado que las variables cambia de una unidad de
estudio a otra, entonces es necesario cuantificar ese grado de variabilidad o dispersin, lo cual
va a ser clave para muchos anlisis estadsticos.

Veamos un ejemplo del impacto de la variabilidad y de por qu no basta slo con las medidas
de posicin. Dos conjuntos de datos podran tener la misma media y ser totalmente distintos.
Por ejemplo, el conjunto A contiene a los datos 5, 5, 5, 5 y 5, mientras que el conjunto B
contiene a los datos 1, 1, 3, 10 y 10. Ambos conjuntos tienen una media de 5, pero en el
conjunto A la variabilidad es cero, ya que todos son iguales. Pero en el conjunto B los datos
son muy distintos unos de otros, es decir, la variabilidad es elevada.

Las medidas de dispersin pueden ser clasificadas en dos grandes grupos:

Medidas de dispersin absolutas. Las medidas absolutas vienen expresadas en las


mismas medidas de la serie de datos. Las ms conocidas son: el recorrido, la desviacin
cuartlica, la desviacin semicuartlica, la desviacin media, la desviacin estndar
(tambin conocida como desviacin tpica) y la varianza. Aunque estas dos ltimas son las
ms empleadas.
Medidas de dispersin relativas. Las medidas de dispersin relativa son relaciones entre
medidas de dispersin absolutas y medidas de tendencia central multiplicadas por 100, por
lo tanto vienen expresadas como porcentaje. La medida de dispersin relativa de mayor
importancia es el coeficiente de variacin.

Rango o amplitud total


El rango o amplitud total es la medida de dispersin ms sencilla. Simplemente es la
diferencia entre los valores mayor y menor de un conjunto de datos.

RANGO O AMPLITUD Diferencia entre el valor mximo y el valor mnimo de un


conjunto de datos.

Ejemplo Suponga que se tienen los dos siguientes conjuntos de cinco datos:

Conjunto A: 1, 2, 3, 7, 10

Conjunto B: 1, 9, 9, 10, 10

Se desea calcular el rango de este conjunto de datos.

Solucin Para el conjunto A el mximo es 10 y el mnimo es 1, por lo que su rango


o amplitud ser:

Rango = 10 1 = 9

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
116

Para el conjunto B el mximo tambin es 10 y el mnimo tambin es 1, por


lo que su rango o amplitud ser:

Rango = 10 1 = 9

En este ejemplo se ilustra qu tan limitado es el rango como medida de la


variabilidad, pues en el conjunto todos los datos son muy similares entre
s, excepto uno de ellos, sin embargo el rango es igual que el del conjunto
A, el cual s presenta mayor variabilidad.

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Calcule el rango o recorrido.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

La varianza y la desviacin estndar


Tanto la varianza, o variancia, como la desviacin estndar son las medidas de dispersin ms
utilizadas en estadstica, principalmente por ser muy estables, pues para su clculo se utilizan
todos las diferencias o desviaciones con respecto a la media aritmtica de las observaciones.

VARIANZA Medida de variabilidad que consiste en la media aritmtica del cuadrado


de las desviaciones de un conjunto de datos con respecto a su media.

La varianza se expresa como o s si se calcula para datos de una poblacin o una muestra,
respectivamente.

La desviacin estndar se puede definir como la raz cuadrada de la varianza, o sea, la raz
cuadrada del promedio aritmtico de los cuadrados de las desviaciones de las observaciones
con respecto a su media aritmtica.

DESVIACIN ESTNDAR Medida de variabilidad que consiste en la raz cuadrada


de la varianza.

La desviacin estndar se designa con la letra griega minscula (sigma) cuando se trabaja
con una poblacin y con la letra s cuando se trabaja con una muestra.

Las frmulas para calcular la varianza en datos sin agrupar son, para poblacin y muestra
respectivamente:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
117

(x i )2
2 i 1
N

(x i x )2
s2 i 1
n 1

Es importante destacar que cuando se hace referencia a la poblacin l nmero de datos se


expresa con N y cuando se refiere a la muestra l nmero de datos se expresa con n.

Las frmulas para calcular la desviacin estndar en datos sin agrupar son, para poblacin y
muestra respectivamente:
N

(x i )2
i 1
2
N

(x i x )2
s i 1
s2
n 1

Otra manera de calcular la desviacin estndar es:

2
n
xi
i 1
n

x
2
i
n
s i 1

n 1

Ejemplo Suponga que se tiene el siguiente conjunto de cinco datos: 1, 1, 3, 10, 10 y


se desea calcular la varianza y la desviacin estndar de dicha muestra.

Solucin a. Si se emplea la frmula de la varianza para una muestra, es necesario


calcular la media aritmtica primero:

x i
1 1 3 10 10 25
x i 1
5
n 5 5

b. Luego se calcula la diferencia entre cada dato y la media, resultados que


luego sern elevados al cuadrado:

x xx x x 2

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
118

1 1 5 = 4 (4) = 16
1 1 5 = 4 (4) = 16
3 3 5 = 2 (2) = 4
10 10 5 = 5 (5) = 25
10 10 5 = 5 (5) = 25
Suma: (x x) 2
= 86

c. Finalmente se aplica la frmula:

(x i x )2
86
s2 i 1
21.5
n 1 5 1

La varianza es 21.5. Si se desea conocer la desviacin estndar, entonces


lo ms prctico es sacar la raz cuadrada de la varianza:

(x i x )2
s i 1
s2 21.5 4.64
n 1

La desviacin estndar es aproximadamente 4.64. Esta medida mide el


grado de dispersin o variabilidad de los datos alrededor de su media.
Mientras ms grande sea este valor, indica mayor dispersin.

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Calcule la varianza y la desviacin estndar.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para calcular la desviacin estndar y la varianza

Ejemplo Utilice Excel y Minitab para resolver el ejercicio: Suponga que se tiene el
siguiente conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea calcular la
varianza y la desviacin estndar de dicha muestra.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
119

Solucin En Excel, primero se introducen los datos en una fila o columna, por
ejemplo, en la columna A, en el rango de celdas de A1 hasta A5:

Para obtener la varianza, en la celda en la cual se desea el resultado, se


introduce la siguiente funcin:

=VAR(A1:A5)

Y as se obtiene el resultado de 21,5.

Para obtener la desviacin estndar, en la celda en la cual se desea el


resultado, se introduce la siguiente funcin:

=DESVEST(A1:A5)

Y as se obtiene el resultado de 4,64.

En Minitab, primero se introducen los datos en una columna, por ejemplo,


en la columna C1:

Luego se da clic en el men Estadsticas, se elige Estadstica bsica y ah


selecciona Mostrar estadsticas descriptivas. Ah completa el cuadro de
dilogo seleccionando la variable, que en este caso se encuentra en la
columna C1:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
120

Luego en el botn Estadsticas selecciona la varianza y la desviacin


estndar:

Luego de dar clic en Aceptar en cada cuadro, se obtiene el resultado en la


ventana Sesin:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
121

Material En la pgina de internet de este texto


podr encontrar videos que exponen el
audiovisual uso de Excel y Minitab para calcular estas
medidas descriptivas.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Caractersticas de la varianza y la desviacin estndar:


La varianza y la desviacin estndar se calculan con cada todos y cada uno de los valores
de una serie de datos y miden la variacin alrededor de la media, pues se obtienen a partir
de las diferencias de cada dato de la serie con respecto a su media aritmtica.
La desviacin estndar es susceptible de operaciones algebraicas.
La varianza y la desviacin estndar siempre son cantidades positivas.

Interpretacin y usos de la desviacin estndar:


La desviacin estndar o desviacin tpica como medida absoluta de dispersin, es la que
mejor proporciona la variacin de los datos con respecto a la media aritmtica, su valor se
encuentra en relacin directa con la dispersin de los datos, a mayor dispersin de ellos,
mayor desviacin tpica, y a menor dispersin, menor desviacin tpica. As, la desviacin
estndar puede emplearse en distintas reas, por ejemplo, puede ser una medida de la calidad
de un producto, pues en la medida en que haya poca variabilidad en un proceso de
produccin, entonces el proceso es consistente, lo que quiere decir que el producto podra
satisfacer los estndares requeridos. Un proceso con alta variabilidad no puede generar
productos de calidad. Por ejemplo, si se llenan botellas con un refresco, y cada botella debe
tener 300 ml de lquido, una variabilidad elevada significara que habra muchas botellas muy
vacas y otras muy llenas.

Tambin, la desviacin estndar puede verse como una medida del riesgo. Si una inversin es
segura, va a dar el mismo rendimiento, o casi el mismo rendimiento, en cualquier caso. Pero
una inversin riesgosa podra dar grandes ganancias, pero tambin grandes prdidas, por lo
que su resultado es altamente variable.

La regla emprica
La desviacin estndar es de gran utilidad en una distribucin normal, ya que en dicha
distribucin en el intervalo determinado por se encuentra el 68,3% de los datos de la
serie; en el intervalo determinado por la 2 se encuentra el 95,4% de los datos y entre la
3 se encuentra la casi totalidad de los datos, es decir, el 99,7% de los datos; de donde se
puede derivar una regla general de gran utilidad para la comprobacin de los clculos. Esta
regla se conoce como Regla emprica.

Cuando la distribucin es simtrica, se puede aplicar la distribucin normal, y las


probabilidades que se obtienen son:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
122

Si el intervalo est definido por la media ms/menos una vez la desviacin estndar, o
sea, , la probabilidad es 68,3%
Si el intervalo est definido por la media ms/menos dos veces la desviacin estndar,
o sea, 2 , la probabilidad es 95,4%
Si el intervalo est definido por la media ms/menos tres veces la desviacin estndar,
o sea, 3 , la probabilidad es 99,7%

Grficamente se muestra como:

Ejemplo De acuerdo con datos de un estudio, el gasto destinado a salud en el hogar


en el pas tiene una media de $600 anuales y una desviacin estndar de
$30. De acuerdo con la regla emprica, por lo menos que porcentaje de los
hogares tendr un gasto destinado a salud entre $510 y $690?

Solucin Se tiene una media de $600 con una desviacin estndar de $30, y el
intervalo dado est entre $510 y $690. Para aplicar la regla emprica es
necesario saber cuntas veces se ha sumado y restado la desviacin
estndar al promedio. Esto puede obtenerse fcilmente porque se sabe que
cada lmite se obtuvo a partir de k , as que, tomando el lmite
inferior de 510 (y por eso va con signo menos):

600 k * 30 510

Ahora se despeja esa ecuacin:

k * 30 510 600
k 90 / 30
k 3

Si se hubiera tomado el lmite superior de 690 se habra obtenido el mismo


resultado de k = 3.

Sabiendo que k = 3, segn la regla emprica, el porcentaje de los hogares

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
123

que tendr un gasto destinado a salud entre $510 y $690 ser


aproximadamente del 99,7%.

Teorema de Chebyshev
La regla emprica dada anteriormente solo se aplica cuando la distribucin es normal, pero es
posible generalizar esa regla cuando la distribucin sea distinta? Es posible construir
intervalos de modo similar, pero las probabilidades van a cambiar. Segn el teorema de
Chebyshev estas probabilidades van a estar dadas por:

1
1
k2

donde k es el nmero de veces que se suma y resta la desviacin estndar, k > 1. Entonces, si
el intervalo se construye como 3 , se tiene que k = 3, por tanto, la probabilidad ser:

1 1 1 8
1 2
1 2 1 0,889
k 3 9 9

Es decir, que en el intervalo 3 , se tiene una probabilidad del 88,9%.

Ejemplo De acuerdo con datos de un estudio, el gasto destinado a salud en el hogar


en el pas tiene una media de $600 anuales y una desviacin estndar de
$30. a. De acuerdo con el teorema de Chebyshev, por lo menos que
porcentaje de los hogares tendr un gasto destinado a salud entre $525 y
$675?

Solucin Se tiene una media de $600 con una desviacin estndar de $30, y el
intervalo dado est entre $525 y $675. Para aplicar el teorema de
Chebyshev es necesario saber cuntas veces se ha sumado y restado la
desviacin estndar al promedio. Esto puede obtenerse fcilmente porque
se sabe que cada lmite se obtuvo a partir de k , as que, tomando el
lmite inferior de 525 (y por eso va con signo menos):

600 k * 30 525

Ahora se despeja esa ecuacin:

k * 30 525 600
k 75 / 30
k 2,5

Si se hubiera tomado el lmite superior de 675 se habra obtenido el mismo


resultado de k = 2,5.

Sabiendo que k = 3, segn el teorema de Chebyshev, se aplica la frmula

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
124

sustituyendo k = 2,5:

1 1 1
1 2
1 2
1 0,84
k 2,5 6,25

As, el porcentaje de los hogares que tendr un gasto destinado a salud


entre $525 y $675 ser al menos 84%.

Ejercicio Las botellas de agua envasadas en un proceso de llenado tienen una media
de 501 ml con una desviacin estndar de 2 ml.
de
revisin a. Si no se conoce si la distribucin es simtrica o asimtrica, qu
porcentaje de las botellas podran tener entre 497 ml y 505 ml de agua?
b. Cmo cambia su respuesta anterior si se sabe que la distribucin del
contenido de agua en las botellas se distribuye normalmente?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Puntajes estandarizados
Considere la siguiente situacin: una persona ha realizado una prueba de aptitud acadmica,
que mide la capacidad del razonamiento verbal, cuantitativo y analtico, entre otras destrezas.
Esta persona obtuvo una puntuacin de 40 en el rea de aptitud verbal y 42 puntos en la de
matemticas y razonamiento analtico. Es cierto que tiene mejores destrezas para el
razonamiento cuantitativo que para el verbal? Para poder responder se requiere un poco ms
de informacin. Segn la institucin que desarrolla la prueba, la seccin de aptitud verbal
tiene una media de 44 puntos con una desviacin estndar de 11 puntos, mientras que la
seccin de razonamiento matemtico tiene una media de 50 puntos con una desviacin
estndar de 9 puntos. Entonces, se puede emplear la desviacin estndar como una especie de
unidad de medida para realizar comparaciones entre datos con diferente media, e incluso con
distintas unidades de medicin. En una situacin como esta se pueden calcular los puntajes
estandarizados, que consisten en tomar un valor de una variable y restarle su media, para
luego dividirlo entre su desviacin estndar. Este resultado va a indicar "cuntas desviaciones
estndar se aleja un dato de su media". La frmula para calcular los puntajes estandarizados
sera:

x
z

En el caso de la prueba de aptitud verbal se tiene que la media () es 44 puntos, la desviacin


estndar () es 11 y la puntuacin de la persona (x) es 40, por lo que el puntaje estandarizado
ser:

x 40 44
z 0,36
11

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
125

El resultado es negativo porque su puntuacin est por debajo de la media e indica que su
resultado est 0,36 veces la desviacin estndar por debajo del promedio.

En el caso de la prueba de razonamiento matemtico se tiene que la media () es 50 puntos, la


desviacin estndar () es 9 y la puntuacin de la persona (x) es 42, por lo que el puntaje
estandarizado ser:

x 42 50
z 0,89
9

Puede observarse que en trminos absolutos obtuvo ms puntos en la seccin de razonamiento


matemtico, pero en trminos relativos, o sea, en trminos de los puntajes estandarizados, su
puntuacin en aptitud verbal es mayor, pues se aleja menos veces la desviacin estndar que
en el caso de anlisis cuantitativo.

Ejemplo Se sabe que los recin nacidos varones de una ciudad tienen un peso medio
de 3.450 gramos, con una desviacin estndar de 75 gramos, mientras que
los recin nacidos varones de una zona rural tienen un peso medio de
3.350 gramos con una desviacin estndar de 100 gramos. Una madre
residente de esa ciudad acaba de tener un nio con un peso de 3.475
gramos y otra madre residente de la zona rural dada acaba de tener un nio
con un peso de 3.450 gramos, cul de los dos nios tiene, en trminos
relativos, un peso mayor?

Solucin En el caso de la ciudad se tiene que la media () es 3.450 gramos, la


desviacin estndar () es 75 gramos y el peso del recin nacido (x) es
3.475 gramos, por lo que el puntaje estandarizado ser:

x 3475 3450
z 0,33
75

En el caso de la zona rural se tiene que la media () es 3.350 gramos, la


desviacin estndar () es 100 gramos y el peso del recin nacido (x) es
3.450 gramos, por lo que el puntaje estandarizado ser:

x 3450 3350
z 1
100

El puntaje estandarizado para el nio de zona rural es mayor que para el


nio de la ciudad, por lo que, en trminos relativos, tiene un peso mayor.

Ejercicio Suponga que el gasto promedio anual en salud de cada habitante de


Argentina es de $742 con una desviacin estndar de $250, mientras que
de en Chile se destinan, en promedio, $947 en salud al ao, con una
revisin desviacin estndar de $358.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
126

Si una persona en Argentina gast este ao $850 en salud, mientras que


otra persona en Chile gast $1050 en salud, cul de los dos gast ms en
trminos relativos?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Medidas de variabilidad relativa: El coeficiente de variacin


Las medidas de variabilidad descritas hasta ahora miden la variabilidad absoluta de un
conjunto de datos. Esto es muy til cuando se trata de analizar una sola poblacin o una sola
muestra, pero no es tan til cuando hay que establecer comparaciones entre distintas
poblaciones o muestras, especialmente si las magnitudes que se comparan son muy diferentes
o estn expresadas en unidades de medida distintas. Es por esto que es necesario calcular
medidas de variabilidad en trminos relativos, o sea, como proporciones o porcentajes.

El coeficiente de variacin se designa con las letras CV y consiste en el cociente de la


desviacin estndar entre la media.

COEFICIENTE DE VARIACIN Es el cociente de la desviacin estndar entre la


media de un conjunto de datos y muestra la variabilidad relativa de un conjunto de
datos.

El coeficiente de variacin es la medida de variabilidad relativa ms usada. Es un ndice de


variabilidad sin dimensiones, lo que facilita la comparacin entre diferentes conjuntos de
datos, aun expresados en diferentes unidades de medida.

La frmula matemtica es, para poblacin y muestra, respectivamente:


CV 100

s
CV 100
x

Ejemplo En el caso del conjunto de datos anterior, se calcul una media de 5 y una
desviacin estndar de 4.64, calcule el coeficiente de variacin.

Solucin Dado que se calcul una media de 5 y una desviacin estndar de 4.64,
entonces el coeficiente de variacin es:

s 4.64
CV 100 100 92.74%
x 5

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
127

Ejercicio Con base en el siguiente conjunto de datos:


de 40, 50, 65, 85, 75, 90, 60, 60, 60, 75
revisin
Calcule el coeficiente de variacin.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para calcular el coeficiente de variacin

Ejemplo Utilice Minitab para resolver el ejercicio: Suponga que se tiene el siguiente
conjunto de cinco datos: 1, 1, 3, 10, 10 y se desea calcular el coeficiente de
variacin de dicha muestra.

Solucin En Minitab, primero se introducen los datos en una columna, por ejemplo,
en la columna C1:

Luego se da clic en el men Estadsticas, se elige Estadstica bsica y ah


selecciona Mostrar estadsticas descriptivas. Ah completa el cuadro de
dilogo seleccionando la variable, que en este caso se encuentra en la
columna C1:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
128

Luego en el botn Estadsticas selecciona el coeficiente de variacin.


Despus de dar clic en Aceptar en cada cuadro, se obtiene el resultado en
la ventana Sesin:

Uso de Excel y Minitab para calcular medidas descriptivas

Ejemplo Se tiene el siguiente conjunto de datos:

24, 24, 25, 25, 25, 25, 25, 26, 26, 26, 27, 27, 28, 29, 30

Utilice la herramienta de anlisis de datos de Excel para obtener las


principales estadsticas descriptivas de este conjunto de datos.

Solucin Lo primero es introducir los datos en la hoja de Excel. Lo ms conveniente


es agregarlos todos en una misma columna, que en este caso va de la celda
A1 hasta la celda A15.

Luego se da clic a la pestaa Datos y en la seccin Anlisis se elige el


botn Anlisis de datos. Ahora elige Estadstica descriptiva. Ahora hay
que completar el cuadro de dilogo.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
129

En rango de entrada se indica el rango de datos, por lo que se seleccionan


las celdas de la A1 hasta la A15. Despus marca la opcin Resumen de
estadsticas y da clic en Aceptar.

Excel genera una serie de medidas estadsticas de uso comn, como se


muestra a continuacin.

Ejemplo Se tiene el siguiente conjunto de datos:

24, 24, 25, 25, 25, 25, 25, 26, 26, 26, 27, 27, 28, 29, 30

Utilice el resumen grfico de Minitab para obtener las principales


estadsticas descriptivas de este conjunto de datos.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
130

Solucin El primer paso es digitar estos datos en una columna de la hoja de trabajo
de Minitab, por ejemplo, en la columna C1. Luego se da clic en el men
Estadsticas, se selecciona Estadstica bsica y ah se elige Resumen
grfico.

En el cuadro de dilogo se selecciona la variable en la columna C1 y se da


clic en Aceptar. Minitab despliega una ventana con un histograma con
ajuste a la curva normal y una grfica de caja. Adems un cuadro con
varias medidas descriptivas y otros datos que se estudiarn ms adelante en
este texto.

Resumen para C1
P rueba de normalidad de A nderson-Darling
A -cuadrado 0,64
V alor P 0,078

M edia 26,133
Desv .Est. 1,767
V arianza 3,124
A simetra 0,932550
Kurtosis 0,217419
N 15
M nimo 24,000
1er cuartil 25,000
M ediana 26,000
3er cuartil 27,000
24 25 26 27 28 29 30 M ximo 30,000
Interv alo de confianza de 95% para la media
25,155 27,112
Interv alo de confianza de 95% para la mediana
25,000 27,000
Interv alo de confianza de 95% para la desv iacin estndar
Intervalos de confianza de 95%
1,294 2,787
Media

Mediana

25,0 25,5 26,0 26,5 27,0

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
131

Apoyo En la pgina de internet www.auladeeconomia.com/raeep.html podr


encontrar una presentacin de diapositivas que expone este tema y es una
audiovisual parte importante de este texto. Esta presentacin presenta el tema en
y uso de la forma visual, pues emplea fotografas, esquemas u otros recursos
tecnologa visuales, e incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
132

Cuadro de resumen sobre las medidas de posicin y variabilidad:

Medidas de posicin
Medida Significado Uso
Moda El valor que ms se repite. Se usa sobre todo en variables
cualitativas para indicar lo ms
frecuente, aunque tambin se puede
usar en variables cuantitativas.

Mediana Es un valor mayor que el 50% de los Se usan para describir el conjunto y
datos y menor que el restante 50%. es muy til cuando la distribucin de
los datos no es simtrica y hay
valores extremos.

Media Es el valor promedio de los datos. Es la medida ms usada para


describir un conjunto de datos.
Cuando hay valores extremos, se ve
distorsionada.

Cuartil 1 Es un valor que es mayor que el Se usa para indicar la posicin


Q1 25% de los datos y menor que relativa de un valor con respecto a
restante 75%. los dems. Equivale al percentil 25.

Cuartil 3 Es un valor que es mayor que el Se usa para indicar la posicin


Q3 75% de los datos y menor que relativa de un valor con respecto a
restante 25%. los dems. Equivale al percentil 75.

Deciles Son valores que dividen al conjunto Se usa para indicar la posicin
de datos en 10 partes. As, el D6 es relativa de un valor con respecto a
un valor que es mayor que un 60% los dems. Cada decil equivale a un
de los datos y menor que el restante percentil. Por ejemplo D6 = P60.
40%.

Percentiles Son valores que dividen al conjunto Se usa para indicar la posicin
de datos en 100 partes. Por ejemplo, relativa de un valor con respecto a
el P38 es un valor que es mayor que los dems.
un 38% de los datos y menor que el
restante 62%.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
133

Medidas de variabilidad
Medida Significado Uso
Rango o Es la diferencia entre el valor Se usa para medir la variabilidad de
recorrido mximo y el mnimo de un conjunto los datos, pero es una medida
de datos. deficiente.

Varianza Mide la media de los cuadrados de Es una de las medidas ms


las desviaciones con respecto al empleadas para medir la
promedio. variabilidad. Mientras ms alta sea,
indica ms variabilidad.

Desviacin Mide la media de las desviaciones Es la medida ms empleada para


estndar con respecto al promedio medir la variabilidad absoluta.
Mientras ms alta sea, indica ms
variabilidad.

Coeficiente Es la desviacin estndar entre el Es la medida ms empleada para


de variacin promedio. medir la variabilidad relativa.
Mientras ms alta sea, indica ms
variabilidad.

Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se le presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

1. Los siguientes son los ingresos de siete personas (en $/mes):

300, 450, 500, 250, 600, 550, 450, 3000

a. Calcule e interprete la media, moda y mediana.


b. Cul de las tres medidas describe mejor al conjunto de datos?

2. La presencia de manganeso en la gasolina puede significar un problema, pues genera


ciertos daos a los vehculos, a la salud de las personas y al ambiente. Ante la duda de altas
concentraciones de esta sustancia en la gasolina vendida en el pas se toman muestras en los
distintos planteles de la compaa refinadora de petrleo para que vaya a ser estudiadas en un
laboratorio. Los siguientes son datos recopilados para un plantel de la refinadora durante el
mes de octubre anterior (concentracin de manganeso en mg/L de gasolina):

0,4 0,5 0,0 0,1 0,0 0,2 0,6 0,2 0,1 0,0
0,2 0,3 0,6 0,2 0,3 0,4 0,3 0,2 0,1 0,0

Con base en los datos anteriores:


a. Calcule e interprete la media, la mediana y la moda.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
134

b. Indique la forma de la distribucin de las concentraciones de manganeso (simtrica


o asimtrica positiva o negativa).

3. Los siguientes son los pesos, en gramos, de una muestra de frascos de mermelada que se
envasan en una empresa:

252, 260, 266, 248, 240, 246, 255, 260, 270, 258, 259, 260, 264, 254, 256, 262

a. Calcule e interprete la media, moda y mediana.


b. Qu se puede concluir sobre la simetra o asimetra de los pesos?
c. Si cada frasco debe contener 250 gramos, qu indican los datos calculados y el tipo
de simetra o asimetra que se presenta?

4. Los siguientes datos corresponden a las tasas de pobreza de un pas en el transcurso de los
ltimos 12 aos:

18,7 18,8 18,7 17,8 17,3 17,8


16,6 16,5 16,5 16,5 17,3 17,6

Con base en los datos anteriores, conteste las siguientes preguntas (incluya todos los clculos
y procedimientos necesarios):
a. Calcule la tasa media de pobreza en el periodo citado e interprete el resultado.
b. Calcule la tasa mediana de pobreza en el periodo citado e interprete el resultado.
c. Calcule la tasa de pobreza ms frecuente en el periodo citado e interprete el
resultado.
d. Qu puede decirse sobre la simetra de las tasas de pobreza de este pas en el
periodo dado? Explique la forma de la distribucin de las tasas de pobreza basndose
en los indicadores adecuados.

5. Un contador est realizando una auditora de los cheques extendidos por una compaa. En
una muestra de 15 cheques se obtuvieron los siguientes montos, en miles dlares:

8, 4, 2, 60, 6, 8, 14, 25, 20, 5, 6, 8, 2, 19, 11

a. Calcula la media, mediana y moda de los montos de los cheques.


b. Cul de las tres medidas calculadas en el inciso anterior describe mejor al conjunto
de datos?
c. Qu podra afirmarse sobre la forma de la distribucin de los montos de los
cheques?

6. En una muestra de 12 personas con miopa elevada superior a 12,00 D se midieron algunos
parmetros biomtricos de sus ojos, como la longitud axial. Los resultados fueron los
siguientes:

Paciente Longitud axial (mm)


1 25
2 28
3 26
4 30
5 28

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
135

6 27
7 25
8 29
9 31
10 30
11 31
12 33
13 29
14 31
15 29
16 32
17 29

Con base en estos datos calcule las medidas de tendencia central e indique si la distribucin
de esta variable es simtrica o asimtrica.

7. Un instituto de idiomas ha contratado un estudio de salarios de profesores (salarios


mensuales). En dicho estudio se obtuvieron los siguientes resultados:

Percentil 12 = $600 Cuartil 1 = $650


Mediana = $725 Cuartil 3 = $800
Quintil 4 = $1000 Decil 9 = $1200

Interprete cada uno de estos resultados.

8. Sean los siguientes datos:

45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

Calcule:
a. Cuartil 1
b. Cuartil 3
c. Decil 7
d. Percentil 42
e. Percentil 93
f. Quintil 3

9. Sea la siguiente muestra de datos:

45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

Calcule la varianza y la desviacin estndar.

10. Un mdico ha reunido los siguientes datos sobre la estancia hospitalaria en horas de una
muestra de 10 neonatos en la unidad de cuidados intensivos de un hospital:

150, 70, 95, 120, 120, 72, 240, 84, 600, 48

Con base en los datos anteriores, calcule las siguientes medidas descriptivas (incluya todos los
clculos y procedimientos necesarios):

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
136

a. Mediana
b. Media aritmtica
c. Percentil 95
d. Desviacin estndar
e. Interprete cada uno de los resultados anteriores.

11. Sean las siguientes muestras de datos:

Muestra 1: 45, 56, 72, 81, 43, 62, 55, 90, 49


Muestra 2: 67, 52, 60, 70, 66, 72, 58, 50, 58

Cul posee mayor variabilidad relativa?

12. Sea la siguiente muestra de datos:

45, 56, 72, 81, 43, 62, 55, 90, 49, 52, 60, 75, 66, 72, 58, 50, 88

Calcule el rango intercuartil y la desviacin cuartil.

13. Sea la siguiente muestra de datos:

45, 56, 60, 60, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 88

Construya el diagrama de caja.

14. Analice y compare las siguientes dos diagramas de dispersin.

15. Los siguientes son los tiempos de funcionamiento, en horas, de un tipo de componente
electrnico: 100, 110, 80, 95, 97, 82, 113, 128, 116, 98, 99, 105, 187, 114, 121, 104, 118, 109.
Construya la grfica de caja e interprtela. Puede identificarse valores extremos?

16. Un ingeniero ha recopilado datos sobre la vida til de 20 filtros de gasolina del mismo
tipo y marca. Los datos son los siguientes (en miles de kilmetros): 12, 14, 16, 15, 10, 20, 13,
15, 16, 14, 12, 13, 11, 13, 15, 16, 13, 14, 14, 12.

a. Calcule la media, mediana y moda e interprete los resultados.


b. Construya e interprete la grfica de caja.
c. Qu rango se encontrara al menos el 75% de las duraciones de los filtros de
gasolina, suponiendo que no se conoce la forma de la distribucin de esta variable?

17. En un pas el 25% de los hogares con menos recursos reciben un ingreso mensual
promedio, por persona, de $125. En el otro extremo, el 25% de los hogares con mayores
ingresos, reciben, en promedio, por persona, $1970 por mes.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
137

a. Calcule e interprete el rango intercuartlico.


b. Calcule e interprete la desviacin cuartil.

18. Sea la siguiente muestra de datos:

45, 56, 60, 60, 43, 62, 55, 69, 49, 52, 60, 75, 66, 72, 58, 50, 88

a. Calcule el rango de variacin del 68,3% de estos datos.


b. Calcule el rango en el que se encuentra el 95,4% de los datos.
c. Calcule el rango en el que se encuentra el 99,7% de los datos.

19. Dado el siguiente conjunto de datos sobre el tiempo (en minutos) que una muestra de
personas seleccionadas al azar dura en completar una prueba:

55, 81, 92, 74, 58, 62, 84, 60, 90, 57, 82, 66, 90, 57, 74, 73, 67, 74, 88, 65, 68, 70, 98, 82

Calcule e interprete cada una de las siguientes medidas descriptivas:


a. Moda
b. Mediana
c. Media aritmtica
d. Primer cuartil
e. Tercer cuartil
f. Percentil 45
g. Decil 3
h. Quintil 3
i. Desviacin estndar
j. Varianza
k. Coeficiente de variacin
l. Rango intercuartil
m. Desviacin cuartil
n. Qu se puede concluir sobre la simetra o asimetra de los datos?

20. Una enfermera ha reunido los siguientes datos sobre la cantidad de horas extra semanales
laboradas por 12 enfermeras de la unidad de cuidados intensivos de un hospital:

12, 14, 18, 6, 22, 19, 20, 14, 14, 17, 0, 6

Con base en los datos anteriores, calcule las siguientes medidas descriptivas (incluya todos los
clculos y procedimientos necesarios):
a. Mediana
b. Media aritmtica
c. Percentil 65
d. Desviacin estndar
e. Interprete cada uno de los resultados anteriores:

21. Dado el siguiente conjunto de datos sobre el nmero de turistas que se hospedan en un
hotel por semana en una muestra de 22 semanas seleccionadas al azar:

25 81 92 44 58 62 34 40 90 57 42
40 57 57 57 57 62 40 65 58 50 18

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
138

Calcule e interprete cada una de las siguientes medidas descriptivas:


a. Moda
b. Mediana
c. Media aritmtica
d. Primer cuartil
e. Tercer cuartil
f. Percentil 45
g. Decil 3
h. Quintil 3
i. Desviacin estndar
j. Varianza
k. Coeficiente de variacin
l. Rango intercuartil
m. Desviacin cuartil
n. Qu se puede concluir sobre la simetra o asimetra de los datos?
o. Qu % de los datos se encuentra en un rango de 2 veces la desviacin estndar?
p. Construya el diagrama de caja e interprtelo.

22. Un laboratorio recibe un lote de comprimidos de un frmaco cuyo principio activo es


omeprazol. La especificacin indica que cada uno debe contener 20 mg de dicho principio
activo. En una muestra de 20 comprimidos se encontraron las siguientes cantidades de
omeprazol:

19,3 18,1 17,2 16,5 21,6 19,7 16,6 14,2 19,4 19,3
18,7 17,1 11,6 16,4 15,8 16,8 17,9 16,4 19,3 12,9

Con base en los datos anteriores, calcule e interprete:


a. Media aritmtica
b. Mediana
c. Moda
d. Qu puede concluirse con respecto a la simetra o asimetra de los contenidos de
principio activo de estos comprimidos?
e. Construya la grfica de caja para los datos suministrados e interprete el grfico.
f. Calcule la varianza. Qu se concluye si se ha especificado que la variabilidad
relativa de esta variable no debe exceder el 30%?

23. Una maestra ha reunido los siguientes datos sobre la talla en centmetros de nias de una
institucin preescolar. Los datos corresponden a cinco grupos de la institucin. Los datos se
presentan a continuacin:

Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5


108 99 116 115 117
119 96 117 115 115
119 99 119 114 101
101 92 112 112 112
115 99 128 115 125
117 92 126 115 119
115 94 133 110 112
119 113 125 110 117

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
139

112 128 126 119 115


110 101 124 115 119
112 96 121 115 121
103 99 131 125 108
99 126 126 117 110
119 114 119 119 105
117 108 108 108 -
115 112 121 - -
- 125 115 - -
- 101 - - -

Con base en los datos anteriores relativos a la zona indicada, calcule las siguientes medidas
descriptivas (incluya todos los clculos y procedimientos necesarios):
a. Moda del grupo 1
b. Mediana del grupo 2
c. Media aritmtica del grupo 3
d. Primer cuartil del grupo 4
e. Percentil 85 del grupo 5
f. Desviacin estndar del grupo 5
g. Interprete cada uno de los resultados anteriores:
h. Qu puede decirse de la simetra o asimetra de la distribucin de los datos en el
grupo nmero 2?
i. Con base en los resultados calculados, es cierto que un nio del grupo 1 con una
talla de 102 centmetros es relativamente pequeo? Explique basndose en los datos.
j. Cul grupo tiene mayor variabilidad relativa: el grupo 2 o el grupo 3?
k. Construya e interprete la grfica de caja para los datos del grupo 4.

24. Suponga que se realiz un estudio en el que se compar la efectividad de dos mtodos de
enseanza A y B en una escuela rural. Luego de aplicar exmenes a los estudiantes se
obtuvieron los siguientes resultados:

Mtodo de enseanza A B
Media aritmtica 74,5 74,9
Desviacin estndar 11,3 24,6
Mediana 72 68
Moda 71 65

Determine la validez de las siguientes afirmaciones (justifique su respuesta):


a. Los resultados de ambos mtodos son prcticamente iguales.
b. Con el mtodo B casi todos los estudiantes obtuvieron la misma nota.
c. La distribucin de las notas del mtodo B presenta una asimetra hacia la izquierda.
d. El mtodo A presenta una dispersin de las notas mayor que el mtodo B.

25. Una investigadora ha aplicado un instrumento estandarizado para la medicin de los


aprendizajes en preescolares de 5 aos. La prueba fue desarrollada por la investigadora y
utiliza una seleccin de aprendizajes esperados y cubre distintos mbitos, como la formacin
social, la comunicacin, la relacin con el medio natural, entre otros. Al final se obtiene un
puntaje total luego de la aplicacin de todos los tems de la prueba. El instrumento se aplic a
una muestra de nios de 5 aos y se obtuvieron los siguientes resultados:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
140

35 69 50 41 51 49 31 27 66 78 56 46
45 47 49 33 24 55 49 51 46 47 46 47

Con base en los datos anteriores, calcule e interprete las siguientes medidas descriptivas
siguientes (incluya todos los clculos y procedimientos necesarios):
a. Mediana
b. Moda
c. Media aritmtica
d. Percentil 85
e. Cuartil 1
f. Cuartil 3
g. Desviacin estndar
h. Con base en los datos suministrados, utilice las medidas de posicin central para
determinar si la distribucin de los datos es simtrica o asimtrica. Explique.
i. Dada la respuesta anterior, cul medida preferira en este caso para describir el
comportamiento de los datos? Explique.
j. Con base en los datos suministrados, construya el diagrama de caja para la variable
resultado de la aplicacin del instrumento estandarizado para la medicin de los
aprendizajes en preescolares de 5 aos.
k. Al analizar la grfica de caja, qu se puede afirmar sobre la dispersin de los
datos? Explique. Al analizar la grfica de caja, qu se puede concluir sobre la forma
de la distribucin de los datos (simetra o asimetra)? Explique.

26. Una trabajadora social est preocupada por el consumo de drogas ilegales entre los
estudiantes de secundaria de una comunidad marginal del pas llamada ciudadela Los Robles.
Una muestra de 18 estudiantes varones del liceo local report las siguientes cifras como la
edad en que se inici el consumo de drogas ilegales:

14 17 16 13 15 16 13 14 15 12 16 18 15 14 11 13 15 8

Con base en los datos anteriores, calcule e interprete cada una de las siguientes medidas
descriptivas:
a. Moda
b. Mediana
c. Media aritmtica
d. Rango intercuartil
e. Percentil 85
f. Desviacin estndar
g. Qu puede decirse de la simetra o asimetra de la distribucin de los datos
anteriores sobre la variable edad de inicio en el consumo de drogas?
h. Establezca un intervalo que incluya aproximadamente al 75% de las observaciones,
tomando como base los datos de la pregunta uno sobre las edades de inicio en el
consumo de drogas.
i. Un estudio similar en otra comunidad, llamada San Juan, determin una edad
promedio de inicio en el consumo de drogas entre varones estudiantes de secundaria
de 15,85 aos con una desviacin estndar de 3,1 aos.
i.1. Cul de las dos comunidades presenta mayor homogeneidad en cuanto a
las edades en el inicio del consumo de drogas de los varones estudiantes de
secundaria? Explique basndose en los clculos adecuados.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
141

i.2. Suponga que Luis vive en Los Robles y empez a consumir drogas a los 16
aos. Roberto vive en San Juan y empez a consumir drogas a los 18 aos. En
trminos de relativos, cul de los dos empez a consumir drogas a menor
edad?
j. Con respecto a la variable edad de inicio del consumo de drogas en la comunidad de
Los Robles:
j.1. Construya el diagrama de caja. Incluya todos los clculos y la grfica con
la escala adecuada.
j.2. Qu puede concluirse sobre la dispersin de los datos a partir de la grfica
anterior? Bsese en las medidas de variabilidad asociadas con la mediana.
j.3. Qu puede concluirse sobre la simetra o asimetra de los datos? Utilice la
grfica para responder.

27. Segn un estudio de una agencia de publicidad sobre el nmero de horas de televisin por
semana que ven los jvenes entre 12 y 18 de una zona del pas poseen las siguientes
caractersticas (todas en horas por semana):

Moda: 13 Mediana: 14,34 Media: 16,67


Cuartil 1: 11,04 Cuartil 3: 18,92 Decil 2: 10,87
Decil 8: 19,56 Decil 9: 22,35 Percentil 95: 25,88
Desviacin estndar: 4,5 Mnimo: 6 Mximo: 28

Con base en los datos anteriores, determine lo siguiente:


a. Interprete cada una de las medidas anteriores.
b. Calcule e interprete el coeficiente de variacin.
c. Cules de las siguientes afirmaciones son falsas y cules verdaderas, basndose en
los datos?
i. Yo veo muy poca TV, pues por semana estoy frente al televisor solo 20
horas
ii. Yo creo que la mayora de los muchachos ven menos TV que mi hijo. Es
increble que gaste 11 horas semanales frente al televisor
iii. El 95% de los jvenes miran entre 7,67 y 23,67 horas de TV por mes
iv. La distribucin del nmero de horas de televisin por semana que ven los
jvenes entre 12 y 18 de una zona del pas es asimtrica negativa

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta. (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. En el conjunto de valores 3, 4, 5, 6, 4, 7, 8, 4, 6, 9, 10, la mediana es:


(a)4 (b)7
( c ) 5,5 (d)6

2. La media aritmtica del siguiente conjunto de datos 7, 20, 13, 14, 6, 9, 1 es:
( a ) 70 ( b ) 20
( c ) 14 ( d ) 10

3. La moda del siguiente conjunto de datos 7, 7, 20, 20, 13, 14, 13, 6, 9, 13, 6 es:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
142

(a)7 ( b ) 20
( c ) 13 (d)6

4. La media aritmtica del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36

5. La mediana del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36

6. La moda del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 20, 6 es:
( a ) 20 ( b ) 10
( c ) 13 ( d ) 11,36

7. El primer cuartil del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
(a)7 ( b ) 20
( c ) 13 (d)6

8. El tercer cuartil del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 14 ( b ) 20
( c ) 13 ( d ) 17

9. El percentil 30 del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 7,6 ( b ) 10
(c)7 (d)6

10. El percentil 70 del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
(a)7 ( b ) 20
( c ) 13,4 (d)6

11. La desviacin estndar del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6
es:
( a ) 25,45 ( b ) 5,05
( c ) 1,52 ( d ) 44,4

12. La varianza del siguiente conjunto de datos 7, 8, 20, 20, 13, 14, 12, 6, 9, 10, 6 es:
( a ) 25,45 ( b ) 5,05
( c ) 1,52 ( d ) 44,4

13. Si en una muestra, la media es igual a la moda y a la mediana, entonces se concluye que:

A. Los datos son iguales


B. La desviacin estndar es cero

Con respecto a las dos afirmaciones anteriores, es correcto que con toda certeza:
( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
143

14. Si dos valores en un grupo de datos ocurren ms a menudo que otros cualesquiera, la
distribucin de los datos ser ___________. La opcin que mejor completa la frase anterior
es:
( a ) Simtrica ( b ) Bimodal
( c ) Asimtrica positiva ( d ) Asimtrica negativa

15. Considere las dos siguientes afirmaciones:


A. Los valores extremos en un conjunto de datos influyen profundamente en la
mediana.
B. Para un arreglo de datos con 50 observaciones, la mediana ser el valor de la
vigsima quinta observacin en el arreglo.

Con respecto a las dos afirmaciones anteriores, es correcto que:


( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas

16. Considere las dos siguientes afirmaciones:


A. Cuando la poblacin tiene sesgo negativo o positivo, a menudo es preferible utilizar
la mediana como la mejor medida de localizacin, pues siempre se encuentra entre la
media y la moda.
B. Cuando una distribucin es simtrica y tiene una moda, el punto ms alto en la
curva es la mediana y la media.

Con respecto a las dos afirmaciones anteriores, es correcto que:


( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas

17. Cul de los siguientes enunciados no es una ventaja del uso de la mediana?
( a ) Los valores extremos afectan a la mediana menos intensamente que a la media
( b ) La mediana es fcil de entender
( c ) Una mediana puede calcularse para descripciones cualitativas
( d ) Ninguna de las anteriores

18. Considere las dos siguientes afirmaciones:


A. Las medidas de tendencia central en un conjunto de datos se refieren al grado de
dispersin de las observaciones.
B. La diferencia entre las observaciones ms grandes y las ms pequeas en un
conjunto de datos se llama media geomtrica.

Con respecto a las dos afirmaciones anteriores, es correcto que:


( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas

19. Considere las dos siguientes afirmaciones:


A. La desviacin estndar se mide en las mismas unidades que las observaciones en el
conjunto de datos.
B. Una desventaja del uso del rango para medir la dispersin consiste en que ignora la
naturaleza de las variaciones entre la mayor parte de las observaciones.

Con respecto a las dos afirmaciones anteriores, es correcto que:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
144

( a ) Ambas son verdaderas ( b ) Solo A es verdadera


( c ) Solo B es verdadera ( d ) Ambas son falsas

20. Si un grupo de datos tiene tan slo una moda y el valor de la moda es menor que el de la
media, podremos llegar a la conclusin de que la grfica de la distribucin es:
( a ) Simtrica ( b ) Sesgada a la izquierda
( c ) Sesgada ala derecha ( d ) Platicrtica

21. Cul de los siguientes enunciados NO es correcto?


( a ) Algunos conjuntos de datos no tienen media.
( b ) En los clculos de la media influyen los valores extremos de datos.
( c ) Una media ponderada ha de emplearse cuando es necesario tener en cuenta la
importancia de cada valor.
( d ) Todos estos enunciados son correctos.

22. Cul de los siguientes enunciados es el primer paso en el clculo de la mediana de un


conjunto de datos?
( a ) Obtener el promedio de los dos valores de la mitad en un conjunto de datos.
( b ) Ordenar los datos en un arreglo.
( c ) Determinar los pesos relativos de los valores de los datos por orden de importancia.
( d ) Ninguno de los anteriores.

23. Cul de los siguientes casos es un ejemplo de una medida relativa de dispersin?
( a ) Desviacin estndar
( b ) Varianza
( c ) Coeficiente de variacin
( d ) Las opciones a y b pero no c

24. Si p es el mayor de tres enteros consecutivos, entonces el promedio de los tres nmeros
es:
(a)p (b)p1
(c)p3 ( d ) 3p 1

25. La edad promedio de un grupo de 5 amigos es 17,4 aos. Si se incorpora al grupo un


amigo de 18 aos, la edad promedio de nuevo grupo es:
( a ) 17,5 aos ( b ) 17,7 aos
( c ) 21 aos ( d ) 20,4 aos

26. El gerente de un centro de llamadas desea evaluar el desempeo de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfaccin que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tom una muestra de 12 llamadas
por da de lunes a mircoles y 20 llamadas el jueves y el viernes. Los siguientes son los
tiempos de las muestras tomadas de lunes a mircoles. El lunes y el martes se tomaron
tiempos de llamadas atendidas y el mircoles solo de llamadas no atendidas:

Nmero de muestra (tiempo en segundos)


Da 1 2 3 4 5 6 7 8 9 10 11 12
Lunes 13 15 15 16 16 16 16 17 17 19 11 21
Martes 12 15 15 16 16 15 16 18 15 20 30 40

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
145

Mircoles 30 40 45 45 50 50 45 35 60 50 80 100

Las preguntas de la 26 a la 43 se basan en la informacin anterior.

La distribucin de los tiempos de las llamadas del da lunes es:


( a ) Simtrica ( b ) Asimtrica positiva
( c ) Asimtrica negativa ( d ) Asimtrica hacia la derecha

27. La distribucin de los tiempos de las llamadas del da martes es:


( a ) Simtrica ( b ) Asimtrica positiva
( c ) Asimtrica negativa ( d ) Ninguna de las anteriores

28. El tiempo medio de espera de los clientes de la muestra del da martes es, en segundos:
( a ) 15 ( b ) 19
( c ) 16 ( d ) Ninguna de las anteriores

29. La mediana del tiempo de espera de los clientes de la muestra del da martes es, en
segundos:
( a ) 15 ( b ) 19
( c ) 16 ( d ) Ninguna de las anteriores

30. La moda del tiempo de espera de los clientes de la muestra del da lunes es, en segundos:
( a ) 15 ( b ) 15,5
( c ) 16 ( d ) Ninguna de las anteriores

31. Con respecto a los datos del da mircoles es verdadero que:


( a ) La distribucin es asimtrica a la izquierda
( b ) No se presentan valores extremos
( c ) La distribucin es bimodal
( d ) Todas las anteriores son verdaderas

32. El cuartil 1 de los tiempos de espera del da lunes es, en segundos:


( a ) 15,5 ( b ) 15
( c ) 16 ( d ) 3,25

33. El cuartil 3 de los tiempos de espera del da martes es, en segundos:


( a ) 18,75 ( b ) 19,5
( c ) 9,75 ( d ) 37,5

34. El percentil 80 de los tiempos de espera del da mircoles es, en segundos:


( a ) 62 ( b ) 68
( c ) 10,4 ( d ) Ninguna de las anteriores

35. La varianza de los tiempos de espera del da mircoles es, aproximadamente, en


segundos2:
( a ) 19,6 ( b ) 384,09
( c ) 13,75 ( d ) 189,06

36. La desviacin estndar de los tiempos de espera del da martes es, en segundos:
( a ) 5,5 (b)8

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
146

( c ) 64 ( d ) Ninguna de las anteriores

37. El coeficiente de variacin de los tiempos de espera del lunes es:


( a ) 15,99% ( b ) 2,55
( c ) 6,25% ( d ) Ninguna de las anteriores

38. Con relacin a la variabilidad relativa de los tiempos de espera es verdadero que el da
cuyos tiempos tienen una dispersin relativa ms baja es:
( a ) Lunes ( b ) Martes
( c ) Mircoles ( d ) Falta informacin para determinarlo

39. El decil 4 de los tiempos de espera del da lunes es, en segundos:


( a ) 5,2 ( b ) 15
( c ) 16 ( d ) Ninguna de las anteriores

40. Si el primer cuartil para los tiempos de espera del da viernes es de 14,6 segundos,
entonces es falso que:
( a ) Un 25% de los clientes de ese da esperaron 14,6 segundos o menos
( b ) Un 75% de los clientes de ese da esperaron 14,6 segundos o ms
( c ) Un cliente que esper 12 segundos esper poco con respecto a los dems
( d ) Ninguna de las anteriores

41. Si la mediana para los tiempos de espera del da viernes es de 19,8 segundos, entonces es
falso, con toda certeza, que:
( a ) Un 50% de los clientes de ese da esperaron 19,8 segundos o menos
( b ) El tiempo de espera promedio de ese da fue de 19,8 segundos
( c ) La mayora de los clientes esperaron ms de 19,8 segundos
( d ) Ninguna de las anteriores

42. Si la media para los tiempos de espera del da viernes es de 21,3 segundos, entonces es
verdadero que:
( a ) La mitad de los clientes esperaron 21,3 segundos o menos
( b ) Un 50% de los clientes de ese da esperaron 21,3 segundos o ms
( c ) El tiempo ms frecuente fue 21,3 segundos
( d ) Todas las anteriores son falsas

43. Si la media para los tiempos de espera es de 21,3 segundos y la desviacin estndar para
los tiempos de espera del da viernes es de 7,6 segundos, entonces es verdadero que:
( a ) Los tiempos de espera tuvieron una variabilidad de 7,6 segundos con relacin a su media
( b ) Aproximadamente un 68,3% de los clientes esperaron entre 13,7 y 28,9 segundos
( c ) Aproximadamente un 95,4% de los clientes esperaron entre 6,1 y 36,5 segundos
( d ) Todas las anteriores son verdaderas

Respuestas a ejercicios de seleccin mltiple:

1. d 2. d 3. c 4. d 5. b
6. a 7. a 8. a 9. a 10. c
11. b 12. a 13. d 14. b 15. d
16. a 17. d 18. d 19. a 20. b

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
147

21. a 22. b 23. c 24. b 25. a


26. a 27. b 28. b 29. c 30. c
31. c 32. b 33. b 34. b 35. b
36. b 37. a 38. a 39. c 40. d
41. d 42. d 43. d

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
148

4 .

Distribuciones de frecuencias
OBJETIVOS:
Al concluir el captulo, ser capaz de:
Construir la tabla de una distribucin de frecuencias.
Representar grficamente los datos provenientes de una distribucin de frecuencias.
Calcular e interpretar las principales medidas de posicin en datos agrupados.
Calcular e interpretar las principales medidas de variabilidad en datos agrupados.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
149

Distribuciones de frecuencias
Necesidad de resumir la informacin
Cuando se tiene un conjunto grande de datos, por ejemplo de 2000 datos, no es fcil poder
determinar por la simple observacin de todos esos datos caractersticas de la forma en que se
distribuyen ni conocer medidas que describen al conjunto, como la media, la mediana, la
desviacin estndar, etc. Entonces es necesario contar con alguna herramienta que permita
resumir la informacin. Un modo de hacer esto es agrupando las observaciones en grupos o
clases, o sea, en una distribucin de frecuencias.

En una distribucin de frecuencias se crean clases y a cada clase se le asocia con una
frecuencia. Es decir, se determina cuntas veces aparecen datos en cada una de las clases. La
distribucin de frecuencias es una tabla de datos estadsticos agrupados en clases que
muestra la frecuencia asociada con cada clase.

DISTRIBUCIN DE FRECUENCIAS Es una tabla que agrupa los datos en clases


o categoras mutuamente excluyentes y en la que se indica la cantidad de observaciones
correspondientes a cada categora.

Las distribuciones de frecuencias pueden ser tiles para clasificar tanto variables cualitativas
como cuantitativas, sean stas discretas o continuas. A continuacin se dan algunos ejemplos:

Distribucin para un atributo (variable cualitativa):

Ventas por producto


para el mes de julio 2004
Producto Ventas (millones )
A 25,6
B 84,2
C 12,8
Total 122.6

Distribucin para una variable discreta:

Nmero de reclamos de clientes


durante Agosto de 2004
Nmero de reclamos Nmero de clientes
1 30
2 26
3 18
4 9
5 4
6 o ms 7
Total 94

Distribucin para una variable continua:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
150

Nivel de ingreso familiar mensual


San Jos, 2004
Ingreso familiar mensual Nmero de familias
Menos de 150.000 20
De 150.000 a 300.000 100
De 300.000 a 450.000 85
Ms de 450.000 80
Total 285

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen este tema.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Construccin de distribuciones de frecuencias


Para ilustrar el proceso de la construccin de una distribucin de frecuencias se emplear el
siguiente ejemplo: Se tienen los siguientes datos que corresponden a la edad de 30 personas:

19 25 32 40 21 28 56 27 31 29
41 36 32 18 50 48 25 33 35 26
28 24 22 27 35 26 43 34 43 39

Determinacin del rango o amplitud total: Esto consiste en encontrar la diferencia entre
el dato ms alto y el ms bajo. En este caso:

Dato mayor: 56
Dato menor: 18
Rango = dato mayor menos dato menor = 56 18 = 38

Seleccin del intervalo de clase (c): No es prctico que la distribucin de frecuencias tenga
muchas clases, pero tampoco demasiado pocas. Generalmente se recomienda entre un mnimo
de 5 clases y un mximo de 15. Entonces se divide el rango entre 6 y entre 15:

38 5 = 7,6 38 15 = 2,53

Esto quiere decir que cualquier nmero entero entre 2,53 y 7,6 puede escogerse como
intervalo de clase. Generalmente se prefieren los nmero impares, por ejemplo c = 5.

Tambin, para determinar cuntas clases crear, se puede utilizar la siguiente frmula (frmula
de Sturges):

Nmero de clases = 1 + 3,322 log n

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
151

donde n es el nmero total de datos. Si al aplicar la frmula se obtiene un nmero decimal, se


aproxima al siguiente entero.

Determinacin de los lmites de clase: Los lmites de clase deben elegirse de modo que el
valor medio coincida, hasta donde sea posible, con los valores en cuyo derredor tiendan a
concentrarse los datos. Cabe sealar que se establece la diferencia entre lmites reales y
lmites indicados. Los lmites reales sern los que se emplearn en el clculo de los puntos
medios y los dems clculos posteriores. Ejemplo:

Lmites reales Lmites indicados


17,5 22,5 18 22
22,5 27,5 23 27
27,5 32,5 28 32
32,5 37,5 33 37
37,5 42,5 38 42
42,5 47,5 43 47
47,5 52,5 48 52
52,5 57,5 53 57

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos):
de
revisin 12, 16, 8, 22, 14, 12, 13, 19, 17, 10,
21, 25, 23, 18, 14, 9, 14, 16, 10, 12,
15, 16, 16, 17, 12, 11, 11, 19, 20, 15

Determine cules seran los lmites reales si se desea construir la tabla de


la distribucin de frecuencias empleando 6 clases.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Tabulacin de los datos: Esto consiste en distribuir los datos entre las clases seleccionadas.
Generalmente se redondea a la unidad inmediata superior si el primer decimal del dato es 5 o
ms.

Lmites reales Recuento Frecuencias


17,5 22,5 IIII 4
22,5 27,5 IIIII 5
27,5 32,5 IIIIIIII 8
32,5 37,5 IIIII 5
37,5 42,5 III 3
42,5 47,5 II 2
47,5 52,5 II 2
52,5 57,5 I 1
Total 30

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
152

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos):
de
revisin 12, 16, 8, 22, 14, 12, 13, 19, 17, 10,
21, 25, 23, 18, 14, 9, 14, 16, 10, 12,
15, 16, 16, 17, 12, 11, 11, 19, 20, 15

Si los siguientes son los lmites reales, determine las frecuencias absolutas
de cada clase:

Lmites reales Frecuencia absoluta


7,5 - 10,5
10,5 - 13,5
13,5 - 16,5
16,5 - 19,5
19,5 - 22,5
22,5 - 25,5
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Clculo de los puntos medios: El punto medio es el valor central de la clase. Se obtiene
como el promedio entre el lmite superior y el lmite inferior de cada clase. Se denotarn
como x i .

Lmites indicados Lmites reales Puntos medios x i Frecuencias f i


18 22 17,5 22,5 20 4
23 27 22,5 27,5 25 5
28 32 27,5 32,5 30 8
33 37 32,5 37,5 35 5
38 42 37,5 42,5 40 3
43 47 42,5 47,5 45 2
48 52 47,5 52,5 50 2
53 57 52,5 57,5 55 1
30

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine los puntos
de medios de cada clase:
revisin
Lmites reales Puntos medios
7,5 - 10,5
10,5 - 13,5
13,5 - 16,5

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
153

16,5 - 19,5
19,5 - 22,5
22,5 - 25,5

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Clculo de frecuencias relativas simples: Determinan la proporcin o porcentaje del total


de observaciones que se clasifican en cada clase. Se calculan dividiendo la frecuencia
absoluta de cada clase entre el total de observaciones. El total de las frecuencias relativas
siempre debe ser uno.

Frecuencia absoluta Frecuencia relativa


Lmites reales Puntos medios x i
fi fr fi n
17,5 22,5 20 4 0,1333
22,5 27,5 25 5 0,1667
27,5 32,5 30 8 0,2667
32,5 37,5 35 5 0,1667
37,5 42,5 40 3 0,1000
42,5 47,5 45 2 0,0667
47,5 52,5 50 2 0,0667
52,5 57,5 55 1 0,0333
30 1

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias relativas de cada clase:
revisin
Lmites Frecuencia Frecuencia
reales absoluta relativa
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Frecuencias absolutas acumuladas: Se puede dar la acumulacin en dos sentidos: 1.


Menos de que da el nmero de observaciones menores o iguales al lmite real superior de la

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
154

clase correspondiente, y 2. Ms de que da el nmero de observaciones mayores o iguales al


lmite inferior de la clase correspondiente.

Frecuencia Frecuencia Frecuencia


Puntos medios Frecuencia absoluta absoluta
Lmites reales relativa
xi absoluta f i
fr fi n acumulada acumulada
menos de ms de
17,5 22,5 20 4 0,1333 4 30
22,5 27,5 25 5 0,1667 9 26
27,5 32,5 30 8 0,2667 17 21
32,5 37,5 35 5 0,1667 22 13
37,5 42,5 40 3 0,1000 25 8
42,5 47,5 45 2 0,0667 27 5
47,5 52,5 50 2 0,0667 29 3
52,5 57,5 55 1 0,0333 30 1
30 1

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias absolutas acumuladas a menos de y a ms de de cada clase:
revisin
Lmites Frecuencia Frecuencia acumulada
reales absoluta a menos de a ms de
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Frecuencias relativas acumuladas: Se puede dar la acumulacin en dos sentidos: 1.


Menos de que da la proporcin de observaciones menores o iguales al lmite real superior
de la clase correspondiente, y 2. Ms de que da la proporcin de observaciones mayores o
iguales al lmite inferior de la clase correspondiente.

Frecuen Frecuen Frecuencia Frecuencia Frecuencia Frecuencia


Puntos
cia cia absoluta absoluta relativa relativa
Lmites reales medios
absoluta relativa acumulada acumulada acumulada acumulada
xi fr fi n
fi menos de ms de menos de ms de
17,5 22,5 20 4 0,1333 4 30 0,1333 1,0000
22,5 27,5 25 5 0,1667 9 26 0,3000 0,8667
27,5 32,5 30 8 0,2667 17 21 0,5667 0,7000
32,5 37,5 35 5 0,1667 22 13 0,7333 0,4333

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
155

37,5 42,5 40 3 0,1000 25 8 0,8333 0,2667


42,5 47,5 45 2 0,0667 27 5 0,9000 0,1667
47,5 52,5 50 2 0,0667 29 3 0,9667 0,1000
52,5 57,5 55 1 0,0333 30 1 1,0000 0,0333
30 1

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), determine las
de frecuencias relativa acumuladas a menos de y a ms de de cada clase:
revisin
Lmites Frecuencia Frecuencia acumulada
reales relativa a menos de a ms de
7,5 - 10,5 13,33%
10,5 - 13,5 23,33%
13,5 - 16,5 30,00%
16,5 - 19,5 16,67%
19,5 - 22,5 10,00%
22,5 - 25,5 6,67%
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Grficos de las distribuciones de frecuencias:


Para mostrar grficamente una distribucin de frecuencias se emplean diversos tipos de
grficos, tales como los histogramas, polgonos de frecuencias y ojivas.

Un histograma es un grfico que se forma construyendo rectngulos sobre cada uno de los
lmites reales de cada intervalo, cuya altura equivale a la frecuencia absoluta o relativa de
cada clase. En el histograma el valor de la variable aparece en el eje horizontal y la frecuencia
absoluta o relativa en el eje vertical. El histograma se emplea para presentar los datos cuando
estos corresponden a los valores de una variable cuantitativa continua, no una variable
discreta ni cualitativa. Es por eso que, para sealar la continuidad de la variable, no se dejan
espacios entre las barras.

El siguiente es un ejemplo de un histograma:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
156

Uso de Excel y Minitab para construir histogramas

Ejemplo Se tiene la edad de 30 personas en la tabla siguiente:

19 25 32 40 21 28 56 27 31 29
41 36 32 18 50 48 25 33 35 26
28 24 22 27 35 26 43 34 43 39

Utilice Excel y Minitab para construir un histograma que represente dichos


datos.

Solucin En Excel, primero se introducen los datos en una columna (o una fila). En
este caso se introducen los datos en el rango de celdas A1 hasta A30.

En otro rango de celdas se introducen los lmites de las clases. Solo es


necesario indicar los lmites superiores de las clases, que en este caso
seran 22.5, 27.5, 32.5, 37.5, 42.5, 47.5, 52.5 y 57.5. Estos lmites se
introducirn en este caso en las celdas de B1 hasta B8.

Luego se da clic en la pestaa Datos, y se selecciona Anlisis de datos. Si


no aparece el botn de Anlisis de datos, se puede instalar dando clic al
botn de Office (en la esquina superior izquierda del programa), y en el
men se da clic en Opciones de Excel. Ah se elige en el men de la
izquierda se da clic en Complementos, y en los complementos de
aplicaciones inactivas se elige Herramientas para anlisis. Despus se da
clic en el botn Ir que se haya en la parte inferior del cuadro de dilogo, y
en la lista de complementos disponibles se marca Herramientas para
anlisis y despus se presiona Aceptar).

Ahora al dar clic en el botn de Anlisis de datos, en la lista se elige


Histograma y se completa el cuadro de dilogo siguiente:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
157

En rango de entrada se indican los datos de la serie a graficar, que en este


caso estn en las celdas de A1 hasta A30. En rango de clases se indican los
lmites, los cuales estn en las celdas de B1 hasta B8. Luego hay que
marcar la opcin Crear grfico, y se da clic en Aceptar. Excel genera una
tabla y un grfico como el siguiente:

En Minitab, primero se introducen los datos en la hoja de trabajo. Luego


se da clic en el men Grfica y se elige Histograma. En el cuadro de
dilogo se selecciona la opcin Simple. Despus, en el cuadro se
selecciona como variables de grficas la columna C1 y se da clic en
Aceptar:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
158

Histograma de C1

Frecuencia
4

0
20 25 30 35 40 45 50 55
C1

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), construya un
de histograma para esta variable:
revisin
Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Un polgono de frecuencias es una lnea que conecta los puntos medios de todas y cada una
de las barras de un histograma. En el polgono de frecuencias el valor de la variable aparece
en el eje horizontal y la frecuencia absoluta o relativa en el eje vertical. El siguiente es un
ejemplo de un polgono de frecuencias:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
159

Tambin es posible construir los diagramas de las frecuencias acumuladas, tambin llamadas
ojivas, tanto a ms de como a menos de:

Frecuncia
absoluta Ojivas
acumulada
30
Ojiva a menos de
27
24
21
18
15
12
9
6
3
0
Ojiva a ms de
17,5 22,5 27,5 32,5 37,5 42,5 47,5 52,5 57,5 X

Clculo de medidas de posicin y variabilidad en distribuciones de


frecuencias
La moda:
En una distribucin de frecuencias con datos agrupados no es posible conocer con exactitud el
valor de la moda, pero si es posible identificar la clase modal, y a partir de ella obtener un
valor aproximado de la moda. Esto quiere decir que no es posible saber con toda precisin el
valor de la moda.

Para hallar la moda se emplea la siguiente frmula, la cual se aplica a la clase modal, es decir,
la clase con la frecuencia absoluta ms alta:

d1
M o Li c
d1 d 2

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
160

donde:
Mo : valor de la moda
Li : lmite inferior real de la clase modal
c: intervalo de la clase modal
d1 : diferencia entre la frecuencia de la clase modal y la pre modal
d2 : diferencia entre la frecuencia de la clase modal y la pos modal

Ejemplo Considere la siguiente distribucin de frecuencias:

Puntos Frecuencia Frecuencia


Lmites Frecuencia relativa
medios relativa
reales absoluta f i acumulada
xi fr fi n
menos de
17,5 22,5 20 4 13,33% 13,33%
22,5 27,5 25 5 16,67% 30,00%
27,5 32,5 30 8 26,67% 56,67%
32,5 37,5 35 5 16,67% 73,33%
37,5 42,5 40 3 10,00% 83,33%
42,5 47,5 45 2 6,67% 90,00%
47,5 52,5 50 2 6,67% 96,67%
52,5 57,5 55 1 3,33% 100,00%
Total 30 100,00%

Calcule la moda.

Solucin La clase modal es la tercer clase, cuyos lmites reales son 27,5 32,5, su
lmite inferior real es 27,5, su intervalo de clase es 5 (lmite superior
menos lmite inferior = 32,5 27,5 = 5) y su frecuencia absoluta es 8. La
clase pre modal (22,5 27,5) tiene frecuencia 5 (por tanto d1 = 8 5 = 3) y
la pos modal (32,5 37,5) tiene frecuencia tambin de 5 (por tanto d2 = 8
5 = 3). El clculo es:

d1 (8 5)
M o Li c 27.5 5 30
d1 d 2 (8 5) (8 5)

La moda es 30.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
161

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la moda:
de
revisin Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen el clculo de las .

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

La mediana:
Tampoco es posible conocer el valor de la mediana con toda precisin en el caso de
distribuciones de frecuencias con datos agrupados, pero si es posible identificar la clase
mediana (clase donde est la mediana), como aquella cuya frecuencia acumulada menos de
es apenas mayor a n/2. El clculo de la mediana implica el uso de la siguiente frmula:

n Fi 1
Med Li c 2
fi

donde:
Med : valor de la mediana
Li : lmite inferior real de la clase mediana
c: intervalo de la clase mediana
n: nmero total de datos en la distribucin de frecuencias
Fi1 : frecuencia acumulada menos de de la clase pre mediana
fi : frecuencia absoluta de la clase mediana

Ejemplo Considere la siguiente distribucin de frecuencias:

Lmites Puntos Frecuencia Frecuencia Frecuencia

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
162

reales medios absoluta fi relativa relativa


xi fr fi n acumulada
menos de
17,5 22,5 20 4 13,33% 13,33%
22,5 27,5 25 5 16,67% 30,00%
27,5 32,5 30 8 26,67% 56,67%
32,5 37,5 35 5 16,67% 73,33%
37,5 42,5 40 3 10,00% 83,33%
42,5 47,5 45 2 6,67% 90,00%
47,5 52,5 50 2 6,67% 96,67%
52,5 57,5 55 1 3,33% 100,00%
Total 30 100,00%

Calcule la mediana.

Solucin Se tiene que n = 30, por tanto n/2 = 30/2 = 15, lo que quiere decir que la
clase mediana ser la tercer clase, ya que su frecuencia acumulada menos
de es 17, que es la que apenas supera a 15. El lmite inferior de la clase es
27,5, el intervalo de la clase es 5, la frecuencia acumulada de la clase pre
mediana es 9 y la frecuencia de la clase mediana es 8. Aplicando la
frmula:

n Fi 1 30 9
Med Li c 2 27,5 5 2 27,5 5 6 31,25
fi 8 8

La mediana es 31,25.

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la mediana:
de
revisin Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

La media aritmtica:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
163

Para calcular la media aritmtica se emplean los puntos medios de cada clase y sus
frecuencias absolutas, como sigue:

x i fi
x i 1

Ejemplo Considere la siguiente distribucin de frecuencias:

Puntos Frecuencia Frecuencia


Lmites Frecuencia relativa
medios relativa
reales absoluta f i acumulada
xi fr fi n
menos de
17,5 22,5 20 4 13,33% 13,33%
22,5 27,5 25 5 16,67% 30,00%
27,5 32,5 30 8 26,67% 56,67%
32,5 37,5 35 5 16,67% 73,33%
37,5 42,5 40 3 10,00% 83,33%
42,5 47,5 45 2 6,67% 90,00%
47,5 52,5 50 2 6,67% 96,67%
52,5 57,5 55 1 3,33% 100,00%
Total 30 100,00%

Calcule la media aritmtica.

Solucin Para el clculo es til el empleo de una tabla auxiliar:

Puntos medios xi Frecuencia absoluta fi xifi


20 4 80
25 5 125
30 8 240
35 5 175
40 3 120
45 2 90
50 2 100
55 1 55
Total 30 985

Aplicando la frmula:
k

x i fi
985
x i 1
32,83
n 30

La media es 32,83.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
164

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la media:
de
revisin Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Aplicacin ndice Dow Jones


Posiblemente en alguna oportunidad usted habr escuchado noticias sobre
el mundo de los negocios que se relacionen con la Bolsa de Valores de
Nueva York y entonces habr escuchado hablar sobre el Dow Jones, el
cual es el indicador burstil ms conocido en el planeta.

El ndice Promedio Industrial Dow Jones (DJIA, por sus siglas en ingls)
es un promedio ponderado que se calcula a partir de los precios de las
acciones de las 30 mayores empresas transadas en la Bolsa de Valores de
Nueva York. En el ndice se incluyen acciones de empresas como General
Electric, Exxon Mobil, DuPont, 3M, Coca Cola, AT&T, Intel, etc.

Originalmente el ndice era un promedio simple, es decir, se calculaba


dividiendo la suma total (en dlares) del valor de las acciones de las
empresas incluidas en el ndice dividido entre el nmero de acciones de las
mismas. Sin embargo, fue necesario realizar algunas modificaciones para
hacerlo ms representativo, y entonces se convirti en un promedio
ponderado, en el cual las empresas ms grandes tienen un peso
relativamente superior.

En la prctica el valor del DJIA no es tan importante como su variacin


relativa. Por ejemplo, el lunes 19 de octubre de 1987 este ndice sufri una
cada de 508 puntos, los cuales representaron una reduccin de 22,6%.
Esta fue una de las cadas ms fuertes que ha sufrido el ndice en toda su
historia, de ah que a ese da se le ha llamado el lunes negro. A inicios de
octubre de 2012 el ndice tena un valor de alrededor de 13.610 puntos, por
lo que una contraccin de 508 puntos habra representado apenas un 3,7%.

Percentiles y cuartilos:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
165

El clculo de los percentiles y los cuartilos es similar al de la mediana. Igual que en el caso de
datos no agrupados, los cuartiles, deciles y quintiles se convierten al percentil equivalente.
Para el clculo se emplea la frmula siguiente:

m
100 n Fi 1
Pm Li c
fi

Ejemplo Considere la siguiente distribucin de frecuencias:

Puntos Frecuencia Frecuencia


Lmites Frecuencia relativa
medios relativa
reales absoluta f i acumulada
xi fr fi n
menos de
17,5 22,5 20 4 13,33% 13,33%
22,5 27,5 25 5 16,67% 30,00%
27,5 32,5 30 8 26,67% 56,67%
32,5 37,5 35 5 16,67% 73,33%
37,5 42,5 40 3 10,00% 83,33%
42,5 47,5 45 2 6,67% 90,00%
47,5 52,5 50 2 6,67% 96,67%
52,5 57,5 55 1 3,33% 100,00%
Total 30 100,00%

Calcule el tercer cuartil.

Solucin El clculo es muy similar al de la mediana. El tercer cuartil equivale al


percentil 75, por lo tanto se puede buscar en la columna de la frecuencia
relativa acumulada a menos de aquel valor que es el primero en exceder
75%. Esto se da en quinta clase, por lo que el lmite inferior de la clase es
37.5, el intervalo de la clase es 5, la frecuencia acumulada de la clase
previa es 22 y la frecuencia de la clase es 3. Aplicando la frmula:

mn Fi 1 75 x30 22
Q3 P75 Li c 100 37,5 5 100
fi 3

0,5
37,5 5 38,33
3

La tercer cuartil es 38,33.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
166

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule el primer cuartil
de y el percentil 70:
revisin
Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Varianza y desviacin estndar:


Para el clculo de la varianza basta modificar las frmulas vistas anteriormente, donde la
primera corresponde a datos de una poblacin y las dos siguientes en el caso de muestras:

(x i )2 fi
2 i 1
N

(x i x )2 fi
s2 i 1
n 1

2
n
xi f i
xi f i i 1
n

n
s 2 i 1
n 1

La desviacin estndar puede seguir calculndose como la raz cuadrada de la varianza.

Ejemplo Considere la siguiente distribucin de frecuencias:

Lmites Puntos Frecuencia Frecuencia


Frecuencia
reales medios relativa relativa

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
167

xi absoluta fi fr fi n acumulada
menos de
17,5 22,5 20 4 13,33% 13,33%
22,5 27,5 25 5 16,67% 30,00%
27,5 32,5 30 8 26,67% 56,67%
32,5 37,5 35 5 16,67% 73,33%
37,5 42,5 40 3 10,00% 83,33%
42,5 47,5 45 2 6,67% 90,00%
47,5 52,5 50 2 6,67% 96,67%
52,5 57,5 55 1 3,33% 100,00%
Total 30 100,00%

Calcule la varianza y la desviacin estndar.

Solucin Se supondr que los datos corresponden a una muestra y se usar la


segunda frmula de las sealadas anteriormente. Tambin es til construir
una tabla auxiliar. La media se calcul anteriormente y es de 32.83.

Puntos Frecuencia
medios x i absoluta f i
( xi x ) ( xi x ) 2 ( xi x ) 2 f i
20 4 12,83 164,69 658,78
25 5 7,83 61,36 306,81
30 8 2,83 8,03 64,22
35 5 2,17 4,69 23,47
40 3 7,17 51,36 154,08
45 2 12,17 148,03 296,06
50 2 17,17 294,69 589,39
55 1 22,17 491,36 491,36
30 Total 2584,17

Aplicando la frmula:

(x i x )2 fi
2584,17
s2 i 1
89,11
n 1 30 1

La varianza es de 89,11. Para calcular la desviacin estndar se saca la raz


cuadrada al resultado anterior:

s s 2 89,11 9,44

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
168

Ejercicio Suponga que se tienen los siguientes datos relacionados con el tiempo de
espera de los usuarios de un servicio (en minutos), calcule la varianza y la
de desviacin estndar:
revisin
Lmites reales Frecuencia absoluta
7,5 - 10,5 4
10,5 - 13,5 7
13,5 - 16,5 9
16,5 - 19,5 5
19,5 - 22,5 3
22,5 - 25,5 2
Total 30

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
169

Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se le presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

1. Un mdico ha reunido los siguientes datos sobre la estancia hospitalaria en horas de una
muestra de 40 neonatos en la unidad de cuidados intensivos de un hospital:

150 70 95 120 120 72 240 84 300 48


100 120 75 86 90 120 220 180 165 36
48 72 240 270 128 80 110 270 250 112
160 170 120 80 50 60 78 90 48 75

Con base en estos datos, construya una tabla de distribucin de frecuencias (con 8 clases) y
elabore el histograma para las frecuencias relativas.

2. En los datos recopilados por la enfermera encontr los datos de los siguientes tiempos de
espera de los pacientes, en minutos. Los siguientes son algunos de los datos.

15 8 12 20 28 45 43 19 9 5 32 33 36 52 47
34 28 27 10 12 8 15 16 18 19 24 27 28 26 23
38 40 42 44 46 48 40 38 37 37 32 22 26 31 34
32 37 33 35 36 34 31 39 29 51 48 21 38

Con base en esos datos, construya una tabla de una distribucin de frecuencias de 7 clases.
Indique el rango, el intervalo de clase, los lmites de clase reales, frecuencia absoluta,
frecuencia relativa, frecuencia absoluta acumulada menos de y frecuencia relativa acumulada
menos de.

3. En una muestra de 12 personas con miopa elevada superior a 12,00 D se midieron algunos
parmetros biomtricos de sus ojos, como la longitud axial. Los resultados fueron los
siguientes:

25 28 26 30 28 27 25 29 31 30 31 33 29 31 29 32 29

Construya el histograma para esta variable (utilice 6 clases) e indique si la distribucin de esta
variable es simtrica o asimtrica.

4. Los siguientes son los tiempos de funcionamiento, en horas, de un tipo de componente


electrnico: 100, 110, 80, 95, 97, 82, 113, 128, 116, 98, 99, 105, 117, 114, 121, 104, 118, 109,
110, 80, 95, 97, 82, 113, 128, 116, 98, 99, 105, 127, 114, 121, 104, 118, 122, 121, 86, 92, 96,
101. Construya el histograma para las frecuencias absolutas (utilice 5 clases).

5. Un ingeniero ha recopilado datos sobre la vida til de una muestra de filtros de gasolina del
mismo tipo y marca. Los datos son los siguientes (en miles de kilmetros): 12, 14, 16, 15, 10,
20, 13, 15, 16, 14, 12, 13, 13, 15, 16, 13, 14, 14, 12, 8, 10, 16, 14, 12, 13, 11, 13, 9, 19, 22.
Construya la tabla de la distribucin de frecuencias.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
170

6. La presencia de manganeso en la gasolina puede significar un problema, pues genera


ciertos daos a los vehculos, a la salud de las personas y al ambiente. Ante la duda de altas
concentraciones de esta sustancia en la gasolina vendida en el pas se toman muestras en los
distintos planteles de la compaa refinadora de petrleo para que vaya a ser estudiadas en un
laboratorio. Los siguientes son datos recopilados para un plantel de la refinadora durante el
mes de octubre anterior (concentracin de manganeso en mg/L de gasolina):

18 25 20 17 24 12 16 12 18 8
12 13 16 21 19 14 13 22 17 10
24 25 20 19 22 19 16 17 17 10
21 23 26 29 17 14 30 20 18 23

Con base en los datos anteriores:


a. Construya la tabla de la distribucin de frecuencias (utilice 8 clases).
b. Calcule e interprete la media, la mediana y la moda.
c. Construya el histograma para las frecuencias absolutas.
d. Tomando como base el clculo de la media, mediana y moda, indique la forma de la
distribucin de las concentraciones de manganeso (simtrica o asimtrica positiva o
negativa). Es consistente ese resultado con lo que se observa en la grfica?
e. Si se considera como aceptable que la gasolina contenga a lo sumo 18 mg/L de
manganeso, qu puede usted concluir en este caso?

7. Despus de examinar los registros de facturacin mensual de una compaa de ventas por
internet, un auditor toma una muestra de 30 cuentas por cobrar, obteniendo las siguientes
cantidades que distintos clientes deben a la empresa (en miles de dlares):

9 10 10 10 11 11 11 12 14 15
15 17 17 18 18 19 19 19 19 21
25 26 26 32 33 34 34 37 38 40

a. Qu monto mximo adeuda el 40% de las cuentas por cobrar observadas?


b. Qu monto mnimo correspondi al 15% de las cuentas por cobrar con mayores
montos?

8. Un contador est realizando una auditora de los cheques extendidos por una compaa. En
una muestra de 20 cheques se obtuvieron los siguientes montos, en miles dlares:

15, 17, 22, 8, 4, 2, 16, 6, 8, 14, 15, 25, 20, 5, 6, 8, 12, 19, 11, 12

a. Construya la tabla de la distribucin de frecuencias de los montos de los cheques


extendidos por la compaa.
b. Construya el histograma para las frecuencias relativas de los montos de los cheques
extendidos por la compaa.
c. Use la Calcula la media, mediana y moda de los montos de los cheques.

9. Los siguientes datos corresponden a la demanda, en unidades al mes, que los consumidores
de un producto estaran dispuestos a comprar a un determinado precio: 5, 8, 12, 14, 21, 18, 6,
14, 15, 24, 32, 17, 15, 4, 5, 9, 7, 28, 26, 22, 20, 17, 15, 14, 13, 11, 8, 9, 16, 10, 11, 12, 16, 15,
17, 12, 13, 14, 18, 15, 12, 11, 16.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
171

a. Construya la tabla de la distribucin de frecuencias con 5 clases.


b. Construya la tabla de la distribucin de frecuencias con 10 clases.
c. Construya el histograma para cada una de las tablas de los incisos anteriores.
Comente las diferencias.

10. Dado el siguiente conjunto de datos sobre el nmero de turistas que se hospedan en un
hotel por semana en una muestra de 22 semanas seleccionadas al azar:

25 81 92 44 58 62 34 40 90 57 42
40 57 57 57 57 62 40 65 58 50 18

Construya la tabla de la distribucin de frecuencias (con 6 clases) y a partir de ella calcule e


intrprete cada una de las siguientes medidas descriptivas: coeficiente de variacin y
desviacin cuartil.

11. Los siguientes datos corresponden a una muestra de personas que aplicaron un test para
medir su cociente intelectual: 102, 98, 95, 100, 99, 112, 125, 85, 83, 100, 98, 129, 78, 100,
116, 101, 102, 101, 96, 100, 103, 97, 100, 97, 98, 99, 103, 102, 95, 101, 98, 100, 98, 99, 101,
102, 99, 103, 101. Construya la tabla de la distribucin de frecuencias y con base en ella
calcule los percentiles 20, 40, 60, 80 y 90.

12. Una trabajadora social est preocupada por el consumo de drogas ilegales entre los
estudiantes de secundaria de una comunidad marginal del pas llamada ciudadela Los Robles.
Una muestra de 18 estudiantes varones del liceo local report las siguientes cifras como la
edad en que se inici el consumo de drogas ilegales:

14 17 16 13 15 16 13 14 15
12 16 18 15 14 11 13 15 8
12 15 16 15 19 9 10 11 10

Con base en los datos anteriores, construya la tabla de la distribucin de frecuencias (usando 5
clases) y a partir de ella calcule e intrprete cada una de las siguientes medidas descriptivas:
a. Moda
b. Mediana
c. Media aritmtica
d. Cuartil 3
e. Percentil 85
f. Desviacin estndar

13. Con relacin a los datos suministrados a cerca de la siguiente distribucin de frecuencias,
complete la tabla.

75, 85, 96, 62, 46, 80, 81, 80, 82, 63, 28, 65, 72, 35, 40, 43, 52, 40, 49, 53, 52, 40, 42, 42, 65, 58,
60, 49, 50, 41, 42, 42, 42, 42, 48, 49, 44, 45, 56, 43, 80, 81, 80, 82, 63, 28, 65, 72, 35, 40, 43, 52,
40, 49, 53, 52, 40, 42, 42, 65, 58, 60, 49, 50, 41, 42, 42, 42, 42

Frec. Frec.
Frecuencia Frecuencia
Lmites Puntos Frecuencia Frecuencia Relativa Relativa
abs. acum. abs. acum.
reales medios absoluta relativa acum. a acum. a
a menos de a ms de
menos de ms de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
172

Total

14. Con relacin a la tabla realice lo siguiente:

Lmites reales Frecuencia absoluta


28.530.5 16
30.532.5 68
32.534.5 33
34.536.5 12
36.538.5 8
38.540.5 5
40.542.5 1

a. Calcule: moda, percentil 90, tercer cuartil, coeficiente de variacin.


b. Construya las ojivas a menos de y a ms de.
c. Suponga que los datos mostrados en la tabla corresponden a una muestra de las
cantidades en mililitros de un producto que una empresa envasa.
Qu puede concluirse sobre la simetra de la distribucin al observar la relacin entre
moda, mediana y media y qu importancia tiene eso?
Si se define la distancia intercuartlica como la diferencia entre el tercer cuartil y el
primer cuartil, calcule la diferencia o distancia intercuartlica, e indique si sera mejor
que fuera menor o que fuera mayor. Explique.
Si la etiqueta del producto dice que el envase debe contener 40 ml y la empresa
tolera como aceptable una diferencia de 2 ml hacia arriba o hacia abajo, qu
puede decirse del grado de cumplimiento de esta especificacin?

15. Con relacin a la tabla realice lo siguiente:

Lmites reales Frecuencia absoluta


28.530.5 6
30.532.5 48
32.534.5 33
34.536.5 16
36.538.5 8
38.540.5 5
40.542.5 1

a. Calcule: moda, mediana, percentil 70, tercer cuartil, coeficiente de variacin.


b. Construya el histograma.
c. Suponga que los datos mostrados en la tabla corresponden a una muestra de los pesos en
gramos de un producto que una empresa envasa.
Qu puede concluirse al observar la relacin entre moda, mediana y media?
Interprete el tercer cuartil.
Con respecto al coeficiente de variacin, sera mejor que fuera menor o que fuera
mayor? Explique.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
173

Si la etiqueta del producto dice que el envase debe contener 40 gramos y la empresa
tolera como aceptable una diferencia de 2 gramos hacia arriba o hacia abajo, qu
puede decirse del grado de cumplimiento de esta especificacin?

16. Con relacin a los datos suministrados a cerca de la siguiente distribucin de frecuencias, complete
la tabla.

Frec. Frec.
Frecuencia Frecuencia
Lmites Puntos Frecuencia Frecuencia Relativa Relativa
abs. acum. abs. acum.
reales medios absoluta relativa acum. a acum. a
a menos de a ms de
menos de ms de
? ? ? ? ? ? ? ?
? ? ? ? ? ? ? 0.9
? ? ? 0.45 ? ? 0.7 ?
? ? ? ? ? ? ? ?
? 85 ? ? ? 4 ? 0.05
Total ?

Adems se sabe que todas las clases tienen el mismo intervalo de clase, que es de 9.

17. Con relacin a los datos suministrados a cerca de la siguiente distribucin de frecuencias,
complete la tabla.

Frec. Frec.
Frecuencia Frecuencia
Lmites Puntos Frecuencia Frecuencia Relativa Relativa
abs. acum. abs. acum.
reales medios absoluta relativa acum. a acum. a
a menos de a ms de
menos de ms de
? ? ? ? ? ? ? ?
? ? ? ? ? ? ? 0.92
? ? ? 0.4 ? ? 0.7 ?
? ? ? ? ? ? ? ?
? 25 ? ? ? 4 ? 0.04
Total ?

Adems se sabe que todas las clases tienen el mismo intervalo de clase, que es de 7.

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta. (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. Considere el siguiente grfico:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
174

Con respecto a esta grfica es falso con toda certeza que:


( a ) La variable X es cuantitativa continua
( b ) La grfica es un polgono de frecuencias
( c ) Los datos corresponden a una poblacin
( d ) La grfica corresponde a un histograma

2. Con relacin a la grfica de la pregunta 1, es verdadero que:


( a ) El intervalo de clase es 12,5
( b ) El valor de n es 32
( c ) El punto medio de la segunda clase es 24
( d ) El lmite superior de la cuarta clase es 38

3. Con relacin a la grfica de la pregunta 1, es verdadero que:


( a ) La frecuencia relativa acumulada de la cuarta clase es 0,78125
( b ) La frecuencia relativa de la sexta clase es 2/30 pues hasta ah se acumulan 30 datos
( c ) El punto medio de la segunda clase es 24
( d ) La frecuencia absoluta acumulada de la tercera clase es 8

4. Suponga que la variable X de la grfica de la pregunta 1 corresponde al tiempo, en


segundos, entre la llegada de dos autos consecutivos a un peaje en una autopista durante
periodo aleatoriamente seleccionado. Con respecto a esta afirmacin es falso con toda certeza
que:
( a ) Los datos no son confiables pues la muestra es muy pequea
( b ) El 56,25% de los tiempos entre la llegada de dos autos es de 33,5 segundos
( c ) La mayora de los tiempos registrados se da entre 26,5 y 33,5 segundos
( d ) Los tiempos de llegada entre dos autos sucesivos nunca son mayores a 54,5 segundos

5. Considere el grfico de la pregunta 1, la media aritmtica es:


( a ) 33,5 ( b ) 31,97
( c ) 1023 ( d ) Ninguna de las anteriores

6. Considere el grfico de la pregunta 1, la mediana es:


( a ) 26,5 ( b ) 28,83
( c ) 31,75 ( d ) Ninguna de las anteriores

7. Considere el grfico de la pregunta 1, la moda es, redondeando a dos decimales:


( a ) 31,17 ( b ) 30
( c ) 26,5 ( d ) Ninguna de las anteriores

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
175

8. Considere el grfico de la pregunta 1, el primer cuartil es, redondeando a dos decimales:


( a ) 24,17 ( b ) 22,30
( c ) 31,75 ( d ) Ninguna de las anteriores

9. Considere el grfico de la pregunta 1, el percentil 95 es:


( a ) 48,9 ( b ) 30,4
( c ) 47,59 ( d ) Ninguna de las anteriores

10. Considere las dos siguientes afirmaciones:


A. Si quisiramos unir los puntos medios de barras consecutivas en un histograma de
frecuencia con una serie de lneas, estaramos graficando un polgono de frecuencias.
B. Por lo regular, los estadsticos consideran que una distribucin de frecuencia es
incompleta si tiene menos de 20 clases.

Con respecto a las dos afirmaciones anteriores, es correcto que:


( a ) Ambas son verdaderas ( b ) Solo A es verdadera
( c ) Solo B es verdadera ( d ) Ambas son falsas

11. El gerente de un centro de llamadas desea evaluar el desempeo de los agentes de servicio
y para ello decide basarse en los tiempos de espera de los clientes para ser atendidos (medido
en segundos) y el grado de satisfaccin que los clientes manifiesten al recibir el servicio
(valorado como bueno, regular o malo). La semana anterior tom una muestra de 12 llamadas
por da de lunes a mircoles y 20 llamadas el jueves y el viernes.

La siguiente tabla corresponde a las frecuencias de los Lmites reales Frecuencia


tiempos de espera de los clientes para la muestra de 10,5 14,5 2
llamadas atendidas durante el da jueves.
14,5 18,5 4
Las preguntas de la 11 a la 22 se basan en esta tabla. 18,5 22,5 8
22,5 26,5 5
El punto medio de la tercera clase es: 26,5 30,5 1
( a ) 20,5 ( b ) 19 a 22
( c ) 20 ( d ) Ninguna de las anteriores

12. La frecuencia porcentual de la cuarta clase es:


( a ) 25% ( b ) 30%
( c ) 95% ( d ) 5%

13. La frecuencia absoluta acumulada a menos de de la segunda clase es:


(a)4 (b)6
( c ) 18 ( d ) 30%

14. La frecuencia relativa acumulada a ms de de la tercera clase es:


( a ) 14 ( b ) 40%
( c ) 0,70 ( d ) Ninguna de las anteriores

15. La frecuencia absoluta acumulada a menos de correspondiente a la tercera clase significa


que:
( a ) 14 clientes esperaron 18,5 segundos o ms
( b ) 14 clientes esperaron 18,5 segundos o menos

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
176

( c ) 14 clientes esperaron 14,5 segundos o ms


( d ) Ninguna de las anteriores

16. La grfica apropiada para representar las frecuencias absolutas relacionadas con sus
puntos medios se llama:
( a ) Grfico de barras horizontales ( b ) Polgono de frecuencias
( c ) Ojiva a menos de ( d ) Diagrama de frecuencias acumuladas

17. El tiempo medio de espera de los clientes de la muestra del da jueves es, en segundos:
( a ) 20,5 ( b ) 20,3
( c ) 18,5 ( d ) Ninguna de las anteriores

18. La mediana del tiempo de espera de la muestra del da jueves es, en segundos:
( a ) 20,5 ( b ) 20,3
( c ) 18,5 ( d ) Ninguna de las anteriores

19. La desviacin estndar del tiempo de espera de la muestra del da jueves es, en segundos:
( a ) 4,2 ( b ) 17,64
( c ) 1,21 ( d ) Ninguna de las anteriores

20. El primer cuartil del tiempo de espera de la muestra del da jueves es, en segundos:
( a ) 17,5 ( b ) 16,5
( c ) 21,5 ( d ) Ninguna de las anteriores

21. El percentil 78 del tiempo de espera de la muestra del da jueves es, en segundos:
( a ) 23,78 ( b ) 19,78
( c ) 22,88 ( d ) Ninguna de las anteriores

22. Con respecto al tercer cuartil para los tiempos de espera del da jueves es verdadero que:
( a ) Un 25% de los clientes de ese da esperaron 23,3 segundos o menos
( b ) Un 75% de los clientes de ese da esperaron 23,3 segundos o menos
( c ) Un 25% de los clientes de ese da esperaron 22,5 segundos o menos
( d ) Un 75% de los clientes de ese da esperaron 22,5 segundos o menos

Respuestas a los ejercicios de seleccin mltiple:


1. b 2. b 3. a 4. b 5. b
6. c 7. a 8. a 9. a 10. b
11. a 12. a 13. b 14. c 15. c
16. b 17. b 18. a 19. a 20. a
21. a 22. b

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
177

5 .

Introduccin a las probabilidad


OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Reconocer la importancia y uso del concepto de probabilidad
2. Aplicar conceptos bsicos de conteo
3. Calcular probabilidades empleando la definicin clsica de probabilidad
4. Aplicar los principales teoremas y axiomas de probabilidad

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
178

Probabilidad
La probabilidad es un tema de todos los das. Cada vez que se habla del clima, por ejemplo si
va a llover o no en un da determinado, o bien, la posibilidad de sufrir un accidente, est
implcito el concepto de probabilidad. En general, se habla de probabilidad en cualquier
situacin en la que no haya certeza del resultado.

PROBABILIDAD Una probabilidad es un valor numrico de la incertidumbre de que


un suceso especfico pueda ocurrir.

Las probabilidades se pueden obtener como resultado de experimentos realizados


aleatoriamente, como en los juegos de azar, en donde todos los elementos tienen la misma
posibilidad de ser seleccionados. Por ejemplo, al lanzar un dado, cada uno de los nmeros
tiene la misma posibilidad de salir. Ahora bien, las probabilidades tambin se pueden obtener
en forma emprica, o sea, de la observacin de la frecuencia relativa con la que ocurre un
fenmeno en particular. Por ejemplo, al tratar de determinar la probabilidad de que ocurra un
accidente de aviacin se puede observar la frecuencia relativa con la que este evento se
presenta.

Cuando se habla de probabilidad se menciona el concepto de evento o suceso. Los eventos


son los resultados de experimentos aleatorios. Por ejemplo, cuando se lanza un dado, un
evento es que salga el 4, o bien, en el caso de la fabricacin de un artculo el hecho de que
ste tenga un defecto menor puede ser un evento, los otros eventos posibles son que tenga un
defecto mayor, que est en perfecta condicin, etc.

EVENTO Es un posible resultado de un experimento aleatorio.

Los eventos pueden ser simples o compuestos. Un evento simple es aquel que no se puede
descomponer en otros eventos, mientras que el evento compuesto s se puede descomponer en
otros eventos. En el caso del lanzamiento de un dado, un evento simple es que al tirar el dado
salga un cuatro. Un evento compuesto es que al tirar el dado, salga un nmero par. Este es un
evento compuesto porque se compone de los eventos dos, cuatro y seis.

Por otro lado, el espacio muestral de un experimento aleatorio es el conjunto de todos los
posibles eventos que pueden ocurrir. Por ejemplo en el lanzamiento de un dado el espacio
muestral est dado por los eventos 1, 2, 3, 4, 5, 6.

ESPACIO MUESTRAL Conjunto de todos los eventos simples posibles de un


experimento aleatorio.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
179

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen los conceptos y
teoremas de probabilidad.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Conteo
Muchas veces para calcular probabilidades es necesario enumerar sucesos y sus respectivas
posibilidades, para lo cual es necesario aplicar principios de anlisis combinatorio. Por lo
tanto se repasan tres conceptos bsicos:

Principio de multiplicacin de conteo


Si una actividad requiere una primera eleccin que se puede hacer de n1 formas distintas, una
segunda eleccin que se puede hacer de n2 formas diferentes, hasta una ksima eleccin que
se puede hacer de nk formas distintas, entonces la actividad puede ser realizada de n1 n2
nk formas diferentes.

Ejemplo Si usted invita a 8 personas a comer y hay una mesa con 8 sillas, de
cuntas formas distintas pueden sentarse a la mesa?

Solucin La primer persona que se sienta dispone de 8 posibilidades, la segunda de


slo 7 (ya que la primera ya se sent), la tercera tiene 6 posibilidades, la
cuarta 5 y as sucesivamente. Por tanto se pueden sentar de:

8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 40320 formas distintas

Ejercicio 1. Un restaurante ofrece las siguientes opciones para almorzar:


de Tres tipos de plato fuerte: pollo, res, chuleta
revisin Dos tipos de refrescos: frutas, cola
Dos tipos de postre: flan, helado

Cuntas rdenes distintas pueden efectuarse?

2. Si una contrasea para retirar dinero de un cajero automtico se


compone de 4 dgitos. Cuntas contraseas distintas son posibles?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
180

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen los principios bsicos
de conteo.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Factorial: El factorial de un nmero n, que se denota n!, se define como:

n! = n (n1) (n2) 2 1

Es importante sealar que se define 1! = 1 y 0! = 1.

Ejemplo Calcule el factorial de 5.

Solucin El factorial de 5 es:

5! = 5 4 3 2 1 = 120

Ejercicio Calcule el factorial de los siguientes nmeros:


de 1. 5! =
revisin 2. 6! =
3. 10! =
4. 0! =
5. 1! =
6. 70! =
7. 20! =

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para el clculo del factorial

Ejemplo Use Excel y Minitab para calcular el factorial de 5.

Solucin En Excel se emplea la funcin FACT, la cual tiene la siguiente sintaxis:

=FACT(nmero)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
181

Donde "nmero" indica la celda donde se halla el nmero del cual se desea
calcular el factorial, o bien, simplemente se escribe dicho nmero.
Entonces, en este caso se digita en la celda en que se desea obtener el
resultado la funcin:

=FACT(5)

Y as se obtiene el resultado 120.

En Minitab se requiere dar clic al men Calc y elegir Calculadora. En el


cuadro de dilogo se debe completar la columna de la hoja de trabajo en la
cual se desea almacenar el resultado, por ejemplo, la columna C1. Luego
en expresin se emplea la funcin FACTORIAL, la cual emplea la
sintaxis:

FACTORIAL(nmero de elementos)

Donde "nmero de elementos" es el nmero del cual se desea obtener el


factorial, o bien, la columna en la que se hallan esos nmeros. En este
caso, si se indica solo el nmero, entonces la funcin quedara:

FACTORIAL(5)

Despus se da clic en Aceptar y el resultado 120 se obtiene en la hoja de


trabajo en la celda que se haya indicado.

Permutaciones:

PERMUTACIONES Una permutacin es un arreglo ordenado de n elementos


distintos tomados r a la vez sin repeticin.

El nmero de permutaciones, que se denota P(n, r), se calcula como:

n!
P(n, r )
(n r ) !

Ejemplo Calcule el nmero de permutaciones de 5 elementos tomados de 3 en 3.

Solucin Se tiene que n = 5 y r = 3:

5! 5! 120
P(5,3) 60
(5 3) ! 2! 2

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
182

Ejercicio Calcule las siguientes permutaciones:


de 1. P(8, 5) =
revisin 2. P(6, 0) =
3. P(10, 1) =
4. P(5, 5) =
5. P(300, 1) =
6. P(200, 2) =
7. P(n, n) =
8. P(n, 1) =
9. P(n, 0) =
10. P(n, n 1) =

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para el clculo de permutaciones

Ejemplo Use Excel y Minitab para calcular el nmero de permutaciones de 5


elementos tomados de 3 en 3.

Solucin En Excel se emplea la funcin PERMUTACIONES, la cual tiene la


siguiente sintaxis:

=PERMUTACIONES(nmero; tamao)

Donde "nmero" indica la celda donde se halla el valor de n, o bien,


simplemente se escribe dicho valor de n. Luego "tamao" es la celda en la
cual se haya el valor de r o simplemente el valor de r. Entonces, en este
caso se digita en la celda en que se desea obtener el resultado la funcin:

=PERMUTACIONES(5; 3)

Y as se obtiene el resultado 60.

En Minitab se requiere dar clic al men Calc y elegir Calculadora. En el


cuadro de dilogo se debe completar la columna de la hoja de trabajo en la
cual se desea almacenar el resultado, por ejemplo, la columna C1. Luego
en expresin se emplea la funcin PERMUTATIONS, la cual emplea la
sintaxis:

PERMUTATIONS(nmero de elementos.nmero para elegir)

Donde "nmero de elementos" es el valor de n, o bien, la columna en la


que se halla el valor de n. Luego, "nmero para elegir" es el valor de r, o la

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
183

columna en la que se encuentra el valor de r. En este caso, si se indican


solo los nmeros, entonces la funcin quedara:

PERMUTATIONS(5.3)

Despus se da clic en Aceptar y el resultado 60 se obtiene en la hoja de


trabajo en la celda que se haya indicado.

Combinaciones:

COMBINACIONES Una combinacin es un arreglo no ordenado de n elementos


distintos tomados r a la vez sin repeticin.

El nmero de combinaciones, que se denota C(n, r), se calcula como:

n!
C (n, r )
r ! (n r ) !

Ejemplo Calcule el nmero de combinaciones de 5 elementos tomados de 3 en 3.

Solucin Se tiene que n = 5 y r = 3:

5! 5! 120
C (5,3) 10
3! (5 3) ! 3! 2! 6 2

n
La expresin es conocida como coeficiente binomial y es igual a C(n, r).
r

Ejercicio Calcule las siguientes probabilidades:


de 1. C(8, 5) =
revisin 2. C(6, 0) =
3. C(10, 1) =
4. C(5, 5) =
5. C(300, 1) =
6. C(200, 2) =
7. C(n, n) =
8. C(n, 1) =
9. C(n, 0) =
10. C(n, n 1) =

Resuelva los siguientes ejercicios:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
184

1. Cuntas directivas de tres miembros (presidente, secretario y tesorero)


se pueden formar de un grupo de 8 personas elegibles?
2. Cuntos comits de tres miembros se pueden formar de un grupo de 8
personas elegibles?
3. Cuntos comits de tres estudiantes y dos profesores se pueden formar
si hay un grupo de 10 estudiantes y 5 profesores elegibles?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para calcular combinaciones

Ejemplo Use Excel y Minitab para calcular el nmero de combinaciones de 5


elementos tomados de 3 en 3.

Solucin En Excel se emplea la funcin COMBINAT, la cual tiene la siguiente


sintaxis:

=COMBINAT(nmero; tamao)

Donde "nmero" indica la celda donde se halla el valor de n, o bien,


simplemente se escribe dicho valor de n. Luego "tamao" es la celda en la
cual se haya el valor de r o simplemente el valor de r. Entonces, en este
caso se digita en la celda en que se desea obtener el resultado la funcin:

=COMBINAT(5; 3)

Y as se obtiene el resultado 10.

En Minitab se requiere dar clic al men Calc y elegir Calculadora. En el


cuadro de dilogo se debe completar la columna de la hoja de trabajo en la
cual se desea almacenar el resultado, por ejemplo, la columna C1. Luego
en expresin se emplea la funcin COMBINATIONS, la cual emplea la
sintaxis:

COMBINATIONS(nmero de elementos.nmero para elegir)

Donde "nmero de elementos" es el valor de n, o bien, la columna en la


que se halla el valor de n. Luego, "nmero para elegir" es el valor de r, o la
columna en la que se encuentra el valor de r. En este caso, si se indican
solo los nmeros, entonces la funcin quedara:

COMBINATIONS(5.3)

Despus se da clic en Aceptar y el resultado 10 se obtiene en la hoja de


trabajo en la celda que se haya indicado.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
185

Permutaciones con elementos repetidos: La definicin anterior de permutaciones sealaba


que los elementos deban ser distintos, pero cuando en el total de elementos hay algunos
grupos de elementos iguales y se desea calcular el nmero de permutaciones, entonces cambia
el clculo del nmero de permutaciones. Si hay n elementos en total y n1 elementos iguales
entre s, n2 elementos iguales entre s, hasta nk elementos iguales entre s, entonces el nmero
de permutaciones se calcula como:

n!
n1 ! n2 !... nk !

Ejemplo Suponga que en un grupo de 10 bolas hay 5 de color rojo, 3 azules y dos
blancas, cuntas permutaciones son posibles?

Solucin Aplicando la frmula de permutaciones con elementos repetidos:

n! 10! 3628800 3628800


2520
n R ! n A ! n B ! 5! 3! 2! 120 6 2 1440

Definiciones de probabilidad

Definicin clsica de probabilidad


El concepto clsico o matemtico de probabilidad, se origin en los juegos de azar, y parte de
si un experimento aleatorio puede tener N resultados igualmente posibles y mutuamente
excluyentes, como en el caso del lanzamiento de un dado, pues hay N = 6 resultados posibles
que son igualmente posibles y mutuamente excluyentes (o sea, que no pueden salir dos
nmeros distintos al mismo tiempo); y si a de estos resultados corresponden a un evento A,
entonces la probabilidad del evento A, denotada P(A), es:

Nmero de casos favorables al evento A a


P( A)
Nmero de casos posibles N

En esta definicin la probabilidad de un evento determinado representa la proporcin de veces


que se espera que ocurra ese resultado especfico si el experimento se realiza un gran nmero
de veces bajo idnticas circunstancias.

Ejemplo Cul es la probabilidad de que al tirar un dado perfecto se obtenga un


nmero par mayor que 2?

Solucin Se define el evento A como obtener un nmero par mayor de 2. Al tirar el


dado los seis lados tienen igual posibilidad de quedar hacia arriba. Los
nmeros pares mayores que 2 son 4 y 6, por lo tanto:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
186

a 2
P( A) 0,3333
N 6

Ejercicio Se lanzan dos dados y se suman los puntos. Si X es la suma de los puntos,
calcule las siguientes probabilidades:
de
revisin 1. P(X = 3) =
2. P(X = 6) =
3. P(X = 7) =
4. P(X = 11) =
5. P(X = 12) =
6. P(X = 15) =

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Este concepto de probabilidad tiene algunas limitaciones. Por ejemplo, cuando no es posible
conocer el nmero de resultados posibles (espacio muestral), o bien, este espacio muestral es
infinito, o cuando los eventos no son mutuamente excluyentes ni igualmente posibles.

La frecuencia relativa como probabilidad


En muchas situaciones, los resultados de un experimento no tienen la misma posibilidad de
ocurrir, por lo que las probabilidades deben asignarse con base en una evidencia experimental
o con base en datos histricos. En este caso se dice que la probabilidad del evento se puede
determinar como la frecuencia relativa de ocurrencia de dicho suceso, es decir, su frecuencia
absoluta con respecto al total de casos observados:

F ( A)
P( A) Fr ( A)
N

As, por ejemplo, al decir que la probabilidad de obtener una pieza defectuosa en un proceso
es del 6%, se est usando el valor de la frecuencia relativa que se obtuvo al llevar un registro
de las piezas defectuosas durante un perodo razonablemente largo de tiempo.

Ejemplo En un lote de 3.000 piezas producidas en una mquina se encontraron 96


defectuosas. Calcule la probabilidad de piezas defectuosas de esa mquina.

Solucin Si d es el evento obtener una pieza defectuosa, entonces su frecuencia es


96, lo que da la probabilidad:

96
P( d ) 0,0320
3.000

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
187

Ejercicio En una ciudad en la que habitan 5.000 personas, se sabe que 2.700 son
mujeres. Si se selecciona una persona al azar, cul es la probabilidad de
de que sea mujer?
revisin
Ver solucin de este ejercicio en la pgina de internet de este texto:
www.auladeeconomia.com/raeep.html

Concepto intuitivo o subjetivo de probabilidad


En muchas situaciones existe poca o ninguna informacin numrica para determinar la
probabilidad. Entonces se emplean los juicios u opiniones basados en un conocimiento
profundo de la situacin, e incluso basados en la intuicin, acerca de la probabilidad de que
ocurra un evento. Por ejemplo, el caso en que un especialista emite su criterio con relacin al
estado futuro de la economa y estima una probabilidad de que haya recesin y otra
probabilidad de que haya expansin.

Ejercicio En cada caso, indique cul enfoque se empleara para determinar la


probabilidad de que el evento dado ocurra:
de
revisin a. Ganar en un juego de ruleta.
b. Enfermar de cncer de piel.
c. Que un nuevo producto desarrollado por una compaa sea un xito.
d. Que la realizacin de un proyecto dure ms de lo esperado.
e. Que una computadora nueva falle en un plazo de tres aos o menos.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Axiomas y teoremas de probabilidad


Estos se basan en el concepto matemtico o clsico de probabilidad. Se presentan algunos
ejemplos para ilustrar los conceptos.

Axioma l: Para cualquier evento A, la probabilidad no puede ser menor que 0, ni mayor que 1:

0 P( A) 1

Por ejemplo, si un club cuenta con 1.200 miembros de ambos sexos (N = 1200). El evento de
inters (A) es ser mujer, por tanto P(A) = a/N. El mnimo nmero de mujeres en el club es
cero (a = 0), ninguna mujer en el club, en cuyo caso P(A) = 0/1200 = 0. El mximo nmero
posible de mujeres es 1200, no hombres en el club, por lo que P(A) = 1200/1200 = 1. No
puede haber menos de 0 ni ms de 1200 mujeres en el grupo de 1200 personas, por lo tanto:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
188

0 P( A) 1

De lo anterior se puede concluir que:

La probabilidad de un evento imposible es cero.


La probabilidad de un evento que ocurre con toda certeza es uno.

Para el siguiente axioma hay que recordar el concepto de espacio muestral, el cual es el
conjunto de todos los resultados posibles de un experimento aleatorio.

Axioma 2. La suma de la probabilidad de todos los eventos Ai contenidos en el espacio


muestral S es 1.

P( S ) 1

Donde S es el espacio muestral, o sea, el conjunto total de eventos simples posibles, y


equivale a P(Ai). Esto quiere decir que la suma de las probabilidades de todos los eventos
posibles es igual a uno.

Para el axioma siguiente es necesario introducir el concepto de eventos excluyentes.

EVENTOS EXCLUYENTES Dos eventos son excluyentes si no pueden ocurrir


simultneamente.

Por ejemplo, al jugar un partido de futbol hay tres resultados posibles, ganar, empatar o
perder, los cuales son excluyentes, pues dos o ms de esos eventos no pueden ocurrir
simultneamente.

De modo similar se pueden definir los eventos no excluyentes.

EVENTOS NO EXCLUYENTES Dos eventos son excluyentes si pueden ocurrir


simultneamente.

Si se tiene el evento ser mujer y el evento estudiar ingeniera industrial, entonces estos son
eventos no excluyentes, porque pueden ocurrir simultneamente, es decir, una mujer puede
haber estudiado ingeniera industrial.

Axioma 3. Si A y B son eventos mutuamente excluyentes en el espacio muestral S, entonces,

P( A o B) P( A) P( B)

Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Si se selecciona un
aparato al azar, cul es la probabilidad de que sea un televisor o una
computadora?

Solucin Dado que los eventos televisor (T) y computadora (C) son excluyentes se

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
189

calcula cada probabilidad por separado y se suman ambas probabilidades.


Adems, en la bodega hay un total de 1000 aparatos:

400 300 700


P(T o C ) 0,7
1000 1000 1000

Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, cul es la probabilidad de que sea
revisin ingeniero civil o ingeniero industrial?

Industrial Civil Electrnica Otras Total


Masculino 8 6 6 6 26
Femenino 7 2 4 1 14
Total 15 8 10 7 40

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Por induccin matemtica el axioma 3 conduce a los siguientes teoremas:

Teorema 1. Si E1, E2, , Em, son eventos mutuamente excluyentes en el espacio muestral S,
entonces:

P( E1 o E2 o ... o Em ) P( E1 ) P( E2 ) ... P( Em )

Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Si se selecciona un
aparato al azar, cul es la probabilidad de que sea un televisor o una
computadora o una cmara fotogrfica?

Solucin Dado que los eventos televisor (T), computadora (C) y cmara fotogrfica
(F) son excluyentes se calcula cada probabilidad por separado y se suman
ambas probabilidades. Adems, en la bodega hay un total de 1000
aparatos:

400 300 200 900


P(T o C o F ) 0,9
1000 1000 1000 1000

Teorema 2. Regla general de la suma o adicin de probabilidades. Si A y B son eventos


cualesquiera (excluyentes o no excluyentes) en un espacio muestral S, la probabilidad de la
unin de los eventos (o sea, que ocurra un evento o el otro) est dada por:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
190

P( A o B) P( A) P( B) P( AB)

Donde P(AB) es la probabilidad de la interseccin de los dos eventos, o sea, la probabilidad


de que los eventos ocurran simultneamente.

Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Adems, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), segn la tabla:

Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000

Si se selecciona un aparato al azar, cul es la probabilidad de que sea un


televisor o que tenga defectos?

Solucin En la bodega hay un total de 1000 aparatos. Dado que los eventos televisor
(T) y que el aparato tenga defectos (D) no son excluyentes se calcula cada
probabilidad por separado y se suman ambas probabilidades, pero tambin
se resta la probabilidad de que ocurran a la vez:

400 150 50 500


P(T o D) 0,5
1000 1000 1000 1000

Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, cul es la probabilidad de que sea
revisin ingeniero civil o mujer?

Industrial Civil Electrnica Otras Total


Masculino 8 6 6 6 26
Femenino 7 2 4 1 14
Total 15 8 10 7 40

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

El teorema 2 puede generalizarse a tres eventos:

P( A B C) P( A) P( B) P(C) P( AB) P( AC ) P( BC ) P( ABC )

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
191

Para el teorema siguiente se requiere el concepto de eventos complementarios.

EVENTOS COMPLEMENTARIOS Dos eventos A y B son complementarios si su


unin da como resultado el espacio muestral, o sea, que P(A o B) = 1 y su interseccin
es vaca, es decir, P(A y B) = 0.

En palabras sencillas, si un determinado experimento aleatorio tiene solo dos resultados


posibles y esos resultados son excluyentes, es decir, no pueden ocurrir a la vez, entonces son
eventos complementarios. Este es el caso de cuando un estudiante realiza un curso. Solo hay
dos resultados posibles, aprueba o no aprueba, y no es posible aprobar y reprobar al mismo
tiempo, por lo que los eventos aprobar y reprobar son complementarios:

P(Aprobar o Reprobar) = 1

P(Aprobar y Reprobar) = 0

Teorema 3. Si E es un evento cualquiera en el especio muestral S y el evento Ec es su evento


complementario, entonces:

P( E C ) 1 P( E )

De acuerdo con este teorema:

P(Aprobar) = 1 P(Reprobar)

Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Adems, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), segn la tabla:

Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000

Si se selecciona un aparato al azar, cul es la probabilidad de que tenga


defectos?

Solucin Dado que solo hay dos niveles de calidad, perfecto (P) o con defectos (D),
entonces podran considerarse como eventos complementarios, por lo que
la probabilidad de que tenga defectos es igual a uno menos la probabilidad
de que est perfecto:

850 150
P( D) 1
1000 1000

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
192

Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, cul es la probabilidad de que no
revisin sea ingeniero civil?

Industrial Civil Electrnica Otras Total


Masculino 8 6 6 6 26
Femenino 7 2 4 1 14
Total 15 8 10 7 40

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Probabilidad condicional
Se llama probabilidad condicional a la probabilidad de que ocurra un evento B cuando se sabe
que algn otro evento A ha ocurrido (P(A) > 0) y se denota como P(B | A). Esta expresin se
lee as:

P(B | A): La probabilidad de que ocurra B dado que ocurri A

Tambin se lee como la probabilidad de B dado A.

PROBABILIDAD CONDICIONAL Es la probabilidad de que ocurra un


determinado evento, sabiendo que tambin sucede otro evento especificado.

Si A y B son dos eventos en el espacio muestral S, P(A) > 0, P(B) > 0, la probabilidad
condicional de B dado A es:

P( AB )
P( B / A)
P( A)

donde P(AB) = P(A y B).

Ejemplo En una bodega hay 400 televisores (T), 100 videograbadoras (V), 200
cmaras fotogrficas (F) y 300 computadoras (C). Adems, se tienen
algunos datos sobre su nivel de calidad, como perfectos (P) o con defectos
(D), segn la tabla:

Tipo de aparato
T V F C Total
P 350 80 150 270 850
D 50 20 50 30 150
Total 400 100 200 300 1000

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
193

Si se selecciona un televisor al azar, cul es la probabilidad de que tenga


defectos?

Solucin Aplicando la definicin de probabilidad condicional:

P( DT )
P( D / T )
P(T )

Se calcula la probabilidad de que sea televisor y tenga defectos:

P(DT) = 50/1000

Y se divide entre la probabilidad de que sea un televisor:

P( DT ) 50 / 1000 50
P( D / T )
P(T ) 400 / 1000 400

Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional y se sabe que debe ser mujer, cul
revisin es la probabilidad de que sea ingeniero civil?

Industrial Civil Electrnica Otras Total


Masculino 8 6 6 6 26
Femenino 7 2 4 1 14
Total 15 8 10 7 40

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Para los teoremas siguientes se requieren algunos conceptos nuevos.

EVENTOS INDEPENDIENTES Dos eventos son independientes si la ocurrencia de


uno no afecta la probabilidad de ocurrencia del otro.

Por ejemplo, si que un artculo salga defectuoso en un proceso no se relaciona con la


probabilidad de que otro artculo tambin salga defectuoso, entonces estos seran eventos
independientes. O bien, si el hecho de que un cliente compre o no compre un producto no
influye sobre la decisin de otro cliente, entonces estos seran eventos independientes.

EVENTOS DEPENDIENTES Dos eventos son dependientes si la ocurrencia de uno


afecta la probabilidad de ocurrencia del otro.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
194

Si el hecho de que un cliente compre o no compre un producto influye sobre la decisin de


otro cliente, tal vez porque esos dos clientes se conocen y el primero le da una recomendacin
al segundo, entonces estos seran eventos dependientes.

Teorema 4. Regla general de multiplicacin. Si A y B son dos eventos cualesquiera en el


espacio muestral S, entonces:

P( A y B) P( A) P( B / A) si P( A) 0

Si A y B son dos eventos independientes, es decir, la ocurrencia de A no depende de B, ni la de


B depende de A, entonces:

P( B / A) P( B) y P( A / B) P( A)

Esto conduce a:

Teorema 5. Regla especial de multiplicacin. Si A y B son eventos independientes:

P( A y B) P( A) P( B)

Ejemplo Se tiene una caja con 10 bolas de colores: 6 bolas rojas y 4 bolas azules. Se
seleccionarn dos bolas al azar:

1. Cul es la probabilidad de que la primera bola sea roja y la segunda


azul, si la primera bola se regresa a la caja antes de sacar la segunda?

2. Cul es la probabilidad de que la primera bola sea roja y la segunda


azul, si la primera bola no se regresa a la caja antes de sacar la segunda?

Solucin Dado que los eventos televisor (T), computadora (C) y cmara fotogrfica
(F) son excluyentes se calcula cada probabilidad por separado y se suman
ambas probabilidades. Adems, en la bodega hay un total de 1000
aparatos:

400 300 200 900


P(T o C o F ) 0,9
1000 1000 1000 1000

Ejercicio Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera
y por sexo segn la tabla. Suponga que ninguno ha estudiado dos carreras.
de Si se selecciona al azar un profesional, cul es la probabilidad de que sea
revisin ingeniero civil o ingeniero industrial?

Industrial Civil Electrnica Otras Total


Masculino 8 6 6 6 26
Femenino 7 2 4 1 14

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
195

Total 15 8 10 7 40

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Aplicacin Simulacin
La simulacin es una tcnica de la ingeniera que permite realizar
experimentos sobre el papel o en una computadora, y de ese modo,
describir el comportamiento y estructura de sistemas reales mucho ms
complejos. El investigador disea un sistema que representa a travs de un
modelo, el cual incluye las variables y relaciones lgicas implicadas.
Generalmente el modelo se verifica y valida con la ayuda del computador.

La simulacin se utiliza en el diseo de sistemas de produccin, anlisis


financieros o econmicos complejos, evaluacin de polticas de inventario,
anlisis de sistemas de transporte, la toma de decisiones humanas, entre
muchos otros.

Frecuentemente la simulacin es probabilstica, pues en muchos de los


sistemas que se estudian existe incertidumbre sobre las variables
comprendidas por el modelo. Por ejemplo, se puede simular la llegada de
clientes a una agencia bancaria, de modo que se pueda pronosticar qu tan
extensa se va a hacer la cola o el tiempo de espera de los clientes. O bien,
el banco podra simular, mediante el uso de probabilidades, el
comportamiento futuro de variables importantes, como las tasas de inters,
el tipo de cambio y la inflacin, entre otras, y as poder determinar cmo
se afecta su situacin financiera y econmica.

Teorema de Bayes
Supngase que Marta viaja desde una casa, en donde no tiene acceso por bus para ir a la
universidad. Como no tiene automvil recurre a cualquiera de tres vecinos amigos que
estudian en el mismo lugar y que viaja cada quien en su carro. Si llamamos A al evento de que
Marta asista a clases, B1 al evento de que un amigo llamado Luis vaya a la universidad y lleve
a Marta, B2 al evento que otro amigo llamado Juan asista a la universidad y lleve a Marta, y B3
al evento que un tercer amigo llamado Ral asista a la universidad y lleve a Marta, entonces la
probabilidad de que Marta vaya a clases est dada por la suma de las probabilidades de que la
lleven cualquiera de los tres amigos.

P( A) P( AB1 ) P( AB2 ) P( AB3 )

Al sustituir usando la regla general de la multiplicacin se tiene:

P( A) P( B1 ) P( A / B1 ) P( B2 ) P( A / B2 ) P( B3 ) P( A / B3 )

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
196

Generalizando esta situacin se obtiene el siguiente teorema:

Teorema 6. Si B1, B2, ... , Bk son eventos mutuamente excluyentes, uno de los cuales debe
ocurrir, y que tienen interseccin con el evento A, entonces,

P( A) P( Bi ) P( A / Bi )

Si lo que se quiere conocer es la probabilidad de que un amigo en particular haya venido a la


universidad (evento Br) sabiendo que Marta vino a clases, se aplica el teorema de Bayes.

Teorema 7. Teorema de Bayes. Si B1, B2, ... , Bk son eventos mutuamente excluyentes, uno
de los cuales debe ocurrir, que tienen interseccin con el evento A, entonces,

P( Br ) P( A / Br ) P( Br ) P( A / Br )
P( Br / A)
P( A) P( Bi ) P( A / Bi )
En el caso especfico de los dos eventos A y B, el teorema de Bayes se expresara la
probabilidad de ocurrencia del evento B dada la ocurrencia del evento A como:

P( B) P( A / B)
P( B / A)
P( B) P( A / B) P( B ) P( A / B )

Es decir, dados dos eventos A y B, el teorema de Bayes consiste en la determinacin de la


probabilidad condicional del evento B dada la ocurrencia del evento A. Este teorema se aplica
generalmente en el contexto de eventos secuenciales.

En la frmula anterior B es el evento complementario de B.

Ejemplo Si la probabilidad de que un da cualquiera B1 haya venido a la universidad


es del 50% y la probabilidad de que Marta haya viajado con l es del 30%;
la probabilidad de que B2 haya venido a la universidad es del 30% y la de
que Marta haya venido con l es del 25% y la probabilidad de que B3 haya
venido a la universidad es del 20% y la de que Marta haya venido con l es
del 15%. Cul es la probabilidad de que si Marta vino a clases haya
viajado con B2?

Solucin Calculando primero P(A):

P( A) P( Bi ) P( A / Bi ) 0.5 0.3 0.3 0.25 0.2 0.15 0.255

Y luego aplicando el teorema de Bayes:

P( B2 ) P( A / B2 ) 0.3 0.25
P( B2 / A) 0.2941
P( A) 0.255

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
197

Aplicacin Valor predictivo positivo


Cuando se realiza una prueba diagnstica, se puede establecer la
probabilidad de padecer una enfermedad (o tener cierta condicin, como
un embarazo) luego de conocer el valor de la prueba diagnstica. Por
ejemplo, suponga que se tienen los siguientes datos relacionados con una
muestra de 100 hombres mayores de 40 aos a quienes se les realiz una
prueba para la deteccin del cncer de prstata:

Enfermos Sanos Total


Positivos 20 5 25
Negativos 15 60 75
Total 35 65 100

De la tabla anterior se puede obtener la tasa de prevalencia de este tipo de


cncer, que sera la proporcin de individuos que en un periodo
determinado presentan una caracterstica determinada (en este caso sera
estar enfermos):

Prevalencia = 35/100 = 35%

Ahora bien, se puede determinar la sensibilidad de la prueba, que es la


probabilidad de clasificar en forma correcta a un individuo que posee la
caracterstica indicada (en este caso, que est enfermo), va a ser la razn de
los enfermos que dieron positivo en la prueba entre el total de caso
positivos en la prueba:

Sensibilidad = 20/35 = 43%

La especificidad de la prueba es la probabilidad de clasificar en forma


correcta a un individuo que no tenga la caracterstica en cuestin (en este
caso, que no est enfermo):

Especificidad = 60/75 = 80%

El valor predictivo positivo sera la probabilidad de que el individuo tenga


la caracterstica indicada (en este caso, que est enfermo) si obtiene un
resultado positivo en la prueba:

Valor predictivo positivo = 20/25 = 80%

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
198

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Ejercicios:
Preguntas de desarrollo:
Conteste las preguntas que se formulan a continuacin (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

1. Cul enfoque de probabilidad (clsico, de frecuencias relativas o subjetivo) se empleara


para determinar la probabilidad de ocurrencia de cada uno de los siguientes eventos?

a. Un cientfico cree que un terremoto que afectar fuertemente al pas.


b. Una empresa debe remplazar un equipo de sonido a un cliente porque el aparato
tiene defectos de fbrica.
c. Alguien desea ganar $1000 jugando ruleta en un casino.
d. Una persona gana $1.000.000 al ganar la lotera nacional.
e. Una persona abandona sus estudios universitarios.
f. Un trabajador que no ha completado su enseanza primeria cae en pobreza.
g. Una persona sufre un paro cardaco.
h. Un banco sufre grandes prdidas.
i. Un proyecto inmobiliario sufre un atraso.
j. Que un antiguo volcn vuelva a entrar en actividad.
k. Una operacin a corazn abierto es exitosa.

2. Los siguientes datos corresponden a la matrcula de una universidad. Calcule la


probabilidad de que al seleccionar un estudiante al azar este (suponga que cada estudiante
estudia solo una carrera y que no estudia dos o ms carreras a la vez):

Tipo de estudiante
Carrera Regular Nuevo
Enfermera 500 100
Publicidad 850 150
Relaciones Internacionales 500 100
Relaciones Pblicas 800 200
Trabajo social 200 100

a. Sea estudiante regular


b. Estudie publicidad
c. Estudie trabajo social
d. Estudie enfermera o trabajo social
e. No estudie enfermera
f. Estudie enfermera o publicidad
g. Sea nuevo o estudie relaciones pblicas

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
199

h. Estudie publicidad y sea estudiante regular


i. Estudie relaciones internacionales o sea estudiante nuevo
j. Estudie trabajo social y sea estudiante nuevo

3. Los siguientes datos corresponden a la matrcula de una universidad. Calcule la


probabilidad de que al seleccionar un estudiante al azar este (cada estudiante estudia solo una
carrera):

Sexo
Carrera Hombre Mujer
Administracin 300 200
Contadura 200 150
Derecho 50 60
Ingeniera Civil 100 20
Ingeniera Industrial 200 120

a. Sea hombre
b. Estudie derecho
c. Estudie administracin
d. Estudie alguna ingeniera
e. No estudie contadura
f. Estudie derecho o contadura
g. Sea mujer o estudie derecho
h. Estudie derecho y sea mujer
i. Estudie ingeniera industrial o sea hombre
j. Estudie ingeniera civil dado que el estudiante seleccionado sea mujer
Si se seleccionan dos estudiantes diferentes, calcule la probabilidad de que:
k. Ambos sean mujeres
l. El primero estudie derecho y el segundo administracin

4. La siguiente tabla ofrece datos sobre los niveles de glucosa en la sangre de una muestra de
50 pacientes segn su sexo:

Nivel de glucosa
Sexo Hipoglucemia Normal Hiperglucemia
Masculino 5 10 7
Femenino 8 14 6

Con base en los datos anteriores, calcule la probabilidad de que al seleccionar al azar un
paciente este presente:
a. Nivel de glucosa normal
b. Hipoglucemia o hiperglucemia
c. Hipoglucemia o que sea hombre
d. Hiperglucemia dado que sea mujer
e. Si se seleccionan al azar dos pacientes distintos, cul es la probabilidad de que
ambos tengan hiperglucemia?

5. El paracetamol es considerado un frmaco seguro y bien tolerado, y sus efectos adversos


son raros y generalmente leves y transitorios. A continuacin se muestran algunos datos de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
200

efectos adversos causados por esta sustancia segn el sexo del paciente en una muestra de 200
personas que han consumido este frmaco con cierta regularidad:

Efectos adversos
Sexo Sin efecto adverso Nuseas Hipersensibilidad Otros
Masculino 90 5 3 2
Femenino 92 4 2 2

Con base en los datos anteriores, calcule la probabilidad de que al seleccionar un paciente al
azar que haya consumidor paracetamol presente:
a. Ningn tipo de efecto adverso
b. Nuseas o sea hombre
c. Nuseas y no tenga efecto adverso alguno
d. Sea hombre o presente hipersensibilidad
e. Que no tenga efecto adverso si sabe que el paciente seleccionado es hombre.
f. Si se seleccionan tres pacientes distintos al azar, cul es la probabilidad de que el
primero presente hipersensibilidad, que el segundo no tenga efecto adverso alguno y
que el tercero tambin presente hipersensibilidad?

6. Un estudio publicado por SquareTrade a fines del ao pasado, revel que generalmente las
empresas fabricantes de computadoras porttiles de marcas pequeas suelen ser ms
confiables que sus rivales ms grandes. La tabla muestra datos basados en los resultados de
ese estudio.

Marca de la computadora
Asus Sony Acer HP
Fall antes de 3 aos 2 3 5 7
No fall antes de 3 aos 12 17 15 19

Si se elige al azar, sin reemplazo, una computadora, calcule la probabilidad de que:


a. Su marca sea Acer o HP.
b. Su marca sea HP o haya fallado antes de tres aos.
c. Su marca sea HP y haya fallado antes de tres aos.
d. Si el equipo seleccionado es marca HP, cul es la probabilidad de que falle antes
de tres aos?
e. Cul marca tiene mayor probabilidad de fallar antes de 3 aos?

7. El trabajo social en crceles o dirigido a reclusos juega un papel muy importante dentro de
los mbitos de actuacin profesional de un trabajador social. En un estudio realizado por un
trabajador social sobre el sistema carcelario nacional se encontraron los siguientes datos en
una muestra de 200 reclusos:

Tipo de delito
Origen Drogas Propiedad Personas Otros Total
Nacional 68 13 4 14 99
Extranjero 93 3 2 3 101
Total 161 16 6 17 200

Con base en los datos anteriores, calcule las siguientes probabilidades:


a. Seleccionar al azar un recluso que haya cometido un delito contra la propiedad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
201

b. Seleccionar al azar un recluso extranjero.


c. Seleccionar al azar un recluso nacional y que est vinculado con un delito con
drogas.
d. Seleccionar al azar un recluso extranjero o que haya cometido un delito contra las
personas.
e. Seleccionar al azar un recluso que haya cometido un delito contra la propiedad dado
que sea nacional.
f. Seleccionar al azar dos reclusos nacionales distintos.

8. En una encuesta aplicada a un grupo de economistas se encontr que el 60% crean que la
crisis internacional haba afectado menos de los esperado a la economa nacional. Un 40%
consider que las polticas del gobierno haban sido las adecuadas para enfrentar la crisis, a la
vez que un 20% del total coincidan en que la crisis afect menos de lo esperado y que las
polticas del gobierno fueron adecuadas. Con base en estos datos, calcule la probabilidad de
que si selecciona uno de estos economistas al azar:
a. Que est de acuerdo en que la crisis afect menos de los esperado o que las polticas
del gobierno fueron adecuadas.
b. Que est de acuerdo en que la crisis afect menos de los esperado o que las polticas
del gobierno fueron adecuadas, pero no ambas.
c. Que no est de acuerdo en que la crisis afect menos de los esperado y que tampoco
considere que las polticas del gobierno fueron adecuadas.

9. La Escuela de Negocios de la Universidad de Edimburgo, en el Reino Unido, realiz un


estudio sobre el uso que las personas realizan en la red social Facebook. Segn esta
investigacin el 56% de los entrevistados tena a su pareja como amistad en dicha red social,
mientras que el 64%, que tenan a una ex pareja, y un 35% tenan tanto a su pareja como a
alguna ex pareja como amigos en Facebook. Con base en estos datos determine la
probabilidad de que al seleccionar al azar un usuario de Facebook:
a. Tenga como amistad a su pareja o a una ex pareja.
b. Tenga a como amistad a su pareja o su ex pareja pero no ambas.
c. No tenga como amistad ni a su pareja ni a una ex pareja.
d. Si al seleccionar una persona, esta tiene a su pareja como amistad en Facebook,
cul es la probabilidad de que tambin tenga una ex pareja?
e. Si se seleccionan dos personas al azar, cul es la probabilidad de que ambas tengan
a su pareja como amistad en Facebook?

10. Un grupo de nios es clasificado de acuerdo con su resultado en el instrumento


estandarizado para la medicin de los aprendizajes en preescolares de 5 aos. Los resultados
son los siguientes:

Peso
Sobre lo esperado En lo esperado para Bajo lo esperado
Sexo para su edad su edad para su edad
Masculino 30 76 34
Femenino 20 54 26

Con base en los datos anteriores, calcule las siguientes probabilidades.


a. Si se selecciona al azar un nio (a), calcule la probabilidad de elegir a uno con
resultado esperado para su edad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
202

b. Si se selecciona al azar un preescolar, calcule la probabilidad de elegir a uno con


resultado esperado para su edad o que sea de sexo masculino.
c. Si se seleccionan al azar dos preescolares (sin reemplazo), calcule la probabilidad de
ambos tengan un resultado bajo para su edad

11. En un centro de copiado se tienen tres fotocopiadoras. La probabilidad de que cada una
est fuera de servicio es de 20%, 15% y 30%, respectivamente. Cada mquina es
independiente de las dems. Con base en los datos proporcionados, determine la probabilidad
de que:
a. Exactamente dos copiadoras estn en servicio.
b. La segunda o la tercera estn fuera de servicio, y la primera fuera de servicio.

12. En una fbrica las lneas de ensamblaje 1 y 2 produjeron respectivamente 600 y 400
piezas de un lote. La lnea 1 produce un 6% de piezas defectuosas y la lnea 2 produce 2
piezas defectuosas de cada 40. Si del lote se sacan piezas aleatoriamente, calcule:
a. la probabilidad de obtener una pieza defectuosa.
b. Si al tomar una pieza sale defectuosa, cul es la probabilidad de que haya sido
producida en la lnea 2?

13. Explique cules de las siguientes afirmaciones son falsas y cules verdaderas:
a. La probabilidad de un evento siempre ser igual o mayor que cero y menor o igual
que uno.
b. Cuando la ocurrencia de un evento afecta la probabilidad de ocurrencia de otro
evento, entonces los eventos son independientes.
c. Cuando la ocurrencia de un evento no afecta la probabilidad de ocurrencia de otro
evento, entonces los eventos son dependientes.
d. Si A y B son eventos excluyentes, entonces es correcto que P(A o B) = P(A) + P(B)
P(AB).
e. Si A y B son eventos independientes, entonces es correcto que P(A y B) = P(A) *
P(B/A).
f. Si A y B son eventos dependientes, entonces es correcto que P(A y B) = P(A) *
P(B/A).

14. En una caja hay 10 bolas azules, 6 rojas y 4 verdes. Determine las siguientes
probabilidades:
a. Que al sacar al azar una bola, esta sea verde.
b. Que al sacar aleatoriamente una bola, esta sea azul o roja.
c. Sacar al azar una bola verde y luego una bola roja, sin devolver la primera bola a la
caja antes de sacar la segunda.
d. Sacar aleatoriamente una bola azul y luego una bola roja, devolviendo la primera
bola a la caja antes de sacar la segunda.

15. En una caja hay 35 bolas rojas, 33 blancas, 37 negras y 32 azules.


a. Cul es la probabilidad de sacar una bola roja primero y luego una bola azul, si se
vuelve a depositar en la caja la primera bola antes de sacar la segunda?
b. Cul es la probabilidad de sacar dos bolas blancas, si no se regresa a la caja la
primera bola?
c. Cul es la probabilidad de sacar una bola roja o una blanca?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
203

16. Un ingeniero conoce los siguientes datos relacionados con el nmero de fallas semanales
que un sistema informtico ha experimentado en el transcurso de tres aos:

# fallas/semana 0 1 2 3 4 5
Frecuencia 35 61 32 21 12 2

a. Con base en los datos proporcionados, determine la probabilidad de que al


seleccionar al azar una semana de las registradas por el ingeniero:
El sistema haya fallado 2 o 3 veces por semana.
El sistema no haya fallado.
b. Con base en los datos proporcionados, determine la probabilidad de que al
seleccionar al azar sin reemplazo dos semanas de las registradas por el ingeniero:
El sistema haya fallado 2 veces la primera semana y 4 veces la segunda.
El sistema no haya fallado en las dos semanas.
El sistema haya fallado dos o tres veces la primera semana y ninguna vez la
segunda.
La primera semana no registre falla alguna pero en la segunda si se registre al
menos una falla.

17. El trabajo social en crceles o dirigido a reclusos juega un papel muy importante dentro de
los mbitos de actuacin profesional de un trabajador social. En un estudio realizado por un
trabajador social sobre el sistema carcelario nacional se encontr que 1 de 4 cada reclusos
haba cometido un delito relacionado con drogas.

Si se toma una muestra aleatoria con reemplazo de 3 reclusos, calcule la probabilidad de que:

a. Los tres hayan cometido delitos relacionados con drogas.


b. Dos o tres hayan cometido delitos relacionados con drogas.
c. Especficamente el segundo recluso no haya cometido un delito relacionado con
drogas (sin importar si los otros estn relacionados o no con este tipo de delito).

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. Se tiene un grupo de n libros. El nmero de diferentes rdenes posibles de los n libros en


una mesa no equivale a:
( a ) P(n, n) ( b ) n!
( c ) C(n, n) ( d ) Ninguna de las anteriores

2. Se tiene un grupo de n libros, suponga que los n libros se van a conformar en grupos de 3
libros (suponiendo que n > 3). El nmero de diferentes grupos con distinto orden, equivale a:
( a ) P(n, 3) ( b ) n! / 3!
( c ) C(n, 3) ( d ) P(n, n 3)

3. Se tiene un grupo de n libros, suponga que se desea saber el nmero de diferentes


agrupaciones sin importar el orden de tres libros de los n libros del grupo (n > 3). Ese nmero
equivale a:
( a ) P(n, 3) ( b ) n! / 3! ( c ) C(n, 3) ( d ) C(n, n 3)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
204

4. Se tiene un grupo de 5 personas. El nmero de diferentes disposiciones posibles de los


asientos para este conjunto de 5 individuos que se van a sentar en 5 sillas no equivale a:
( a ) P(5, 5) ( b ) 5!
( c ) C(5, 5) ( d ) Ninguna de las anteriores

5. Se tiene un grupo de 5 personas, suponga que solo se van a sentar 3 de los 5 individuos. El
nmero de diferentes disposiciones posibles de los asientos para este conjunto de 3
individuos, considerando que pueden ser elegidos 3 cualesquiera de los 5, equivale a:
( a ) P(5, 2) ( b ) 5! / 2!
( c ) C(5, 3) ( d ) Ninguna de las anteriores

6. Se tiene un grupo de 5 personas, suponga que se desea saber el nmero de diferentes


agrupaciones de tres de los cinco miembros del grupo. Ese nmero equivale a:
( a ) P(5, 2) ( b ) 5! / 2!
( c ) C(5, 3) ( d ) Ninguna de las anteriores

7. Suponga que se tiene un grupo de 40 ingenieros que se agrupan por carrera y por sexo
segn la tabla:

Industrial Civil Electrnica Otras


Masculino 8 6 6 6
Femenino 7 2 4 1

La probabilidad de que un ingeniero aleatoriamente seleccionado sea una mujer o que haya
estudiado ingeniera industrial (o ambos) es:
( a ) 11/20 ( b ) 29/40 ( c ) 7/40 ( d ) 210/1600

8. Con respecto a los datos del ejercicio 7, la probabilidad de seleccionar al azar un ingeniero
que sea hombre o sea ingeniero civil, pero no ambos, es:
( a ) 11/20 ( b ) 34/40
( c ) 28/40 ( d ) Ninguna de las anteriores

9. Con respecto a los datos del ejercicio 7, la probabilidad condicional de seleccionar al azar
un ingeniero en electrnica dado que sea mujer es:
( a ) 2/7 ( b ) 14/40
( c ) 4/40 ( d ) 8/4

10. Con respecto a los datos del ejercicio 7, al calcular la probabilidad de seleccionar al azar
un ingeniero industrial y la probabilidad de seleccionar un ingeniero que sea hombre, se
concluye que los eventos, ser ingeniero industrial y ser de sexo masculino son:
( a ) mutuamente excluyentes y dependientes
( b ) dependientes pero no mutuamente excluyentes
( c ) mutuamente excluyentes e independientes
( d ) ni mutuamente excluyentes ni dependientes

11. Se sabe que la caja A contiene un sobre con un billete de un dlar y otro sobre con un
billete de $10. La caja B contiene 2 sobres, cada uno con un billete de $10. Se elige
aleatoriamente una caja y de ella se selecciona un sobre. Si en el primer paso se selecciona la

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
205

caja A, la probabilidad de que en el segundo paso se seleccione un sobre con un billete de $10
es:
( a ) 1/2 ( b ) 1/10
(c)1 ( d ) Ninguna de las anteriores

12. Con base en los datos de la pregunta 8, si en el segundo paso se selecciona un sobre con
un billete de $10, la probabilidad de que ese sobre provenga de la caja A es:
( a ) 1/3 ( b ) 1/4
( c ) 1/2 ( d ) Ninguna de las anteriores

13. Un evento que no se puede descomponer en dos o ms eventos se llama:


( a ) evento simple ( b ) espacio muestral
( c ) evento compuesto ( d ) probabilidad

14. Para dos eventos complementarios A y B, es verdadero que:


( a ) 0 P(A) + P(B) 1 ( b ) P(A o B) < 1
( c ) P(A) = 1 + P(B) ( d ) P(A y B) = 1

15. Un ejemplo de la aplicacin del enfoque de probabilidad de frecuencias relativas se da al


determinar:
( a ) La probabilidad de que haya recesin el prximo ao
( b ) La probabilidad de obtener un 6 al lanzar un dado
( c ) La probabilidad de que en un proceso se obtenga una pieza defectuosa
( d ) La probabilidad de ganar el premio mayor de la lotera

16. Al calcular C(n, n) se obtiene:


(a)1 (b)n
(c)0 ( d ) Ninguna de las anteriores

17. La proporcin global de artculos no defectuosos en un proceso de produccin continua es


de 0,80. La probabilidad de obtener al azar dos artculos defectuosos consecutivamente es:
( a ) 0,04 ( b ) 0,64
( c ) 0,96 ( d ) 0,4

18. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola roja no equivale a:
( a ) 1 8/25 7/25 ( b ) 8/25 7/25 1
( c ) 2/5 ( d ) 10/25

19. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y una bola roja despus, en un muestreo sin
reemplazo, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 x 10/24
( c ) 10/25 x 8/25 ( d ) 8/25 + 10/24

20. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y una bola roja despus, en un muestreo con
reemplazo, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 x 10/24
( c ) 10/25 x 8/25 ( d ) Ninguna de las anteriores

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
206

21. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde o una bola roja, equivale a:
( a ) 8/25 x 9/24 ( b ) 8/25 + 10/24
( c ) 10/25 x 8/25 ( d ) 10/25 + 8/25

22. En una caja hay 10 bolas rojas, 8 bolas azules y 7 bolas verdes. La probabilidad de
seleccionar al azar una bola que no sea verde equivale a:
( a ) 2/5 8/25 + 1 ( b ) 17/25 + 1
( c ) 18/25 ( d ) 10/25 + 7/25

23. En una caja hay 10 bolas rojas, 7 bolas azules y 8 bolas verdes. La probabilidad de
seleccionar al azar una bola verde primero y otra bola verde despus, en un muestreo sin
reemplazo, equivale a:
( a ) 8/25 x 8/24 ( b ) 8/25 x 7/24
( c ) 8/25 x 8/25 ( d ) 8/25 + 7/24

24. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que los tres hijos sean varones es de:
( a ) 0,45 ( b ) 0,0911 ( c ) 1,35 ( d ) 0,1664

25. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que tenga dos hijos varones es de:
( a ) 0,45 ( b ) 0,1113 ( c ) 0,3341 ( d ) 1,45

26. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que los dos primeros hijos sean varones es de:
( a ) 0,2025 ( b ) 0,45 ( c ) 0,1135 ( d ) 0,90

27. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que solo tenga un hijo varn es de:
( a ) 0,1361 ( b ) 0,4083 ( c ) 1,55 ( d ) 0,3025

28. Si la probabilidad de que una familia tenga un hijo varn es de 0,45. Si la familia tiene 3
hijos, entonces la probabilidad de que ninguno de los hijos sea varn es de:
( a ) 0,1361 ( b ) 0,1663 ( c ) 1,65 ( d ) 0,55

29. En una caja hay bolas rojas, bolas azules y bolas verdes. La probabilidad de seleccionar al
azar una bola verde primero y una bola roja despus, en un muestreo sin reemplazo, equivale
a:
( a ) P(V) x P(R) ( b ) P(V) x P(R/V)
( c ) P(V) + P(R) ( d ) P(V) x (1 P(R))

30. En una caja hay bolas rojas, bolas azules y bolas verdes. La probabilidad de seleccionar al
azar una bola que sea verde o bola roja, no equivale a:
( a ) P(V) + P(R) P(VR) ( b ) 1 P(A)
( c ) P(V) + P(R) ( d ) P(V) x P(R)

31. Considere la siguiente informacin: En una encuesta aplicada a 700 hogares a nivel
nacional, de los cuales la mitad tienen actualmente acceso al servicio de telefona celular, se

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
207

obtuvieron los siguientes datos: ante la apertura en el mercado de telecomunicaciones, el 68%


los usuarios actuales de telefona celular estara dispuesto a cambiar de operador. Entre la
poblacin que aun no posee celular, solo un 38% optar por el operador actual, mientras que
el resto escoger un nuevo proveedor de servicio. Con base en los datos anteriores, la
probabilidad de seleccionar un hogar al azar de los 700 estudiados que sea un usuario actual
de telefona celular y que desee mantener ese servicio con el proveedor actual es:
( a ) 0,16 ( b ) 0,32 ( c ) 112 ( d ) 0,68

32. Utilizando la misma informacin del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que no sea un usuario actual de telefona celular y que desee
contratar para ese servicio al proveedor actual es:
( a ) 0,38 ( b ) 0,19 ( c ) 0,62 ( d ) 0,31

33. Utilizando la misma informacin del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que no sea un usuario actual de telefona celular es:
( a ) 0,31 ( b ) 0,38 ( c ) 0,62 ( d ) 0,5

34. Utilizando la misma informacin del ejercicio 31, la probabilidad de seleccionar un hogar
al azar de los 700 estudiados que estara no dispuesto a contratar a un nuevo proveedor de
telefona celular distinto del actual es:
( a ) 0,62 ( b ) 0,68 ( c ) 1,3 ( d ) 0,65

35. El 56% de los habitantes del pas se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar a dos personas y que
ambas utilicen internet con regularidad es:
( a ) 0,1936 ( b ) 0,2809 ( c ) 0,3136 ( d ) 1,12

36. El 56% de los habitantes del pas se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar dos hogares, tal que el
primero tenga computadora y el segundo no, es:
( a ) 0,2209 ( b ) 0,2809 ( c ) 0,2491 ( d ) 0,3136

37. El 56% de los habitantes del pas se conectan a internet con regularidad y 53% de los
hogares tienen computadora. La probabilidad de seleccionar al azar un hogar, tal que tenga
computadora o que al menos uno de sus miembros utilice internet con regularidad es:
( a ) 1,09 ( b ) 0,2968 ( c ) 0,06 ( d ) Falta informacin

38. Un ejemplo de la aplicacin del enfoque subjetivo de probabilidad se da al determinar:


( a ) La probabilidad de que internet colapse dentro de 10 aos
( b ) La probabilidad de ganar $10.000 en un casino
( c ) La probabilidad de que en un proceso se obtenga una pieza defectuosa todos los das
( d ) La probabilidad de seleccionar al azar una persona que haya nacido en la misma fecha

39. Un evento que no se puede descomponer en dos o ms eventos se llama:


( a ) evento simple ( b ) espacio muestral
( c ) evento compuesto ( d ) probabilidad

40. Para dos eventos excluyentes A y B, es falso con toda certeza que:
( a ) 0 P(A) + P(B) 1 ( b ) P(A o B) = 1
( c ) P(A) = 1 P(B) ( d ) P(A y B) = 1

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
208

Respuestas a las preguntas de seleccin mltiple:

1. c 2. a 3. c 4. c 5. b
6. c 7. a 8. a 9. a 10. d
11. a 12. a 13. a 14. a 15. c
16. a 17. a 18. b 19. b 20. c
21. d 22. c 23. b 24. b 25. c
26. a 27. b 28. b 29. b 30. d
31. a 32. b 33. d 34. d 35. c
36. c 37. d 38. a 39. a 40. d

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
209

6 .

Distribuciones de probabilidad de
variable discreta
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Calcular la media y la varianza de una distribucin de probabilidad
2. Resolver problemas empleando la distribucin binomial
3. Resolver problemas empleando la distribucin hipergeomtrica
4. Resolver problemas empleando la distribucin de Poisson
5. Resolver problemas empleando la distribucin multinomial
6. Resolver problemas empleando la distribucin geomtrica

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
210

Distribuciones de probabilidad
Para hablar de distribuciones de probabilidad es necesario presentar el concepto de
experimento estadstico.

EXPERIMENTO ESTADSTICO Es un proceso mediante el cual se generan


observaciones aleatorias.

Es decir, en un experimento estadstico se producen observaciones al azar, y generalmente a


esas observaciones se les asigna una descripcin numrica, aunque pueden ser cualitativas, tal
como se expuso en el captulo 1. Por ejemplo, lanzar un dado puede ser un experimento
aleatorio, pues el resultado es producto del azar. Ahora bien, no solo juegos de ese tipo son
experimentos aleatorios, pues tambin podran ser el nmero de piezas defectuosas en un
proceso productivo, el nmero de personas en la fila de una farmacia, el nmero de llamadas
que ingresan en una hora cualquiera en un centro de llamadas, entre muchas otras
posibilidades.

VARIABLE ALEATORIA Cantidad numrica cuyo valor se determina a travs de


un experimento aleatorio.

En otras palabras, las variables aleatorias toman valores al azar en cada caso. Las variables
aleatorias se pueden clasificar de acuerdo con el nmero de valores que pueden asumir:

Variables aleatorias discretas: si se puede contar su conjunto de resultados posibles, por


ejemplo: nmero de artculos defectuosos, nmero de personas en una fila, nmeros de
datos procesados etc.
Variables aleatorias continuas: Cuando la variable aleatoria puede tomar valores en una
escala continua se llama variable aleatoria continua. Por regla general las variables
aleatorias continuas representan datos medidos. Por ejemplo: la velocidad a la que va un
grupo de vehculos, estaturas, longitud, temperaturas, dimetros, espesor, intensidad del
ruido, etc.

Una distribucin de probabilidades permite determinar el valor de la probabilidad para todos y


cada uno de los eventos del espacio muestral. La distribucin de probabilidad puede
expresarse empleando una tabla, un grfico o una funcin algebraica.

Ejemplo Suponga que se lanza al aire una moneda dos veces para ver si cae cara
(evento A) o cruz (evento B). Construya la tabla de la distribucin de
probabilidad.

Solucin En este caso existen 4 resultados posibles, cada uno con las siguientes
probabilidades:

Evento Probabilidad
AA 0,25
AB 0,25
BA 0,25

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
211

BB 0,25
Total 1,00

La tabla anterior es la distribucin de probabilidad para el experimento


lanzar al aire una moneda dos veces.

Ejemplo Suponga que se est efectuando el siguiente juego de dados: el jugador


hace una apuesta y lanza los dos dados. Si la suma de los puntos es 7 u 11,
gana el monto apostado. Pero si sale cualquier otra suma, pierde el monto
apostado. Construya la distribucin de probabilidad para la suma de los
puntos de los dos dados y la distribucin de probabilidad para los
resultados del juego.

Solucin En este caso existen resultados posibles, cada uno con las siguientes
probabilidades:

Evento Sumas Probabilidad


2 1+1 1/12
3 1 + 2, 2 + 1 2/12
4 1 + 3, 2 + 2, 3 + 1 3/12
5 1 + 4, 2 + 3, 3 + 2, 4 + 1 4/12
6 1 + 5, 2 + 4, 3 + 3, 4 + 2, 5 + 1 5/12
7 1 + 6, 2 + 5, 3 + 4, 4 + 3, 5 + 2, 6 + 1 6/12
8 2 + 6, 3 + 5, 4 + 4, 5 + 3, 6 + 2 5/12
9 3 + 6, 4 + 5, 5 + 4, 6 + 3 4/12
10 4 + 6, 5 + 5, 6 + 4 3/12
11 5 + 6, 6 + 5 2/12
12 6+6 1/12
Total - 1,00

La tabla anterior es la distribucin de probabilidad para el experimento


lanzar al aire una moneda dos veces.

Ejercicio En cada uno de los siguientes casos construya la tabla de la distribucin de


frecuencias:
de
revisin 1. Una rifa consta de 100 nmeros a un precio de $20 cada uno. El premio
es de $1000 (premio nico) y el jugador compra un nmero.

2. Una rifa consta de 100 nmeros a un precio de $20 cada uno. El premio
es de $1000 (premio nico) y el jugador compra dos nmeros.

3. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
saca una bola y si la bola es azul se ganan cero puntos, si es verde se gana
un punto y si es roja se ganan dos puntos.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
212

4. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
sacan dos bolas y se suman los puntos sabiendo que si la bola es azul se
ganan cero puntos, si es verde se gana un punto y si es roja se ganan dos
puntos.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen este tema.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Media y varianza de una distribucin de probabilidad


La media de una distribucin de probabilidad es la esperanza matemtica o valor esperado de
la variable aleatoria correspondiente. Si las probabilidades de los valores xi son P(xi)
entonces:

La media es:

E ( X ) xP( x)

Y la varianza es:

2 ( x E ( x)) 2 P( x)

La desviacin estndar es la raz cuadrada de la varianza:

Ejemplo Calcule la media y la desviacin estndar de la demanda semanal de cierto


artculo en una ferretera. Los datos de demanda y su probabilidad de
ocurrencia se dan en la tabla.

Unidades vendidas xi 30 35 40 45 50
Probabilidad P(xi) 0,20 0,28 0,30 0,15 0,07

Solucin La media o valor esperado es:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
213

E ( X ) xi P ( xi )
30 0.2 35 0.28 40 0.30 45 0.15 50 0.07 38.05

Y la varianza es:

2 ( xi ) 2 P( xi ) 0.2(30 38.05) 0.28(35 38.05)


0.30(40 38.05) 0.15(45 38.05) 0.07(50 38.05) 33.95

La desviacin estndar es la raz cuadrada de la varianza:

33.95 5.83

Ejercicio En cada uno de los siguientes casos, a partir de la tabla de la distribucin


de frecuencias, calcule el valor esperado (media) y la desviacin estndar:
de
revisin 1. Una rifa consta de 100 nmeros a un precio de $20 cada uno. El premio
es de $1000 (premio nico) y el jugador compra un nmero.

2. Una rifa consta de 100 nmeros a un precio de $20 cada uno. El premio
es de $1000 (premio nico) y el jugador compra dos nmeros.

3. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
saca una bola y si la bola es azul se ganan cero puntos, si es verde se gana
un punto y si es roja se ganan dos puntos.

4. En una caja hay 10 bolas, 2 son azules, 3 son verdes y 5 son rojas. Se
sacan dos bolas y se suman los puntos sabiendo que si la bola es azul se
ganan cero puntos, si es verde se gana un punto y si es roja se ganan dos
puntos.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Aplicacin rboles de decisin


Un rbol de decisin es una herramienta til para la toma de decisiones. Se
basan en probabilidades y en el concepto de valor esperado. Por ejemplo,
suponga que una empresa puede lanzar un producto nuevo, y que segn
sus estudios de mercado y financieros, puede obtener ganancias segn tres
escenarios diferentes. En un escenario optimista ganaran $200.000, en un
escenario normal ganaran $150.000 y en un escenario pesimista las
ganancias llegaran a $100.000. Los escenarios anteriores tienen
probabilidades de ocurrencia de 0.3, 0.5 y 0.2, respectivamente. La otra
alternativa es seguir con su producto actual, el cual genera ganancias de
$140.000. La empresa no tiene la posibilidad de producir los dos productos
simultneamente. Entonces, puede construirse un rbol de decisin como

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
214

el siguiente:

Optimista
$200.000
0,3

Normal $150.000
Producto 0,5
nuevo
Pesimista
0,2 $100.000

Producto
actual $140.000

La alternativa del producto nuevo tiene un valor esperado de:

200.000 * 0,3 + 150.000 * 0,5 + 100.000 * 0,2 = $155.000

El producto nuevo tiene un rendimiento esperado mayor que el del


producto actual, sin embargo el producto nuevo tiene un nivel de riesgo
mayor.

Los rboles de decisin pueden ser mucho ms complejos, y son tiles en


situaciones en las que se tienen secuencias de decisiones, como sera
indicar una nueva decisin en caso de que se d el escenario pesimista.

Aplicacin Medicin del riesgo


Suponga que usted invierte en un tipo de activo que paga un rendimiento
fijo. Sin duda, esa sera una inversin segura, sin riesgo. Pero si invierte en
un proyecto en el cual se podra ganar mucho, pero tambin con la
posibilidad de perder mucho, entonces esa sera una inversin muy
riesgosa. As, el riesgo puede asociarse con el concepto de variabilidad. En
la medida en la que la variabilidad sea poca, el riesgo es bajo; pero
mientras ms elevada sea la variabilidad, ms riesgosa ser la decisin.

El riesgo puede medirse a travs de la varianza o la desviacin estndar.


Por ejemplo, suponga que se tienen dos inversiones, una con probabilidad
de 60% de ganar $100.000 y 40% probabilidad de perder $50.000. La otra
tiene 50% de probabilidad de ganar $90.000 y otro 50% de probabilidad de
perder $10.000. Podemos calcular el valor esperado para determinar cul
tendra un mayor rendimiento esperado. Para la primera inversin:

E(X) = 100.000 * 0,60 + 50.000 * 0,40 = 40.000

Para la segunda inversin:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
215

E(X) = 90.000 * 0,50 + 10.000 * 0,50 = 40.000

Como se observa, ambas tienen el mismo rendimiento esperado, pero


vamos a calcular la varianza para ver cul es ms riesgosa. Para la primera
inversin:

2 = (100.000 40.000)2 * 0,60 + (50.000 40.000)2 * 0,40


= 5.400.000.000

Para la segunda inversin:

2 = (90.000 40.000)2 * 0,50 + (10.000 40.000)2 * 0,50


= 2.500.000.000

Vemos que la primera inversin tiene una varianza mayor, o sea, es una
inversin ms riesgosa que la segunda.

Distribuciones discretas de probabilidad


Tal como se ha mencionado en captulos anteriores, las variables discretas toman valores que
se obtienen por conteo y cada uno de ellos asumir esos valores con una cierta probabilidad.
Generalmente se emplea una frmula para determinar las probabilidades que cada uno de los
posibles valores de estas variables aleatorias discretas. As, si x representa los posible valores
numricos de la variable, entonces se podra disponer de una funcin f(x) que permita conocer
los valores de cada valor de x. Esa funcin f(x) se definira como la distribucin de
probabilidad de la variable aleatoria discreta en cuestin.

Distribucin binomial
Suponga que un vendedor de un producto sabe que cada cliente que visita puede comprar su
producto, o bien, no comprarlo, por lo que solamente hay dos posibles resultados. Por su
experiencia sabe que el porcentaje de casos en los que logra la venta permanece constante a lo
largo del tiempo y que generalmente cada cliente no tiene contacto con los dems. El
vendedor desea saber la probabilidad de lograr 3 ventas si visita 8 clientes. Una situacin
como esta corresponde a un problema de una distribucin binomial de probabilidad.

Un experimento binomial (o sea, un ejercicio en que se emplea la distribucin binomial) se da


cuando se realiza un experimento aleatorio cuyo resultado es una variable aleatoria discreta y
que cumple con las siguientes suposiciones:

1. Existen solamente dos resultados posibles en cada ensayo, llamados, arbitrariamente,


xitos y fracasos. Por ejemplo, vender y no vender, en el caso mencionado
anteriormente.
2. Existe un nmero fijo n de intentos o ensayos. Por ejemplo, el vendedor visita 8
clientes, es decir, va a realizar 8 intentos de vender su producto.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
216

3. La probabilidad de un xito, representada por p, permanece constante en todos los


intentos. Por ejemplo, suponga que el vendedor logra la venta en el 30% de los casos.
4. Todos los n intentos repetidos son independientes. En el ejemplo se dijo que cada
cliente no tiene contacto con los dems, por lo que cada evento es independiente de los
otros.

Un experimento de este tipo puede resultar en un xito, con una probabilidad de p, o en un


fracaso, con una probabilidad de q = 1 p. Entonces, la distribucin de probabilidad de la
variable aleatoria X es:

P( X ) C (n, x) p x q n x para x = 0, 1, 2, , n

Donde X es el nmero establecido de xitos, n el nmero de ensayos u observaciones, p la


probabilidad de xito y q la probabilidad de fracaso (q = 1 p).

La expresin C(n, x) es conocida como coeficiente binomial y equivale a:

n!
C (n, x)
x !( n x ) !

Entonces, la frmula de la distribucin binomial puede ser escrita como:

n!
P( X ) C (n, x) p x q n x p x q n x
x !( n x ) !

Para la distribucin binomial, su media y su desviacin estndar corresponden a:

= np

npq

Ejemplo Un vendedor de un producto sabe, por su experiencia, que logra la venta en el


30% de los clientes que visita, porcentaje que ha permanecido constante a lo
largo del tiempo. Cada cliente no tiene contacto con los dems. El vendedor
desea saber la probabilidad de que si visita 8 clientes,

a) logre vender en exactamente 3 casos.


b) logre vender en por lo menos 3 casos.
c) logre vender en menos de 6 casos.
d) no logre vender en a lo ms 5 casos.
e) no logre en ms de 7 casos.

Solucin a) Se tiene que se realizan 8 intentos de vender el producto, por lo que se tiene
que n = 8. Adems, se desea saber la probabilidad de lograr 3 ventas, o sea
que x = 3.

En este caso se define xito como lograr la venta, por tanto p = 0,30.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
217

La probabilidad de fracaso es q = 1 p = 1 0,30 = 0,70.

As, sustituyendo en la frmula de probabilidad:

8!
P( X 3) (0,30) 3 (0,70) 83 0.2541
3!(8 3) !

b) En este caso se requiere que x 3, lo que significa que nos interesa que 3 o
ms clientes compren el producto, por lo que buscamos:

P( x 3) P( X 3) P( X 4) P( X 5) P( X 6) P( X 7) P( X 8)

Esto implicara emplear la frmula anterior 6 veces y luego sumar los


resultados. Una opcin que lleva un poco menos de trabajo es calcular lo que
no nos interesa, o sea que 0 clientes, o 1 cliente o 2 clientes compren el
producto, y luego restar esos valores de uno, que es la probabilidad total. O
sea, se puede recurrir a la regla de la complementacin para encontrar la
probabilidad de x 3:

P( x 3) 1 P( X 0) P( X 1) P( X 2)

Aplicando la frmula o la tabla de probabilidades binomiales, se tiene:

P(x 3) = 1 0,0576 0,1977 0,2965 = 0,4482

c) En este caso se requiere que x < 6, es decir, nos interesa la probabilidad de


que de 0 a 5 clientes compren el producto:

P(x < 6) = P(x 5)

Obsrvese que no se incluye al 6 mismo, pues se indica menos de 6, as se


calculan las probabilidades para los valores entre 0 y 5:

P(x 5) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4) + P(x = 5)

= 0,0576 + 0,1977 + 0,2965 + 0,2541 + 0,1361 + 0,0468 = 0.9887

d) Se desea determinar la probabilidad de que a lo ms 5 clientes no realicen


la compra. Aqu se considera xito no lograr la venta, as que p = 0,70 y q =
0,30. Entonces, se debe calcular:

P(x 5) = P(x = 0) + P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4) + P(x = 5)

= 0,0001 + 0,0012 + 0,0100 + 0,0467 + 0,1361 + 0,2541

= 0,4482

e) Se desea determinar la probabilidad de que ms de 7 clientes no compren el


producto (p = 0,70). Es decir, solo interesa que x = 8:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
218

P(x = 8) = 0,0576

Ejemplo Se sabe que la probabilidad de que un cierto tipo de calentador falle ante
un sobrecalentamiento es de 15%, calcule la probabilidad de que entre 6 de
tales calentadores:

a) fallen entre 2 y 4
b) no fallen como mximo 3

Solucin a) Se tiene que n = 6 y que xito es fallar, as que p = 0,15 y q = 0,85:

P(2 X 5) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5)

Se calcula cada una por separado:

P(X = 2) = C(6, 2) (0,15)2 (0,85)6 2 = 0,1762


P(X = 3) = C(6, 3) (0,15)3 (0,85)6 3 = 0,0415
P(X = 4) = C(6, 4) (0,15)4 (0,85)6 4 = 0,0055
P(X = 5) = C(6, 5) (0,15)5 (0,85)6 5 = 0,0004

Entonces se suman los resultados anteriores:

= 0,1762 + 0,0415 + 0,0055 + 0,0004

= 0,2235

b) Si xito es no fallar, entonces p = 0,85 y q = 0,15:

P(X 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)

Se calcula cada una por separado:

P(X = 0) = C(6, 0) (0,85)0 (0,85)6 0 = 0,0000


P(X = 1) = C(6, 1) (0,85)1 (0,85)6 1 = 0,0004
P(X = 2) = C(6, 2) (0,85)2 (0,85)6 2 = 0,0055
P(X = 3) = C(6, 3) (0,85)3 (0,85)6 3 = 0,0415

Entonces se suman los resultados anteriores:

= 0,0000 + 0,0004 + 0,0055 + 0,0415

= 0,0473

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
219

Ejercicio Segn un estudio aproximadamente tres de cada diez computadoras


porttiles falla en un plazo de 3 aos o menos. De una muestra de 10
de computadoras porttiles calcule la probabilidad de que, en tres aos o
revisin menos:

a. Fallen exactamente 4 computadoras.


b. Fallen menos de 3 computadoras.
c. Fallen como mnimo 8 computadoras.
d. No fallen a lo sumo 7 computadoras.
e. No fallen entre 3 y 5 computadoras.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen la distribucin
binomial.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Uso de Excel y Minitab para la distribucin binomial

Ejemplo Segn un estudio, de las muertes de motociclistas en el 2005, el 42% no


tenan el casco puesto en el accidente. Calcule, usando Excel y Minitab, la
probabilidad de que de una muestra de 12 accidentes ocurridos ese ao y
seleccionados aleatoriamente:

a. En exactamente 5 de ellos el motociclista no tena puesto el


casco en el accidente.
b. En menos de 5 de ellos el motociclista no tena puesto el casco
en el accidente.

Solucin Se tiene que n = 12, el xito es que no llevara el casco, entonces p = 0,42 y
q = 0,58.

a. Lo que se desea calcular es:

P(X = 5) =

Entonces, en Excel se emplea la funcin DISTR.BINOM, cuya sintaxis es:

=DISTR.BINOM(nm_xito;ensayos;prob_xito;acumulado)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
220

As en este caso, se completa la funcin en la celda en la que se desea el


resultado como:

=DISTR.BINOM(5;12;0,42;0)

Se indic acumulado como 0, para calcular el valor exacto y no el


acumulado. El resultado es 0,2285.

b. Lo que se desea calcular es:

P(X < 5) = P(X 4)

Entonces, en Excel se emplea la funcin DISTR.BINOM, cuya sintaxis es:

=DISTR.BINOM(nm_xito;ensayos;prob_xito;acumulado)

As en este caso, se completa la funcin en la celda en la que se desea el


resultado como:

=DISTR.BINOM(4;12;0,42;1)

Se indic acumulado como 1, para calcular el valor acumulado. El


resultado es 0,3825.

En Minitab, se tiene los mismos datos, o sea, que n = 12, el xito es que
no llevara el casco, entonces p = 0,42 y q = 0,58.

a. Lo que se desea calcular es:

P(X = 5) =

Entonces, se da clic en el men Calc, luego en Distribuciones de


probabilidad, y ah se elige Binomial. Se completa el cuadro de dilogo:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
221

Se selecciona probabilidad para que calcule el valor exacto del nmero de


eventos. El nmero de ensayos es n y la probabilidad del evento es p. El
nmero establecido de xitos se puede dar como una columna, y en ese
caso de debe elegir columna de entrada, o se puede digitar en el cuadro, en
cuyo caso es constante de entrada, que es lo que se muestra en la
ilustracin anterior. Luego se da clic en Aceptar y se obtiene el resultado
0,2285 en la ventana Sesin.

b. Lo que se desea calcular es:

P(X < 5) = P(X 4)

Entonces, se da clic en el men Calc, luego en Distribuciones de


probabilidad, y ah se elige Binomial. Se completa el cuadro de dilogo:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
222

Se selecciona probabilidad acumulada para que calcule el valor acumulado


desde x = 0 hasta el nmero establecido de xitos. El nmero de ensayos es
n y la probabilidad del evento es p. El nmero establecido de xitos se
puede dar como una columna, y en ese caso de debe elegir columna de
entrada, o se puede digitar en el cuadro, en cuyo caso es constante de
entrada, que es lo que se muestra en la ilustracin anterior. Luego se da
clic en Aceptar y se obtiene el resultado 0,3825 en la ventana Sesin.

Tambin, se puede hacer uso del men Grfica, donde se selecciona


Grfica de distribucin de probabilidad. En el cuadro de dilogo se
selecciona la opcin que dice Ver probabilidad.

En el cuadro de dilogo se selecciona en la lista la distribucin binomial y


se introduce el dato del nmero de ensayos y la probabilidad de xito:

Posteriormente se da clic en la pestaa rea sombreada. Aqu se elige


definir el rea sombreada por valor X y como en este caso se desea saber la
probabilidad de que x = 4, entonces se selecciona Cola izquierda y se
escribe el valor de x en el espacio que aparece:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
223

Al dar clic en Aceptar, Minitab crea un grfico que indica el valor de la


probabilidad:

Grfica de distribucin
Binomial. n=12. p=0,42
0,25

0,20
Probabilidad

0,15

0,10

0,3825
0,05

0,00
4 10
X

Distribucin hipergeomtrica
Suponga que se tiene un lote de 50 telfonos celulares y se sabe que 4 de ellos se daaron
durante el embarque. Se va a tomar una muestra sin reemplazo de 10 de estos aparatos y se
desea saber la probabilidad de que uno de ellos est defectuoso. Para esto se realizar un
muestreo sin reemplazo, por lo que los eventos en este caso no son independientes, y por
tanto, no se puede emplear la distribucin binomial. En un caso como este se emplea la
distribucin hipergeomtrica.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
224

La distribucin hipergeomtrica se utiliza en situaciones similares a los casos en que se


emplea la distribucin binomial, pero la diferencia principal es que en la binomial los eventos
deben ser independientes, mientras que en la hipergeomtrica no son independientes.
Entonces, si, como en el ejemplo, se realiza un muestreo de un lote, para aplicar la binomial
debe hacerse un muestreo con reemplazo para obtener la independencia, y de ese modo se
mantendr constante la probabilidad de xito. Pero si el muestreo se hace sin reemplazo, los
eventos no son independientes y la probabilidad no es constante.

La distribucin de probabilidad de la variable aleatoria hipergeomtrica es:

C ( N a, n X ) C ( a, X )
P ( X / N , a, n) para x = 0, 1, ... , n
C ( N , n)

Donde X es el nmero establecido de xitos, N el nmero total de elementos en la poblacin, a


es el nmero total de xitos incluidos en la poblacin y n el nmero de elementos de la
muestra.

Ejemplo Se tiene un lote de 50 telfonos celulares y se sabe que 4 de ellos se


daaron durante el embarque. Se va a tomar una muestra sin reemplazo de
10 de estos aparatos y se desea saber la probabilidad de que:

a) Exactamente un telfono salga defectuoso.


b) Por lo menos dos telfonos salgan defectuosos.
c) Como mnimo 7 telfonos salgan buenas.

Solucin a) En este caso xito es que un telfono salga defectuoso, por tanto se
tienen 4 xitos en la poblacin, o sea, a = 4 defectuosos, N = 50 y n = 10, y
se busca la probabilidad de que en la muestra haya uno defectuoso, es
decir, x = 1, por tanto:

C ( N a, n X ) C ( a, X )
P ( X / N , a, n)
C ( N , n)

C 50 4,10 1C 4,1 C 46, 9C 4,1


P( X 1)
C 50,10 C 50,10
1101716330 4
0,4290
10272278170

b) La probabilidad de que por lo menos dos telfonos salgan defectuosos


se puede calcular como:

P(X 2) = P(X = 2) + P(X = 3) + ... + P(X = 10)

Lo anterior lleva aplicar la frmula de la distribucin hipergeomtrica 9


veces, por lo que es ms rpido calcular del modo siguiente, usando el
principio de complementariedad:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
225

P( X 2) 1 P( X 0) P( X 1)
C 50 4,10 0C 4, 0 C 50 4,10 1C 4,1
1
C 50,10 C 50,10
1 0,3968 0,4290 0,1742

c) Se define xito como que un telfono salga bueno, as que a = 46


buenos, por tanto:

P( X 7buenos ) P( x 7) P( x 8) P( x 9) P( x 10)

C 50 46,10 7 C 46,7 C 4,3C 46,7


P ( x 7) 0,0208
C 50,10 C 50,10
C 50 46,10 8C 46,8 C 4,2 C 46,2
P( x 8) 0,1524
C 50,10 C 50,10
C 50 46,10 9 C 46,9 C 4,1C 46,9
P ( x 9) 0,4290
C 50,10 C 50,10
C 50 46,10 10 C 46,10 C 4,0 C 46,10
P( x 10) 0,3968
C 50,10 C 50,10

P( x 7) 0,0208 0,1524 0,4290 0,3968 0,9991

Ejemplo Para evaluar la calidad de los materiales de construccin comprados, el


departamento de compras realiza muestreos con cierta frecuencia. Hay un
material que se recibe en lotes de 30 unidades. Frecuentemente cada lote
tiene 2 unidades con defectos. Aleatoriamente se seleccionan muestras sin
reemplazo de 4 unidades y se rechaza el lote completo si se encuentra una
o ms unidades defectuosas. Determine la probabilidad de aceptacin del
lote.

Solucin Dado que se realiza un muestreo sin reemplazo, entonces corresponde a un


experimento hipergeomtrico.

En la poblacin hay 2 defectuosos, o sea, se tiene que a = 3, el tamao de


la poblacin es 30, N = 30 y se toma una muestra de tamao 4, n = 4.

Para que el lote sea aceptado, en la muestra debe haber cero defectuosos, o
sea, x = 0, por lo tanto la probabilidad de aceptacin del lote corresponde a
P(x = 0):

C ( N a, n X ) C ( a, X )
P ( X / N , a, n)
C ( N , n)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
226

C 30 2,4 0C 2, 0 20475 1
P( X 0) 0,7471
C 30,4 27405

Ejercicio Si de un lote de 200 comprimidos de un medicamento se sabe que hay 10


que no satisfacen las especificaciones. Si se toma una muestra de 9 de esos
de comprimidos, determine la probabilidad de que:
revisin
a. Exactamente 2 de ellos no satisfagan las especificaciones.
b. A lo sumo 2 no satisfagan las especificaciones.
c. Al menos 8 satisfagan las especificaciones.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen la distribucin
hipergeomtrica.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

La distribucin binomial puede ser usada como aproximacin de la distribucin


hipergeomtrica cuando el tamao de la muestra es como mximo un dcimo del tamao de la
poblacin (n N/10).

Ejemplo Se sabe que en un lote de 70 comprimidos para la fiebre hay 8 que no


satisfacen las especificaciones solicitadas. Calcule la probabilidad de que
en una muestra de 5 de esos comprimidos haya exactamente 2
comprimidos que no satisfagan la especificacin:

a) usando la frmula de la distribucin hipergeomtrica ,


b) usando la binomial como aproximacin y compare los valores.

Solucin a) Se considera xito si un comprimido no satisface la especificacin, por


lo que a = 8, N = 70 y n = 5:

C 70 8, 5 2C 8, 2
P( X 2) 0,0875
C 70, 5

b) Se puede resolver usando la binomial como aproximacin porque N/10


= 70/10 = 7 > n. Con una poblacin de tamao 70, n puede llegar a valer
hasta 7 y se puede seguir usando la aproximacin por la binomial.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
227

Para usar la binomial se necesita tener la probabilidad poblacional p:

p = a/N = 8/70 = 0,11

Aplicando la frmula de la binomial con n = 5 y p = 0,11 se obtiene:

P( X 2) C (5,2)(0,11) 2 (0,89) 52 0,0853

La diferencia entre el valor real y el valor aproximado es apenas de:

0,0875 0,0853 = 0,0022

Uso de Excel y Minitab para la distribucin hipergeomtrica

Ejemplo En un lote de 200 frascos de un medicamento se sabe que 8 frascos no


satisfacen las especificaciones de calidad establecidas para dicho frmaco.
Calcule, usando Excel y Minitab, la probabilidad de que de una muestra
aleatoria de 12 frascos exactamente 3 de ellos no satisfagan las
especificaciones.

Solucin Se tiene que una poblacin N = 200 frascos, a = 8 xitos (el xito sera que no
satisfaga la especificacin), una muestra n = 12 frascos, y se pregunta la
probabilidad de que 3 no satisfagan la especificacin, o sea, que lo que se
desea calcular es:

P(X = 3) =

Entonces, en Excel se emplea la funcin DISTR.HIPERGEOM, cuya sintaxis


es:

=DISTR.BINOM(muestra_xito;nm_de_muestra;poblacin_xito;nm_de_p
oblacin)

Los argumentos de la funcin anterior son:

muestra_xito: nmero establecido de xitos (x)


nm_de_muestra: tamao de muestra (n)
poblacin_xito: nmero de xitos en la poblacin (a)
nm_de_poblacin: tamao de la poblacin (N)

As en este caso, se completa la funcin en la celda en la que se desea el


resultado como:

=DISTR.HIPERGEOM(3;12;8;200)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
228

El resultado es 0,0074.

En Minitab, se tiene los mismos datos, una poblacin N = 200 frascos, a = 8


xitos (el xito sera que no satisfaga la especificacin), una muestra n = 12
frascos, y se pregunta la probabilidad de que 3 no satisfagan la especificacin,
o sea, que lo que se desea calcular es:

P(X = 3) =

Entonces, se da clic en el men Calc, luego en Distribuciones de probabilidad,


y ah se elige Hipergeomtrica. Se completa el cuadro de dilogo:

Se selecciona probabilidad para que calcule el valor exacto del nmero de


eventos y se completan los datos tal como se muestra en la imagen. Luego se
da clic en Aceptar y se obtiene el resultado 0,0074 en la ventana Sesin.

Tambin, se puede hacer uso del men Grfica, donde se selecciona Grfica
de distribucin de probabilidad. En el cuadro de dilogo se selecciona la
opcin que dice Ver probabilidad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
229

En el cuadro de dilogo se selecciona en la lista la distribucin


hipergeomtrica y se introduce el dato del tamao de poblacin, del nmero
de xitos en la poblacin y del tamao de la muestra:

Posteriormente se da clic en la pestaa rea sombreada. Aqu se elige definir


el rea sombreada por valor X y como en este caso se desea saber la
probabilidad de que x = 3, entonces se selecciona Centro y se escribe el valor
de x en los dos espacios que aparecen:

Al dar clic en Aceptar, Minitab crea un grfico que indica el valor de la


probabilidad:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
230

Grfica de distribucin
Hipergeomtrico. N=200. M=8. n=12

0,6

0,5

0,4
Probabilidad

0,3

0,2

0,1

0,007406
0,0
0 3
X

Distribucin de Poisson
A una oficina de un banco llegan, en promedio, 3 clientes por hora a solicitar un crdito. Eso
quiere decir, que en una hora cualquiera, regularmente llegar una cantidad de clientes
cercana a 3. Bajo la capacidad actual, se ha determinado que se puede atender ptimamente
hasta un mximo de 5 clientes por hora, por lo que se desea determinar la probabilidad de que
en una hora cualquiera lleguen ms de 5 clientes. Un problema de este tipo, en el que se desea
calcular la probabilidad de que ocurra determinada cantidad de eventos en un intervalo
continuo de tiempo, rea o volumen, se puede resolver empleando la distribucin de Poisson.

As, la distribucin de probabilidad de la variable aleatoria discreta de Poisson permite


determinar la probabilidad del nmero de eventos que ocurren en un intervalo de tiempo dado
o en un rea o volumen especfico. Esta probabilidad se obtiene por medio de:

x e
P( X / ) para x = 0, 1, 2, ...
X!

Donde X es el nmero establecido de xitos, es la media y e es la constante 2.7183


(aproximadamente).

Ejemplo A una oficina de un banco llegan, en promedio, 3 clientes por hora a


solicitar un crdito. Calcule la probabilidad de que:

a) en una hora aleatoriamente seleccionada lleguen exactamente 5 clientes.


b) en una hora aleatoriamente seleccionada lleguen 5 o ms clientes.
c) en 5 horas de comportamiento similar lleguen entre 14 y 17 clientes.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
231

Solucin a) Se tiene que la llegada de clientes al banco es de 3 por hora en


promedio, por lo que = 3 clientes/hora, entonces la probabilidad de que
lleguen exactamente 5 clientes es:

x e
35 e 3
P( X 5) 0,1008
X! 5!

b) Se sabe que la tasa de llegada de clientes al banco es de 3 por hora en


promedio, por lo que = 3 clientes/hora, entonces la probabilidad de que
lleguen ms de 5 clientes es:

P(X 5) = P(X = 5) + P(X = 6) + P(X = 7) + P(X = 8) + P(X = 9) + ...

Para calcular este resultado es mejor determinar la probabilidad


complementaria:

P(X 5) = 1 P(X < 5)

P(X 5) = 1 P(X = 0) P(X = 1) P(X = 2) P(X = 3) P(X = 4)

Entonces se calcula cada probabilidad por separado:

x e 30 e 3
P( X 0) 0,0498
X! 0!
x e
31 e 3
P( X 1) 01494
X! 1!
x e 3 2 e 3
P ( X 2) 0,2240
X! 2!
x e 33 e 3
P( X 3) 02240
X! 3!
x e 3 4 e 3
P ( X 4) 0,1680
X! 4!

Luego se resta cada resultado de uno:

P(X 5) = 1 0,0498 0,1494 0,2240 0,2240 0,1680 = 0,1847

c) Aqu el perodo de inters es de 5 horas, por lo que = 5 3 = 15


clientes/perodo de 5 horas, entonces se calcula la probabilidad de que
lleguen entre 14 y 17 clientes:

P(14 x 17) = P(X = 14) + P(X = 15) + P(X = 16) + P(X = 17)

= 0,1024 + 0,1024 + 0,0960 + 0,0847 = 0,3856

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
232

Ejercicio Un promedio de 15 personas por hora ingresa un parque zoolgico. Si se


selecciona una hora cualquiera, calcule la probabilidad de que:
de
revisin a. Ingresen entre 12 y 15 personas.
b. Ingresen menos de 8 personas.
c. Ingresen ms de 10 personas.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen la distribucin
Poisson.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Uso de Excel y Minitab para la distribucin de Poisson

Ejemplo A una clnica llega un promedio de 5 pacientes cada hora. Calcule, usando
Excel y Minitab, la probabilidad de que en una hora seleccionada en forma
aleatoria lleguen exactamente 3 pacientes.

Solucin Se tiene que una media de 5 pacientes por hora y se pregunta la


probabilidad de que lleguen 3 por hora, o sea, que lo que se desea calcular
es:

P(X = 3) =

Entonces, en Excel se emplea la funcin POISSON, cuya sintaxis es:

=POISSON(x;media;acumulado)

Los argumentos de la funcin anterior son:

x: nmero establecido de xitos (x)


media: promedio ()
acumulado: 0 si no es acumulado o 1 si es acumulado

As en este caso, se completa la funcin en la celda en la que se desea el


resultado como:

=POISSON(3;5;0)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
233

El resultado es 0,1404.

En Minitab, con base en los datos dados, una media de 5 pacientes por
hora y se pregunta la probabilidad de que lleguen 3 por hora, o sea, que lo
que se desea calcular es:

P(X = 3) =

Entonces, se da clic en el men Calc, luego en Distribuciones de


probabilidad, y ah se elige Poisson. Se completa el cuadro de dilogo:

Se selecciona probabilidad para que calcule el valor exacto del nmero de


eventos y se completan los datos tal como se muestra en la imagen. Luego
se da clic en Aceptar y se obtiene el resultado 0,1404 en la ventana Sesin.

Tambin, se puede hacer uso del men Grfica, donde se selecciona


Grfica de distribucin de probabilidad. En el cuadro de dilogo se
selecciona la opcin que dice Ver probabilidad.

En el cuadro de dilogo se selecciona en la lista la distribucin Poisson y


se introduce el dato de la media:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
234

Posteriormente se da clic en la pestaa rea sombreada. Aqu se elige


definir el rea sombreada por valor X y como en este caso se desea saber la
probabilidad de que x = 3, entonces se selecciona Centro y se escribe el
valor de x en los dos espacios que aparecen:

Al dar clic en Aceptar, Minitab crea un grfico que indica el valor de la


probabilidad:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
235

Grfica de distribucin
Poisson. Media=5
0,20

0,15 0,1404

Probabilidad
0,10

0,05

0,00
0 3 13
X

Aproximacin de la distribucin de Poisson a la binomial


Bajo ciertas condiciones hay distribuciones de probabilidad que tienden a ofrecer resultados
muy similares, por lo que es posible utilizar una de ellas para aproximar resultados de la otra.
Esto ocurre entre la distribucin de Poisson y la distribucin binomial.

Cuando el tamao de muestra n es relativamente grande y la probabilidad de xito p es


pequea, entonces las probabilidades binomiales pueden aproximar por medio de la
distribucin de Poisson. Generalmente esta aproximacin se utiliza si n > 20 y p < 0,05.
Tambin se considera como una buena regla si n 30, np < 5 y nq < 5. Si n > 100, la
aproximacin es excelente, siempre que np < 10.

Ejemplo En un proceso de manufactura de papel se encuentra un defecto por cada


1.000 metros producidos. Calcule la probabilidad de que en una muestra
aleatoria de 10.000 metros de papel se encuentren 8 defectos.

Solucin Tal como se presenta, este es esencialmente un problema de la distribucin


binomial, en el cual se tiene una muestra n = 10.000 metros de papel y la
probabilidad de xito (metro de papel con defectos) es p = 1/1000 = 0,001.

Debido a que n > 20, que p 0,05 y np = 10.000 0,001 = 10 10 se


puede usar la aproximacin por la Poisson.

Entonces se determina la media = np = 10.000 0,001 = 10, entonces:

x e 10 8 e 10
P(x = 8) = 0,112599
X! 8!

Si este problema se hubiera resuelto empleando la distribucin binomial,


se tendra n = 10.000, con p = 1/1000 = 0,001, q = 1 0,001 = 0,999,

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
236

entonces:

P(x = 8) = C(10.000, 8) (0,001)8 (0,999)1000 8 = 0,112622

Se observa claramente que los resultados son sumamente prximos.

Para la distribucin de Poisson se cumple que el valor esperado de la distribucin es igual a la


media , y que a su vez este valor equivale a la varianza de esta distribucin de probabilidad,
es decir:

E(X) = V(X) = = 2

Ejemplo En la tabla se da la distribucin de probabilidad del nmero de delfines (x)


que se encuentran por cada cierta rea de mar luego de un derrame de
petrleo de un barco. Si se sabe que esta variable sigue una distribucin de
Poisson, muestre que:

= 2

X 0 1 2 3 4 5 6
P(x) 0,2465 0,3452 0,2417 0,1128 0,0395 0,0111 0,0032

Solucin Con base en los datos de la tabla se obtiene primero el valor esperado:

E(x) = 0 * 0,2465 + 1 * 0,3452 + 2 * 0,2417 + 3 * 0,1128 + 4 * 0,0395


+ 5 * 0,0111 + 6 * 0,0032 = 1,39

Luego se calcula la varianza:

2 = (x E(x))2 P(x) = (0 1,3997)2 * 0,2465 + ... + (6 1,3997)2 *


0,0032

= 1,39

Por lo que queda claro que si = 1,39, entonces 2 = 1,39. Queda


comprobado que = 2.

Aplicacin Seguros
Cuando una persona desea adquirir un seguro es porque desea contar con
una compensacin ante la eventualidad de que se materialice determinado
riesgo, o sea, que se presente un evento desfavorable que le genere alguna
necesidad econmica. Cuando la persona adquiere el seguro, la compaa
de seguros se compromete a pagar la compensacin prometida. Para que

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
237

una empresa est anuente a participar en este tipo de negocio debe ser
capaz de medir el tipo de riesgo que est asegurando y para ello es
necesario emplear distribuciones de probabilidad. As, la teora del riesgo
analiza esos posibles eventos y permite a la aseguradora determinar
cuntas reservas debe mantener y cunto riesgo aceptar en su cartera.

Por ejemplo, cuando una aseguradora conoce cul podra ser el nmero
mximo de siniestros posibles, puede emplear la distribucin binomial
para determinar la probabilidad de que tenga que pagar una determinada
cantidad de reclamaciones. Cuando no conoce cul podra ser el mximo
de posibles siniestros, entonces podra utilizar la distribucin de Poisson,
la cual se aproxima a la binomial conforme n tiende a infinito, para
determinar el nmero esperado de reclamaciones o las probabilidades de
que se den ciertas cantidades de siniestros.

Distribucin multinomial
Los audfonos fabricados por una empresa son sometidos a un control de calidad en el cual se
clasifican como perfectos, con defectos secundarios o con defectos mayores. Generalmente el
85% de los audfonos se clasifican como perfectos, el 10% con defectos secundarios y un 5%
con defectos mayores. En una muestra de 8 audfonos se quiere saber la probabilidad de que
haya 5 perfectos, 2 con defectos secundarios y uno con defectos mayores. Esta situacin es
similar en todo a un problema binomial, excepto que hay tres resultados posibles y no dos. En
estos casos se emplea la distribucin multinomial.

Cuando un experimento binomial tiene ms de dos resultados posibles, y no solo dos


resultados posibles, se convierte en un experimento multinomial. Se tiene, por ejemplo, la
clasificacin de calidad de la situacin de la fabricacin de audfonos, en la cual estos
artculos se clasifican como perfectos, con defectos secundarios o con defectos mayores. Cada
uno de los eventos es independiente y sus probabilidades se mantienen constantes al realizar
los muestreos con reemplazo.

En general, si un ensayo puede resultar en cualquiera de k posibilidades E1, E2, ... , Ek, con
probabilidades p1, p2, ... , pk, entonces la distribucin multinomial dar la probabilidad de que
E1 ocurra x1 veces, de que E2 ocurra x2 veces, ... , y de que Ek ocurra xk veces, en n intentos
independientes.

La distribucin multinomial es:

n!
P( x1 , x2 ,..., xk )
x x x
p1 1 p 2 2 ... p k k
x1 ! x2 ! ... xk !

Donde:

n = x1 + x2 + ... + xk

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
238

Ejemplo Los audfonos fabricados por una empresa son sometidos a un control de
calidad en el cual se clasifican como perfectos, con defectos secundarios o
con defectos mayores. Generalmente el 85% de los audfonos se clasifican
como perfectos, el 10% con defectos secundarios y un 5% con defectos
mayores. En una muestra de 8 audfonos se quiere saber la probabilidad de
que haya 5 perfectos, 2 con defectos secundarios y uno con defectos
mayores.

Solucin Primeramente se plantean los datos del problema:

Perfectos: p1 = 0,85
Con defectos secundarios: p2 = 0,10
Con defectos mayores: p3 = 0,05

Se tiene que x1 = 5, x2 = 2 y que x3 = 1, por lo que n = 5 + 2+ 1 = 8.


Entonces, se sustituye en la frmula:

8!
P( x1 = 5, x2 2, x3 1) (0,85) 5 (0,10) 2 (0,05)1 0,0372
5! 2! 1!

Ejemplo En una encuesta de intencin de voto se obtuvo que el candidato A


obtendra el 35% de los votos, el candidato C el 45% y el candidato B el
restante 20%.

Si se toma una muestra de 10 personas, cul es la probabilidad de que la


mitad deseen votar por el candidato A, dos quintas partes por el candidato
B y el resto por C?

Solucin Primeramente se plantean los datos del problema:

Candidato A: p1 = P(A) = 0,35


Candidato B: p2 = P(B) = 0,20
Candidato C: p3 = P(C) = 0,45

Se tiene que x1 = 5, x2 = 4 y que x3 = 1, por lo que n = 5 + 4+ 1 = 10.


Entonces, se sustituye en la frmula:

10!
P( x1 = 5, x2 4, x3 1) (0,35) 5 (0,20) 4 (0,45)1 0,0048
5! 4! 1!

Ejercicio Un equipo de futbol gana el 40% de los partidos que juega, empata el 25%
y pierde el resto de los encuentros. Suponiendo que se mantienen estas
de proporciones, calcule la probabilidad de que en los prximos 6 partidos:
revisin

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
239

a. Gane 3 veces, empate 2 y pierda 1 juego.


b. Gane o empate 4 partidos y pierda los otros dos.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen la distribucin
multinomial, adems de una plantilla de
Excel para su clculo y una macro para
Excel.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Distribucin geomtrica
Una empresa de televisin por cable pone a disposicin de sus clientes un nmero telefnico
para proveer soporte en caso de que haya problemas con el servicio. Sin embargo la central
telefnica pasa ocupada el 90% del tiempo, por lo que los clientes deben hacer ms de intento
para que su llamada sea contestada. Cul es la probabilidad de que la llamada de un cliente
sea contestada en su tercer intento? Un problema de este tipo satisface todas las condiciones
de la distribucin binomial, excepto que no hay un nmero fijo de intentos, por lo que es un
problema que se resuelve empleando la distribucin geomtrica.

Entonces, si en una sucesin de pruebas o ensayos se desea saber la probabilidad del nmero
de la prueba en que ocurre el primer xito, y si adems se cumplen todas las dems
condiciones de la distribucin binomial, o sea que existen solamente dos resultados posibles
en cada ensayo (xitos y fracasos), la probabilidad de un xito, representada por p permanece
constante en todos los intentos, y todos los n intentos repetidos son independientes. En
resumen, se cumplen las mismas suposiciones fundamentales de la distribucin binomial,
excepto que n no es fijo.

De ese modo, si en pruebas independientes repetidas puede resultar un xito con una
probabilidad p y en un fracaso con una probabilidad q = 1 p, entonces la distribucin de
probabilidad de la variable aleatoria X, el nmero de la prueba en la cual ocurre el primer
xito es la distribucin geomtrica:

P( x, p) p(1 p) x1 para x = 1, 2, 3, ...

La media de esta distribucin es = 1/p

Ejemplo Una empresa de televisin por cable pone a disposicin de sus clientes un
nmero telefnico para proveer soporte en caso de que haya problemas con
el servicio. Sin embargo la central telefnica pasa ocupada el 90% del

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
240

tiempo, por lo que los clientes deben hacer ms de intento para que su
llamada sea contestada. Cul es la probabilidad de que la llamada de un
cliente sea contestada en su tercer intento?

Solucin En este problema se busca la probabilidad de que la llamada ingrese, pero


si la central telefnica pasa ocupada el 90% del tiempo, esta probabilidad
es de solo 10%. Esa es la probabilidad de xito p = 0,10.

Sustituyendo en la frmula de la distribucin geomtrica:

P( x 3) 0,10(1 0,10) 31 0,10(0,90) 2 0,081

Observe, apoyndose en el ejemplo anterior, la diferencia entre la distribucin binomial y la


geomtrica. Si este problema hubiera dicho que va a hacer 5 llamadas y se va a calcular la
probabilidad de que entren 3 llamadas, entonces sera un problema de distribucin binomial.
Pero el problema no plantea un nmero de intentos determinado, solo desea saberse la
probabilidad de que en el tercer intento entre la llamada, por lo que corresponde a la
distribucin geomtrica.

Ejemplo En un establecimiento de produccin de lana se sabe que el 40% de los


animales poseen algn tipo de lunar que produce fibras pigmentadas, las
cuales reducen el valor del producto. Si se empiezan a examinar los
animales, cul es la probabilidad de que la quinta oveja inspeccionada sea
la primera en poseer algn tipo de lunar que produzca fibras pigmentadas?

Solucin Si la primera oveja que posee algn tipo de lunar que produzca fibras
pigmentadas es la quinta (x = 5), quiere decir que las primeras 7 no poseen
este tipo de lunares (x 1 = 4). La probabilidad de obtener una oveja con
este tipo de lunares es p = 0,40, por tanto, aplicando la frmula:

P( x 5) 0,40(1 0,40) 51 0,40(0,60) 4 0,0518

Ejercicio Un basquetbolista encesta el 60% de los tiros libres que lanza. Calcule la
probabilidad de que:
de
revisin a. El primer tiro que enceste sea el tercero.
b. El primer tiro que falle sea el cuarto.
c. Si el jugador lanza 6 veces, cul es la probabilidad de que enceste en
exactamente tres ocasiones?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
241

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen la distribucin
geomtrica.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Uso de Minitab para la distribucin geomtrica

Ejemplo El 10% de las llamadas que ingresan al centro de servicio telefnico de una
empresa son para reportar averas. Calcule, usando Minitab, la
probabilidad de que la primera llamada que ingresa para reportar averas
sea la tercera.

Solucin Se tiene que una probabilidad de xito p = 0.10 y se pregunta la


probabilidad de que la primera llamada que ingresa para reportar averas
sea la tercera, o sea, que lo que se desea calcular es:

P(X = 3) =

En Minitab, se da clic en el men Calc, luego en Distribuciones de


probabilidad, y ah se elige Geomtrica. Se completa el cuadro de dilogo:

Se selecciona probabilidad para que calcule el valor exacto del nmero de


eventos y se completan los datos tal como se muestra en la imagen. Luego
se da clic en Aceptar y se obtiene el resultado 0,081 en la ventana Sesin.

Tambin, se puede hacer uso del men Grfica, donde se selecciona


Grfica de distribucin de probabilidad. En el cuadro de dilogo se

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
242

selecciona la opcin que dice Ver probabilidad.

En el cuadro de dilogo se selecciona en la lista la distribucin geomtrica


y se introduce el dato de la probabilidad de xito:

Posteriormente se da clic en la pestaa rea sombreada. Aqu se elige


definir el rea sombreada por valor X y como en este caso se desea saber la
probabilidad de que x = 3, entonces se selecciona Centro y se escribe el
valor de x en los dos espacios que aparecen:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
243

Al dar clic en Aceptar, Minitab crea un grfico que indica el valor de la


probabilidad:

Grfica de distribucin
Geomtrico. p=0,1

0,10

0,081
0,08
Probabilidad

0,06

0,04

0,02

0,00
1 3 51
X
X = nmero total de pruebas.

Material En la pgina de internet de este texto


podr encontrar una herramienta
audiovisual calculadora de probabilidades para
algunas de las principales distribuciones
de probabilidad.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
244

Aplicacin Mantenimiento predictivo


Para una empresa no es conveniente esperar a que una mquina falle para
repararla. Esto tendra un costo elevado, especialmente porque por
mientras se detiene la produccin. Es mejor emplear un enfoque
preventivo. El propsito del mantenimiento preventivo es mantener las
mquinas en un estado de operacin que sea satisfactorio. Sin embargo, se
puede ir un poco ms all, y aplicar un enfoque predictivo. Esto es tratar
de pronosticar un punto futuro de falla de una mquina, o sea, determinar
los puntos ptimos para realizar un mantenimiento preventivo. Esto
permitira sustituir el componente que pueda fallar justo antes de que falle.
As, puede construirse un plan para realizar estos remplazos de manera que
se minimicen los tiempos muertos debido al mantenimiento y se maximice
la vida til de la mquina.

Este tipo de mantenimiento se base en mediciones de vibraciones, anlisis


de aceite, medicin de temperaturas, anlisis de desgaste de partculas,
entre otros tipos de datos, que junto con las tcnicas apropiadas, adems
del uso de probabilidades, permiten estimar datos como la probabilidad de
que la mquina contine operando sin fallas durante un determinado
tiempo (confiabilidad), la probabilidad de realizar ciertas operaciones de
mantenimiento en el tiempo de reparacin establecido (mantenibilidad) o
la probabilidad de poder efectuar las operaciones de mantenimiento en un
tiempo de espera previamente establecido (soportabilidad).

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Ejercicios:
Ejercicios de desarrollo:
Conteste las preguntas que se formulan a continuacin (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

Distribuciones de probabilidad

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
245

1. A continuacin se muestra la tabla de la distribucin de probabilidad para el nmero de


accidentes por da que se presentan por da en una fbrica (cuyo mximo es 4). Cul es la
probabilidad de que se presente en un da cualquiera dos o ms accidentes?

X 0 1 2 3 4
P(x) 0,40 0,30 0,10 0,05

2. La cantidad de pacientes que llegan a una clnica cada hora se comporta de acuerdo con la
tabla siguiente, la cual muestra de distribucin de probabilidad de esta variable discreta.
Nunca llegan ms de 6 pacientes. Obtenga e interprete el valor esperado y la desviacin
estndar.

X 0 1 2 3 4 5 6
P(x) 0,05 0,10 0,15 0,20 0,15 0,05

3. La tabla siguiente muestra el nmero de quejas por da que recibe una compaa de
televisin por cable:

Nmero de quejas (X) Probabilidad P(X)


0 0,20
1 0,25
2 0,15
3 0,15
4 0,10
5 0,10
6 0,05
Total 1,00

a. Cul es el nmero esperado de quejas que recibir compaa de televisin por


cable en un da cualquiera?
b. Cul es la desviacin estndar del nmero de quejas?

4. Se lanzan dos monedas, si sale escudo gana un punto, si sale corona, gana cero puntos, y X
es la suma de los puntos. Construya la tabla de la distribucin de probabilidad de X, calcule el
valor esperado y la desviacin estndar de la distribucin.

5. Una compaa de internet ha observado el nmero de veces que sus operaciones se han
visto interrumpidas por la cada de alguno de sus servidores. En 200 das analizados, se
determin que en 120 no hubo cada alguna de los servidores, pero que en 35 das el servicio
se interrumpi una vez por esa causa, en 25 das los servidores se cayeron dos veces, en 15
das se presentaron tres cadas de los servidores y que en 5 das el servicio se vio afectado
cuatro veces. Nunca se presentaron ms de 4 cadas de los servidores en un mismo da.

a. Construya la distribucin de probabilidad para la variable nmero cadas diarias de


los servidores de la empresa.
b. Calcule el valor esperado y la desviacin estndar de la variable.

6. En una encuesta aplicada a nivel nacional a exportadores se les pregunt sobre el efecto que
ha tenido la crisis econmica sobre su actividad. El 40% indic que la crisis le haba afectado
mucho en su nivel de exportaciones. Si se toma una muestra de 500 empresas exportadoras,

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
246

cuntas de esas empresas se esperara que hayan sido muy afectadas por la crisis? Calcule e
interprete la desviacin estndar para esta distribucin de probabilidad.

7. A continuacin se muestra la funcin de distribucin de probabilidad para el nmero de


accidentes por da que se presentan por da en una fbrica. Cul es la desviacin estndar de
la distribucin de probabilidad?

8. En la tabla se muestra la probabilidad de que una red de cmputo se halle fuera de


operacin durante un cierto nmero de horas por semana en su fase de operacin normal.

Nmero de horas 0 1 2 3 4 5
Probabilidad 0,45 0,20 0,15 0,10 0,05 0,05

a. Calcule el nmero esperado de horas por semana en que la red est fuera de
operacin y la desviacin estndar de esta variable.
b. Si usted tiene que escoger entre este tipo de red y otro tipo de red cuyo nmero
esperado de horas por semana fuera de operacin es 1,05 y con desviacin estndar de
2,12, cul tipo de red seleccionara y por qu?

9. Calcule la media y la desviacin estndar de la demanda semanal de cierto artculo en un


almacn. Los datos de demanda y su probabilidad de ocurrencia se dan en la tabla.

Unidades vendidas 0 10 20 30 40
Probabilidad 0,05 0,25 0,50 0,15 0,05

10. Un ingeniero conoce los siguientes datos relacionados con el nmero de fallas semanales
que un sistema informtico ha experimentado en el transcurso de tres aos:

# fallas/semana 0 1 2 3 4 5
Frecuencia 35 61 32 21 12 2

Este ingeniero afirma que es mejor otro sistema, ya que el valor esperado del nmero de fallas
semanales es 1,9 con una desviacin estndar de 3,5 veces por semana. Cambiara usted el
sistema actual por el sugerido por este ingeniero o mantendra el sistema actual? Explique
basndose en los resultados del valor esperado y la desviacin estndar, para esto primero
calcule ambos datos primero.

Distribucin binomial
11. En un esfuerzo para fomentar la creatividad y la innovacin entre su personal, una
empresa financiera ha implementado un sistema para captar propuestas de sus empleados. Un
elemento del sistema es un formulario que luego es depositado en un buzn. Se ha observado
que de cada 4 formularios entregados, uno posee una propuesta que podra generar un gran
impacto en la empresa y sus actividades. Con base en estos datos, calcule la probabilidad de
que, de una muestra de:
a. 5 formularios, 3 posean ideas de impacto.
b. 8 formularios, la mitad o menos tengan ideas de impacto.
c. 10 formularios, 6 o ms no tengan ideas de impacto.

12. El jefe de un departamento de recursos humanos de una empresa grande, estudia con
frecuencia el grado de satisfaccin de los trabajadores dentro de la empresa, y ha encontrado

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
247

que 5 de cada 11 empleados se siente insatisfecho con su salario. Esta proporcin se ha


mantenido constante durante mucho tiempo. Si se seleccionan aleatoriamente 8 personas,
a. Cul es la probabilidad de que exactamente 3 de ellas se sientan insatisfechas con
su salario?
b. Cul es la probabilidad de que la mitad de ellas se sientan satisfechas con su
salario?
c. Cul es la probabilidad de que a lo sumo 3 de ellas se sientan insatisfechas con su
salario?
Cul es la probabilidad de que ninguna de ellas se sienta satisfecha con su salario?

13. Se considera que el 20% de los votantes de un pas estn a favor de la poltica econmica
seguida por el actual gobierno. Si se toma una muestra de 12 votantes, cul es la
probabilidad de que del menos 25% de ellos est a favor de las polticas del gobierno actual?

14. Considere la siguiente informacin publicada en el sitio


http://www.nutriologo.net/2009/09/02/mexico-lider-en-diabetes/:

Mxico lder en diabetes


Un mal que silenciosamente ha permeado nuestro pas es la Diabetes Melitus y sus
consecuencias son mortales. Es el resultado de una falta de balance en nuestros hbitos
alimenticios y puede prevenirse fcilmente.
La Federacin Mexicana de Diabetes nos presenta estadsticas alarmantes, como por
ejemplo que en Mxico el 10% de la poblacin tiene esta enfermedad y algunos ni si
quiera saben que la tienen.
La diabetes tiene mayor incidencia en pases en vas de desarrollo y su causa principal
es la obesidad, en nuestro pas 7 de cada 10 personas tiene sobrepeso u obesidad.
Mxico se encuentra en 2 lugar de obesidad en el mundo.

Si se selecciona una muestra al azar de 10 mexicanos, calcule la probabilidad de que:


a. Tres o menos padezcan diabetes
b. Exactamente 6 tengan sobrepeso u obesidad
c. Al menos ocho no padezcan diabetes
d. A lo sumo dos no sean obesos

15. Segn una noticia publicada en das recientes El 4% de los medicamentos que los
proveedores entregan a la Caja Costarricense de Seguro Social (CCSS) se rechazan porque no
cumple con los estndares de calidad internacionales que la institucin tiene establecidos. Si
se toma una muestra aleatoria de 10 de los medicamentos comprados por esta institucin,
calcule la probabilidad de que:
a. Al menos 5 de ellos se rechazado por no cumplir los estndares de calidad.
b. Menos de 3 sean rechazados por no cumplir los estndares de calidad.
c. Si se realiza dos veces la experiencia de seleccionar un medicamento empleando un
muestreo con reemplazo, cul es la probabilidad de que en ambos casos exactamente
9 de sean aceptados por satisfacer los estndares de calidad.

16. El jefe de un departamento de recursos humanos de una empresa grande, estudia con
frecuencia el grado de satisfaccin de los trabajadores dentro de la empresa, y ha encontrado
que 5 de cada 12 empleados se siente insatisfecho con su salario. Esta proporcin se ha
mantenido constante durante mucho tiempo. Si se seleccionan aleatoriamente 8 personas
Cul es la probabilidad de que exactamente 5 de ellas se sientan insatisfechas con su salario?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
248

Distribucin hipergeomtrica
17. Para probar la calidad de un tipo de concreto se prepararon 60 probetas de la mezcla y se
obtuvo que 5 de ellas no presentaban una resistencia a la compresin adecuada. Si se toma
una muestra aleatoria de 8 de esas 60 probetas, calcule la probabilidad de que:
a. Al menos 3 no satisfagan el requerimiento de resistencia a la compresin.
b. A lo sumo 55 satisfagan el requerimiento de resistencia a la compresin.
c. Entre 2 y 6 no satisfagan el requerimiento de resistencia a la comprensin.

18. En un embarque se recibieron 250 cajas con unos componentes electrnicos llamados
termistores. Los termistores pueden ser positivos o negativos. De la cantidad total de cajas se
sabe que 120 solo contienen termistores negativos. Con base en estos datos calcule la
probabilidad de que al seleccionar 10 cajas de componentes al azar se encuentre:
a. Exactamente 3 cajas de termistores negativos.
b. Al menos 4 cajas de termistores negativos.
c. A lo sumo 6 cajas de termistores positivos.
d. Entre 4 y 7 cajas de termistores negativos.

19. En una encuesta reciente se obtuvo que 900 de una muestra 2400 personas se haba visto
afectadas por la gripe en al menos una ocasin en los ltimos seis meses. Suponga que se
selecciona una muestra aleatoria de 12 personas, determine la probabilidad de que en los
ltimos 6 meses:
a. Exactamente 7 personas hayan tenido gripe al menos una vez.
b. Ms de 5 personas hayan tenido gripe al menos una vez.
c. Como mximo 8 no hayan tenido gripe.
d. Entre 7 y 11 no hayan tenido gripe.

Distribucin de Poisson
20. Al servicio de emergencias de un hospital llegan, en promedio, 5 pacientes por hora. Con
base en esta informacin calcule la probabilidad de que en una hora seleccionada al azar:
a. Lleguen exactamente 2 pacientes
b. Lleguen menos de 3 pacientes
c. Lleguen ms de 2 pacientes

21. Usted ha observado que la carretera por la que se dirige desde la universidad hasta su casa
tiene un promedio de tres grietas por kilmetro. Cul es la probabilidad de que en un
kilmetro seleccionado al azar de esa carretera:
a. no haya grieta alguna?
b. hayan al menos cinco grietas?

22. Un estudio revel que a la fila de una caja de un supermercado llegan en promedio 15
clientes cada 20 minutos. Con base en esta informacin determine la probabilidad de:
a. Que en una hora aleatoriamente seleccionada lleguen exactamente 50 clientes.
b. Que en un plazo cualquiera de 10 minutos lleguen como mximo 10 clientes.
c. Que en un plazo cualquiera de media hora lleguen como mnimo 20 clientes.

23. Segn estudios realizados en una autopista del pas, en un determinado tramo ocurren, en
promedio, 5 accidentes por semana. Con esta informacin, calcule la probabilidad de que en
una semana seleccionada aleatoriamente:
a. Ocurran ms de 7 accidentes.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
249

b. Ocurran menos de 4 accidentes.


c. Ocurran entre 6 y 9 accidentes.
d. No ocurran accidentes.

24. En la central telefnica de un hospital privado de la ciudad capital, en el servicio de


medicina general, se reciben 2 llamadas en promedio cada media hora para realizar una cita
con alguno de los mdicos. Con esta informacin calcule las siguientes probabilidades de que:
a. Se presenten menos de 3 llamadas en media hora.
b. Se reciban ms de 5 llamadas en un lapso de 45 minutos.
c. Se reciban menos de 6 llamadas en un lapso de una hora.

Distribucin multinomial
25. En una encuesta de intencin de voto se obtuvo que el candidato A obtendra el 35% de
los votos, el candidato C el 45% y el candidato B el restante 20%. Si se toma una muestra de
12 personas, cul es la probabilidad de que la mitad deseen votar por el candidato A, una
cuarta partes por el candidato B y el resto por C?

26. Una empresa clasifica a su clientes como promotores, si estn muy dispuestos a
recomendar sus productos, como pasivos, si estn poco dispuestos a recomendar sus
productos, y como detractores si no tienen anuencia a recomendar los productos de la
empresa. El 50% de los clientes de la empresa se han catalogado como promotores, el 40
como pasivos y el 10% como detractores. Calcule la probabilidad de que en una muestra de
10 clientes se obtenga 6 promotores, 3 pasivos y un detractor.

27. En una caja hay 20 bolas, 8 rojas, 6 verdes, 4 azules y 2 blancas. Si se seleccionan 8 bolas
al azar, cul es la probabilidad de que 3 sean rojas, dos verdes, dos azules y una blanca?

28. En el control de calidad de una empresa los productos de una empresa se clasifican como
perfectos, aceptables y como rechazados. Si el 80 de los productos se consideran perfectos, el
15% como aceptables y el 5% como rechazados, calcule la probabilidad de que en una
muestra de 10 productos haya 8 perfectos, uno aceptable y otro rechazado.

Distribucin geomtrica
29. En el proceso de ensamblado de un camin de juguete a bateras se sabe que se obtiene
una unidad defectuosa con una probabilidad de 4%. Peridicamente se efectan pruebas para
controlar la calidad del producto. Determine la probabilidad de encontrar el primer juguete
defectuoso en:
a. Exactamente la quinta prueba.
b. Antes de la sexta prueba.
c. Despus de la tercera prueba.

30. Una central telefnica de una empresa est ocupada todo el tiempo. Si la probabilidad de
lograr hacer una llamada en un momento de alta congestin es del 25%, calcule la
probabilidad de que se tengan que hacer 6 intentos para lograr comunicarse.

31. Un tirador experto acierta en el blanco con una probabilidad del 90%. Calcule la
probabilidad de que al hacer 8 disparos falle por primera vez en el octavo intento.

32. Una compaa tiene la costumbre de ofrecer descuentos a los radioescuchas de un popular
programa de radio, los cuales llaman por telfono para participar en el sorteo. Durante el lapso

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
250

del programa la central telefnica tiende a saturarse, por lo que la probabilidad de que la llama
de una persona ingrese es de solo 5%. Suponga que una persona desea participar en el sorteo,
calcule la probabilidad de que tenga que:
a. hacer 10 llamadas para participar.
b. realizar ms de 5 llamadas para participar.
c. logre participar en el stimo intento.

Ejercicios sobre varias distribuciones


33. La isla Pinta es la isla ms al norte en las Islas Galpagos. Hace algunos aos haba gran
cantidad de tortugas de la especie Chelonoidis abingdoni, una especie nativa de la isla Pinta
pero que se extingui hace un tiempo. El ltimo espcimen fue conocido como el Solitario
George. Un grupo de investigadores tomaron muestras de 1600 tortugas gigantes en las
cercanas de un volcn en las Galpagos y encontraron que 17 tortugas (nueve hembras, tres
machos y cinco jvenes) eran "hbridas", es decir, que podran ser descendientes de
Chelonoidis abingdoni.
a. Si se toma una muestra aleatoria de 50 tortugas, cul es la probabilidad de que a lo
sumo dos sean descendientes de Chelonoidis abingdoni?
b. Si se tienen 100 tortugas y se sabe que 3 de ellas son descendientes de Chelonoidis
abingdoni, cul es la probabilidad de que en una muestra de 12 de ellas exactamente
una sea descendiente de Chelonoidis abingdoni?
c. Suponga que se puede encontrar un promedio de una tortuga descendiente de
Chelonoidis abingdoni por cada hectrea de una cierta zona de la isla Pinta, cul es la
probabilidad de que en una hectrea aleatoriamente seleccionada se encuentren
exactamente dos tortugas descendientes de Chelonoidis abingdoni?
d. Si se examinan tortugas en la zona de las Galpagos, cul es la probabilidad de que
la primera tortuga descendiente de Chelonoidis abingdoni sea la dcimo novena?
e. Considere que se tienen las 17 tortugas descendientes de Chelonoidis abingdoni que
se encontraron y se toma una muestra de 6 de ellas, cul es la probabilidad de que dos
sean hembras, una macho y tres sean jvenes?

34. Un empresa posee 500 empleados. Se sabe que 100 de ellos trabajan en el rea
administrativa, un 50 laboran en ventas y el resto en produccin. Calcule la probabilidad de:
a. Que al seleccionar 9 empleados aleatoriamente, 2 sean del rea administrativa en un
muestreo con reemplazo.
b. Que al seleccionar 9 empleados aleatoriamente, 2 sean del rea administrativa en un
muestreo sin reemplazo.
c. Que al seleccionar 9 empleados aleatoriamente, 2 sean del rea administrativa, uno
de ventas y el resto de produccin, en un muestreo con reemplazo.
d. Que al seleccionar varios empleados, el primero que pertenezca al rea de ventas
sea el quinto.

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. La distribucin de probabilidad que se aplica en un experimento de acuerdo con un proceso


de Bernoulli y tiene ms de dos resultados posibles se llama:
( a ) Binomial ( b ) Hipergeomtrica

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
251

( c ) Multinomial ( d ) Poisson

2. La distribucin de probabilidad que representa el nmero de resultados que ocurren en un


intervalo de tiempo dado o en un rea o volumen especfico se llama:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Multinomial ( d ) Poisson

3. La distribucin de probabilidad que se emplea en una sucesin de pruebas y se quiere saber


el nmero de la prueba en que ocurre el primer xito se llama:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Geomtrica ( d ) Poisson

4. La distribucin de probabilidad que se emplea en una situacin similar a un proceso de


Bernoulli, pero con un muestreo sin reemplazo, se llama:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Geomtrica ( d ) Poisson

5. A continuacin se muestra la funcin de distribucin de probabilidad para el nmero de


accidentes por da que se presentan en una fbrica (nunca se presentan ms de 4 accidentes).

X 0 1 2 3 4
P(x) 0,40 0,30 0,10 0,05

Cul es la probabilidad de que se presente en un da cualquiera dos o ms accidentes?


( a ) 0,85 ( b ) 0,15
( c ) 0,30 ( d ) Ninguna de las anteriores

6. Con base en la tabla del ejercicio 4, en el largo plazo, el nmero esperado de accidentes
diarios en esa fbrica es de:
( a ) 0,8 (b)2
( c ) 1,1 ( d ) Ninguna de las anteriores

7. Con base en la tabla del ejercicio 4, la desviacin estndar de la distribucin de


probabilidad es:
( a ) 1,18 ( b ) 0,1215
( c ) 1,39 ( d ) 3,68

8. A continuacin se muestra la funcin de distribucin de probabilidad para el nmero de


accidentes por da que se presentan en una fbrica (nunca se presentan ms de 4 accidentes).

X 0 1 2 3 4
P(x) 0,30 0,20 0,10 0,02

Cul es la probabilidad de que se presente en un da cualquiera dos o menos accidentes?


( a ) 0,78 ( b ) 0,88
(c)1 ( d ) Ninguna de las anteriores

9. Con base en la tabla del ejercicio 8, en el largo plazo, el nmero esperado de accidentes
diarios en esa fbrica es de:
(a)0 ( b ) 1,6

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
252

(c)2 ( d ) 1,16

10. Con base en la tabla del ejercicio 8, la desviacin estndar de la distribucin de


probabilidad es:
( a ) 1,05 ( b ) 1,08
( c ) 1,03 ( d ) Ninguna de las anteriores

11. Las acciones de la empresa A tienen una probabilidad de 0,7 de devolver una ganancia de
$200. Tambin tienen una probabilidad de 0,3 de tener una prdida de $600. En el largo
plazo, cul es la mejor opcin de las siguientes que se puede hacer para maximizar su
beneficio, y por qu?
( a ) Invertir en las acciones porque hay una mayor probabilidad de ganar dinero que perder
dinero.
( b ) No invertir en las acciones debido a la cantidad de dinero por cada prdida es mayor que
el monto en dlares para cada ganancia.
( c ) Invertir en las acciones porque la inversin tiene un valor esperado positivo.
( d ) No invertir en las acciones debido a que el valor esperado es una prdida.

12. Las acciones de la empresa A tienen una probabilidad de 0,7 de devolver una ganancia de
$200. Tambin tienen una probabilidad de 0,3 de tener una prdida de $600. Las acciones de
la empresa B tienen una probabilidad de 0,3 de devolver una ganancia de $600 y una
probabilidad de 0,7 de tener una prdida de $200. En el largo plazo, usando la desviacin
estndar como medida del riesgo, es cierto que:
( a ) Las acciones de la empresa A son ms riesgosas que las acciones de la empresa B
( b ) Las acciones de la empresa A son menos riesgosas que las acciones de la empresa B
( c ) Las acciones de la empresa A son igualmente riesgosas que las acciones de la empresa B
( d ) Falta informacin para determinar la desviacin estndar

13. Si usted toma una muestra de 15 artculos con reemplazo, para conocer si se presentan
unidades con algn defecto, entonces se emplea la distribucin:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Multinomial ( d ) Geomtrica

14. En un proceso de produccin se genera una unidad defectuosa por cada 10 unidades
producidas. Si usted desea saber la probabilidad de que, en un muestra de 20 unidades sin
reemplazo, se presenten 2 defectuosas, debera emplear la distribucin:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Multinomial ( d ) Ninguna de las anteriores

15. La tasa media de llegadas de vehculos a un peaje es de 10 por minuto. Si usted desea
saber la probabilidad de que en una hora seleccionada aleatoriamente lleguen menos de 50
vehculos, entonces usara:
( a ) Binomial ( b ) Exponencial
( c ) Poisson ( d ) Normal

16. La tasa media de llegadas de vehculos a un peaje es de 15 por minuto. Si usted desea
saber la probabilidad de que pasen 4 minutos entre la llegada de dos vehculos en una hora
seleccionada aleatoriamente, entonces usara:
( a ) Binomial ( b ) Exponencial
( c ) Poisson ( d ) Normal

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
253

17. Si se sabe que, en un problema binomial, la probabilidad de xito es 0.60, en 10 ensayos,


la probabilidad de obtener exactamente 4 fracasos es, aproximadamente:
( a ) 0,1115 ( b ) 0,5630
( c ) 0,2508 ( d ) Ninguna de las anteriores

18. Si se sabe que, en un problema hipergeomtrico, hay 5 xitos en una poblacin de 12


unidades, en una muestra de 4 unidades la probabilidad de obtener exactamente 3 fracasos es,
aproximadamente:
( a ) 0,1414 ( b ) 0,6465
( c ) 0,3535 ( d ) Ninguna de las anteriores

19. Si se sabe que, en un problema geomtrico, la probabilidad de xito es 0.1, entonces la


probabilidad de que el primer xito sea el tercero es, aproximadamente:
( a ) 0,919 ( b ) 0,271
( c ) 0,081 ( d ) Ninguna de las anteriores

20. Si se sabe que, en un problema hipergeomtrico, hay 7 xitos en una poblacin es de 10


unidades, en una muestra de 4 unidades la probabilidad de obtener al menos 3 fracasos es,
aproximadamente:
( a ) 0,7381 ( b ) 0,9762
( c ) 0,0333 ( d ) 0,2381

21. Si se sabe que, en un problema hipergeomtrico, hay 4 xitos en una poblacin es de 9


unidades, en una muestra de 4 unidades la probabilidad de obtener a lo sumo 2 fracasos es,
aproximadamente.
( a ) 0,1667 ( b ) 0,3571
( c ) 0,6429 ( d ) 0,8333

22. Si se sabe que x sigue una distribucin de Poisson con media igual a 3, la probabilidad de
x sea mayor que 2 es:
( a ) 0,4232 ( b ) 0,8009
( c ) 0,5768 ( d ) Ninguna de las anteriores

23. Si se sabe que x sigue una distribucin de Poisson con media igual a 5, la probabilidad de
x sea cuando mucho 1 es:
( a ) 0,9933 ( b ) 0,0337
( c ) 0,0404 ( d ) Ninguna de las anteriores

24. Si los resultados del anlisis de un producto pueden ser bueno, regular o malo, y se conoce
que las probabilidades de dichos resultados son 0.6, 0.3 y 0.1, respectivamente, entonces en
una muestra de 5 unidades, la probabilidad de que una de ellas sea clasificada como regular, 1
como mala y 3 como buenas es:
( a ) 0,0036 ( b ) 0,0324
( c ) 0,1296 ( d ) Ninguna de las anteriores

25. Si los resultados del anlisis de un producto pueden ser bueno, regular o malo, y se conoce
que las probabilidades de dichos resultados son 0.6, 0.3 y 0.1, respectivamente, entonces en
una muestra de 5 unidades, la probabilidad de que 4 de ellas sean clasificadas como buenas
es:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
254

( a ) 0,9222 ( b ) 0,7408
( c ) 0,2592 ( d ) Ninguna de las anteriores

26. Si se sabe que, en un problema binomial, la probabilidad de xito es 0.60, en 10 ensayos,


la cantidad esperada de fracasos es:
( a ) 0,0016 (b)6
(c)4 ( d ) Ninguna de las anteriores

27. Si usted controla la calidad de las piezas compradas a un proveedor y desea calcular la
probabilidad de que en un muestreo sin reemplazo se rechace el lote por contener ms de 3
piezas defectuosas, entonces se emplea la distribucin:
( a ) Binomial ( b ) Hipergeomtrica
( c ) Multinomial ( d ) Geomtrica

28. Se tiene un cargamento de 60 alarmas contra robo el cual contiene 9 defectuosas. La


probabilidad de que salgan exactamente 2 defectuosas en una muestra de 5 alarmas es:
( a ) 0,8627 ( b ) 0,1886
( c ) 0,1373 ( d ) Ninguna de las anteriores

29. Un fabricante de medicamentos sostiene que cierta medicina cura una enfermedad para la
sangre en el 80% de los casos. Para verificarlo los inspectores del gobierno utilizan una
muestra de 100 individuos y deciden aceptar la afirmacin si se curan por lo menos 75 de
ellos. La probabilidad de que lo que dice sea rechazado, si efectivamente la probabilidad de
curacin es del 80%, es:
( a ) 0,9162 ( b ) 0.0838
( c ) 0,4567 ( d ) Ninguna de las anteriores

30. En un proceso de manufactura se sabe que la probabilidad de obtener una pieza defectuosa
es de 2%. Cul es la probabilidad de que la octava pieza inspeccionada sea la primera
defectuosa?
( a ) 0,9826 ( b ) 0,9800
( c ) 0,0174 ( d ) Ninguna de las anteriores

31. Un fabricante sabe que cierto tipo de refrigeradores tienen una probabilidad de 0,8 de
clasificarse como aceptable, una probabilidad de 0,15 de ser clasificados como con defectos
secundarios y de 0,05 de ser clasificados como con defectos mayores. Si se revisan seis
refrigeradores, escogidos al azar, la probabilidad de que tres sean aceptables, 2 tengan
defectos menores y 1 tenga defecto mayor es:
( a ) 0,9654 ( b ) 0,7645
( c ) 0,0346 ( d ) Ninguna de las anteriores

32. Una empresa de mercadeo por internet tiene una promocin por email que produce una
respuesta de 15%. Si se hace un envo de dicha promocin a 10 clientes (independientes), la
probabilidad de que nadie responda es:
( a ) 0,0000 ( b ) 0,8031
( c ) 0,1969 ( d ) Ninguna de las anteriores

33. Una empresa de mercadeo por internet tiene una promocin por email que produce una
respuesta de 15%. Si se hace un envo de dicha promocin a 10 clientes (independientes), la
probabilidad de que exactamente dos personas respondan es:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
255

( a ) 0,0000 ( b ) 0,8241
( c ) 0,2759 ( d ) Ninguna de las anteriores

34. Una empresa de mercadeo por internet tiene una promocin por email que produce una
respuesta de 15%. Si se hace un envo de dicha promocin a 10 clientes (independientes), la
probabilidad de que ms de la mitad respondan es:
( a ) 0,0000 ( b ) 0,9986
( c ) 0,0014 ( d ) Ninguna de las anteriores

35. Una empresa de mercadeo por internet tiene una promocin por email que produce una
respuesta de 15%. Si se hace un envo de dicha promocin a 10 clientes (independientes), la
probabilidad de que ms de 4 no respondan es:
( a ) 0,0099 ( b ) 0,0014
( c ) 0,9986 ( d ) Ninguna de las anteriores

36. Considere la siguiente informacin: En una encuesta aplicada a 700 hogares a nivel
nacional, de los cuales la mitad tienen actualmente acceso al servicio de telefona celular, se
obtuvieron los siguientes datos: ante la apertura en el mercado de telecomunicaciones, el 68%
los usuarios actuales de telefona celular estara dispuesto a cambiar de operador. Entre la
poblacin que aun no posee celular, solo un 38% optar por el operador actual, mientras que
el resto escoger un nuevo proveedor de servicio. Si se toma una muestra de 6 hogares que
ya poseen servicio celular, la probabilidad de que todos conserven el operador actual es:
( a ) 0,0011 ( b ) 0,0989
( c ) 0,0030 ( d ) 0,0568

37. Utilizando la misma informacin del ejercicio 36, si se toma una muestra de 6 hogares que
ya poseen servicio celular, la probabilidad de que 2 o menos hogares cambien su proveedor
actual de telefona celular es:
( a ) 0,0011 ( b ) 0,0875
( c ) 0,7064 ( d ) 0,1527

38. Utilizando la misma informacin del ejercicio 36, si se toma una muestra de 6 hogares que
aun poseen servicio celular, la probabilidad de que 4 o ms hogares utilicen el proveedor
actual en el mercado de telefona celular es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1527

39. Utilizando la misma informacin del ejercicio 36, si se toma una muestra de 6 hogares que
aun poseen servicio celular, la probabilidad de que 4 o ms hogares utilicen el proveedor
actual en el mercado de telefona celular es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1527

40. El jefe de un departamento de recursos humanos de una empresa grande, estudia con
frecuencia el grado de satisfaccin de los trabajadores dentro de la empresa, y ha encontrado
que 4 de cada 20 empleados se siente insatisfecho con su salario. Esta proporcin se ha
mantenido constante durante mucho tiempo. Si se seleccionan aleatoriamente 8 personas, la
probabilidad de que exactamente 3 de ellas se sientan insatisfechas con su salario es:
( a ) 0,7064 ( b ) 0,1202
( c ) 0,3201 ( d ) 0,1468

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
256

41. Es un proceso de Bernoulli es falso que:


( a ) Existen solamente dos resultados posibles en cada ensayo
( b ) La probabilidad de un xito permanece constante en todos los intentos.
( c ) Todos los intentos repetidos son independientes.
( d ) Ninguna de las anteriores

42. La probabilidad de que cierto componente falle ante una carga axial especfica es de 5%.
La probabilidad de que entre 16 de tales componentes fallen entre 2 y 5:
( a ) 0,1891 ( b ) 0,8109
( c ) 0,95 ( d ) Ninguna de las anteriores

43. Con respecto a las lminas de zinc esmaltadas que se emplearn en el techo de un edificio
nuevo, se sabe que el 95% no tienen defecto alguno, que el 4% tienen, en promedio, un
defecto menor en el esmalte por cada dos metros cuadrados de lmina, y el resto poseen
huecos u otros defectos mayores, y por tanto sern devueltas al proveedor. La probabilidad de
que al seleccionar una muestra aleatoria de 8 lminas haya que devolver a lo sumo una lmina
es:
( a ) 0,9926 ( b ) 0,0027
( c ) 0,0074 ( d ) Ninguna de las anteriores

44. En relacin a la misma situacin de la pregunta 43, la probabilidad de que al seleccionar


una muestra aleatoria de 10 lminas haya al menos 8 en perfecto estado es:
( a ) 0,0861 ( b) 0,9238
( c ) 0,0115 ( d ) Ninguna de las anteriores

45. En relacin a la misma situacin de la pregunta 43, si se selecciona una lmina al azar
correspondiente a las que tienen un defecto en el esmalte, entonces la probabilidad de que
posea una superficie continua de 1,5 metros cuadrados sin defecto alguno es:
( a ) 0,5276 ( b ) 0,3679
( c ) 0,4724 ( d ) Ninguna de las anteriores

46. En relacin a la misma situacin de la pregunta 43, si un empleado est inspeccionando


las lminas, entonces la probabilidad de que la primera lmina con defectos en el esmalte sea
la sexta es:
( a ) 0,0340 ( b ) 0,0326
( c ) 0,0311 ( d ) Ninguna de las anteriores

47. En relacin a la misma situacin de la pregunta 43, suponga que se han comprado 100
lminas. Si se toma una muestra aleatoria sin reemplazo de 6 lminas, la probabilidad de que
exactamente 5 estn en perfecto estado es:
( a ) 0,2430 ( b ) 0,2709
( c ) 0,2649 ( d ) Ninguna de las anteriores

48. En relacin a la misma situacin de la pregunta 43, si se toma una muestra aleatoria de 8
lminas, la probabilidad de que 6 estn en perfecto estado, que una tenga un defecto en el
esmalte y otra un defecto mayor es:
( a ) 0,0261 ( b ) 0,0138
( c ) 0,0315 ( d ) Ninguna de las anteriores

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
257

49. En una distribucin binomial se cuenta la probabilidad de obtener un nmero establecidos


de xitos cuando:
( a ) el nmero de intentos es constante pero la probabilidad de fracaso no
( b ) el nmero de intentos no es constante ni la probabilidad de fracaso
( c ) el nmero de intentos es constante y la probabilidad de fracaso tambin
( d ) el nmero de intentos no es constante pero la probabilidad de fracaso s

50. Considere las dos siguientes afirmaciones:

A. En una distribucin de Poisson es verdadero que E(X) = V(X) = = 2


B. Cuando n es relativamente grande y p pequea, las probabilidades binomiales a menudo
se aproximan por medio de la distribucin de Poisson.

Con respecto a las dos afirmaciones anteriores, es correcto que:


( a ) Son verdaderas ambas ( b ) Solo B es verdadera
( c ) Son falsas ambas ( d ) Solo A es verdadera

Respuestas a preguntas de seleccin nica:

1. a 2. d 3. c 4. b 5. c
6. c 7. a 8. b 9. d 10. c
11. d 12. c 13. a 14. b 15. c
16. b 17. c 18. c 19. c 20. c
21. c 22. c 23. c 24. c 25. c
26. c 27. b 28. c 29. b 30. c
31. c 32. c 33. c 34. c 35. c
36. a 37. b 38. d 39. d 40. d
41. d 42. a 43. c 44. c 45. c
46. b 47. a 48. d 49. c 50. a

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
258

7 .

Distribuciones de probabilidad de
variable continua
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Resolver problemas empleando la distribucin normal
2. Resolver problemas empleando la distribucin exponencial

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
259

Distribuciones continuas de probabilidad


En el captulo anterior se trabaj con distribuciones de probabilidad en las cuales la variable
aleatoria era discreta, es decir, se obtena por conteo, pero en las distribuciones de
probabilidad de variables aleatorias continuas el valor de la variable se obtiene por medicin,
como es el caso del peso de paquetes de harina, el dimetro del anillo de un pistn, la longitud
de una pieza, la vida til de un producto, el nivel de glucosa en la sangre, la temperatura de un
horno, el tiempo de atencin de un paciente, entre muchas otras variables que se obtienen a
travs de la medicin, y por tanto se van a expresar en unidades de medida, como los gramos,
milmetros, metros, aos, segundos, etc.

Otra diferencia con respecto a las distribuciones de variable discreta, es que al calcular las
probabilidades de variables aleatorias continuas no se puede hablar de la probabilidad de que
tome un valor en particular, por ejemplo, calcular la probabilidad de que el tiempo de espera
en una fila sea exactamente 4 minutos; sino que se calcula la probabilidad de que la variable
tome valores en un intervalo, como sera que el tiempo de espera est entre 3 y 5 minutos.
Entonces, se encontrar la probabilidad de que la variable aleatoria x tome valores entre a y b:
P(a x b), como en el ejemplo, que sera obtener P(3 x 5).

A las funciones de probabilidad de las variables continuas se les llama funciones densidad y
se integran para obtener las probabilidades buscadas.

La distribucin normal
La distribucin de probabilidad de variable continua ms importante es la distribucin normal.
Esta distribucin, cuya curva tiene forma de campana, mide en forma muy aproximada
muchos fenmenos que ocurren en la naturaleza, los negocios, la industria y la investigacin,
como por ejemplo:

En una fbrica, las mediciones sobre las partes manufacturadas.


Caractersticas fsicas de las personas y otros seres vivos, tales como estatura, masa
corporal, etc.
Algunas variables financieras (principalmente el logaritmo de ndices de precios, tasas de
cambio, etc.).
El cociente intelectual.
Efecto de un frmaco en el organismo.
Nivel de ruido en telecomunicaciones.
La media muestral se distribuye normalmente, tal como se expondr en el captulo 8.

Esta distribucin fue estudiada a partir del siglo XVII, cuando el matemtico francs
Abraham DeMoivre desarroll la ecuacin matemtica de la distribucin de probabilidad.
Posteriormente el alemn Karl Friedrich Gauss tambin deriv la ecuacin en un estudio de
errores en mediciones repetidas de la misma cantidad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
260

La curva de la distribucin, a la que se le llama campana de Gauss o gaussiana, satisface las


siguientes propiedades bsicas:

Asinttica con respecto al eje horizontal.


El rea bajo la curva es igual a uno (se trata de una funcin de densidad).
Es simtrica con respecto a la media aritmtica ().
Queda perfectamente determinada si se conocen y .

La funcin densidad de la distribucin normal es:

1 x
2

1
f ( x, , 2 ) e 2
para < x <
2

La probabilidad de que x tome valores en el intervalo entre a y b, es:

1 x
2
b
1
P ( a x b) e 2
dx
a 2

Se mencion que la curva normal queda perfectamente determinada si se conocen y , lo


cual indica que para cada par de valores de y existe una curva normal diferente, o sea,
existe una cantidad infinita de curvas normales y dada la complejidad de integrar la expresin
anteriormente dada, el trabajo con la curva normal sera muy complicado. Para resolver este
problema se emplea una curva normal que tiene = 0 y = 1, llamada distribucin normal
estndar, as que, no es necesario integrar para obtener las probabilidades. La variable
aleatoria de la distribucin normal estndar, denotada por z, es:

x
z

Los valores de esta distribucin normal estndar se obtienen de una tabla, la cual da el valor
de probabilidad para cada valor de z. La frmula anterior se emplea para convertir de la
variable x a z y viceversa, segn se requiera.

El uso de la tabla de la distribucin normal estndar acumulada (ver Apndice 6) es muy


sencillo.

Ejemplo Se desea saber el valor de las siguientes probabilidades:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
261

a) P(z 1,46) =
b) P(z 1,46) =
c) P(z 1,46) =
d) P(z 1,46) =
e) P(1,03 z 1,46) =

Solucin a) La tabla de la curva normal estndar (Apndice 6) solo da


probabilidades para valores acumulados hasta el nmero buscado, en otras
palabras, la probabilidad de que la variable z sea menor o igual que cierto
valor. Entonces, si se busca la probabilidad de que z sea menor o igual que
1,46, la tabla va a dar directamente el resultado.

Se desea conocer P(z 1,46), entonces en la tabla se busca el entero y el


primer decimal, o sea, 1,4, en la primera columna, y luego el segundo
decimal, en este caso 6, se busca en la primera fila, tal como se ilustra a
continuacin:

El nmero que aparece donde se cruza esa fila con esa columna es el valor
de la probabilidad, que en este caso es 0,9279.

b) Tal como se seal anteriormente, la tabla de la distribucin normal


estndar del Apndice 6 solo da la probabilidad de que la variable z sea
menor o igual que cierto valor, pero en este caso se busca la probabilidad
de que z sea mayor que 1,46. Grficamente este problema se vera del
modo siguiente:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
262

La tabla dara el rea en blanco, no el rea sombreada, pero sabiendo que


el rea total bajo la curva es igual a 1, entonces se puede calcular:

P(z 1,46) = 1 P(z 1,46)

De la tabla se obtiene que P(z 1,46) = 0,9279, por lo que:

P(z 1,46) = 1 P(z 1,46) = 1 0,9279 = 0,0721

c) Como se seal en los casos anteriores, la tabla de la distribucin


normal estndar (Apndice 6) da la probabilidad de que la variable z sea
menor o igual que cierto valor positivo, pero en este caso se busca la
probabilidad de que z sea menor que 1,46. Grficamente este problema se
vera del modo siguiente:

Dado que la curva es simtrica, entonces la tabla dara el rea en blanco,


no el rea sombreada, pero sabiendo que el rea total bajo la curva es igual
a 1, entonces se puede calcular:

P(z 1,46) = 1 P(z 1,46)

De la tabla se obtiene que P(z 1,46) = 0,9279, por lo que:

P(z 1,46) = 1 P(z 1,46) = 1 0,9279 = 0,0721

d) Nuevamente sabemos que la tabla de la distribucin normal estndar


(Apndice 6) da la probabilidad de que la variable z sea menor o igual que
cierto valor positivo, pero en este caso se busca la probabilidad de que z
sea mayor que 1,46. Grficamente este problema se vera del modo
siguiente:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
263

Dado que la curva es simtrica, entonces la tabla dara el rea sombreada,


entonces se puede calcular:

P(z 1,46) = P(z 1,46)

De la tabla se obtiene que P(z 1,46) = 0,9279, por lo que:

P(z 1,46) = P(z 1,46) = 0,9279

e) Este problema se vera en forma grfica del modo siguiente:

La tabla da el rea acumulada hasta 1,46 y da el rea acumulada hasta


1,03, por que podra calcularse cada una por separado y luego restar los
resultados:

P(1,03 z 1,46) = P(z 1,46) = P(z 1,03) =

De la tabla se obtiene:

= 0,9279 0,8485 = 0,0794

Ejercicio Calcule el valor de las siguientes probabilidades:


de a) P(z 2,38) =
revisin b) P(z 3,01) =
c) P(z 0,96) =
d) P(z 2,81) =
e) P(-0,19 z 2,71) =

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Ahora bien, en la prctica muchas variables se distribuyen normalmente, pero no tienen media
igual a 0 y desviacin estndar igual a 1. Es necesario entonces estandarizar estas variables,
tal como se indic anterior, para lo cual se emplea la frmula:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
264

x
z

Ejemplo La cantidad de refresco envasada por una empresa est normalmente


distribuido con una media de un litro (1000 ml) y tiene desviacin estndar
de 30 ml. Calcule las probabilidades de que una botella aleatoriamente
seleccionada tenga una cantidad de refresco:

a) De menos de 1010 ml.


b) Mayor de 1050 ml.
c) Por lo menos de 990 ml.
d) Como mximo de 1090 ml.
e) Entre 980 y 1040 ml.
f) Cul es el valor mximo del 20% de las botellas con menor
cantidad de lquido?
g) Cul es el valor mnimo del 40% de las botellas con mayor
cantidad de lquido?

Solucin Se tiene = 1000 y = 30, y los valores de la probabilidad de z se obtienen


de la tabla.

a) La probabilidad que se busca es P(x 1010). Para las distribuciones


continuas menor o igual es lo mismo que estrictamente menor. Lo primero
que se hace es aplicar la frmula de estandarizacin para convertir x en z:

1010 1000
P( x 1010) P z P( z 0,33)
30

Para obtener dicha rea se aplica la tabla de distribucin normal estndar


(Apndice 6), de donde se obtiene:

P(Z 0,33) = 0,6293

b) Se busca la probabilidad P(x 1050). Aplicando la frmula de


estandarizacin y la tabla normal estndar:

1050 1000
P( x 1050) P z
30
P( z 1,67) 1 0,9525 0,0475

c) Se busca la probabilidad P(x 990). Siguiendo los pasos sealados:

990 1000
P( x 990) P z
30
P( z 0,33) 0,6293

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
265

d) Se requiere encontrar P(x 1090), entonces:

1090 1000
P( x 1090) P z
30
P( z 3) 0,9987

e) En este caso la probabilidad buscada es P(980 x 1040), por lo que a


cada valor se aplica la frmula de estandarizacin y luego la tabla normal
estndar:

P(980 x 1040)
9.80 1000 1040 1000
P z
30 30
P(0,67 z 1,33)
P( z 1,33) P( z 0,67)
0,9082 (1 0,7486)
0,9082 0,2514 0,6568

f) El valor mximo del 20% de las botellas con menor cantidad de lquido
se encuentra al lado izquierdo de la curva, en el cual los valores de z son
negativos, por estar a la izquierda de z = 0 ( = 0). Grficamente el
problema queda representado del modo siguiente:

Al buscar en la tabla el valor de z que corresponde a una probabilidad


mxima de 0,20 se encuentra en la tabla del Apndice 6 que solo aparecen
valores positivos, y no negativos, pero esto no es problema dado que la
curva es simtrica. Tambin se observa que los valores de probabilidad de
la tabla son iguales o mayores que 0,5, y no menores, por lo que el valor de
0,20 no va a aparecer, as que se busca su complemento 1 0,20 = 0,80. De
ese modo se busca el valor de probabilidad (no de z) ms cercano a 0,80:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
266

Vase que el valor de probabilidad de 0,7995 es el ms cercano a 0,80, por


lo que en la primera columna se obtiene el entero y el primer decimal del
valor de z, y en la primera fila el segundo decimal. As, se obtiene que z =
0,84, pero se dijo que este valor deba ser negativo por encontrase del lado
izquierdo de la grfica, as que z = 0,84.

Ahora se sustituye y se despeja el valor de x de la frmula de z:

x
z

x 1000
0,84
30
x 0,84 * 30 1000
x 974,8

Esto indica que 974,8 ml es el valor mximo del 20% de las botellas con
menor cantidad de lquido.

g) El valor mnimo del 40% de las botellas con mayor cantidad de lquido
se encuentra al lado derecho de la curva, en el cual los valores de z son
positivos, por estar a la derecha de z = 0 ( = 0). Grficamente el problema
queda representado del modo siguiente:

Se observa que los valores de probabilidad de la tabla de la distribucin

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
267

normal estndar (Apndice 6) son iguales o mayores que 0,5, y no menores


que 0,5, por lo que el valor de 0,40 no va a aparecer, as que se debe buscar
su complemento 1 0,40 = 0,60. De ese modo se busca el valor de
probabilidad (no de z) ms cercano a 0,60:

Vase que el valor de probabilidad de 0,5987 es el ms cercano a 0,60, por


lo que en la primera columna se obtiene el entero y el primer decimal del
valor de z, y en la primera fila el segundo decimal. As, se obtiene que z =
0,25.

Ahora se sustituye y se despeja el valor de x de la frmula de z:

x
z

x 1000
0,25
30
x 0,25 * 30 1000
x 1007,5

Esto indica que 1007,5 ml es el mnimo del 40% de las botellas con mayor
cantidad de lquido.

Ejemplo Un profesional dura por las maanas un promedio de 26 minutos para


llegar a su oficina. Se puede suponer razonablemente que la distribucin
del tiempo de los viajes es aproximadamente normal. La desviacin
estndar es de 3,5 minutos.

a. De cunto es la probabilidad de que llegue tarde a una reunin


programada para 8:50 a.m. si ese da sali de su casa a las 8:35?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
268

b. Cuntas veces de las 120 que viaj el ltimo semestre lleg a tiempo, si
debe estar en su oficina a las 9:00 a.m. y acostumbra salir de su casa a las
8:30?
c. Encuentre el tiempo mximo que le tom el 62% de los viajes ms
rpidos.

Solucin Se tiene que = 26 minutos y = 3,5 minutos.

a. Si sali de su casa a las 8:35 y la reunin es a las 8:50 llegar tarde si el


viaje el toma ms de los 15 minutos con que cuenta.

P(llegar tarde) = P(x 15) = P(Z 3,14) = 0,9992

b. Si sale a las 8:30 y tiene que estar en la oficina a las 9 cuenta con 30
minutos para llegar.

P(llegar a tiempo) = P(x 30) = P(Z 1,14) = 0,8729

De esta forma, el nmero de veces que lleg a tiempo = 120 0,8729 =


104,75. Por tanto, llegar a tiempo entre 104 y 105 veces de las 120 del
semestre.

c. Los viajes ms rpidos son los que toman menos tiempo, por lo tanto, el
rea es el 62% del lado izquierdo.

Usando la frmula de estandarizacin:

x 26 0,31* 3,5 27,09

De ese modo se tiene que 27,09 minutos es el tiempo mximo que toma el
62% de los viajes ms rpidos.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
269

Ejercicio Un bilogo ha determinado que el peso promedio de los alevines de cierta


especie de tilapia se distribuye normalmente con media de 30 gramos a los
de 120 das de cultivo y una desviacin estndar de 4,5 gramos. Calcule la
revisin probabilidad de que al seleccionar una de estas tilapias al azar tenga un
peso:

a) Mayor que 34 gramos


b) Menor que 32 gramos
c) Como mximo 26,8 gramos
d) Sobre qu valor se encuentra el 78% de los peces?
e) Cul es el valor bajo el que se encuentra el 35% de los peces con
menor peso?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen la distribucin normal.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Uso de Excel y Minitab para la distribucin normal

Ejemplo Se conoce que el nivel de colesterol en sangre en una poblacin adulta


entre 50 y 60 aos se distribuye normalmente con una media de 180
mg/100 ml de sangre y que la desviacin estndar es de 30 mg/100 ml.
Calcule, usando Excel y Minitab, la probabilidad de que uno de esos
adultos entre 50 y 60 aos tenga un nivel inferior a 200 mg/100 ml de
sangre.

Solucin En Excel: Se tiene que una media de 180 mg/100ml con una desviacin
estndar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:

P(X < 200) =

Entonces, en Excel se emplea la funcin DISTR.NORM, cuya sintaxis es:

= DISTR.NORM(x;media;desv_estndar;acum)

Los argumentos de la funcin anterior son:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
270

x: nmero establecido de la variable (x)


media: promedio ()
desv_estndar: desviacin estndar ()
acumulado: 0 si no es acumulado o 1 si es acumulado

As en este caso, se completa la funcin en la celda en la que se desea el


resultado (se indica al final 1 para que d el resultado acumulado):

=DISTR.NORM(200;180;30;1)

El resultado es 0,7475.

En Minitab: Se tiene que una media de 180 mg/100ml con una desviacin
estndar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:

P(X < 200) =

En Minitab, se da clic en el men Calc, luego en Distribuciones de


probabilidad, y ah se elige Normal. Se completa el cuadro de dilogo:

Se selecciona probabilidad acumulada para que calcule el valor de que x


sea menor que 200 y se completan los datos tal como se muestra en la
imagen. Luego se da clic en Aceptar y se obtiene el resultado 0,7475 en la
ventana Sesin.

Tambin, se puede hacer uso del men Grfica, donde se selecciona


Grfica de distribucin de probabilidad. En el cuadro de dilogo se
selecciona la opcin que dice Ver probabilidad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
271

En el cuadro de dilogo se selecciona en la lista la distribucin normal y se


introduce el dato de la media y la desviacin estndar:

Posteriormente se da clic en la pestaa rea sombreada. Aqu se elige


definir el rea sombreada por valor X y como en este caso se desea saber la
probabilidad de que x 200, entonces se selecciona Cola izquierda y se
escribe el valor de x en el espacio que aparece:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
272

Al dar clic en Aceptar, Minitab crea un grfico que indica el valor de la


probabilidad:

Grfica de distribucin
Normal. Media=180. Desv.Est.=30
0,014

0,012

0,010
Densidad

0,008
0,7475
0,006

0,004

0,002

0,000
180 200
X

Ejemplo Si el peso promedio de un hombre adulto es 74,8 kilogramos con una


desviacin estndar de 8 kilogramos. Si las medidas se distribuyen segn
una distribucin normal, calcule, usando Excel y Minitab, el peso que
separa el 15% de los hombres adultos con menor peso.

Solucin En Excel: Se tiene que una media de 74,5 Kg. con una desviacin estndar
de 8 Kg., y se pregunta el peso que separa el 15% de los hombres adultos
con menor peso. Entonces, en Excel se emplea la funcin
DISTR.NORM.INV, cuya sintaxis es:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
273

= DISTR.NORM.INV(probabilidad;media;desv_estndar)

Los argumentos de la funcin anterior son:

probabilidad: valor de probabilidad o percentil dado


media: promedio ()
desv_estndar: desviacin estndar ()

As en este caso, se completa la funcin en la celda en la que se desea el


resultado:

=DISTR.NORM.INV(0,15;74,5;8)

El resultado es 66,21 Kg.

En Minitab: Se tiene que una media de 180 mg/100ml con una desviacin
estndar de 30 mg/100ml, y se pregunta la probabilidad de que tenga un
nivel inferior a 200 mg/100 ml, o sea, que lo que se desea calcular es:

P(X < 200) =

En Minitab, se da clic en el men Calc, luego en Distribuciones de


probabilidad, y ah se elige Normal. Se completa el cuadro de dilogo:

Se selecciona probabilidad acumulada inversa para que devuelva el valor


de la variable en vez de calcular la probabilidad y se completan los datos
tal como se muestra en la imagen. Luego se da clic en Aceptar y se obtiene
el resultado 66,21 Kg. en la ventana Sesin.

Tambin, se puede hacer uso del men Grfica, donde se selecciona


Grfica de distribucin de probabilidad. En el cuadro de dilogo se

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
274

selecciona la opcin que dice Ver probabilidad.

En el cuadro de dilogo se selecciona en la lista la distribucin normal y se


introduce el dato de la media y la desviacin estndar:

Posteriormente se da clic en la pestaa rea sombreada. Aqu se elige


definir el rea sombreada por Probabilidad y como en este caso se el
problema se refiere a los de menor peso, entonces se selecciona Cola
izquierda y dado que se requiere saber el valor de x entonces se digita la
probabilidad de 0,15 en el espacio que aparece:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
275

Al dar clic en Aceptar, Minitab crea un grfico que indica el valor de la


variable x en el eje horizontal:

Grfica de distribucin
Normal. Media=74,5. Desv.Est.=8

0,05

0,04
Densidad

0,03

0,02

0,01
0,15

0,00
66,21 74,5
X

Aplicacin Administracin de proyectos


Cuando se administra un proyecto se tiene que planear un conjunto de
actividades y la duracin de las mismas. Hay muchos factores que pueden
provocar que una actividad dure ms tiempo, o menos tiempo, que lo que
se planea. Esto genera un riesgo para los encargados del proyecto, es decir,

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
276

no poder concluir el proyecto en el plazo comprometido.

Se han desarrollado tcnicas que permiten determinar la probabilidad de


terminar el proyecto en un determinado plazo. Esto es fundamental y
valioso para tomar decisiones en la gestin del proyecto.

Una tcnica bastante conocida consiste en calcular los tiempos de


terminacin de las distintas actividades bajo tres escenarios diferentes, uno
optimista, otro pesimista y uno que sea el ms probable. Luego se calcula
un tiempo esperado y una varianza. Con esta informacin podr calcularse
un tiempo esperado para todo el proyecto y su desviacin estndar.
Despus, usando la distribucin normal, puede estimarse la probabilidad
de terminar el proyecto en menos de determinado tiempo.

Claro que no estrictamente los tiempos de los proyectos tienen que seguir
una distribucin normal, por lo que tambin es posible emplear otras
distribuciones de probabilidad, e incluso usar tcnicas de simulacin, que
si bien, son un poco ms complejas, pueden dar resultados ms confiables.

Aproximacin de la distribucin normal a la binomial


Se vio anteriormente que cuando el tamao de la muestra tomada en la distribucin binomial
es mayor que 20, la probabilidad del evento se obtena por medio de la distribucin de
Poisson, siempre que p 5%. En los casos en que n > 20, pero p > 5% la distribucin que se
usa para aproximarse a la binomial es la normal. Algunos otros autores sealan que es cuando
n 30 que se puede hacer este ajuste. En general, conforme ms grande sea n, mejor ser la
forma que la normal aproxima a la binomial. En este caso, a diferencia de cuando se aproxima
la binomial, que es discreta, por la Poisson que tambin es discreta, se est realizando la
aproximacin por medio de una distribucin de variable continua.

Tericamente algunas distribuciones convergen a la normal a medida que sus parmetros se


aproximan a ciertos lmites. La distribucin binomial se aproxima bastante bien con la
normal.

Teorema. Si X es una variable aleatoria binomial con media = np y varianza 2 = npq, y si:

x x np
z
npq

entonces la expresin lmite de la funcin de distribucin de esa variable aleatoria


estandarizada cuando n es la distribucin normal estndar.

Cuando n es pequea la aproximacin es an bastante buena si p es razonablemente cercana a


0,5. La figura que se presenta muestra la aproximacin por la normal de una distribucin
binomial con n = 15 y p = 0,4. Las barras muestran las probabilidades segn la binomial y la
campana corresponde a la distribucin normal.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
277

Ejemplo Un ingeniero de sistemas cree que el 30% de las empresas estaran


dispuestas a actualizar el sistema operativo de sus equipos de cmputo a la
nueva versin que va a ser lanzada al mercado dentro de poco tiempo. De
acuerdo con ese dato, calcule la probabilidad de que de una muestra de 80
empresas:

a) entre 25 y 35 actualicen su sistema operativo.


b) por lo menos 20 actualicen su sistema operativo.
c) menos de 60 no actualicen su sistema operativo.

Solucin Este es un problema de distribucin binomial, pero que por tener n > 20 se
resuelve por aproximacin. En este caso no se puede aplicar la Poisson
porque p > 5%, por lo tanto se resuelve usando la normal como
aproximacin.

Al aplicarse la normal se debe realizar una correccin por continuidad


debido a que se est resolviendo un problema de variable discreta con una
distribucin de variable continua, para lo cual se restar 0,5 y se sumar
0,5 a los valores de x en el clculo de la probabilidad, tal como se explicar
ms adelante.

a) La probabilidad de que las empresas actualicen su sistema operativo es


de 30%, por lo tanto:

= np = 80 0,3 = 24

= npq 80 0,3 0,7 4,10

Se requiere calcular:

P(25 x 35) =

Ahora se va a aplicar la correccin por continuidad, que es de media


unidad (0,5) hacia atrs y media unidad (0,5) hacia delante en el intervalo:

P(25 0,5 x 35 + 0,5) =

P(24,5 x 35,5) =

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
278

Tomando los valores de = 24 y = 4,10, se aplica el clculo por la curva


normal:

24,5 24
z1 0,12
4,10
35,5 24
z2 2,80
4,10

Entonces:

P(25 x 35) = P(24,5 x 35,5) = P(0,12 z 2,80)

Aplicando la tabla de la curva normal estndar (Apndice 6):

= 0,9974 0,5478 = 0,4496

Si se utiliza Minitab para hacer el clculo con la distribucin binomial con


valores de n = 80 y p = 0,3, se obtiene una probabilidad de 0,4419, lo cual
indica que la aproximacin por la normal tiene un resultado bastante
cercano.

b) En este segundo caso se quiere calcular:

P(x 20)

Al aplicar la correccin por continuidad se recomienda poner los valores


en un intervalo, en este caso desde 20 hasta 80, ya que el tamao de
muestra es 80, y luego corregir:

P(x 20) = P(19,5 x 80,5)

Luego se estandariza:

19,5 24
z1 1,10
4,10
80,5 24
z2 13,78
4,10

Calculando con la distribucin normal:

P(x 20) = P(19,5 x 80,5) = P(1,10 z 13,78)

= P(z 13,78) P(z 1,10) = 1,0000 0,1357 = 0,8643

c) En este caso xito es que las empresas no deseen actualizar su sistema


operativo, por lo que p = 0,70. Entonces:

= np = 80 0,7 = 56

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
279

= npq 80 0,7 0,3 4,10

Luego se tiene que se busca:

P(x < 60)

Primero se expresa como el problema equivalente pero empleando el signo


en vez de <, ya que menos de 60 es lo mismo que menor o igual a 59,
esto para aplicar el mismo procedimiento visto anteriormente:

P(x < 60) = P(x 59)

Ahora se convierte al intervalo, pues menor o igual que 59 equivale al


intervalo de 0 a 59 y se aplica la correccin por continuidad:

P(x < 60) = P(x 59) = P(0 x 59) = P(0,5 x 59,5)

Ahora se estandariza:

0,5 56
z1 13,78
4,10
59,5 56
z2 0,85
4,10

Planteando el problema completo y aplicando la tabla de normal estndar:

P(x < 60) = P(x 59) = P(0 x 59) = P(0,5 x 59,5)

= P(13,78 z 0,85) = P(z 0,85) P(z 13,78)

= 0,8023 0 = 0,8023

Aplicacin Garanta de los productos


Cuando usted adquiere un producto, como un televisor, un telfono o una
computadora, siempre espera que el fabricante ofrezca un plazo de garanta
razonable. Posiblemente usted no comprara un aparato de estos si le
ofrecen una garanta de un mes. As, un producto con una garanta por un
plazo amplio es visto como un producto de calidad, es un producto
confiable.

Entonces, para la empresa fabricante la garanta es un factor para competir


contra otras compaas. Ahora bien, las empresas ofrecen un plazo de
garanta determinado cuando saben que el nmero de unidades que podran
fallar en dicho plazo es mnimo, pues cada falla significa un costo y
significa que hubo algn problema a lo largo del proceso de produccin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
280

Las empresas tratan de calcular intervalos de confianza de la tasa de


reclamaciones por garanta y su varianza, adems de estimar el posible
efecto sobre sus costos y entonces poder pronosticar el impacto futuro de
las reclamaciones por garanta. En el clculo de estas estimaciones se
requiere gran cantidad de datos y el uso de modelos estadsticos, entre
ellos distribuciones de probabilidad, tales como la distribucin de Poisson,
la distribucin normal, la distribucin exponencial, la distribucin
lognormal y la distribucin de Weibull, entre otras.

Distribucin exponencial
A una oficina de un banco llegan, en promedio, 3 clientes por hora a solicitar un crdito. Se
desea saber la probabilidad de que transcurran 30 minutos entre la llegada de un cliente y el
siguiente. En un problema de este tipo, en el que se desea calcular la probabilidad de que se
d un determinado tiempo entre la ocurrencia de dos eventos sucesivos, muy similar a un
problema en el que se pueda aplicar la distribucin de Poisson, se puede resolver empleando
la distribucin exponencial.

As, si un determinado evento ocurre en el mismo contexto de un proceso de Poisson, segn


se explic anteriormente, entonces el intervalo de tiempo o espacio entre dos eventos
sucesivos sigue la distribucin exponencial. As, la distribucin exponencial se utiliza para
calcular la probabilidad de ocurrencia de un cierto evento en una extensin de tiempo, en un
rea o en un volumen especfico.

Un proceso de Poisson es estacionario, por lo que la probabilidad de ocurrencia del evento es


igual a todo lo largo del espacio o periodo relevante, de modo que la distribucin exponencial
permite calcular la probabilidad de, por ejemplo:

Que un evento ocurra dentro de un determinado plazo o espacio.


Que transcurra determinado tiempo entre dos eventos sucesivos.
Que transcurra determinado tiempo desde un determinado punto temporal hasta un primer
evento.

Si es el nmero promedio de ocurrencias en el plazo de inters, entonces la variable x est


exponencialmente distribuida si su funcin de densidad es:

P(x) = ex para x 0, 0.

La probabilidad exponencial de que el primer evento ocurra dentro de un determinado


intervalo temporal o especial es:

P( X x) 1 e x

Por otro lado, la probabilidad exponencial de que el primer evento no ocurra dentro de un
intervalo temporal o especial especificado es:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
281

P( X x) e x

Ejemplo A una oficina de un banco llegan, en promedio, 3 clientes por hora a


solicitar un crdito. Se desea saber la probabilidad de:

a. Que transcurran 30 minutos entre la llegada de un cliente y el siguiente.


b. Que tras la salida de un cliente el prximo llegue en el curso de los 20
minutos siguientes.

Solucin Se tiene que = 3 clientes por hora:

a. Dado que la pregunta se refiere al periodo 30 minutos, entonces:

= 3/2 = 1,5

Dado que se busca la probabilidad de que el primer evento no ocurra


dentro de un intervalo temporal dado, entonces se sustituye en la frmula:

P e e 1,5 0,2231

b. En un lapso de 20 minutos, = 1. Dado que se busca la probabilidad de


que el primer evento ocurra dentro de un intervalo temporal dado, entonces
se sustituye en la frmula:

P 1 e 1 e 1 1 0,3679 0,6321

Ejemplo El tiempo requerido para que ocurra una reaccin qumica est
exponencialmente distribuido con un tiempo esperado de 4 minutos:

a. Qu proporcin de la sustancia se formar dentro de dos minutos?


b. Qu proporcin de la sustancia se formar entre 3 y 8 minutos?

Solucin Se pueden emplear intervalos de un minuto, dado que la reaccin se hace,


en promedio, en 4 minutos, entonces el nmero esperado de sustancia
formada en un minuto ser = 1/4 = 0,25 (este sera la cantidad media de
ocurrencias por minuto), entonces:

a. Dado que la pregunta se refiere al periodo 2 minutos, entonces = 0,5:

P e e 0,5 0,6065

b. Entre 3 y 8 minutos, se usa = 0,75 y = 2, respectivamente:

P(4 x 8) e 0,75 e 2 0,4724 0,1353 0,3370

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
282

Ejercicio Se sabe que la vida til de cierto tipo de bujas sigue una distribucin
exponencial con media de 160.000 km. Cul es la probabilidad de que
de una buja seleccionada aleatoriamente dure:
revisin
a. a lo sumo 180.000 km?
b. entre 150.000 y 200.000 km?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen la distribucin normal.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Uso de Excel y Minitab para la distribucin exponencial

Ejemplo Los clientes de una tienda llegan en promedio de 20 por hora. Utilice
Excel y Minitab para determinar la probabilidad de que transcurran a lo
sumo 6 minutos despus de la llegada del ltimo cliente y el prximo.

Solucin En Excel: Se tiene que una media = 20 clientes por hora y se pregunta la
probabilidad de que transcurran a lo sumo 6 minutos despus de la llegada
del ltimo cliente y el prximo, por lo que x = 0,1, pues equivale a 6
minutos de una hora que tiene 60 minutos, o sea, x = 6/60 = 0,1. Entonces,
en Excel se emplea la funcin DISTR.EXP, cuya sintaxis es:

= DISTR.EXP(x;lambda;acum)

Los argumentos de la funcin anterior son:

x: nmero establecido de la variable (x)


lambda: promedio ()
acumulado: 0 si no es acumulado o 1 si es acumulado

As en este caso, se completa la funcin en la celda en la que se desea el


resultado colocando el valor de x como 0,1, la media de 20 y(se indica al
final 1 para que d el resultado acumulado):

=DISTR.EXP(0,1;20;1)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
283

El resultado es 0,8647.

En Minitab: Se tiene que una media de 1/20, y se pregunta la probabilidad


de que transcurran a lo sumo 6 minutos despus de la llegada del ltimo
cliente y el prximo, por lo que x = 0,1, pues equivale a 6 minutos de una
hora que tiene 60 minutos, o sea, x = 6/60 = 0,1. Se da clic en el men
Calc, luego en Distribuciones de probabilidad, y ah se elige Exponencial.
Se completa el cuadro de dilogo:

Se selecciona probabilidad acumulada y se completan los datos tal como se


muestra en la imagen. Luego se da clic en Aceptar y se obtiene el resultado
0,8647 en la ventana Sesin.

Tambin, se puede hacer uso del men Grfica, donde se selecciona


Grfica de distribucin de probabilidad. En el cuadro de dilogo se
selecciona la opcin que dice Ver probabilidad.

En el cuadro de dilogo se selecciona en la lista la distribucin


exponencial y se introduce el dato de la escala, que es la media, y el dato
del valor umbral se puede dejar en cero:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
284

Posteriormente se da clic en la pestaa rea sombreada. Aqu se elige


definir el rea sombreada por Valor de x, se selecciona Cola izquierda y se
digita el valor de x de 0,1 en el espacio que aparece:

Al dar clic en Aceptar, Minitab crea un grfico que indica el valor de la


variable x en el eje horizontal:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
285

Grfica de distribucin
Exponencial. Escala=0,05. Valor umbral=0

20

15
Densidad

10

0,8647

0
0 0,1
X

El valor esperado y la varianza de una distribucin exponencial de probabilidad, donde la


variable es x y corresponde a una unidad de tiempo o espacio, son:

1
E ( x)

1
2
2

Aplicacin Lneas de espera


Todos conocemos la frase el tiempo es oro. Para algunos negocios esa
frase es clave para su competitividad, como en el caso de los restaurantes
de comida rpida o los bancos. En la medida en la cual el cliente espere
poco tiempo, sea en la fila o en el servicio mismo, esos clientes tendrn
una razn ms para continuar empleando sus servicios.

Los ingenieros han desarrollado modelos de teora de colas o lneas de


espera basados en distribuciones de probabilidades (como la distribucin
de Poisson o la distribucin exponencial) que permiten determinar qu tan
larga podra llegar a ser la cola o cunto sera el tiempo promedio de
espera, de manera que es posible disear un sistema en el que el cliente no
espere demasiado y a un costo razonable para el proveedor del servicio.
Por ejemplo, en el rea de cajas, podra tomarse la decisin de que los
clientes hagan filas independientes para cada caja (varios cajero cada uno
con su propia cola), o si es deben formarse en una nica fila y que luego
pasen al cajero que se desocupe primero (una cola con varios servidores).

Una tcnica alternativa a la teora de colas es la simulacin, la cual puede


ser empleada para evaluar el desempeo del sistema de colas. La

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
286

simulacin tambin se basa en distribuciones de probabilidad, pero con la


ventaja de que puede ser mucho ms flexible.

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Otras distribuciones de variable continua


Existen muchas otras distribuciones de variable continua como la distribucin uniforme,
triangular, Gamma, t, Weibull, entre muchas otras. En el material impreso de este texto no se
presentan estas otras distribuciones, pero en el material digital en la pgina de internet de este
libro s se desarrollan otras distribuciones de variable continua.

Ejercicios:
Ejercicios de desarrollo:
Conteste las preguntas que se formulan a continuacin (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

Distribucin normal
1. Si se tiene que = 35, = 5, halle las siguientes probabilidades normales:
a. P(x 28) =
b. P(x 40) =
c. P(26 x 34) =

2. Se sabe que las concentraciones de colesterol total en la sangre para cierta poblacin se
distribuyen normalmente con promedio 210 mg/100ml y desviacin estndar de 18
mg/100ml. Con base en estos datos, conteste
a. Cul es la probabilidad de que al seleccionar una de estas personas al azar tenga
una concentracin de colesterol entre 175 y 220 mg/100ml?
b. Si hay 25000 personas en esa poblacin, cuntos de ellos se espera que tengan los
niveles de colesterol superiores a 230 mg/100 ml?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
287

3. Suponga que el nivel de glucosa en la sangre de una poblacin se distribuye normalmente


con media de 101 mg/dl con desviacin estndar de 29 mg/dl, entonces calcule la
probabilidad de que al seleccionar una de esas personas al azar, tenga un nivel de glucosa en
la sangre:
a. Inferior a 90 mg/dl
b. Superior a 108 mg/dl
c. Entre 95 y 120 mg/dl

4. Un laboratorio farmacutico prepara pastillas circulares. Se sabe que el dimetro se


distribuye normalmente con media es 9 mm con una desviacin estndar de 0,5 mm. Si se
sabe que las pastillas deben satisfacer un dimetro mnimo de 8 mm y mximo de 10,2 mm,
calcule la probabilidad de que una pastilla seleccionada al azar:
a. Tenga un dimetro fuera de la especificacin
b. A partir de qu dimetro se encuentra el 10% de las pastillas con mayor dimetro?
c. Qu porcentaje de las pastillas tiene un dimetro en un rango de ms/menos una
vez la desviacin estndar con respecto a la media?

5. En un estudio sobre las alpacas se encontr que los adultos machos tenan, en promedio, un
peso vivo de 64,78 Kg., con una desviacin estndar de 12,87 Kg. Con base en estos datos
determine la probabilidad de que un macho adulto seleccionado tenga un peso:
a. Superior a 71 Kg.
b. Inferior a 56 Kg.
c. Entre 60 y 70 Kg.
d. Cul es el peso mnimo que marca el lmite del 35% de los machos adultos de
mayor peso?
e. Cul es el peso mximo que marca el lmite del 15% de los machos adultos de
menor peso?

6. Una empresa fabrica pantallas LCD para cmaras digitales. Las pantallas deben tener una
dimensin de 76 mm. En promedio las pantallas fabricadas miden 75,95 mm con una
desviacin estndar de 0,08 mm distribuidas normalmente. Con base en estos datos, calcule la
probabilidad de obtener al azar una pantalla con dimensin:
a. Mayor que 76,1 mm.
b. Menor que 75,0 mm.
c. Entre 75,2 y 76,9 mm.
d. Cul es la dimensin del 10% de las pantallas de mayor dimensin?

7. En una determinada localidad se va a construir un puente. Luego del anlisis de distintos


escenarios en los que se efectuara cada una de las etapas del proyecto, desde la delimitacin y
preparacin de la zona, la construccin de los apoyos, montaje de la estructura, entre otras,
hasta su conclusin se tomara un tiempo esperado de 39 semanas con una desviacin
estndar de 7 semanas. Calcule la probabilidad de que el proyecto:
a. Se comprometera usted a entregar el proyecto en 42 semanas?
b. Cunto tiempo propondra usted para entregar el proyecto de modo que se tenga un
95% de probabilidad de cumplir con ese plazo estipulado?

8. Suponga que el proceso de empacado de frijoles tiene una media de 896 gramos por bolsa
con una desviacin estndar de 12 gramos. Se considera que los pesos se distribuyen
normalmente. Con base en los datos anteriores determine la probabilidad de que al seleccionar
aleatoriamente una bolsa:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
288

a. Tenga un peso superior a 1 kilogramo.


b. Tenga un peso inferior a 890 gramos.
c. Tenga un peso entre 0,90 y 0,95 kilogramos.
d. Si se decide volver a llenar la cuarta parte de las bolsas con menor peso, a partir de
qu peso, en gramos, se debern volver a llenar estas bolsas?

9. Un analista ha observado las comisiones que ganan los corredores de bolsa durante los
ltimos aos y se ha dado cuenta que siguen una distribucin de probabilidad normal. El
monto anual medio percibido es de $30000, y la desviacin estndar de $7000.
a. Qu porcentaje de los corredores de bolsa percibe entre $27500 y $40000 al ao?
b. Si hay 200 corredores de bolsa, cunto de ellos se espera que tengan comisiones
superiores a $42000?
c. Si se va a otorgar un incentivo al 10% de los corredores que logran mayores
comisiones, a partir de cul monto de comisiones se ofrecer este incentivo?

10. El departamento de recursos humanos de una empresa ha desarrollado un novedoso


sistema de entrenamiento. Luego de probarlo por unas semanas se ha observado que el tiempo
para completar el entrenamiento se comporta normalmente y que los empleados lo concluyen
en un promedio de 265 horas con una desviacin estndar de 55 horas. Encuentre la
probabilidad de que un empleado seleccionado al azar termine el programa:
a. En menos de 285 horas.
b. En menos de 240 horas.
c. En ms de 230 horas.
d. En ms de 300 horas.
e. Entre 270 y 310 horas.
f. Entre 200 y 260 horas.
g. Entre 250 y 290 horas.
h. Cul es el tiempo que separa el 20% de los empleados que duran ms en la
terminacin del programa?
i. Cul es el tiempo que separa el 15% de los empleados que duran menos en la
terminacin del programa?

11. Un viaje en autobs tiene una duracin distribuida normalmente con media de 23 minutos
y desviacin estndar 3,4 minutos. Todos los das se requiere llegar al destino a las 9.00 a.m.
a. A qu hora debe iniciarse para tener una probabilidad del 95% de estar a tiempo?
b. Si se inicia a las 8.30 a.m., Cul es la probabilidad de que no llegue a tiempo?
c. Si se ha decidido iniciar a las 8.30 todos los das, Cuntas veces se llegar a tiempo
en un periodo de un ao (suponga que se realiza 360 veces en ese periodo)?

12. Un hotel registra datos sobre el nmero de das de estancia de cada uno de sus huspedes.
Esta variable se distribuye normalmente con media 6 y desviacin estndar 3,1. Segn una
proyeccin se esperan 150 huspedes. Con base en estos datos, calcule cuntos huspedes se
espera que se hospeden:
a. Menos de 4 das?
b. Ms de 8 das?
c. Entre 5 y 9 das?
d. Cul es el tiempo mnimo que se prolonga la estancia del 75% de los huspedes
que se alojan ms tiempo en el hotel?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
289

13. Las puntuaciones de una prueba para medir el nivel de ingls de personas de habla hispana
se distribuyen normalmente con media de 520 puntos y desviacin estndar de 110 puntos.
Calcule la probabilidad de obtener una nota:
a. Menor de 630 puntos. Primero indique cul debera ser el resultado (empleando la
regla emprica) y luego efecte los clculos para comprobar el resultado.
b. De por lo menos 740 puntos.
c. De ms de 850 puntos.
d. Como mximo 345 puntos.
e. De ms de 475 puntos.
f. De entre 450 y 800 puntos.
g. Cuntas personas, de un grupo de 400, se esperara que obtengan notas entre 420 y
735 puntos?
h. Cul fue la calificacin obtenida por el 10% de los que salieron con mejor nivel de
ingls?
i. Cul fue la calificacin mxima obtenida por el 20% de los de ms bajo nivel de
ingls?

14. Algunas personas desarrollan adiccin al trabajo, lo cual les resta calidad de vida y afecta
sus relaciones familiares y sociales, e incluso afecta su salud. Un equipo especializado ha
elaborado una prueba para determinar si una persona es adicta al trabajo. La prueba mide la
adiccin al trabajo en una escala y si una persona obtiene entre 120 y 150 puntos est en
riesgo de ser adicto al trabajo, y si obtiene ms de 150 puntos, entonces es adicto al trabajo.
Luego de aplicar la prueba a varios miles de personas, se encontr que las puntuaciones se
distribuyen normalmente con una media de 105 puntos y desviacin estndar de 28 puntos.
Calcule la probabilidad de que una persona seleccionada al azar:
a. Est en riesgo de ser adicto al trabajo.
b. Sea adicto al trabajo.
c. No sea adicto ni est en riesgo de ser adicto al trabajo.
d. A partir de cul puntaje se encuentra el 10% de las personas con mayor nivel de
adiccin al trabajo?

15. Si el nmero de horas que los funcionarios de una empresa dedican a iniciativas de
voluntariado se distribuye normalmente, cul es la probabilidad de que un funcionario
seleccionado al azar dedique una cantidad de hora que se ubique en un rango de dos veces la
desviacin estndar (hacia arriba o hacia abajo) con respecto a la media?

16. Una institucin realiz un plan de capacitacin entre mujeres emprendedoras de una zona
marginal del pas. Se logr determinar que el ingreso de estas mujeres se distribuye
normalmente con una media de $450 al mes. Si el percentil 70 de ingreso es de $650, cul es
la desviacin estndar del ingreso de estas mujeres?

17. En un estudio se determin que los gastos en publicidad de las universidades privadas del
pas se distribuye normalmente con una desviacin estndar de $400 mil al ao. Si el monto
mximo del gasto en publicidad del 30% de las empresas que menos gastan en publicidad es
$100 mil dlares al ao, calcule el gasto anual promedio de estas grandes compaas.

18. En una investigacin sobre las iniciativas de voluntariado que realizan los empleados de
distintas empresas del pas involucradas en programas sociales se estim que el tiempo que
cada funcionario dedica a estas actividades se distribuye normalmente con media de 40

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
290

horas/ao y desviacin estndar de 22 horas/ao. Si en una empresa participan en estos


programas 50 colaboradores:
a. Calcule la probabilidad de que un funcionario seleccionado al azar participe menos
de 30 horas/ao.
b. Cuntos empleados se esperara que participen ms de 60 horas/ao?
c. Cul es el nmero de horas mnimo correspondiente al 15% de los funcionarios
que ms tiempo participan?

19. Suponga que el proceso de empacado de detergente en polvo tiene una media de 996
gramos por bolsa con una desviacin estndar de 42 gramos. Se considera que los pesos se
distribuyen normalmente. Con base en los datos anteriores determine la probabilidad de que al
seleccionar aleatoriamente una bolsa:
a. Tenga un peso superior a 1,1 kilogramos.
b. Tenga un peso superior a 900 gramos.
c. Tenga un peso inferior a 1000 gramos.
d. Tenga un peso inferior a 920 gramos.
e. Tenga un peso entre 900 y 950 gramos.
f. Si se decide volver a llenar el 10% de las bolsas con menor peso, a partir de qu
peso, en gramos, se debern volver a llenar estas bolsas?

20. Si los dimetros del cable coaxial RG-174 fabricado por una empresa se distribuyen
normalmente con media 2,55 mm. y desviacin estndar 0,8 mm., determinar el porcentaje de
cables con dimetros:
a. entre 2,5 y 2,6 mm.
b. menores o iguales a 2,44 mm.
c. mayores o iguales a 2,62 mm.
d. Cul debe ser el tamao mnimo que debe tener el 10% de los cables con el mayor
dimetro?

21. Los dimetros interiores de las arandelas hechas por cierto fabricante se distribuyen
normalmente con una media de 11,2 mm y una desviacin estndar de 0,15 mm.
a. Cuntas arandelas de un lote de 1500 tienen un dimetro interno mayor a 11,5
mm?
b. Cul es la probabilidad de que una arandela tenga un dimetro inferior a 11,4 mm?
c. Cul es la probabilidad de que una arandela tenga un dimetro entre 11,05 y 11,59
mm?
d. Cul es el dimetro mnimo del 70% de las arandelas con mayor dimetro interno?
e. Cul es el valor del dimetro sobre el que est el 15% de las arandelas de menor
dimetro interno?
f. Cul es el valor del dimetro bajo el que est el 25% de las arandelas?
g. Cul es el dimetro mximo del 82,5% de las arandelas?

22. Los rendimientos de un portafolio de inversiones se distribuyen normalmente con una


media anual de 4,5% con una desviacin estndar de 1,7%.
a. Cul es el rendimiento porcentual que est por debajo del 95% de los rendimientos
del portafolio?
b. Cul es la probabilidad de tener prdidas con este portafolio?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
291

23. Los resultados de una prueba para determinar el cociente intelectual se distribuyen
normalmente con una media de 101 puntos y desviacin estndar de 10 puntos. Si se
selecciona al azar una persona, determine la probabilidad de que obtenga en la prueba:
a. Ms de 120 puntos.
b. Menos de 85 puntos.
c. Entre 90 y 110 puntos.
d. Cul es el puntaje mnimo del 6% de las personas con mayor cociente intelectual
segn este test?

24. Una empresa que emisora de tarjetas de crdito sabe, por experiencia, que el saldo
mensual promedio de los clientes es de $258 con una desviacin estndar de $136. Calcule la
probabilidad de que el saldo mensual sea:
a. Ms de $220.
b. Menos de $300.
c. Entre $188 y $227.
d. Cunto ser el monto mximo del 70% de los saldos ms bajos?
e. Sobre qu valor se encuentra el 23% de los saldos?

Distribucin exponencial
25. Como administrador de un restaurante de comidas rpidas sabe que, en promedio, llega un
cliente cada 2,5 minutos y desea conocer la probabilidad exponencial de que pasen ms de 50
segundos entre la llegada de dos clientes.

26. Un fabricante de discos duros indica que los discos que fabrica tiene una vida media de
1400000 horas. Si esta vida til vara exponencialmente, determine la probabilidad de que uno
de estos discos duros seleccionados al azar tenga una vida til:
a. Menos a 1000000 de horas.
b. Inferior a 10 aos funcionando 24 horas al da.
c. Si la esperanza de vida en un pas es de 78 aos, cul es la probabilidad de que uno
de estos discos duros dure ms que la vida esperada de una persona?

27. Se sabe que el tiempo de espera de una persona que llama a un centro de llamadas de una
empresa de soporte tecnolgico es una variable aleatoria exponencial con media 4,5 minutos.
Encuentre la probabilidad de que un cliente que llame en un momento seleccionado al azar
tenga que esperar:
a. A lo sumo 6 minutos.
b. Como mximo 3 minutos.
c. Entre 2 y 5 minutos.

28. Se sabe que un cierto tipo de motor debera tener una vida til distribuida
exponencialmente de 400000 kilmetros. Con base en estos datos determine:
a. La probabilidad de que un motor seleccionado al azar tenga una vida de a lo sumo la
mitad de lo esperado.
b. Si se tiene una flota de 200 vehculos empleando este tipo de motor, cuntos se
esperara que se que tenga una vida superior a 500000 km?

29. Los tiempos de espera en la fila de los clientes de un banco se distribuyen


exponencialmente con una media de 15 minutos. Calcule la probabilidad de que un cliente
seleccionado al azar espere:
a. Ms de 20 minutos.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
292

b. Entre 17 y 23 minutos.
c. Menos de 25 minutos.

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. Si se sabe que b es una variable normal estndar, Cul es la probabilidad de que b sea
mayor que 2,5?
( a ) 0,0000 ( b ) 0,9938
( c ) 0,0062 ( d ) Falta informacin

2. Si se sabe que b es una variable normal estndar, Cul es el valor de que b que se ubica en
el percentil 19? Usando la tabla de la distribucin normal estndar acumulada:
( a ) 0,88 ( b ) 0,7910
( c ) 0,88 ( d ) Ninguna de las anteriores

3. Si se sabe que x es una variable normal con media 12 y varianza 9, Cul es la probabilidad
de que x sea menor que 10? Usando la tabla de la distribucin normal estndar acumulada:
( a ) 0,4121 ( b ) 0,7486
( c ) 0,2514 ( d ) Ninguna de las anteriores

4. Si se sabe que x es una variable normal con media 12 y varianza 9, Cul es la probabilidad
de que x sea como mnimo igual a 8? Usando la tabla de la distribucin normal estndar
acumulada:
( a ) 0,6716 ( b ) 0,0918
( c ) 0,9082 ( d ) Ninguna de las anteriores

5. Si se sabe que x es una variable normal, Cul es la probabilidad de que x tome valores en
un intervalo de 2 veces la desviacin estndar con respecto a la media?
( a ) 0,997 ( b ) 0,683
( c ) 0,954 ( d ) Falta informacin

6. Si se sabe que x es una variable normal con media 12 y varianza 9, Cul es el valor de x
que separa el 15% superior de los valores posibles de x?
( a ) 0,85 ( b ) 8,891
( c ) 15,11 ( d ) Ninguna de las anteriores

7. La distribucin exponencial permite obtener respuesta a preguntas relacionadas con la


probabilidad de que un evento ocurra en determinado plazo, el tiempo entre dos eventos
sucesivos o el tiempo que transcurre desde un determinado punto temporal hasta un primer
evento, se llama:
( a ) Exponencial ( b ) Normal
( c ) Geomtrica ( d ) Poisson

8. Una empresa ha comprado un equipo para su produccin que requiere una pieza especial.
Segn el proveedor esa pieza especial posee una vida esperada de 8 meses. Si usted desea

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
293

saber la probabilidad de tener que reemplazar esta pieza antes de 6 meses, debera emplear la
distribucin:
( a ) Binomial ( b ) Normal ( c ) Multinomial ( d ) Geomtrica

9. La tasa media de llegadas de clientes a un restaurante de comida rpida es de 4 por minuto.


Si usted desea saber la probabilidad de que en una hora seleccionada aleatoriamente lleguen
menos de 200 clientes, entonces usara:
( a ) Binomial ( b ) Exponencial
( c ) Poisson ( d ) Normal

10. La tasa media de llegadas de clientes a un restaurante de comida rpida es de 4 por


minuto. Si usted desea saber la probabilidad de que pasen 30 segundos entre la llegada de dos
clientes en una hora seleccionada aleatoriamente, entonces usara:
( a ) Binomial ( b ) Exponencial
( c ) Poisson ( d ) Normal

11. Una fbrica de cemento empaca su producto en sacos que tienen una media de 51,9
kilogramos, con una desviacin estndar de 350 gramos, de acuerdo con una distribucin
normal. La especificacin es que cada saco pese exactamente 52 kilogramos. La probabilidad
de que un saco seleccionado al azar tenga un exceso en el peso de un kilogramo o ms con
respecto al peso especificado es:
( a ) 0,0008 ( b ) 0,9992
( c ) 0,0021 ( d ) Ninguna de las anteriores

12. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso en un rango de 2 veces la desviacin estndar con respecto al promedio
es:
( a ) 0,9540 ( b ) 0,6830
( c ) 0,9970 ( d ) Ninguna de las anteriores

13. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso entre 50 y 52 kilogramos es:
( a ) 0,6125 ( b ) 0,3875
( c ) 0,9999 ( d ) Ninguna de las anteriores

14. Tomando los mismos datos del problema 11, la probabilidad de que un saco seleccionado
al azar tenga un peso inferior a 51,1 kilogramos es:
( a ) 0,4991 ( b ) 0,5009
( c ) 0,0111 ( d ) Ninguna de las anteriores

15. Tomando los mismos datos del problema 11, en un lote de 200 sacos, el nmero de sacos
que se esperara que tengan un peso superior a 52,5 kilogramos es:
( a ) 12,5 ( b ) 8,64
( c ) 0,0432 ( d ) Ninguna de las anteriores

16. Tomando los mismos datos del problema 11, si se considera que si un saco tiene un peso
en el 10% inferior debe reprocesarse, entonces el valor que marca el peso en kilogramos a
partir del cual los sacos deben reprocesarse es:
( a ) 51,95 ( b ) 51,45
( c ) 0,5235 ( d ) Ninguna de las anteriores

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
294

17. Tomando los mismos datos del problema 11, el valor que marca el percentil 85 de los
pesos, en gramos, es:
( a ) 52,26 ( b ) 52260
( c ) 0,5154 ( d ) Ninguna de las anteriores

18. En una distribucin exponencial:


A. La media de la distribucin equivale a uno entre lambda
B. La varianza de la distribucin equivale a uno entre lambda al cuadrado
Con respecto a las dos afirmaciones anteriores, es correcto que:
( a ) Son verdaderas ambas ( b ) Solo B es verdadera
( c ) Son falsas ambas ( d ) Solo A es verdadera

19. Cul de las siguientes es falsa acerca de los datos que sigue la distribucin normal?
( a ) El promedio es el mismo que el modo
( b ) La desviacin estndar es la misma que la media
( c ) La mediana es el mismo que el modo
( d ) La mayora de los datos est dentro de 3 desviaciones estndar de la mediana

20. Cul de las siguientes no es cierto acerca de la distribucin normal?


( a ) la media, la mediana y la moda son iguales
( b ) la curva es sesgada a la derecha
( c ) la curva nunca toca el eje x
( d ) el rea bajo la curva es uno

21. En los problemas binomiales en que n > 20 y p > 5%, es falso que:
( a ) se puede emplear la normal para aproximar la binomial
( b ) los resultados de la binomial y la normal son iguales
( c ) los resultados de la binomial y la normal convergen con forme n tiende a infinito
( d ) efectuar el clculo usando la distribucin binomial lleva ms trabajo

Respuestas a los ejercicios de seleccin mltiple:

1. c 2. c 3. c 4. c 5. c
6. c 7. a 8. b 9. c 10. b
11. a 12. a 13. a 14. c 15. b
16. b 17. b 18. a 19. b 20. b
21. b

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
295

8 .

Estimacin por intervalos


OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Explicar el concepto de inferencia estadstica.
2. Explicar el teorema del lmite central.
3. Calcular intervalos de confianza para la media poblacional.
4. Calcular intervalos de confianza para la proporcin poblacional.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
296

Inferencia estadstica
El objetivo de una investigacin estadstica por muestreo es poder realizar inferencias acerca
de la poblacin pero obtenidas a partir de la informacin contenida en una muestra tomada
aleatoriamente. Por ejemplo, si en una investigacin se desea conocer la ingesta promedio de
caloras en una determinada poblacin, entonces se toma una muestra representativa y se
espera que esos datos muestrales permitan efectuar conclusiones relacionadas con toda la
poblacin, pues el objetivo es conocer la poblacin, no la muestra.

Las poblaciones son representadas por descripciones numricas llamadas parmetros, por
ejemplo, la media () o la desviacin estndar (), as, la inferencia estadstica consiste en
hacer inferencias sobre parmetros a partir de estadsticos como x y s, los cuales son
calculados con base en las observaciones de las muestras. Para efectos de este texto, estas
inferencias se relacionarn principalmente con la estimacin por intervalos de una media
poblacional y de una proporcin poblacional, las cuales se tratarn en este captulo, y en un
captulo posterior se trabajar lo relacionado con las pruebas de hiptesis.

Distribucin muestral de la media si es conocida


Antes de empezar a exponer propiamente cmo se realiza una estimacin por intervalos, es
necesario presentar algunos aspectos que son fundamentales para poder comprender en qu se
basa la teora que sustenta la determinacin de los intervalos de confianza.

Suponga que se realizan 4 lanzamientos seguidos de un dado. En cada caso se van a apuntar
los 4 resultados. En la tabla se presentan los resultados de simular 50 series de 4 lanzamientos
del dado. La simulacin se efectu usando la funcin de Excel =ALEATORIO.ENTRE(1;6) y
los promedios se :

# lanzamiento del dado # lanzamiento del dado


Serie 1 2 3 4 Serie 1 2 3 4
1 1 5 3 6 26 5 2 1 6

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
297

2 4 5 5 2 27 2 5 6 1
3 4 5 5 2 28 1 3 4 6
4 4 5 3 6 29 3 1 6 6
5 4 4 6 2 30 4 5 3 1
6 2 4 2 4 31 4 6 6 1
7 2 2 6 5 32 5 1 5 1
8 3 5 1 4 33 6 4 3 4
9 5 3 1 1 34 5 3 2 3
10 2 2 6 2 35 3 6 1 4
11 2 3 3 2 36 4 1 2 4
12 2 6 5 6 37 4 5 3 2
13 4 5 3 1 38 1 6 4 4
14 4 6 1 5 39 5 1 5 1
15 1 5 3 5 40 4 1 1 6
16 3 1 2 4 41 6 6 5 5
17 4 2 5 2 42 1 6 2 2
18 6 1 1 6 43 3 1 5 4
19 5 4 4 6 44 3 5 4 1
20 4 6 6 4 45 5 4 4 5
21 2 1 2 3 46 5 1 6 4
22 1 2 6 4 47 4 4 6 3
23 2 1 1 3 48 6 5 3 3
24 5 5 3 3 49 2 1 6 1
25 2 4 5 5 50 3 1 5 3

Si se toman los 200 lanzamientos en total (50 series de 4 lanzamientos cada una) y se
construye una grfica representando los resultados, es de esperar que todas las barras sean de
una altura similar, porque cada uno de los 6 posibles resultados tiene la misma probabilidad
de aparecer (probabilidad que en cada caso es 1/6), pero con pequeas diferencias debidas al
azar, tal como se muestra en el siguiente histograma:

40
35
30
25
Frecuencia

20
15
10
5
0
1 2 3 4 5 6
Resultados del dado

Ahora, para cada una de las 50 serie se va a obtener la media, es decir, en cada caso se suman
los 4 valores y se divide entre 4 para cada una de las series de 4 lanzamientos. Esto va a dar
una lista de 50 promedios:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
298

Serie x Serie x Serie x Serie x


1 3,75 14 4,00 27 3,50 40 3,00
2 4,00 15 3,50 28 3,50 41 5,50
3 4,00 16 2,50 29 4,00 42 2,75
4 4,50 17 3,25 30 3,25 43 3,25
5 4,00 18 3,50 31 4,25 44 3,25
6 3,00 19 4,75 32 3,00 45 4,50
7 3,75 20 5,00 33 4,25 46 4,00
8 3,25 21 2,00 34 3,25 47 4,25
9 2,50 22 3,25 35 3,50 48 4,25
10 3,00 23 1,75 36 2,75 49 2,50
11 2,50 24 4,00 37 3,50 50 3,00
12 4,75 25 4,00 38 3,75
13 3,25 26 3,50 39 3,00

Observe que cada serie tiene una media distinta, a pesar de que se origina del mismo proceso
aleatorio. Esas diferencias se deben al azar. Ahora, en vez de emplear los datos de los 200
lanzamientos, se tomarn las 50 medias obtenidas en cada serie, y se volver a construir la
grfica, la cual corresponde al histograma siguiente.
30

25

20
Frecuencia

15

10

0
1 2 3 4 5 6
Resultados del dado

En principio se pudo haber esperado que las dos grficas debieran tener forma similar, pero es
claro que esto no es as. Al graficar los promedios muestrales se observa que la distribucin
muestral de las medias es aproximadamente normal. Este resultado no es casualidad. En
general, si se toman muestras aleatorias de n elementos de una poblacin y se calculan los
promedios x i de cada una de las muestras, es de esperar que los valores de las medias no sean
todos iguales, sino que presentan diferencias debidas al azar, pero que estas medias tienden a
distribuirse segn una curva normal, independientemente de la forma de la poblacin original,
o sea, que no importa si los datos originales siguen o no una distribucin normal. Todo esto
conduce al siguiente teorema:

Teorema: Si se extrae una muestra aleatoria de tamao n de una poblacin que tiene media
y varianza finita 2 entonces x es el valor de una variable aleatoria con media y desviacin
estndar:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
299

Para muestras tomadas de poblaciones infinitas:


x
n

Para muestras tomadas de poblaciones finitas de tamao N:

N n
x
n N 1

A la desviacin estndar de las medias muestrales se le conoce como error estndar de la


media y se denota por x .

ERROR ESTNDAR DE LA MEDIA Desviacin estndar de las medias


muestrales. Se denota por x .

Se puede demostrar que para N grande en comparacin al tamao n de la muestra el factor de


N n
correccin para muestras es aproximadamente igual a 1 por lo que las dos frmulas del
N 1
error estndar daran prcticamente el mismo valor.

Ejemplo El nivel de glucosa en la sangre de una cierta poblacin compuesta por


5000 miembros tiene una desviacin estndar de 29 mg/dl. Se toma una
muestra de 40 personas, cul es el factor de correccin y el error estndar
de la media?

Solucin El factor de correccin es:

N n 5000 40
0,9922
N 1 5000 1

Si la desviacin estndar = 29, entonces el error estndar de la media es:

29
x 4,59
n 40

y aplicando el factor de correccin:

N n 29 5000 40
x 4,57
n N 1 40 5000 1

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
300

Ejercicio La prueba de admisin de una universidad tiene una desviacin estndar de


250 puntos. Si se toma una muestra de 60 estudiantes que han aplicado la
de prueba, cul es el error estndar?
revisin
Cmo cambia el resultado anterior si se sabe que un total de 6000
estudiantes han realizado la prueba?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen el clculo de
intervalos de confianza.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Puede verse en el ejemplo que la diferencia entre el error estndar con el factor de correccin
y el primero que se calcul que no lo incorporaba es mnima, ya que en ese caso el factor de
correccin es muy cercano a uno. Si el tamao de la muestra es ms grande o si la poblacin
es ms pequea, entonces el factor de correccin marcar una diferencia ms importante. Por
ejemplo, con una poblacin ms pequea de tamao 500 (y con tamao de muestra 40), el
factor de correccin es:

N n 500 40
0,9218
N 1 500 1

y entonces el error estndar sera:

N n 29 500 40
x 4,40
n N 1 40 500 1

Teorema del lmite central


Con base en los conceptos anteriores, puede enunciarse un importante teorema para la
inferencia estadstica, conocido como el teorema del lmite central:

Teorema: Si x es la media de una muestra aleatoria de tamao n extrada de una poblacin


que tiene media y varianza finita 2, entonces dicha media muestral x tendr una
distribucin normal con media y varianza 2/n conforme aumenta el tamao de la muestra
n.

En otras palabras se tendr que z, dada por:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
301

x
z
/ n

es el valor de una variable aleatoria cuya funcin de distribucin se aproxima a la distribucin


normal estndar cuando n tiende a . Esto se cumple independientemente de la forma de la
poblacin, es decir, la distribucin de x es aproximadamente normal con media y varianza
2/n cuando n es grande.

Distribucin muestral de la media con desconocida (distribucin t de


Student)
Ahora bien, muchas veces la desviacin estndar poblacional no es conocida, entonces no
se cumple el teorema anterior, pero si es posible emplear el teorema siguiente:

Teorema: Si x es la media de una muestra aleatoria de tamao n extrada de una poblacin


normal que tiene media que tiene media y varianza 2, entonces:

x
t
s/ n

es el valor de una variable aleatoria con distribucin t y gl = n 1 grados de libertad.

Para usar la distribucin t no se requiere conocer , pero se debe poder suponer


razonablemente que la poblacin de donde se tom la muestra es normal.

La distribucin t tiene forma de campana y es simtrica con respecto al origen, igual que la
distribucin normal, e, igual que la distribucin normal estndar, tiene media = 0, sin
embargo, su desviacin estndar depende de los grados de libertad. A medida que la muestra
es ms grande la distribucin t se aproxima a la normal estndar, es decir, tiende a 1 cuando
n tiende a y, por lo tanto, gl tiende a . Se considera que la distribucin normal estndar es
una buena aproximacin a la distribucin t para muestras mayores o iguales a 30.

Los valores de t se encuentran en la tabla de la distribucin t en el Apndice 7 de este texto, y


pueden corresponder a las probabilidades de una cola o de dos colas. Por ejemplo, para el
caso de la cola derecha se tendra grficamente:

La tabla que aparece en el Apndice 7 se muestra del modo siguiente (aqu aparece solo una
parte de la tabla para ilustrar su uso):

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
302

Los siguientes son ejemplos de valores de t tomados de la tabla t (Apndice 7). Si se tiene que
el valor = 0,01, y que n = 2, entonces gl = n 1 = 1, por lo que se busca el = 0,01 en los
niveles de significancia para pruebas de una cola, o sea, en la cuarta columna, y en el rengln
de gl = 1, as que se tendra que t = 31,821. Si se buscara en el valor = 0,01 para pruebas de
dos colas, entonces se busca en la quinta columna, y en el rengln de gl = 1, as que se tendra
que t = 63,657. Luego, en este captulo y los siguientes, se indicar cundo emplear los
valores para la prueba de una cola y cundo los de la prueba de dos colas.

Si = 0,01 con n = 12, entonces gl = n 1 = 11, entonces se busca el = 0,01 en los niveles
de significancia para pruebas de una cola, o sea, en la cuarta columna, y en el rengln de gl =
11, as que se tendra que t = 2,718. Otros ejemplos son:

Si n = 22, entonces gl = n 1 = 21 y t = 2,518


Si n = 30, entonces gl = n 1 = 29 y t = 2,462, tambin z = 2,325

Claramente se observa que conforme n crece, y por lo tanto gl tambin crece, el valor de t se
aproxima al de z en la curva normal estndar.

Inferencia para la media


La inferencia para la media aritmtica se realiza principalmente mediante intervalos de
confianza y mediante pruebas de hiptesis. En este captulo se tratar solamente lo
correspondiente a los intervalos de confianza, pero en un captulo posterior se trabajar el
tema de las pruebas de hiptesis.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
303

Intervalos de confianza para la media y error mximo de la estimacin


Cuando se usa una media muestral x para estimar el valor de la media poblacional no se
puede esperar que los dos valores sean iguales. La probabilidad de que el estimador (la media
muestral) y el parmetro (la media poblacional) sean diferentes es muy alta. Esa diferencia
entre estos dos valores se le conoce como error de la estimacin.

ERROR DE ESTIMACIN Diferencia, en valor absoluto, entre el valor de la media


muestral y la media poblacional.

En trminos de los smbolos de cada uno de los valores el error de estimacin se expresara:

ERROR DE ESTIMACIN E x

Cuando se utiliza la media muestral x para construir un intervalo de confianza para estimar la
media poblacional , la probabilidad de que esta estimacin no falle es como mximo de 1
. Esta probabilidad se le conoce como nivel de confianza.

CONFIANZA Probabilidad de que la estimacin por intervalos de la media


poblacional no falle.

Grficamente se puede expresar, en trminos de la distribucin normal o la distribucin t,


como sigue:

Segn el teorema del lmite central el valor de z en la distribucin normal es:

x
z
/ n

Solo interesan los valores de Z que estn entre en el intervalo de confianza Z/2 y Z/2:

x
Z / 2 Z / 2
/ n

Si se toman los valores en los extremos de las desigualdades y el valor absoluto de x (que
es el error de estimacin) al sustituir en las desigualdades de arriba se tiene:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
304

x E
Z / 2
/ n / n

Despejando el valor de E se obtiene el error mximo de la estimacin de por x :


ERROR MXIMO DE ESTIMACIN EZ para n 30
n

E t para n < 30
n

Retomando la expresin anterior:

x
Z / 2 Z / 2
/ n

se obtienen las frmulas para el intervalo de confianza. Se toma primero slo el lado
izquierdo de la desigualdad:

x
Z / 2
/ n

y se despeja:

Z / 2 / n x
x Z / 2 / n

Despejando el lado derecho se obtiene:

x Z / 2 / n

Y juntando los lados se obtiene en intervalo de confianza para la media poblacional :

x Z / 2 / n x Z / 2 / n

La frmula resumida para el intervalo de confianza es:

xE

A modo de resumen, los lmites de estimacin o intervalos de confianza corresponden a:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
305

INTERVALOS DE CONFIANZA:
Cuando n 30 y conocida: x Z / n

Cuando n < 30 y conocida: x Z / n

Cuando n 30 y desconocida: x Z s/ n

Cuando n < 30 y desconocida: x ts/ n


si se puede suponer que la poblacin de donde se tom la muestra es normal

Cuando n < 30 y desconocida: x k s/ n


si la poblacin no es normal

En el ltimo caso la confianza del intervalo es 1 1/k2 (se aplica el teorema de Chebyshev).

Intervalos de confianza cuando n 30 y conocida


Tal como se mostr en el cuadro anterior, si el tamao de muestra es mayor o igual a 30 y se
conoce la desviacin estndar poblacional, entonces al calcular los intervalos de confianza se
emplea la distribucin normal, o sea, un valor de z y el valor conocido de la desviacin
estndar.

INTERVALO DE CONFIANZA:
Cuando n 30 y conocida: x Z / n

Ejemplo Durante una semana se toma una muestra aleatoria de 50 empleados de


una empresa, y se obtiene un salario promedio de $206. Se conoce que la
desviacin estndar poblacional de $40.

Determine los intervalos de confianza del 95% para la media de los


salarios de esta empresa.

Solucin Se tiene que n = 50, x = $206, = 40 y una confianza 1 = 0,95.

Dado que la confianza es: 1 = 0,95, entonces = 0,05, o sea, que se


tendra /2 = 0,025, por lo que 1 /2 = 1 0,025 = 0,975. Como n 30 y
conocida, se debe usar z. De la tabla de la distribucin normal estndar z
con /2 equivale a z = 1,96.

Luego se sustituye en la frmula del intervalo de confianza cuando n 30


y conocida:

x Z / n

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
306

206 1,96 40 / 50

Para obtener el lmite inferior se resta:

Li 206 1,96 40 / 50 194,91

Y para obtener el lmite superior se suma:

Ls 206 1,96 40 / 50 217,09

En conclusin, se tiene una confianza de que la media de los salarios de


esta empresa se encuentra entre $194,91 y $217,09.

Ejercicio En una muestra de 50 hectreas tomadas al azar de diferentes fincas


productoras de papa se rendimiento promedio de 40 toneladas por hectrea
de al emplear un cierto tipo de abono orgnico. Se conoce, por un estudio
revisin previo, que la desviacin estndar poblacional es de 8 toneladas/ha.
Obtenga un intervalo de confianza del 95% para la media del rendimiento
de papa por hectrea.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para calcular intervalos de confianza

Ejemplo Utilice Excel y Minitab para resolver el problema: Durante una semana se
toma una muestra aleatoria de 50 empleados de una empresa, y se obtiene
un salario promedio de $206. Se conoce que la desviacin estndar
poblacional de $40.
Determine los intervalos de confianza del 95% para la media de los
salarios de esta empresa.

Solucin Se tiene que n = 50, x = $206, = 40 y una confianza: 1 = 0,95.

En Excel se emplea la funcin INTERVALO.CONFIANZA, la cual da el


error mximo de estimacin, o sea, el resultado de calcular z / n , por
lo que luego es necesario tomar el promedio obtenido en la muestra y
restar y sumar el valor dado por la funcin para obtener los lmites de
confianza inferior y superior, respectivamente. La funcin tiene la
siguiente sintaxis:

=INTERVALO.CONFIANZA(alfa;desv_estndar;tamao)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
307

Los argumentos de la funcin anterior son:

alfa: es el valor dado


desv_estndar: es la desviacin estndar ( o s)
tamao: es el tamao de muestra (n)

Luego se sustituyen los valores:

=INTERVALO.CONFIANZA(0,05;40;50)

As se obtiene el valor 11,09. Para obtener el lmite inferior se resta:

= 206 11,09 = 194,91

Y para obtener el lmite superior se suma:

= 206 + 11,09 = 217,09

En conclusin, se tiene una confianza de que la media de los salarios de


esta empresa se encuentra entre $194,91 y $217,09.

En Minitab se da clic en el men Estadstica, se elige Estadstica bsica y


luego se selecciona Z de 1 muestra. Ah se completa el cuadro de dilogo
siguiente:

Se marca la opcin de datos resumidos y se completan los datos tal como


se muestra en la imagen. En el botn Opciones se indica el nivel de
confianza, que en este caso es 95%. La opcin Hiptesis alterna debe
dejarse como "no es igual a". Luego se da clic en Aceptar y el resultado se
obtiene en la ventana Sesin:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
308

En la salida en la ventana Sesin se observa IC de 95%, que corresponde al


intervalo de confianza del 95%, y que este es 194,91 a 217,09.

Intervalos de confianza cuando n < 30 y conocida


Cuando el tamao de muestra es menor que 30 y se conoce la desviacin estndar
poblacional, entonces al calcular los intervalos de confianza se emplea la distribucin normal,
o sea, un valor de z y el valor conocido de la desviacin estndar.

INTERVALO DE CONFIANZA:
Cuando n < 30 y conocida: x Z / n

Ejemplo Se sabe que el tiempo que toma completar una prueba psicomtrica tiene
una varianza de 225 minutos. Una muestra de 20 estudiantes es sometida a
la prueba obtenindose una media de 71 minutos. Obtenga los lmites de
confianza del 99% para el tiempo medio en que se completa dicha prueba.

Solucin Se tiene que n = 20, x = 71 minutos, = 15 minutos (la raz cuadrada de


225, que es la varianza) y una confianza: 1 = 0,99.

Dado que la confianza es: 1 = 0,99, entonces /2 = 0,005. Como n < 30


y conocida, se debe usar z. De la tabla de la distribucin normal estndar
z con /2 equivale a z = 2,58.

Luego se sustituye en la frmula del intervalo de confianza cuando n < 30


y conocida:

x Z / n
71 2,58 15 / 20

Para obtener el lmite inferior se resta:

Li 71 2,58 15 / 20 62,36

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
309

Y para obtener el lmite superior se suma:

Ls 71 2,58 15 / 20 79,64

En conclusin, se tiene una confianza de el tiempo de terminacin de la


prueba se encuentra entre 62,36 y 79,64 minutos.

Ejercicio Se desea estimar el consumo promedio de leche de los habitantes de un


pueblo rural. En una muestra de 15 pobladores se obtuvo un consumo
de medio por da de 288 ml y una desviacin estndar de 52 ml. Determine
revisin los intervalos de confianza del 90% para el verdadero promedio del
consumo diario de leche de esta poblacin.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar un video que expone el
audiovisual uso de Minitab para el clculo de
intervalos de confianza.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Intervalos de confianza cuando n 30 y desconocida


Cuando el tamao de muestra es mayor o igual a 30 y no se conoce la desviacin estndar
poblacional, sino que solo se conoce la desviacin estndar muestral, entonces al calcular los
intervalos de confianza se emplea la distribucin normal (por el teorema del lmite central), o
sea, se utiliza un valor de z y el valor de la desviacin estndar muestral.

INTERVALO DE CONFIANZA:
Cuando n 30 y desconocida: x Z s/ n

Ejemplo En una muestra de 42 personas que se han sometido a un trasplante de


corazn se ha obtenido un tiempo medio de sobrevivencia (en aos) de
5,25 aos con una desviacin estndar muestral de 1,75 aos. Hallar un
intervalo de confianza del 95 por ciento para el promedio de vida de todas
las personas que se han sometido a un trasplante de corazn.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
310

Solucin Se tiene que n = 42 personas, x = 5,25 aos, s = 1,75 aos y una


confianza: 1 = 0,95.

Dado que la confianza es: 1 = 0,95, entonces /2 = 0,025. Como n 30


y desconocida se debe usar z. De la tabla de la distribucin normal
estndar z con /2 equivale a z = 1,96.

Luego se sustituye en la frmula del intervalo de confianza cuando n 30


y desconocida:

x zs/ n
5,25 1,96 1,75 / 42

Para obtener el lmite inferior se resta:

Li 5,25 1,96 1,75 / 42 4,72

Y para obtener el lmite superior se suma:

Ls 5,25 1,96 1,75 / 42 5,78

En conclusin, se tiene una confianza de que el promedio de vida de todas


las personas que se han sometido a un trasplante de corazn se encuentra
entre 4,72 y 5,78 aos.

Ejercicio Una empresa productora de harina de trigo empaca paquetes que deben
contener un kilogramo de producto. En una muestra de 60 paquetes se
de obtuvo un peso medio de 992 gramos y una desviacin estndar muestral
revisin de 44 gramos. Calcule los intervalos de confianza del 98% para el peso
medio de los paquetes de harina.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Intervalos de confianza cuando n < 30 y desconocida


Cuando el tamao de muestra es menor o igual a 30 y no se conoce la desviacin estndar
poblacional, sino que solo se dispone de la desviacin estndar muestral, entonces al calcular
los intervalos de confianza no se emplea la distribucin normal, sino que se utiliza la
distribucin t (con grados de libertad gl = n 1) y el valor conocido de la desviacin estndar.
En estos casos se supone que la variable que se estima se distribuye normalmente.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
311

INTERVALO DE CONFIANZA:
Cuando n < 30 y desconocida: x ts/ n

Cuando n < 30 y desconocida se puede emplear x k s / n si la poblacin no es normal,


donde la confianza del intervalo es 1 1/k2, aplicando el teorema de Chebyshev.

Ejemplo El ciclo medio de vida de una muestra aleatoria de 12 focos es de 2000


horas, con una desviacin estndar muestral de 200 horas. Se supone que
la vida media de los focos se distribuye normalmente. Determine los
intervalos de confianza del 95% para la vida media de los focos.

Solucin Se tiene que n = 10, x = 2000, s = 200 y una confianza: 1 = 0,95.

Dado que la confianza es: 1 = 0,95, entonces /2 = 0,025. Como n < 30


y desconocida, se debe usar t. Despus se busca en la tabla de la
distribucin t de Student, con una significancia de 0,05, con dos colas y
grados de libertad gl = n 1 = 10 1 = 9, el valor de t equivale a t = 2,262.

Luego se sustituye en la frmula del intervalo de confianza cuando n 30


y desconocida:

x ts/ n
2000 2,262 200 / 10

Para obtener el lmite inferior se resta:

Li 2000 2,262 200 / 8 1856,94

Y para obtener el lmite superior se suma:

Ls 2000 2,262 200 / 8 2143,06

En conclusin, se tiene una confianza de 95% de que la vida media de los


focos se encuentra entre 1856,94 y 2143,06 horas.

Ejercicio En una encuesta aplicada a 25 personas residentes de la ciudad capital se


encontr que, por semana, dedicaban un promedio de 4,8 horas a la
de lectura, tanto de libros, revistas, peridicos y otros materiales. Se conoce
revisin que la desviacin estndar poblacional es de 3,5 horas/semana. Determine
los intervalos de confianza del 99% para el nmero de horas promedio que
las personas dedican a la lectura.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
312

Grados de libertad
Los grados de libertad corresponden a una medida del nmero de observaciones
independientes entre los elementos de una muestra, es decir, es el nmero de datos que se
podran cambiar de modo que, dado un total fijo, se puede obtener ese total. Por ejemplo, la
media aritmtica tiene n - 1 grados de libertad, ya que, si tuviramos una muestra de 10 datos
y conocemos el valor de la media, entonces podramos modificar 9 datos, o sea, n - 1 datos, y
el dcimo quedara determinado. Si se tuviera una tabla de 5 filas y 4 columnas, o sea, 5 x 4, y
se conocen los totales de cada fila y columna, entonces en cada fila se podra modificar 3
datos (y el quinto quedara determinado por la diferencia de los 4 primeros con el total) y en
cada columna se podran cambiar 4 datos, de modo que los grados de libertad de esta tabla 5 x
4 seran (5 - 1) x (4 - 1) = 4 x 3 = 12 grados de libertad.

Uso de Minitab para calcular intervalos de confianza usando la distribucin t

Ejemplo Utilice Minitab para resolver el problema: El ciclo medio de vida de una
muestra aleatoria de 12 focos es de 2000 horas, con una desviacin
estndar muestral de 200 horas. Se supone que la vida media de los focos
se distribuye normalmente. Determine los intervalos de confianza del 95%
para la vida media de los focos.

Solucin Se tiene que n = 10, x = 2000, s = 200 y una confianza: 1 = 0,95.

En Minitab se da clic en el men Estadstica, se elige Estadstica bsica y


luego se selecciona t de 1 muestra. Ah se completa el cuadro de dilogo
siguiente:

Se marca la opcin de datos resumidos y se completan los datos tal como

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
313

se muestra en la imagen. En el botn Opciones se indica el nivel de


confianza, que en este caso es 95%. La opcin Hiptesis alterna debe
dejarse como "no es igual a". Luego se da clic en Aceptar y el resultado se
obtiene en la ventana Sesin:

En la salida en la ventana Sesin se observa IC de 95%, que corresponde al


intervalo de confianza del 95%, y que este es 1856,9 a 2143,1.

Ejemplo Se sabe que 20 fusibles que fueron sometidos a una sobrecarga del 20% se
fundieron en un tiempo promedio de 10,63 minutos, con desviacin
estndar de 2,48 minutos.

a) Si se utiliza x = 10,63 como estimacin puntual de la media de tiempo


poblacional, de cunto es el error mximo si se desea con una confianza
del 95%?
b) Determine un intervalo de confianza del 95% para el promedio
verdadero del tiempo de fusin.

Solucin Se tiene que n = 20, x = 10,63 minutos, s = 2,48 minutos y una confianza:
1 = 0,95.

a) Dado que la confianza es: 1 = 0,95, entonces /2 = 0,025. Como n <


30 y desconocida se debe usar t en vez de Z, con gl = 20 1 = 19. De la
tabla t con /2 = 0,025 y gl = 19, se obtiene t/2 = 2,093.

De ah el error: E = t/2s/ n = 2,093 2,48/ 20 = 1,16 minutos. Se


puede afirmar con una confianza del 95% que la media de la muestra se
aparta de la media poblacional a lo sumo en 1,16 minutos.

b) Si se supone que la poblacin de donde se tom la muestra es normal, el


intervalo de confianza est dado por x t / 2 s / n porque n < 30 y
desconocida.

En la parte (a) ya se obtuvo el valor del error de la estimacin por lo que el


intervalo es 1.16, por lo que los intervalos estarn dados por 10,63 1,16,
de donde se obtiene 10,63 1.16 = 9,47 y 10,63 + 1,16 = 11,79. As se
puede concluir que:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
314

P(9,47 < < 11,79) = 0,95

Es decir, 95 de cada 100 promedios calculados con muestras de 20


elementos tendrn un valor de entre 9,47 y 11,79 minutos.

Qu pasara si se supiera que la poblacin no es normal? Entonces se


aplican los intervalos dados por x k s / n , donde la confianza est
dada por 1 1/k2. Es decir:

1 1/k2 = 0,95

Despejando k:

1/k2 = 0,05
1/ 0,05 = 20 = k2
k = 4,472

Calculando los lmites:

8,15
x k s / n 10,63 4,472 2,48 20 10,63 2,48
13,11

Entonces:

P(8,15 < < 13,11) = 0,95

Inferencia para proporciones


Para realizar la estimacin de una proporcin poblacional se cuenta con la proporcin
x
muestral, p , donde x es el nmero de veces que ha ocurrido un evento en n pruebas. Por
n
x 30
ejemplo, si en un lote de 3000 piezas salen 30 defectuosas, p 0,01 es la
n 3000
proporcin muestral que podr usarse como estimador del valor poblacional. Este valor puede
darse tambin en forma porcentual, as es que se puede afirmar que el porcentaje de
defectuosos es de 1%. Tambin, si el valor se repite en gran cantidad de muestras, se puede
decir que la probabilidad de defectuosos en el proceso es de 0,01.

Al trabajar con proporciones se supondr siempre que las situaciones satisfacen las
condiciones de la distribucin binomial, por lo tanto, la distribucin de muestreo en la que se
basarn los mtodos es la binomial con = np y = npq . Se sabe adems que cuando n >
20 y p > 5% la binomial se puede aproximar por la distribucin normal con:

x x nP pP
z
nPQ PQ n

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
315

El valor p P es la diferencia entre la proporcin muestral p, y la poblacional P. Si se toma


en valor absoluto se tiene el error de la estimacin de la proporcin E = | p P |.

En los intervalos de confianza interesan los valores de Z que estn en Z/2 < Z < Z/2, los
cuales se obtienen por medio de:

pz pq n

Debido a que no se tienen la proporcin poblacional, en todas estas frmulas se usa el valor
de p y q de la muestra.

Ejemplo Se toma una muestra de 500 varones adultos y se encuentra que 156 son
fumadores. Encuentre los lmites de confianza del 99% para la proporcin
de fumadores varones.

Solucin Se tiene que x = 156 fumadores de una muestra de n = 500 varones


adultos, as que la proporcin muestral p sera:

p = x/n = 156/500 = 0,312

por lo que q = 1 p = 1 0,312 = 0,688.

La confianza del 99%, es decir, 1 = 0,99, = 0,01, /2 = 0,005, as que


de la tabla se obtiene z = 2,58, segn la distribucin normal.

Calculando el intervalo con p = 0,312, q = 0,688, z = 2,58 y n = 500:

0,2586
pz pq n = 0,312 2,58 0,312 0,688 500 =
0,3653

Se tiene una confianza del 99% de que la proporcin de fumadores est


entre 25,86% y 36,53%.

Ejemplo El departamento de ventas de una empresa sostiene que se entregan en la


fecha fijada con el cliente el 95% de los pedidos. Si al revisar las fechas de
entrega de 200 rdenes se encontr que 184 fueron entregadas a tiempo,
con los datos de la muestra encuntrese un intervalo del 95% de confianza
para la proporcin verdadera de pedidos entregados a tiempo. Debe
sealarse el error de la estimacin.

Solucin Se pide el intervalo para la proporcin poblacional p z pq n con una


confianza del 95%, es decir, 1 = 0,95, = 0,05, /2 = 0,025, as que de
la tabla se obtiene z = 1,96, segn la distribucin normal.

Adems se tiene que x = 184 entregas a tiempo de una muestra de n = 200


entregas, as que la proporcin muestral p sera:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
316

p = x/n = 184/200 = 0,92

por lo que q = 1 p = 1 0,92 = 0,08.

Calculando el intervalo con p = 0,92, q = 0,08, z = 1,96 y n = 200:

pz pq n = 0,92 1,96 0,92 0,08 200 = 0,92 0,038

El error es 0,038 y el intervalo queda:

P(0,882 p 0,958) = 0,95

Es decir, se tiene una confianza de 95% de que la proporcin de pedidos


entregados a tiempo se encuentra entre 88,2% y 95,8%.

Ejercicio Una empresa desea lanzar un nuevo servicio por internet al mercado y para
ello requiere conocer la proporcin de hogares de la zona que posee acceso
de a internet. En una muestra 120 hogares, 70 indicaron que posean algn
revisin tipo de conexin a la red. Determine los intervalos de confianza del 99%
para la proporcin de hogares de la zona con acceso a internet.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Minitab para calcular intervalos de confianza para proporciones

Ejemplo En una muestra de 1000 adultos y se encuentra que 198 estarn de acuerdo
con la despenalizacin de la marihuana. Encuentre los lmites de confianza
del 99% para la proporcin de adultos que apoyaran la despenalizacin de
la marihuana.

Solucin Se tiene que x = 198 eventos de una muestra de n = 1000 adultos, as que
en el men Estadsticas / Estadstica bsica / 1 Proporcin se completa el
cuadro, seleccionando la opcin Datos resumidos con 198 eventos y 1000
ensayos:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
317

Luego en el botn Opciones se indica el nivel de confianza del 99% y se


debe marcar la opcin que dice Utilice la prueba y el intervalo basado en la
distribucin normal:

El resultado se obtiene en la ventana Sesin. Se concluye que se tiene una


confianza del 99% de que la proporcin de adultos que est de acuerdo con
la despenalizacin de la marihuana est entre 16,55% y 23,05%.

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
318

Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios siguientes (las respuestas a los ejercicios se encuentran en la pgina de
internet del texto: www.auladeeconomia.com/raeep.html).

1. En un estudio se logr determinar que el aclaramiento sistmico promedio del diclofenaco


en plasma es de 263 ml/min con una desviacin estndar de 56 ml/min. Se emple un tamao
de muestra de 350 observaciones. Obtenga los intervalos de confianza del 90% para
aclaramiento sistmico promedio.

2. En una muestra de 250 metros de cable coaxial RG-174 fabricado por una empresa se
obtuvo un dimetro medio de 2,55 mm. Se sabe que la desviacin estndar es 0,5 mm.
Determine los intervalos de confianza del 99% para el dimetro promedio.

3. En una prueba de seguridad automovilstica, la presin promedio en las llantas de los


automviles de una muestra de 47 neumticos fue de 28 libras por pulgada cuadrada y la
desviacin estndar fue de 2,7 libras por pulgada cuadrada.

a. Cul es la desviacin estndar estimada para la poblacin?


b. Calcule el error estndar y el error de estimacin.
c. Construya un intervalo de confianza del 95% para la media de la poblacin.

4. En una feria de empleo se tom una muestra al azar de 40 aplicantes. Se les aplic una
prueba para determinar su nivel de ingls y se obtuvo que 32 tenan un nivel de 600 puntos o
ms y un promedio de 680 puntos. Se sabe que la prueba tiene una desviacin estndar de 150
puntos. Con base en estos datos:

a. Determine los intervalos de confianza del 95% para el nivel medio de ingls de las
personas que buscaban empleo en esa la feria.
b. Si el nivel de 600 puntos se considera como aceptable para las empresas que buscan
un alto dominio del ingls, determine los intervalos de confianza del 99% para la
proporcin de personas que tienen un elevado dominio del idioma ingls.

5. En una nuestra de 40 mujeres se determin que su pulso cardaco promedio era de 76,3
latidos por minuto. Se conoce que la desviacin estndar poblacional es de 12,5 latidos por
minuto. Con base en los datos anteriores, determine:

a. Calcule el error estndar del pulso cardaco promedio (en latidos por minuto).
b. Calcule los intervalos de confianza del 95% para el pulso cardaco promedio de las
mujeres.

6. El gerente de una empresa procesadora de caf est preocupado porque sus proveedores le
entregan con frecuencia caf verde. Se tomaron como muestras 36 probetas de 250 ml cada
una y encontr que en promedio se entreg 30 ml de grano verde por probeta con una
desviacin de 10 ml. Calcule el intervalo del 98% para la cantidad de grano verde por probeta.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
319

7. Un fabricante de hornos de microondas quiere saber la proporcin de familias que


preferiran usar su marca. Toman al azar una muestra de 75 amas de casa y 30 de ellas
respondieron que la usaran. Calcule un intervalo de confianza del 95% para la verdadera
proporcin de amas de casa que preferiran dicha marca de lavadora.

8. Segn un estudio en 25 familias de estratos socio econmicos medios y altos, los nios
inician alguna prctica de cuidado de su salud buco dental a los 15,6 meses. Se conoce que la
desviacin estndar es 8,5 meses. Calcule los intervalos de confianza del 99% para la edad de
inicio de las prcticas cuidado buco dental de los nios de familias de estratos socio
econmicos medios y altos.

9. Un arquitecto considera que actualmente las casas tienen un rea construida inferior a la de
hace dos o ms dcadas. En una muestra de 15 viviendas construidas en el transcurso de los
dos ltimos aos se encontr un rea construida promedio de 92 metros cuadrados y una
desviacin estndar de 30 metros cuadrados.

a. Obtenga los intervalos de confianza del 95% para el rea construida de las viviendas
nuevas.
b. Si se sabe, por otro estudio, que las viviendas construidas hace dos dcadas o ms
tenan un rea construida promedio de 130 metros cuadrados, podra considerarse,
con base en el intervalo calculado, que efectivamente el rea de las viviendas es menor
actualmente?

10. En una muestra de 12 motores para automvil de cierto tipo se obtuvo una vida til
promedio de 300000 kilmetros. La desviacin estndar muestral es de 60000 kilmetros.
Obtenga los intervalos de confianza del 90% para la vida til promedio de estos motores.

11. Una compaa ha desarrollado un nuevo motor de gasolina. Para valorar su consumo de
combustible efecta 15 recorridos y el motor consumi en promedio 8,7 galones de gasolina
por minuto con una desviacin estndar de 1,2 galones. Qu se podra afirmar, con un 99%
de confianza, acerca del tamao mximo del error de estimacin?

12. Un jefe de produccin de una maquiladora desea estimar en forma rpida el tiempo medio
que requieren las 520 costureras de la planta para realizar cierta tarea. Con ese fin selecciona
una muestra de 15 de ellas y cronometra sus tiempos, obteniendo los siguientes resultados
(tiempos en segundos):

52 59 63 49 54 56 54 50 66 70 61 57 53 55 56

Efecte una estimacin por intervalos, con una confianza del 95% para el tiempo medio de
realizacin de dicho trabajo.

13. Cierta compaa desea determinar el tiempo medio de horas extra laboradas cada semana
por sus trabajadores del rea de produccin. Se ha tomado una muestra de 15 trabajadores con
las siguientes cantidades de horas para la semana pasada:

5 8 7 2 1 6 0 4 3 11 6 13 7 2 4

Construya un intervalo de confianza del 98% para la media poblacional.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
320

14. Los siguientes datos corresponden a una muestra de personas que aplicaron un test para
medir su cociente intelectual: 102, 98, 95, 112, 125, 85, 83, 129, 78, 116, 101, 96, 100, 103,
97, 102, 95, 101, 98, 99, 103, 101. Determine los intervalos de confianza del 90% para el
cociente intelectual promedio.

15. Una institucin realiz un plan de capacitacin entre mujeres emprendedoras de una zona
marginal del pas. El objetivo es que estas mujeres lograran incrementar los ingresos de sus
microempresas. Luego de implementadas las capacitaciones se compararon los ingresos de
una muestra de 12 microempresas y se registraron los siguientes ingresos (en dlares al mes):

Participantes 1 2 3 4 5 6 7 8 9 10 11 12
Antes 320 290 421 510 210 402 625 560 360 431 506 505
Despus 340 285 475 510 210 500 631 560 365 431 525 619

a. Determine los intervalos de confianza del 90% para los ingresos de las participantes
antes de la capacitacin.
b. Determine los intervalos de confianza del 90% para los ingresos de las participantes
despus de la capacitacin.
c. A qu conclusin puede llegarse luego de analizar los dos resultados anteriores?

16. Un ingeniero ha recopilado datos sobre la vida til de 20 filtros de gasolina del mismo
tipo y marca. Los datos son los siguientes (en miles de kilmetros): 12, 14, 16, 15, 10, 20, 13,
15, 16, 14, 12, 13, 11, 13, 15, 16, 13, 14, 14, 12. Calcule los intervalos de confianza del 95%
para la vida media de un filtro de gasolina.

17. Un contador est realizando una auditora de los cheques extendidos por una compaa.
En una muestra de 20 cheques se obtuvieron los siguientes montos, en miles dlares:

15, 17, 22, 8, 4, 2, 16, 6, 8, 14, 15, 25, 20, 5, 6, 8, 12, 19, 11, 12

Construya un intervalo del 95% de confianza para el monto medio de los cheques extendidos
por la compaa.

18. Dada la alta incidencia de la diabetes, en una zona del pas se ha implementado un
programa de dieta y ejercicio para la poblacin que padece esta enfermedad. Para determinar
la efectividad del programa se han reunido los siguientes datos, que corresponden a los
niveles de glucosa en la sangre de una muestra de 5 pacientes diabticos, tomadas antes del
programa de dieta y ejercicio y luego de dicho programa.

Paciente Antes Despus


1 142 127
2 115 109
3 132 117
4 91 102
5 170 158

Con base en los datos anteriores:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
321

a. Calcule los intervalos de confianza del 95% para los niveles de glucosa en la sangre
antes del programa de dieta y ejercicio.
b. Calcule los intervalos de confianza del 95% para los niveles de glucosa en la sangre
despus del programa de dieta y ejercicio.
c. Considera usted que existe evidencia estadstica suficiente para considerar que
hubo una disminucin en los niveles de glucosa de los pacientes?

19. Se sabe que el tiempo que toma completar una prueba psicomtrica tiene desviacin
estndar de 10 minutos. Una muestra de 30 estudiantes son sometidos a la prueba
obtenindose una media de 91 minutos. Obtenga los lmites de confianza del 97% para la
media poblacional.

20. Se desea conocer la incidencia del cncer de estmago en una cierta zona del pas. Si en
una muestra de 2000 personas de esa zona se encontraron 26 con dicho padecimiento, obtenga
los lmites de confianza del 95% para la proporcin de personas con cncer de estmago en
esa zona.

21. Una reciente encuesta incluy a 1220 adultos elegidos al azar y se les pregunt si
consideraban que debera permitirse la clonacin de seres humanos. Los resultados mostraron
que 912 de los encuestados dijeron que no debe permitirse la clonacin. Se desea determinar
si estos resultados constituyen una fuerte evidencia de que la mayora de las personas (ms del
50%) se oponen a este tipo de clonacin. Para dar su respuesta,

a. Construya un intervalo de confianza del 99% de la proporcin de adultos que


considera que no debe permitirse este tipo de clonacin.
b. Considera usted que efectivamente la mayora de la gente se opone a la clonacin
de seres humanos? Explique basndose en los resultados del punto a).

22. Segn un estudio el 25% de las viviendas de zonas urbanas del pas estn en estado malo
o regular. Si se emple un tamao de muestra de 50 viviendas, obtenga los intervalos de
confianza del 98% para la proporcin de viviendas de zonas urbanas del pas estn en estado
malo o regular.

23. Una empresa pauta publicidad en televisin todos los meses. Recientemente ha lanzado
una campaa muy agresiva, y se espera que al menos el 55% de los consumidores de menos
de 40 aos recuerden el anuncio de la empresa. Se ha tomado una muestra de 120
consumidores de menos de 40 aos y el 48% dijeron que recordaban el anuncio de la empresa.
Determine los intervalos de confianza del 95% para la proporcin de consumidores meta que
recuerda el anuncio. Puede considerarse que se ha alcanzado la meta?

24. En una muestra de 250 periodistas, 120 indicaron que no perciban que hubiera
importantes amenazas a la libertad de prensa en el pas. Estime los intervalos de confianza del
90% para la proporcin de periodistas que no perciban que hubiera importantes amenazas a
la libertad de prensa en el pas.

25. Un artculo publicado en la British Medical Journal


(http://www.bmj.com/content/345/bmj.e4737) cuestiona los estudios que respaldan el efecto
supuestamente positivo de las bebidas hidratantes como Gatorade, Powerade y otras. En el
artculo se indica que el 76% de los estudios tena algn tipo de problemas de metodologa.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
322

Estime los intervalos del 95% de confianza para la proporcin de estudio con problemas
metodolgicos si se emple una muestra de 106 estudios.

26. En una poblacin de 850 familias, se llev a cabo una encuesta para estimar el consumo
medio de leche. La muestra consisti en 44 familias seleccionadas por muestreo simple al
azar. El consumo mensual en litros fue el siguiente:

15 45 75 90 45 68 41 12 16 52 53
8 28 35 63 54 90 47 35 41 49 38
30 15 53 43 39 54 21 43 38 32 45
36 32 47 29 41 40 40 42 52 30 44

a. Estime puntualmente la media de consumo mensual de leche en la poblacin.


Interprete el resultado.
b. Calcule e interprete el intervalo de confianza del 95% para la estimacin del
consumo mensual medio de leche por familia. Se conoce que s= 324 litros. Interprete
los resultados.
c. Si se conoce que cada familia, en promedio, tiene 4.4 miembros, calcule el intervalo
de confianza del 95% para estimar el consumo per cpita de leche, en la poblacin.
d. Obtenga e interprete el intervalo de confianza del 98%, para la proporcin de
familias que consumen menos de 35 litros mensuales de leche.

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. Un ejemplo de inferencia estadstica es:


(a) Elaborar grficas para un conjunto de datos muestrales
(b) Calcular la media de la muestra
(c) Estimar un parmetro poblacional a partir de datos muestrales
(d) Calcular la media de una variable a partir de datos poblacionales

2. Un valor que describe una poblacin se denomina:


(a) Parmetro (b) Estadstico
(c) Estimador (c) Observacin

3. Luis est tratando de estimar el gasto promedio en alimentacin de las familias de su pas.
Para resolver este problema:
(a) Se puede entrevistar a todas y cada una de las familias del pas
(b) Seleccionar algunas familias "modelo" segn el criterio de Luis
(c) Seleccionar una muestra aleatoria de familias de todo el pas
(d) Seleccionar una muestra de familias cercanas al lugar donde Luis vive

4. De los siguientes, no es un ejemplo de un parmetro:


(a) Media (c) Desviacin estndar s
(b) Proporcin P (d) Varianza 2

5. Un buen estimador debe ser insesgado, lo cual consiste en:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
323

(a) El valor esperado del estadstico es igual al valor del parmetro que se estima
(b) Se utiliza toda la informacin proporcionada por la muestra en lo que se refiere al
parmetro
(c) La distribucin del estimador est concentrada alrededor del parmetro
(d) La precisin del estimador ser mayor para tamaos de muestra grandes

6. Un buen estimador debe ser consistente, lo cual consiste en:


(a) El valor esperado del estadstico es igual al valor del parmetro que se estima
(b) Se utiliza toda la informacin proporcionada por la muestra en lo que se refiere al
parmetro
(c) La distribucin del estimador est concentrada alrededor del parmetro
(d) La precisin del estimador ser mayor para tamaos de muestra grandes

7. Un buen estimador debe ser de varianza mnima, lo cual consiste en:


(a) El valor esperado del estadstico es igual al valor del parmetro que se estima
(b) Se utiliza toda la informacin proporcionada por la muestra en lo que se refiere al
parmetro
(c) La distribucin del estimador est concentrada alrededor del parmetro
(d) La precisin del estimador ser mayor para tamaos de muestra grandes

8. Si se toman muestras aleatorias de n elementos de una poblacin y se calculan los


promedios es de esperar que:
(a) El valor en cada caso sea igual a valor poblacional
(b) Los valores de las medias no sean todos iguales
(c) Los valores de las medias sean todos iguales
(d) La diferencia entre una media y otra no se atribuya al azar

9. Si se toman muestras aleatorias de n elementos de una poblacin, se calculan los


promedios, se ponen los promedios muestrales en una tabla de frecuencia y se hace un
histograma es de esperar que el grfico:
(a) Se parezca a una curva normal solo si la poblacin original es normal
(b) Se parezca a una curva normal aun cuando la poblacin original no sea normal
(c) No se parezca a una curva normal, excepto por casualidad
(d) Se parezca a la distribucin original de los datos de la poblacin

10. El error estndar consiste en:


(a) La media de los errores muestrales
(b) La desviacin estndar de los errores de muestreo
(c) La media de los datos estandarizados
(d) La desviacin estndar de las medias muestrales

11. Se sabe que una variable x tiene una desviacin estndar de 10. Si se toma una muestra de
16 unidades, entonces el error estndar equivale a:
(a) 2,5 (b) 4 (c) 0,625 (d) Ninguna de las anteriores

12. Se sabe que una variable x tiene una desviacin estndar de 10. Si se toma una muestra de
16 unidades de una poblacin de 70, entonces el error estndar equivale a:
(a) 2,5 (b) 2,21 (c) 0,5529 (d) Ninguna de las anteriores

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
324

13. La diferencia en, valor absoluto, entre el valor de la media muestral y la media
poblacional se conoce como:
(a) Error estndar (b) Error de la estimacin
(c) Error absoluto medio (d) Ninguna de las anteriores

14. Cuando se utiliza la media muestral como estimacin de la media poblacional , la


probabilidad de que esta estimacin no falle es:
(a) La media poblacional
(b) El error estndar
(c) El error estimado
(d) El nivel de confianza

15. Se desea estimar la media poblacional de una variable x cuya desviacin estndar
poblacional es de 5 unidades. En una muestra de tamao 45 se obtiene una media de 63
unidades, entonces el valor de z necesario para obtener los intervalos de confianza del 95%
es:
(a) 1,645 (b) 0,95 (c) 1,96 (d) 2,58

16. Se desea estimar la media poblacional de una variable x cuya desviacin estndar
poblacional es de 5 unidades. En una muestra de tamao 45 se obtiene una media de 63
unidades, entonces el al obtener los intervalos de confianza del 95%, el lmite inferior es:
(a) 61,77 (b) 61,54 (c) 64,46 (d) Ninguna de las anteriores

17. Se desea estimar la media poblacional de una variable x cuya desviacin estndar
poblacional es de 5 unidades. En una muestra de tamao 45 se obtiene una media de 63
unidades, entonces el al obtener los intervalos de confianza del 95%, se concluye que:
(a) Con una confianza del 95% la media poblacional es 63 unidades
(b) Con una confianza del 95% la media poblacional est entre 61,77 y 64,23 unidades
(c) Con una confianza del 95% la media poblacional es mayor que 61,77 unidades
(d) Con una confianza del 95% la media poblacional est entre 61,54 y 64,46 unidades

18. Se desea estimar la media poblacional de una variable x cuya desviacin estndar
poblacional es de 15 unidades. En una muestra de tamao 200 se obtiene una media de 87
unidades, entonces al obtener los intervalos de confianza del 90%, el lmite superior es:
(a) 87 (b) 85,26 (c) 88,74 (d) Ninguna de las anteriores

19. Se desea estimar la media poblacional de una variable x distribuida normalmente cuya
desviacin estndar poblacional es de 20 unidades. En una muestra de tamao 12 se obtiene
una media de 125 unidades, al obtener los intervalos de confianza del 99%, un investigador
realiz las siguientes dos afirmaciones:

A. Se debe usar un valor de z de 2,58.


B. El lmite inferior es 107,07.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

20. Se desea estimar la media poblacional de una variable x distribuida normalmente. En una
muestra de tamao 12 se obtiene una media de 125 unidades y una desviacin estndar de 20

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
325

unidades, al obtener los intervalos de confianza del 99%, un investigador realiz las siguientes
dos afirmaciones:

A. Se debe usar un valor de t de 3,11.


B. El lmite superior es 142,93.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

21. Se desea estimar la media poblacional de una variable x distribuida normalmente. En una
muestra de tamao 20 se obtiene una media de 3200 unidades y una desviacin estndar de
450 unidades, al obtener los intervalos de confianza del 95%, un investigador realiz las
siguientes dos afirmaciones:

A. Se debe obtener el valor de t con 21 grados de libertad.


B. Los lmites de confianza son 2989,39 y 3410,61 unidades.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

22. Se desea estimar la media poblacional de una variable x. En una muestra de tamao 80 se
obtiene una media de 30 unidades y una desviacin estndar de 4,5 unidades, al obtener los
intervalos de confianza del 99%, un investigador realiz las siguientes dos afirmaciones:

A. Se debe usar un valor de z de 2,58.


B. El valor de la media poblacional es superior a 28,70.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

23. Al estimar la media poblacional de una variable x, en una muestra de tamao 50 se obtiene
una media de 1500 unidades y una desviacin estndar de 250 unidades. Al obtener los
intervalos de confianza del 95%, es verdadero que:
(a) Con certeza la media est entre 1430,70 y 1569,30
(b) Con una confianza del 95% la media poblacional es mayor que 1430,70 unidades
(c) Con una confianza del 95% la media poblacional est alrededor de 1500 unidades
(d) Con una confianza del 95% la media poblacional est entre 1430,70 y 1569,30 unidades

24. Al estimar la media poblacional de una variable x, en una muestra de tamao 500 se
obtiene una media de 2150 unidades y una desviacin estndar de 600 unidades. Al obtener
los intervalos de confianza del 90% se obtuvo como lmite inferior 2105,86 y como lmite
superior 2194,14, entonces es verdadero que:
(a) La media est entre 2105,86 y 2194,14
(b) Con una confianza del 90% la media poblacional es menor que 2194,14 unidades
(c) La media poblacional ser mayor que 2194,14 con una probabilidad de 5%
(d) La media poblacional estar entre 2105,86 y 2194,14 unidades en 90 de cada 100 muestras

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
326

25. Si x es el nmero de veces que ha ocurrido un evento en una muestra n pruebas, entonces
el cociente x/n representa:
(a) La proporcin poblacional (b) La proporcin muestral
(c) La probabilidad de fracaso (d) Ninguna de las anteriores

26. Se desea estimar una proporcin poblacional de una cierta variable. En una muestra de
tamao 120 se obtiene un conteo de 90 eventos. Al obtener los intervalos de confianza del
99%, un investigador realiz las siguientes dos afirmaciones:

A. Se debe usar un valor de z de 2,58.


B. No se pueden calcular los intervalos porque no se tiene la desviacin estndar.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

27. Se desea estimar una proporcin poblacional de una cierta variable. En una muestra de
tamao 120 se obtiene un conteo de 90 eventos. Al obtener los intervalos de confianza del
99%, un investigador realiz las siguientes dos afirmaciones:

A. La proporcin muestral es 0,75.


B. Los intervalos de confianza del 99% son 0,6482 y 0,8518.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

28. Se desea estimar una proporcin poblacional de una cierta variable. En una muestra de
tamao 12 se obtiene un conteo de 5 eventos. Al obtener los intervalos de confianza del 90%,
un investigador realiz las siguientes dos afirmaciones:

A. Se emplea un valor de t con 11 grados de libertad.


B. El lmite superior es de 65,08.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

29. Se desea estimar una proporcin poblacional de una cierta variable. En una muestra de
tamao 1200 se obtiene un conteo de 750 eventos. Al obtener los intervalos de confianza del
95%, un investigador realiz las siguientes dos afirmaciones:

A. La proporcin poblacional es 62,5%.


B. El lmite inferior es de 59,76%.

Con respecto a las dos afirmaciones anteriores, es incorrecto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
327

30. Se desea estimar el peso promedio de las galletas que se elaboran en una fbrica. En una
muestra de tamao 1100 paquetes de galletas se obtiene una media de 195 gramos con una
desviacin estndar de 45 gramos. La empresa ha especificado que el peso de cada paquete de
galletas debe ser 200 gramos. Al obtener los intervalos de confianza del 95%, el encargado
del control del proceso realiz las siguientes dos afirmaciones:

A. No hay problema con el peso de las galletas, el 95% de las galletas tiene un peso de 195
grs.
B. El peso especificado de 200 gramos est fuera del intervalo de confianza del 95%.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

31. Se desea estimar el peso promedio de las galletas que se elaboran en una fbrica. En una
muestra de tamao 10 paquetes de galletas se obtienen los siguientes pesos (en gramos):

190 210 201 196 197 185 176 208 200 191

La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realiz las
siguientes dos afirmaciones:

A. El 95% de las galletas tiene un peso entre 188,01 y 202,79 gramos.


B. El peso especificado de 200 gramos est dentro del intervalo de confianza del 95%.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

32. Se desea estimar el peso promedio de las galletas que se elaboran en una fbrica. Se sabe
que el peso medio de los paquetes de galletas se distribuye normalmente y que tiene una
desviacin estndar de 15 gramos. En una muestra de tamao 10 paquetes de galletas se
obtienen los siguientes pesos (en gramos):

190 210 201 196 197 185 176 208 200 191

La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realiz las
siguientes dos afirmaciones:

A. El 95% de las galletas tiene un peso entre 186,10 y 204,70 gramos.


B. El peso especificado de 200 gramos est fuera del intervalo de confianza del 95%.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
328

33. Se desea estimar proporcin de las galletas que se elaboran en una fbrica cuyo peso est
por debajo de la especificacin. En una muestra de tamao 10 paquetes de galletas se obtienen
los siguientes pesos (en gramos):

190 210 201 196 197 185 176 208 200 191

La empresa ha especificado que el peso de cada paquete de galletas debe ser 200 gramos. Al
obtener los intervalos de confianza del 95%, el encargado del control del proceso realiz las
siguientes dos afirmaciones:

A. El lmite superior del 95% es un peso de 90,36 gramos.


B. Con una confianza del 95% entre 29,6% y 90,4% de las galletas pesan menos de 200
grs.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

34. En un peridico se presentan los resultados de una encuesta aplicada a una muestra
aleatoria de 1200 adultos, de los cuales 610 indicaron que la labor del gobierno es buena o
muy buena. El estudio se hizo con una confianza del 95%. Segn el autor del artculo la
mayora de los ciudadanos consideran que la labor del gobierno es buena o muy buena. Con
respecto a esa afirmacin del autor del artculo un crtico realiz la siguiente aseveracin: "El
autor se ha equivocado, ya que, 1. Con una confianza del 95% la proporcin de ciudadanos de
ciudadanos que aprueban la gestin del gobierno podra estar entre 48% y 53,6%, con lo cual
es muy probable que el porcentaje de ciudadanos que estn de acuerdo con la gestin del
gobierno sea inferior al 50%". Con respecto a esta situacin es correcto que:
(a) El autor est en lo correcto y el crtico est equivocado
(b) El autor est equivocado y el crtico tambin
(c) El autor est equivocado y el crtico est en lo correcto
(d) Falta informacin para indicar quin est equivocado y quin no

Respuestas a los ejercicios de seleccin nica:

1. c 2. a 3. c 4. c 5. a
6. d 7. c 8. b 9. b 10. d
11. a 12. b 13. b 14. d 15. c
16. b 17. d 18. c 19. b 20. a
21. d 22. b 23. d 24. d 25. b
26. b 27. a 28. d 29. b 30. c
31. a 32. b 33. d 34. c

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
329

9 .

Muestreo
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Explicar la importancia y necesidad de trabajar con muestras para conocer informacin
sobre la poblacin
2. Describir algunas aplicaciones empresariales del muestreo
3. Calcular el tamao de muestra necesario para estimar la media poblacional y proporcin
poblacional
4. Describir las principales tcnicas de muestreo probabilstico

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
330

Introduccin:
En los primeros captulos de este texto se han presentado distintas tcnicas que se emplean en
estadstica para describir un conjunto de datos, tales como las distribuciones de frecuencias y
el clculo de diferentes medidas numricas, como la media, la mediana, la moda, la varianza,
la desviacin estndar, entre otras medidas. Sin embargo, en la prctica rara vez se cuenta con
los datos ya recolectados y, por tanto, es necesario efectuar un proceso de recoleccin de la
informacin, en el cual, con gran frecuencia se debe tomar la decisin de trabajar con la
poblacin o con una muestra.

As, por ejemplo, cuando una compaa est estudiando la proporcin de sus clientes que
estn satisfechos con sus servicios podra aplicar un cuestionario a todos sus clientes, o bien,
emplear una muestra. Aplicar el cuestionario a todos y cada uno de los clientes, o sea, a la
poblacin, puede requerir mucho tiempo y recursos, ya que, la cantidad de clientes podra ser
de muchos miles, lo que podra no ser viable para la organizacin. Ahora bien, empleando una
muestra la compaa podra conseguir resultados muy confiables, que le ayuden a alcanzar su
propsito de medir la satisfaccin de los clientes, pero a un costo mucho ms bajo.

La decisin de trabajar o no con una muestra es apenas una primera decisin. Si se decide
trabajar con una muestra, debe determinar el tamao de dicha muestra. Cabe resaltar que esa
muestra que se va a emplear puede ser de apenas unos cientos de clientes, aun cuando la
compaa tenga miles de clientes. Adems, se debe emplear una tcnica que permita
seleccionar cules clientes van a ser incluidos en la muestra y cules no. Tanto un tamao
adecuado de muestra como la aplicacin de la tcnica adecuada de muestreo son importantes
para obtener datos confiables, y por tanto, tiles para la toma de decisiones.

En este captulo se expondr la importancia y necesidad de trabajar con muestras, a la vez que
se describirn algunas aplicaciones frecuentes del muestreo en el entorno empresarial. Luego
se presentarn los distintos factores que determinan el tamao de la muestra cuando se desea
estimar la media de la poblacin o la proporcin poblacional, como en el ejemplo anterior,
que se podra desear conocer la proporcin de clientes satisfechos. Finalmente, se presentarn
distintas tcnicas de muestreo, que son las que permiten establecer cules elementos de la
poblacin se van a incluir en la muestra.

Conceptos de poblacin y muestra


Tal como se mencion en el captulo 1, con frecuencia la palabra poblacin se asocia con la
cantidad de personas que habitan en un pas o en una regin, pero en estadstica este concepto
abarca muchos otras posibles unidades de estudio, que no son exclusivamente personas.

En toda investigacin estadstica hay un objeto de estudio, que es la unidad de inters y sobre
la cual recae la observacin. Por ejemplo, en el control de la calidad de una fbrica de llantas,
se podran emplear pruebas de rendimiento en laboratorio bajo determinadas condiciones y
tambin pruebas en carreteras, para medir el desgaste en diferentes rutas, entre otras variables
de inters. A esta unidad de estudio tambin s ele puede llamar unidad elemental o unidad
estadstica.

UNIDAD ESTADSTICA Unidad de inters en un estudio estadstico.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
331

As, la poblacin est constituida por el conjunto total de los elementos de inters. A este
conjunto de elementos que son objeto de estudio le llamamos poblacin o universo.

POBLACIN Conjunto de individuos u objetos de inters o medidas obtenidas a


partir de todos los individuos u objetos de inters.

As, podramos tener que la poblacin est constituida por los clientes de una empresa, por
productos de una empresa, como las llantas producidas en un determinado periodo; por
documentos, tales como los cheques emitidos por un el departamento financiero de una
compaa; los estudiantes de la carrera de administracin de negocios de una universidad; los
empleados de una organizacin; familias bajo condiciones de pobreza; entre muchos otros.

Al efectuar el estudio estadstico se definen las caractersticas o variables que se desea


observar en cada unidad de estudio. Por ejemplo, en el caso de que la unidad elemental sea un
hogar, entonces estas variables pueden el ingreso mensual del hogar, el nmero de miembros
del hogar, el nivel acadmico del jefe del hogar, entre muchas otras.

Tal como se seal anteriormente, existen diversas razones por las que sera imposible
trabajar con toda la poblacin, o bien, demasiado costoso, y por tanto es necesario emplear
una muestra. Una muestra es una parte de la poblacin de inters, y si es bien selecciona es
representativa de esa poblacin, y las conclusiones que en ella se obtengan luego podrn ser
generalizadas al resto de la poblacin.

MUESTRA Porcin o parte de la poblacin de inters.

En los ejemplos anteriores mencionamos que se poda obtener una muestra de clientes para
determinar la proporcin de clientes satisfechos con los servicios de la empresa, o bien,
emplear una muestra para determinar el desgaste promedio de determinado tipo de llantas
bajo ciertas condiciones. Cuando se desea lanzar al mercado un nuevo producto, como parte
del estudio de mercado, generalmente, se emplea una muestra de los potenciales
consumidores para estimar la demanda del producto. Tambin un auditor puede tomar una
muestra de las cuentas por cobrar de una compaa, para verificar el cumplimiento de ciertos
requisitos.

Ahora bien, cuando se habla de muestreo se hace referencia a todo un proceso mediante el
cual se va a establecer un tamao de muestra, es decir, la cantidad de elementos que se van a
tomar en la muestra; se va a seleccionar una tcnica de muestreo, o sea, una tcnica que
permita establecer cules elementos de la poblacin se van a incluir en la muestra; y se va a
medir la confianza que tienen las estimaciones realizadas con base en esa muestra.

MUESTREO Conjunto de tcnicas que se utilizan para seleccionar una muestra de


una poblacin de inters y medir la confianza de las estimaciones realizadas.

En algunos casos el diseo de la muestra no es muy importante, como en los exmenes de


sangre, dado que la sangre es muy homognea, pero en la mayora de las situaciones, el
diseo de la muestra es clave para garantizar la validez y confiabilidad de los resultados. El
problema del muestreo estadstico es lograr seleccionar muestras representativas en
poblaciones que no son homogneas.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
332

Adems de definir la unidad estadstica, es necesario tambin establecer la unidad de


muestreo.

UNIDAD DE MUESTREO Unidad bsica en trminos de la cual se aplica una


tcnica de muestreo y se seleccionan los elementos incluidos en la muestra.

Tal como se ver ms adelante, existen diferentes tcnicas de muestreo, y segn la tcnica
seleccionada, adems de las caractersticas del estudio, y de los recursos e informacin
disponible se define la unidad de muestreo. Por ejemplo, si se va a efectuar un estudio sobre la
satisfaccin de los empleados de una empresa, entonces la unidad de muestreo y la unidad de
estudio coinciden, y seran un empleado de la compaa, en este caso.

En otros casos la unidad de estudio y la unidad de muestreo no coinciden. Suponga que se va


a efectuar un estudio entre estudiantes de primer ao de secundaria de todo el pas. Entonces
el investigador podra tomar inicialmente una muestra de centros educativos, luego dentro de
cada colegio escoge una muestra de grupos de primer ao y, finalmente, dentro de cada grupo,
selecciona una muestra de estudiantes. Entonces, podemos decir que la unidad de muestreo es
aquella que es objeto de escogencia aleatoria a la hora de seleccionar la muestra.

UNIDAD DE INFORMACIN Unidad que proporciona los datos relacionados con


la unidad de estudio.

Ahora bien, cuando se efecta el estudio, muchas veces la persona que proporciona la
informacin no es la misma unidad de muestreo. Por ejemplo, en una encuesta de hogares,
donde la unidad de muestreo puede ser el hogar, la unidad de informacin podra ser el jefe
del hogar. O bien, en un estudio sobre empresas, la unidad de informacin o informante puede
ser un gerente de cada una de las empresas seleccionadas en la muestra.

Necesidad de trabajar con muestras


Es posible mencionar distintas razones por las cuales es necesario trabajar con muestras. Entre
las razones ms importantes puede mencionarse las siguientes:

Estudiar la poblacin sera muy costoso. Esta es una de las principales razones para
emplear muestras. Suponga que un candidato presidencial desea conocer la proporcin de
votantes que votaran por l. Para dar un ejemplo, en Costa Rica el padrn electoral super
los 2.800.000 electores para las elecciones presidenciales del 2010. Imagine el costo de
entrevistar a tal cantidad de personas distribuidas a lo largo y ancho de todo el pas.
Estudiar la poblacin requerira demasiado tiempo. Si una empresa desea lanzar un
nuevo producto al mercado, y cuenta con un equipo de 5 personas para efectuar el estudio
de mercado. Si hubiera un milln de potenciales clientes, cunto tiempo duraran las 5
personas en encuestar a ese milln de personas? El estudio durara aos, de modo que
cuando obtengan los resultados, la informacin ya no sera til.
La poblacin se destruye al ser observada. Por ejemplo, si una fbrica de bombillos
desea estimar la vida til de su producto, si decidiera emplear la poblacin para hacer esta
estimacin, tendra que probar todos los bombillos que produce, lo cual significara
destruir toda su produccin, y por tanto, sera imposible estudiar la poblacin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
333

La poblacin es infinita. Si en un proceso de produccin industrial se requiere establecer


la proporcin de artculos que satisfacen una cierta especificacin, entonces se tiene que la
produccin tiende a infinito a lo largo del tiempo, por lo que sera imposible estudiar la
poblacin.
Conveniencia. Esta es otra importantsima razn para emplear muestras. Si se selecciona
adecuadamente la muestra, los resultados que se obtienen a partir de ella pueden ser
suficientemente buenos, de modo que aun cuando se tuvieran suficientes recursos y
tiempo, no necesariamente valdra la pena estudiar la poblacin. Se sabe que conforme se
incrementa el tamao de la muestra, el error de la estimacin se disminuye, as que si se
tiene un nivel de error aceptable con un alto grado de confianza, los resultados de una
muestra pueden ser muy satisfactorios.
Mayor calidad de la informacin recopilada. Al trabajar con muestras es ms fcil
controlar el trabajo de recoleccin de la informacin, lo cual permite una mejor
supervisin y verificacin, de modo que se asegura que la informacin obtenida es de la
calidad requerida.
Imposibilidad. En algunos casos simplemente es imposible efectuar un estudio
empleando toda la poblacin. Suponga que se desea determinar el nivel de cierta sustancia
contaminante en el agua de un ro. Es imposible hacer el estudio con toda el agua del ro.
La nica opcin es tomar una muestra.

Muestras e inferencia
La finalidad de hacer un estudio estadstico es conocer informacin sobre la poblacin. Tal
como se ha sealado, se emplea la muestra para efectuar la estimacin de los parmetros
poblacionales. Entonces, si en un estudio se desea conocer el desgaste promedio de cierto tipo
de neumticos bajo determinadas condiciones, entonces el valor de ese promedio para la
poblacin es un parmetro poblacional.

PARMETRO Medida descriptiva de la poblacin de inters.

Dado que normalmente no se conocen los parmetros, entonces se emplea la muestra para
estimarlos. Por ejemplo, se toma una muestra de neumticos y se determina el desgaste
promedio. Ese valor muestral es un estimador que se emplea para estimar el promedio
poblacional.

ESTIMADOR Medida descriptiva de la muestra y que sirve como una estimacin del
parmetro poblacional correspondiente.

Cuando se han determinado los estimadores, entonces lo que se debe hacer es un proceso
mediante el cual se generalizan los resultados de la muestra a la poblacin. Esto es lo que se
conoce como la inferencia estadstica.

INFERENCIA ESTADSTICA Mtodos empleados para determinar una propiedad


de una poblacin con base en la informacin de la muestra.

Al realizar la inferencia, si la muestra es representativa y aleatoria, entonces se puede


establecer el nivel de confianza de la estimacin y el nivel de error implcito en dicha

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
334

estimacin. Para poder realizar la inferencia es fundamental que la muestra sea tomada
aleatoriamente.

Muestreo estadstico y no estadstico


Puede hablarse de dos tipos bsicos de muestras, de acuerdo con el mtodo que se emplee
para seleccionar las unidades incluidas en la muestra:

Muestreo aleatorio: Si cada elemento de la muestra ha sido seleccionado siguiendo un


procedimiento que concede a cada unidad de la poblacin una probabilidad conocida de
ser incluido en la muestra, entonces se dice que la muestra es aleatoria. Una muestra
aleatoria es aquella que se selecciona al azar; tambin se le llama muestra estadstica.
Muestreo no aleatorio. Dentro de este tipo de muestreo se distinguen varios casos: la
seleccin por conveniencia, que corresponde a aquellas muestras seleccionadas de acuerdo
con la conveniencia del investigador. Este tipo de muestreo es muy sesgado y no puede
ser aceptado por su naturaleza. Un segundo caso es la seleccin intencional o de juicio, en
la cual la seleccin la hace un experto con conocimiento amplio de la poblacin bajo
estudio. Tambin se puede dar un muestreo voluntario, que se da cuando los individuos
deciden participar por su propia decisin en el estudio.

Dentro del muestreo aleatorio hay distintas tcnicas de muestreo, las cuales se diferencian por
sus distintos procedimientos aleatorios, o sea, que asignan diferentes probabilidades a las
unidades bajo estudio de ser seleccionadas en la muestra. As, se tiene el muestreo simple al
azar, el muestreo estratificado, el muestreo en etapas, el muestreo sistemtico y el muestreo
por conglomerados.

La principal ventaja del muestreo aleatorio es que limita el sesgo de seleccin y permite la
cuantificacin y control del error de muestreo. Las muestras no aleatorias no permiten medir
ni controlar el error de muestreo. Es por eso que en trminos generales se va a preferir el
muestreo aleatorio sobre los muestreos no aleatorios. Solo en ciertos casos especiales, se
considera que el muestreo de juicio puede lograr muestras ms representativas. Esto cuando
se toma una muestra pequea seleccionada de una poblaciones muy heterognea, pues el
juicio del experto podra ayudar a obtener una muestra representativa.

Errores de muestreo y sesgos


En los estudios estadsticos por muestreo aleatorio se pueden presentar dos tipos de error. Uno
es el error de muestreo y el otro corresponde a los llamados sesgos. Tal como el nombre lo
sugiere, el error de muestreo se presenta solo en aquellos casos en los cuales se ha tomado una
muestra, mientras que los sesgos pueden presentarse tanto en los casos en los cuales se trabaje
con una muestra como en aquellos en que se efecta la enumeracin total de la poblacin.

Suponga que se realiza un estudio de intencin de voto para conocer la proporcin de


electores que estn decididos a votar por determinado candidato. Entonces se toma una
muestra aleatoria para realizar dicha estimacin. Aunque esta muestra se haya obtenido
empleando procedimientos adecuados, la proporcin obtenida en la muestra no es
exactamente igual a la poblacin debido a la naturaleza aleatoria de la muestra. Esa diferencia
entre el verdadero valor poblacional y el valor muestral estimado es el error de muestreo.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
335

ERROR DE MUESTREO Discrepancia, debida al azar, entre la estimacin de una


caracterstica obtenida a travs de una muestra y su verdadero valor en la poblacin.

El error de muestreo tiene la gran ventaja de que puede ser medido y controlado. Por ejemplo,
si se desea reducir la magnitud del error de muestreo, se puede incrementar el tamao de la
muestra.

La naturaleza aleatoria de la muestra permite conocer la probabilidad de que la muestra sea


representativa, sin embargo siempre existe la posibilidad de que la muestra no sea
representativa, y que, por tanto, el error de muestreo sea muy alto.

Por otro lado, cualquier error que no se deba al azar tambin ocasiona que el valor estimado
no sea igual al valor verdadero, pero no es un error de muestreo, sino un sesgo.

SESGO Error sistemtico, no debido al azar, y que ocasiona diferencias entre el valor
estimado a travs de la muestra y el valor verdadero.

Los sesgos son de naturaleza sistemtica y no pueden ser medidos. Los sesgos deben ser
prevenidos a travs de distintas medidas administrativas. Algunas de las principales fuentes de
sesgos son las siguientes:

Seleccin inadecuada de la muestra. Si al seleccionar la muestra influye algn factor


subjetivo, como el criterio o conveniencia de alguna persona, es decir, cuando la muestra,
o parte de la muestra, no es obtenida al azar. Por ejemplo, si un encuestador debe aplicar
un cuestionario telefnicamente a una muestra seleccionada al azar, pero no logra
localizar a uno de los individuos seleccionados, y entonces decide llamar a cualquier otra
persona. Tambin esto ocurre en los llamados muestreos voluntarios, como los sondeos
realizados por algunos canales de televisin y que las personas llaman para dar su opinin
sobre algn tema.
Sesgos introducidos por el encuestador. Cuando el encuestador no hace bien su trabajo,
puede generar una serie de sesgos. Por ejemplo, si entrevistar a las personas, no registra
apropiadamente las respuestas o si introduce sus propios juicios al interpretar las
respuestas de los entrevistados. Para esto es fundamental que el encuestador est bien
capacitado y que su trabajo sea supervisado apropiadamente.
Inadecuado mtodo de estimacin. Cada parmetro que se desea estimar posee su
propio mtodo de estimacin. Si no se emplea el mtodo adecuado, tambin se introduce
un sesgo.
No se logra respuesta de todas las unidades. Esto ocurre cuando muchos elementos no
responden la encuesta, como en las encuestas aplicadas por correo postal o correo
electrnico. Cuando por alguna razn una unidad no responde el cuestionario, entonces
debe efectuarse la sustitucin de modo adecuado.
Otras causas. Pueden presentar otras causas de sesgos, la mayora de ellas se relaciona
con la ejecucin errnea de alguna de las fases del proceso de investigacin estadstica.

Determinacin del tamao de muestra para estimar la media poblacional


Uno de los parmetros que con mayor frecuencia se requiere estimar es la media poblacional.
Este es el caso en el que se desea estimar el ingreso promedio de los hogares, el tiempo

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
336

promedio en que los operarios de una fbrica realizan una actividad, el peso promedio de las
latas de leche condensada envasadas en una empresa, entre muchos otros posibles casos.

Es por eso que expondremos los determinantes del tamao de muestra cuando se desea
estimar la media poblacional y la forma en que se calcula el tamao de muestra, tanto cuando
la poblacin es infinita como cuando es finita.

Determinantes del tamao de la muestra


Cuando se desea estimar el tamao de muestra cuando se desea estimar la media poblacional,
hay que considerar tres variables principales:

Variabilidad de la poblacin: La variabilidad es, tal vez, el principal determinante del


tamao de la muestra. Por ejemplo, al efectuar un examen de sangre para determinar el
tipo de sangre de una persona, basta con una pequea cantidad de sangre, pues la sangre
es homognea, o sea, su variabilidad es muy baja. Pero, por ejemplo, cuando el Instituto
Nacional de Estadstica y Censos (INEC) realiza la encuesta de hogares de propsitos
mltiples, se estudian variables con una elevada dispersin, como pobreza, ingreso,
desempleo, entre otras. Podemos ver que hay hogares con niveles de ingresos muy bajos y
otros con ingresos muy altos. Es decir, el ingreso no es una variable tan homognea como
la sangre. En el 2009 el INEC aplic la encuesta a un total de 15.242 hogares. Tal como se
estudi en el captulo 3, la variabilidad o dispersin de un conjunto de datos se puede
medir a travs de la desviacin estndar poblacional, denotada por .
Precisin deseada o nivel mximo de error permitido: Anteriormente se indic que en
las estimaciones a partir de una muestra se presenta un error, pues debido al azar se va a
presentar una discrepancia entre la estimacin de una caracterstica obtenida a travs de
una muestra y su verdadero valor poblacional. Aunque el investigador no conoce el valor
de ese error, s puede establecer un nivel mximo de error permitido en la estimacin.
Conforme se establezca un nivel de error menor, ms precisa ser la estimacin y se
requerir una muestra de mayor tamao. Si, por el contrario, se establece un nivel de error
mayor, menos precisa ser la estimacin y, en consecuencia, podr trabajarse con una
muestra de menor tamao. A este nivel de error se le denotar por E.
Nivel de confianza que se desea tener: El investigador debe indicar el nivel de confianza
deseado para la estimacin. Los niveles de confianza del 95% y del 99% son los que se
emplean con mayor frecuencia. Cuando se estima la media poblacional, por el llamado
teorema de lmite central (tema que se desarrollar ms adelante), se toma la distribucin
de probabilidad normal como la distribucin muestral de la media. Entonces, luego de
establecer el nivel de confianza, se busca el valor de z correspondiente en la curva normal.
Por ejemplo, para un nivel de confianza del 95%, el valor de z es de 1,96, y para un nivel
de confianza del 99%, el valor de z es de 2,58. El nivel de confianza generalmente lo
denotamos 1 , y entonces buscamos un valor z en la curva normal acumulada
correspondiente a 1 /2.

Tal como se coment en la seccin Estadstica en accin, en realidad el tamao de la


poblacin no es un factor tan relevante. Esto explica por qu en los estudios de intencin de
voto, el tamao de la muestra puede ser muy similar en pases como Estados Unidos, Mxico
o costa Rica, a pesar de que tienen poblaciones de muy distinto tamao, se pueden emplear
tamaos de muestra similares. Sin embargo, ms adelante se mostrar que en poblaciones
finitas se efecta un ajuste por el tamao de la poblacin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
337

En la prctica existe un factor que es muy importante, y aunque las frmulas no lo toman en
cuenta debe ser valorado por cualquier investigador, el cual es el costo. Efectuar un estudio en
una muestra grande puede ser muy caro y es posible no contar con los recursos suficientes.
Por supuesto que si por cuestiones de costo se reduce el tamao de la muestra, se podra estar
sacrificando la confianza y la precisin de las estimaciones realizadas posteriormente. Esta es
una decisin que debe ser tomada con mucho cuidado.

Del mismo modo, es importante tener en cuenta el nmero esperado de no respuestas que se
puedan obtener. Por ejemplo, si por experiencia previa se pudiera estimar que el 25% de los
encuestados no contesta el cuestionario, entonces sera necesario tomar una muestra un 25%
ms grande con el objetivo de poder entrevistar al nmero adecuado de personas.

Clculo del tamao de la muestra


Para el clculo del tamao de muestra para estimar la media poblacional se tomarn en cuenta
los factores descritos anteriormente los cuales conforman las frmulas que a continuacin se
presentan.

Caso de poblaciones infinitas En el caso de poblaciones infinitas, tal como se


mencion, el tamao de la muestra depende de:

Desviacin estndar de la poblacin ()


Precisin deseada o nivel mximo de error permitido (E)
Valor de z correspondiente al nivel de confianza que se desea tener (z)

Entonces estos tres elementos se incorporan en la siguiente frmula:

z
2

FRMULA DEL TAMAO DE MUESTRA n


E

Para explicar la aplicacin de la frmula se desarrolla el siguiente ejemplo.

Ejemplo Suponga que se desea estimar el gasto promedio diario que realizan los
turistas estadounidenses cuando visitan el pas. Por un estudio anterior se
sabe que esta variable tiene una desviacin estndar de $46,6. Adems, se
desea que la estimacin tenga un error mximo de $10 y con una confianza
del 95%. Qu tamao de muestra se necesita?

Solucin Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. As que se plantea:

Desviacin estndar de la poblacin: = $46,6


Precisin deseada o nivel mximo de error permitido: E = $10
Valor de z correspondiente al nivel de confianza del 95%: z = 1,96

Sustituyendo los valores en la frmula:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
338

z 46,6 1,96
2 2

n 83,42 84
E 10

Generalmente cuando se determine el tamao de muestra se va a redondear


hacia arriba.

De acuerdo con el resultado anterior, se requiere una muestra de 84 turistas


estadounidenses para efectuar una estimacin del gasto promedio diario en
el pas con una confianza del 95% y con una discrepancia mxima entre el
valor estimado y el valor real de $10.

Ejercicio Se desea estimar el salario promedio de los operarios industriales del pas.
Se conoce que la desviacin estndar de estos salarios es de $236. Se
de requiere una estimacin con un error mximo de $50 y una confianza del
revisin 99%. De qu tamao debe ser la muestra?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen diferentes conceptos
de muestreo y la determinacin del
tamao de muestra.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Caso de poblaciones finitas La frmula dada anteriormente se aplica a poblaciones


infinitas, pero en poblaciones finitas cuando se trabaja con reemplazo o en poblaciones finitas
cuando el tamao de la muestra n es muy pequeo con respecto al tamao de la poblacin N
puede realizarse un ajuste.

Entonces, en un muestreo sin reemplazo, cuando la poblacin es finita y el tamao de la


muestra n es relativamente grande con respecto al tamao de la poblacin N, se puede aplicar
el siguiente factor de correccin:

n0
FACTOR DE CORRECCIN n
PARA POBLACIONES FINITAS n
1 0
N

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
339

z
2

donde n0 es el resultado dado por la frmula n y N es el tamao de la poblacin.


E

Ejemplo Una empresa posee un total de 800 camiones que se emplean para repartir
sus productos a nivel nacional. Se desea estimar mediante una muestra
aleatoria de los camiones para determinar la cantidad de kilmetros
recorridos mensualmente. Por otro estudio realizado hace un tiempo, se
conoce que esta variable tiene una desviacin estndar de 380 kilmetros.
La estimacin debe tener un error mximo de 30 kilmetros y una
confianza del 95%. Qu tamao de muestra se necesita?

Solucin Dado que la poblacin es finita, entonces la determinacin del tamao de


muestra se efectuar en dos etapas. Primero se calcular el tamao de
muestra como si la poblacin fuera infinita. Luego se aplicar el factor de
correccin para poblaciones finitas.

Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. As que se plantea:

Desviacin estndar de la poblacin: = 380 km.


Precisin deseada o nivel mximo de error permitido: E = 30 km.
Valor de z correspondiente al nivel de confianza del 95%: z = 1,96
Tamao de la poblacin: 800 camiones

Sustituyendo los valores en la frmula:

z 380 1,96
2 2

n 616,36 617
E 30

Ahora se aplica el factor de correccin tomando n0 = 617 y N = 800:

n0 617
n 348,34 349
n0 617
1 1
N 800

De acuerdo con el resultado anterior, se requiere una muestra de 349


camiones para estimar la cantidad de kilmetros recorridos mensualmente
con una confianza del 95% y con un error mximo de 30 km.

Ejercicio El departamento de compras de una empresa grande desea estimar qu


porcentaje de sus 600 proveedores ha actualizado su informacin, pues el
de mes pasado se envi una solicitud a todos los proveedores enviando un
revisin formulario para mantener actualizados todos los datos. De qu tamao
debe ser la muestra si se quiere una confianza en la estimacin del 95% y
que el error no exceda el 5%?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
340

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Minitab para determinar el tamao de la muestra


El paquete estadstico Minitab posee la capacidad de determinar el tamao para estimar la
media, la desviacin estndar, la proporcin y otros parmetros. Para emplear esta funcin
debe dar clic en el men Estadsticas. En ese debe darse clic a la opcin Potencia y tamao
de muestra, y luego en el submen se debe dar clic a Tamao de muestra para estimacin.

En el cuadro de dilogo se completan los campos. Primero se selecciona el parmetro, en este


caso la media, despus se indica la desviacin estndar y el margen de error permitido. En el
botn opciones se selecciona el nivel de confianza y se debe chequear la opcin Suponer que
la desviacin estndar de la poblacin se conoce.

Ejemplo Un fabricante de impresoras desea estimar la cantidad promedio semanal


de hojas de papel que se imprimen en distintas oficinas pblicas del pas.
Por un estudio anterior se sabe que esta variable tiene una desviacin
estndar de 200 hojas. Adems, se desea que la estimacin tenga un error
mximo de 100 hojas y con una confianza del 95%. Qu tamao de
muestra se necesita?

Solucin Con base en los datos anteriores, se plantea:

Desviacin estndar de la poblacin: = 200 hojas


Precisin deseada o nivel mximo de error permitido: E = 100 hojas
Nivel de confianza: 95%

Aplicando los valores en Minitab:

El software genera en resultado en Sesin:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
341

De acuerdo con el resultado anterior, se requiere una muestra de 16


oficinas para efectuar la estimacin con una confianza del 95% y con una
discrepancia mxima entre el valor estimado y el valor real de 100 hojas.

Aplicacin Control de calidad


El aseguramiento de la calidad es un tema que ha tenido una gran
evolucin en las ltimas dcadas. Inicialmente el enfoque que las
compaas le deban era la simple inspeccin final del producto, para luego
tomar las acciones correctivas requeridas. Con el tiempo se adopt un
enfoque de proceso, ya que se observ que era necesario un enfoque ms
preventivo que correctivo, y que de esta manera eran ms efectivos los
esfuerzos de buscar e identificar las causas y los efectos de los problemas
de calidad.

Posteriormente se va ms all, y el enfoque es el control total de la calidad


y el aseguramiento de la calidad. Este enfoque busca que el producto o
servicio se ajuste a su diseo, y este diseo responde a las necesidades y
expectativas del consumidor.

Para lograr este aseguramiento de la calidad se requiere obtener y procesar


informacin desde el diseo del producto o servicio, hasta su proceso de
produccin y su resultado final. Para esto es necesario tomar muestras. El
muestreo estadstico es un valiossimo recurso para conocer los procesos y
para mejorarlos.

Una tcnica comn en el control de la calidad es el llamado muestreo por


aceptacin. Esta es una tcnica estadstica que permite determinar la
calidad de un lote de materiales o de productos, basndose en una o ms
caractersticas de calidad que se estudian en una o ms muestras de un lote.
Esta tcnica puede ser aplica en:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
342

La recepcin de materias primas.


La inspeccin de productos terminados.
La inspeccin del proceso (producto en proceso).

El muestreo por aceptacin tiene dos propsitos fundamentales:

1. Asegurar que cuando se enva un lote, este satisfaga los requisitos del
cliente.
2. Asegurar que cuando se recibe un lote, se acepte solo si cumple los
requerimientos.

Para que el muestreo por aceptacin sea confiable, es necesario que el


tamao de la muestra sea adecuado y que la muestra se haya obtenido
aleatoriamente. De otra manera, los resultados no seran adecuados para la
toma de decisiones.

Otra tcnica de uso muy frecuente en el control de la calidad es el grfico


de control. Un grfico de control es una especie de intervalo de confianza
que se elabora a lo largo del tiempo y que permite descubrir desajustes del
proceso, identificar tendencias o puntos fuera de control, y buscar las
causas de estos problemas de calidad. Cuando se efectan mejoras en los
procesos, se espera que el mismo grfico presente su impacto.

La aplicacin de los grficos de control implica primero su construccin,


para lo cual es necesario tomar muestras. Con base en las muestras se
recolectan los datos y se elabora el grfico. Una vez que se tiene el grfico
es necesario analizarlo y darle seguimiento para poder saber si realmente el
proceso est controlado o no.

Determinacin del tamao de muestra para estimar la proporcin


poblacional
Muchas variables se miden en una escala nominal. Por ejemplo, cuando una empresa
aseguradora desea saber sus clientes estaran dispuestos a adquirir un nuevo seguro de gastos
mdicos. En este caso se tiene una variable que no se puede medir en kilmetros, dlares,
gramos u otra unidad de medida, sino que en una situacin como esta lo que se hace es
calcular una proporcin. Es decir, la empresa estar interesada en saber qu proporcin o
porcentaje de sus clientes tendrn inters en adquirir el nuevo producto.

PROPORCIN Fraccin, razn o porcentaje que indica la parte de la muestra o de la


poblacin que posee un rasgo de inters particular.

Si, por ejemplo, de una muestra de 50 clientes, 30 afirman estar dispuestos a adquirir el nuevo
producto, entonces la proporcin se obtendr como el nmero de xitos entre el nmero de
elementos en la muestra. En esta situacin esta proporcin ser 30/50, que equivale a 0,60 o
60%. Si se denota por p la proporcin de la muestra, X es el nmero de xitos y n es el tamao
de la muestra, entonces la proporcin muestral se calcula como:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
343

X
PROPORCIN MUESTRAL p
n

Tambin se puede definir la proporcin poblacional como el nmero de xitos en la


poblacin, denotado por y que, si se denota por P la proporcin de la poblacin, X es el
nmero de xitos en la poblacin y N es el tamao de la poblacin, se calcula como:

X
PROPORCIN POBLACIONAL
N

Determinantes del tamao de la muestra


La determinacin del tamao de muestra para estimar la proporcin poblacional es similar a la
determinacin del tamao de muestra para estimar la media poblacional. Entonces hay que
considerar tres elementos:

Precisin deseada o nivel mximo de error permitido: Del mismo modo que en la
determinacin del tamao, el investigador debe establecer un nivel de error mximo
permitido. En este caso sera expresado como un porcentaje de divergencia entre el
verdadero valor de la proporcin y el valor estimado p. A este nivel de error se le
denotar por E.
Nivel de confianza que se desea tener: Del mismo modo que cuando se determina el
tamao de muestra para estimar la media, el investigador debe indicar el nivel de
confianza deseado para la estimacin. Los niveles de confianza ms usuales son del 95% y
del 99%, cuyos valores de z son 1,96 y 2,58, respectivamente.
Aproximacin de la proporcin poblacional: Se requiere conocer un valor aproximado
de la proporcin poblacional. Cuando no se conozca dicho valor, puede emplearse el valor
de 0,5, pues es el valor que maximiza el tamao de la muestra, dado un nivel de precisin
y de confianza, y es mejor emplear una muestra ms grande que una pequea.

Clculo del tamao de la muestra


Para el clculo del tamao de muestra para estimar la proporcin poblacional se tomarn en
cuenta los factores descritos anteriormente los cuales conforman las frmulas que a
continuacin se presentan, tanto para el caso de poblaciones infinitas como poblaciones
finitas.

Caso de poblaciones infinitas En el caso de poblaciones infinitas, tal como se


mencion, el tamao de la muestra depende de:

Precisin deseada o nivel mximo de error permitido (E)


Valor de z correspondiente al nivel de confianza que se desea tener (z)
Aproximacin de la proporcin poblacional (p)

Entonces estos tres elementos se incorporan en la siguiente frmula:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
344

2
FRMULA DEL TAMAO DE MUESTRA z
PARA LA PROPORCIN POBLACIONAL
n p(1 p)
E

Ejemplo Una compaa desea conocer el porcentaje de consumidores de ingresos


medios y altos que estaran dispuestos a efectuar compras por internet en el
transcurso de los prximos 6 meses. No se conoce ninguna estimacin
previa de este valor y se desea que la estimacin tenga un error mximo de
3% y una confianza del 99%. Qu tamao de muestra se necesita?

Solucin Con base en los datos anteriores, se tiene que para el nivel de confianza del
99% corresponde un valor de z de 2,58. Adems, como no se tiene una
estimacin de p, se emplear el valor de 0,5. Entonces se plantea:

Precisin deseada o nivel mximo de error permitido: E = 0,03


Valor de z correspondiente al nivel de confianza del 99%: z = 2,58
Aproximacin de la proporcin poblacional: p = 0,5

Sustituyendo los valores en la frmula:

2 2
z 2,58
n p(1 p) 0,5(1 0,5) 1.849
E 0,03

Es decir, es necesaria una muestra de 1.849 personas de ingresos medios y


altos para efectuar una estimacin del porcentaje de consumidores que
estaran dispuestos a efectuar compras por internet en el transcurso de los
prximos 6 meses, estimacin que se realizar con una confianza del 99%
y con un error mximo de 3%.

Ejercicio Un candidato poltico requiere una estimacin del porcentaje de electores


que votara por l en las prximas elecciones presidenciales. Desea que el
de error no exceda el 2,8% y una confianza del 95%. Cul debe ser el
revisin tamao de la muestra?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Caso de poblaciones finitas Del mismo modo que en la determinacin del tamao de
muestra para estimar la media, la frmula dada anteriormente se aplica a poblaciones infinitas,
pero en poblaciones finitas cuando se trabaja con reemplazo o en poblaciones finitas cuando
el tamao de la muestra n es muy pequeo con respecto al tamao de la poblacin N puede
realizarse un ajuste empleando el mismo factor de correccin:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
345

n0
FACTOR DE CORRECCIN n
PARA POBLACIONES FINITAS n
1 0
N
2
z
donde n0 es el resultado dado por la frmula n p(1 p) y N es el tamao de la
E
poblacin.

Ejemplo Una empresa desea conocer la proporcin de sus empleados que estaran
de acuerdo en un nuevo programa de beneficios. La compaa tiene un
total de 350 colaboradores y quiere hacer la estimacin con un error
mximo de 5% y una confianza del 95%. Se estima, por un estudio piloto,
que esta proporcin podra ser del 40%. Qu tamao de muestra se
necesita?

Solucin Dado que la poblacin es finita, entonces la determinacin del tamao de


muestra se efectuar en dos etapas. Primero se calcular el tamao de
muestra como si la poblacin fuera infinita. Luego se aplicar el factor de
correccin para poblaciones finitas.

Con base en los datos anteriores, se tiene que para el nivel de confianza del
95% corresponde un valor de z de 1,96. Los datos del problema son:

Precisin deseada o nivel mximo de error permitido: E = 0,05


Valor de z correspondiente al nivel de confianza del 95%: z = 1,96
Aproximacin de la proporcin poblacional: p = 0,4
Tamao de la poblacin: 350 empleados

Sustituyendo los valores en la frmula:

2 2
z 1,96
n p(1 p) 0,4(1 0,4) 368,79 369
E 0,05

Ahora se aplica el factor de correccin tomando n0 = 369 y N = 350:

n0 369
n 179,58 180
n0 369
1 1
N 350

Es necesaria una muestra de 180 empleados para tener una estimacin de


la proporcin de empleados que estaran de acuerdo en un nuevo programa
de beneficios con una confianza del 95% y con un error mximo del 5%.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
346

Ejercicio Un investigador est investigando la prevalencia de diabetes en adultos


mayores de 30 aos en una poblacin de 2000 personas. Desea un nivel de
de confianza de 95% y un error mximo de 3,5% en su estimacin. De qu
revisin tamao debe ser su muestra?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Tcnicas de muestreo
Tal como se ha expuesto a lo largo de este captulo, cuando se toma una muestra es necesario
tomar ciertas decisiones. Una de ellas es el tamao de la muestra, pero otra muy importante es
establecer el modo para escoger cules elementos se van a incluir en la muestra. Es por eso
que se habla de diferentes tcnicas de muestreo.

La decisin sobre la tcnica de muestreo a emplear depende de varios factores, entre los que
estn la existencia de un marco muestral bien definido, la conveniencia, el costo, la ubicacin
geogrfica de las unidades de estudio, entre otros.

La seleccin de la tcnica apropiada es tan importante como la determinacin del tamao de


la muestra, pues de nada valdra tener un tamao de muestra adecuado si la escogencia de los
elementos que integran la muestra genera algn tipo de sesgo. Por ejemplo, si se va a efectuar
un estudio de mercado para determinar la demanda de una nueva crema dental, sera un grave
problema que todos los miembros de la muestra, o una gran mayora, sean del mismo sexo, o
de la misma zona geogrfica, o de la misma clase socioeconmica, etc.

A continuacin se explicarn algunas de las principales tcnicas de muestreo aleatorias.


Aunque el ms sencillo es el muestreo simple al azar, los ms empleados son el muestreo
sistemtico, el muestreo estratificado y el de conglomerados, entre otras tcnicas importantes.

Importancia del marco muestral


Cuando se desea seleccionar una muestra aleatoria es muy importante contar con un marco
muestral apropiado. El marco muestral es una lista, mapa u otro tipo de herramienta que
permite identificar y seleccionar cada una de las unidades de muestreo. Por ejemplo, el marco
muestral puede ser una lista con todos los empleados de una empresa, de modo que al
seleccionar la muestra se pueda escoger a una cantidad de ellos.

En otros casos el marco muestral puede ser un mapa de una determinada zona geogrfica, el
cual se emplea para identificar y seleccionar viviendas, esto en un estudio sobre viviendas, o
en un estudio donde la unidad estadstica sea la familia, asumiendo que en cada vivienda va a
habitar una familia.

En otras situaciones el marco muestral puede ser una gua telefnica, listados de distintos
tipos, archivos, registros, entre otros.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
347

Muestreo simple al azar


La tcnica de muestreo ms sencilla es la del muestreo simple al azar. Esta tcnica es
importante por su facilidad y porque es la base para otras tcnicas de muestreo.

MUESTREO ALEATORIO SIMPLE Tcnica de muestreo en la que cada miembro


de la poblacin tiene la misma probabilidad de ser seleccionado en la muestra.

Suponga que una compaa desea conocer cul es la opinin de sus empleados acerca de la
posibilidad de impartir cursos de capacitacin a travs de internet. Para esto desea aplicar una
encuesta a una muestra de 60 empleados. El departamento de recursos humanos ha elaborado
una lista de los 670 empleados que laboran en la empresa a la fecha, la cual servir de marco
muestral. En la lista a cada empleado se le ha otorgado un nmero, iniciando en 1 y
terminando en 670. Para elegir a las 60 personas de la muestra, empleando un muestreo
simple al azar, se requiere un mecanismo que le d a cada uno de los 670 empleados la misma
probabilidad de ser incluido en la muestra.

Una alternativa echar en una caja 670 papelitos, cada uno con un nmero distinto entre 1 y
670, los cuales se mezclan bien, y sin mirar el nmero, se seleccionan 60 papelitos. Despus
se toma el nmero indicado en cada papelito y de ese modo se selecciona la persona
correspondiente en la lista elaborada por recursos humanos.

Una alternativa ms conveniente es emplear una tabla de nmeros aleatorios. Las tablas de
nmeros aleatorios, como la del apndice 10 de este libro, es un cuadro con nmeros que han
sido generados mediante un proceso aleatorio. El cuadro siguiente muestra un ejemplo.

Para emplear la tabla de nmeros aleatorios se requiere un punto de inicio aleatorio. Para
obtenerlo usted puede simplemente cerrar los ojos y dejar caer el lpiz sobre la tabla y tomar
como punto inicial el que marque la punta del lpiz.

Suponga en la tabla siguiente que el lpiz cay en la segunda columna y la quinta fila, donde
se encuentra el nmero 61722. Como usted necesita nmeros entre 1 y 670, entonces puede
tomar los primeros 3 dgitos de ese nmero, o sea, 617. Por tanto, selecciona al empleado
#617 en la lista. A partir de ah puede avanzar en la tabla hacia la derecha o hacia abajo, pero
siempre de la misma manera. Entonces, si se avanza hacia la derecha, el segundo nmero
seleccionado es el 291, el tercero es el 013, es decir, 13, el cuarto es el 130 (ntese que el
elemento 891 est fuera del rango buscado, pues la empresa solo posee 670 empleados), y el
quinto es el 357. Del mismo modo se contina en la siguiente lnea hasta completar los 60
miembros de la muestra.

49854 79596 24816 84416 32069 07091 99351


37273 14128 01981 93529 25802 50894 23045
52783 53435 55180 36802 99787 86515 17740
97021 08077 11064 81625 11897 79822 75449
81844 61722 29167 01368 89148 13062 35705
56669 33492 74076 77256 45475 30746 00852
32116 37619 53054 24127 00963 29832 70602
44715 90371 01674 25413 70020 68679 34848

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
348

Los nmeros aleatorios tambin pueden generarse en Excel, Minitab u otros paquetes de
software, e incluso calculadoras cientficas.

Ejemplo Un auditor desea verificar si todos los cheques emitidos en una compaa
satisfacan los requerimientos de control establecidos por la gerencia.
Durante el mes pasado se emitieron 81 cheques y la muestra debe contener
10 cheques. Cules cheques se seleccionaran si se aplica un muestreo
simple al azar y usando la tabla de nmeros aleatorios anterior (tome como
punto inicial la primera columna y segundo rengln de la tabla)?

Solucin Para seleccionar la muestra de 10 cheques de acuerdo con un muestreo


simple al azar, se toman 10 nmeros aleatorios. De acuerdo con lo
establecido en el ejercicio, el punto inicial sera el nmero 37273. Como
solo se extendieron 98 cheques, que es un nmero de 2 dgitos, entonces se
requieren 10 nmeros de 2 cifras entre 1 y 81. En la tabla dada estos
nmero seran 37, 14, 01, 25, 50, 23, 52, 53, 55 y 36 (note que el 93 est
fuera del rango requerido).

Ahora se buscan los cheques con los 10 nmeros seleccionados y el


auditor realiza su verificacin.

Ejemplo Utilice Excel para generar una muestra simple al azar de 5 unidades de una
poblacin total de 20 unidades.

Solucin Tal como se ha mencionado en el muestreo es necesario generar nmeros


aleatorios. Las funciones ALEATORIO y ALEATORIO.ENTRE se
pueden emplear para generar nmeros aleatorios para realizar el muestreo.
Utilice Excel para generar nmeros aleatorios para seleccionar una muestra
de tamao 5 de una poblacin total de tamao 20.

Para resolver este ejercicio se va a emplear la funcin


ALEATORIO.ENTRE la cual genera nmeros aleatorios entre dos valores,
un lmite inferior y otro superior, que en este caso seran 1 y 20,
respectivamente, pues se desea obtener nmeros al azar entre 1 y 20,
porque la poblacin es de tamao 20.

En una celda de la hoja de Excel, por ejemplo, la celda A1 introduce la


funcin:

= ALEATORIO.ENTRE(1;20)

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
349

Y presiona la tecla Intro (Enter). Como se quiere una muestra de tamao 5,


entonces se copia la frmula 5 veces:

En este caso se seleccionaran, segn la imagen, los elementos 2, 16, 6, 3 y


5 de la poblacin para conformar la muestra.

Aplicacin Investigacin de mercados


Cada da las empresas adoptan un mayor enfoque hacia el cliente, ya que
los gerentes de estas organizaciones se han dado cuenta de lo necesario e
importante que es adoptar un enfoque hacia el cliente, de modo que estos
clientes logren una muy alta satisfaccin con los productos y servicios de
la empresa, y por tanto, se logre cierto grado de lealtad o fidelidad del
cliente hacia la empresa. En pocas de crisis y alta competencia esta
lealtad del cliente es clave para el xito de un negocio, ya que los estudios
muestran que es ms econmico retener a los clientes actuales que alcanzar
nuevos clientes. Para lograr esto es necesario conocer a fondo a los
consumidores, especficamente saber cules son sus necesidades y cmo
las satisfacen, y cules son los factores que les motivan a adquirir
determinados bienes y servicios.

La investigacin de mercados es una de las principales herramientas a


disposicin de las empresas para obtener informacin que sirve para
identificar y definir las acciones de marketing de una compaa u
organizacin. En general, el proceso de investigacin de mercados abarca
las siguientes actividades:

1. Especificar cul informacin se requiere obtener en la investigacin


segn los requerimientos la gerencia, de los vendedores, etc.
2. Disear un mtodo para recopilar la informacin, por ejemplo, una
encuesta.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
350

3. Administrar e implementar el proceso de recoleccin de informacin


(que podra consistir en la aplicacin de la encuesta a una muestra de
consumidores).
4. Analizar los resultados obtenidos del proceso de recoleccin de
informacin.
5. Comunicar los hallazgos para la toma de decisiones.

Dado que generalmente el nmero de consumidores es muy grande, tratar


de hacer un estudio de mercado empleando la poblacin puede resultar
excesivamente caro, a tal punto que sera prohibitivo para prcticamente
cualquier empresa.

Muestreo aleatorio sistemtico


Este tipo de muestreo es muy sencillo de efectuar. Se emplea principalmente porque en
algunos casos el muestreo simple al azar produce ciertas concentraciones en algunas partes
del marco muestral, o bien, espacios de la poblacin sin representacin. Tambin se puede
emplear en casos en que el marco muestral no es completo o no se conoce exactamente la
poblacin.

MUESTREO ALEATORIO SISTEMTICO Tcnica de muestreo que selecciona


un punto aleatorio de inicio y posteriormente se elige cada k-simo elemento de la
poblacin.

Para emplear este tipo de muestreo es necesario determinar una constante de espaciamiento k:

N
CONSTANTE DE ESPACIAMIENTO k
n

Donde N es el tamao de la poblacin y n es el tamao de muestra seleccionado.

Entonces, el muestreo sistemtico consiste en seleccionar a la ksima unidad de muestreo


despus de un punto de inicio aleatorio entre 1 y k. En otras palabras, se selecciona al azar una
unidad entre las primeras k unidades, y luego, despus de esa unidad, se toma a la ksima
unidad, y as sucesivamente hasta completar las n unidades de la muestra.

Ejemplo Una empresa tiene 700 empleados y se desea tomar una muestra de 20 de
ellos para aplicar un cuestionario sobre la opinin de los colaboradores
sobre los resultados obtenidos luego de la implementacin de un nuevo
sistema informtico. Cmo se seleccionaran los miembros de la muestra
si se emplea el muestreo aleatorio sistemtico?

Solucin Para poder seleccionar la muestra es necesario que previamente se haya

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
351

preparado una lista con los nombres de los 700 empleados, la cual servir
de marco muestral.

Como la poblacin es de 700 personas, N = 700, y se tomar una muestra


de 20 empleados, n = 20, entonces:

N 700
k 35
n 20

Luego se busca el punto de inicio. Para esto se busca un nmero aleatorio


entre 1 y 35. Suponga que se ha empleado una tabla de nmeros aleatorios
y que se ha obtenido el 8. Entonces, se selecciona al octavo empleado de la
lista. Ese sera el primer integrante de la muestra.

Para obtener el segundo elemento en la muestra, al 8 se le suma la


constante k, es decir, se le suma 35, por lo que el segundo miembro de la
muestra ser el nmero 43 de la lista, pues 8 + 35 = 43.

De manera similar se obtendr el tercer elemento en la muestra. A 43 se le


suma la constante k, de modo que se seleccionar al empleado nmero 78
de la lista, ya que 43 + 35 = 78.

Del mismo modo se seleccionarn los siguientes miembros de la muestra:

Elemento Elemento Elemento Elemento


de la seleccionado de de la seleccionado de
muestra la poblacin muestra la poblacin
1 8 11 323 + 35 = 358
2 8 + 35 = 43 12 358 + 35 = 393
3 43 + 35 = 78 13 393 + 35 =428
4 78 + 35 = 113 14 428 + 35 = 463
5 113 + 35 = 148 15 463 + 35 = 498
6 148 + 35 = 183 16 498 + 35 = 533
7 183 + 35 = 218 17 533 + 35 = 568
8 218 + 35 = 253 18 568 + 35 = 603
9 253 + 35 = 288 19 603 + 35 = 638
10 288 + 35 = 323 20 638 + 35 = 673

De ese modo vemos como se ha seleccionado a los 20 miembros de la


muestra. Luego se buscan los nombres respectivos en la lista y se aplica el
cuestionario a cada uno de ellos.

Cuando la constante de espaciamiento k no da un nmero entero, puede recurrirse al


redondeo. Por ejemplo, si de una poblacin de 700 personas se desea seleccionar una muestra
de tamao 40, entonces k = 700/40 = 17,5. Como 17,5 no es entero, entonces se puede seguir
el siguiente procedimiento. Se multiplica k por 10, para obtener un entero (si k tuviera 2
decimales, se multiplica por 100 para que quede un entero), que en este caso es 175. Despus

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
352

se elige un nmero aleatorio entre 1 y 175. Suponga que en la tabla de nmeros aleatorios se
obtiene el 83. Ahora se repiten los mismos pasos que se efectuaron cuando k es entero; es
decir, se va sumando la constante de espaciamiento k para ir obteniendo cada nuevo elemento
de la muestra:

83
83 + 175 = 258
258 + 175 = 433
433 + 175 = 608

6650 + 175 = 6825

Posteriormente se divide cada uno de estos nmeros entre 10 (ya que se haba multiplicado
por 10) y se redondea cada resultado:

Primer elemento de la muestra: 83 10 = 8,3 8


Segundo elemento de la muestra: 258 10 = 25,8 26
Tercer elemento de la muestra: 433 10 = 43,3 43
Cuarto elemento de la muestra: 608 10 = 60,8 61

ltimo elemento de la muestra: 6825 10 = 682,5 683

Entonces, se selecciona a los elementos nmero 8, 26, 43, 61, , 683 de la poblacin para ser
incluidos en la muestra.

Puede observarse que el muestreo sistemtico es muy sencillo, especialmente si el tamao de


muestra es muy grande. En general, puede considerarse que es fcil tomar al ksimo nombre
de una lista, seleccionar al ksimo artculo en una lnea de produccin, la ksima persona
esperando en una fila en un aeropuerto, etc.

Ahora bien, hay que tener tambin algunas precauciones. Si la lista que sirve de marco
muestral sigue algn patrn o ciclo particular, entonces la muestra obtenida podra no ser
representativa. Si, por ejemplo, la lista de los 700 empleados ha sido ordenada siguiendo el
orden hombre mujer, entonces podra obtenerse una muestra de solo mujeres, lo cual hara
que la muestra no fuera representativa, pues la poblacin tambin contiene hombres.

Muestreo aleatorio estratificado


En ocasiones es posible agrupar las unidades de estudio que se parecen en algn aspecto.
Estos grupos o subpoblaciones se denominan estratos. Suponga que una empresa puede
dividir a sus empleados por departamentos, por ejemplo, personal del rea de finanzas, del
rea de mercadeo y del rea de operaciones; o bien, por su antigedad de laborar en la
empresa, donde se podra tener un grupo de empleados con menos de 5 aos de trabajar para
la compaa, otros con 5 aos o ms pero menos de 10 aos en la empresa, y un tercer grupo
correspondiente a los empleados con 10 o ms aos en la empresa. Entonces, en un muestreo
estratificado se elabora un diseo de muestra en el que se selecciona una muestra al azar de
cada uno de los estratos establecidos. En cada estrato se va a estimar la caracterstica de
inters y luego se combinarn dichas estimaciones para obtener la estimacin para toda la
poblacin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
353

MUESTREO ALEATORIO ESTRATIFICADO Tcnica de muestreo que divide la


poblacin en subgrupos, denominados estratos, y selecciona al azar una muestra de
cada estrato.

Este tipo de muestreo es muy til en poblaciones muy heterogneas, las cuales pueden
dividirse en estratos ms homogneos gracias al conocimiento previo que el investigador tiene
acerca de la poblacin.

Tal como se mencion, los estratos pueden ser de muchos tipos. Por ejemplo, en un estudio
realizado en una universidad, cada uno de los estratos podra corresponder a los estudiantes de
cada una de las carreras que se imparten, y adems, otro estrato podra estar compuesto por el
personal docente y otro por el personal administrativo. Este tipo de muestreo asegurara que
en la muestra va a haber representacin para cada uno de los estratos, lo cual no
necesariamente ocurre con el muestreo simple al azar.

Como se ha indicado, en esta tcnica de muestreo se procura formar estratos ms homogneos


que la poblacin (o sea, con una desviacin estndar dentro de cada estrato menor que la
poblacional), lo cual permitir realizar estimaciones con un error estndar inferior, y por
tanto, se lograra una mayor precisin que la que se obtendra con un muestreo simple al azar
con el mismo tamao de muestra.

Las principales ventajas del muestreo estratificado son:

Se puede obtener estimaciones ms precisas de la caracterstica que se desea medir en el


tanto que los estratos sean ms homogneos con relacin a esa caracterstica de inters.
Los estratos pueden ser importantes por s mismos, es decir, la estratificacin no solo es
til para estimar el parmetro poblacional buscado, sino tambin para conocer a
profundidad cada estrato, e incluso, poder hacer comparaciones entre ellos.
En algunos casos este tipo de muestreo puede ser muy conveniente desde el punto de vista
administrativo, pues la recoleccin de la informacin puede facilitarse a travs de la
estratificacin. Por ejemplo, en el caso anterior de la universidad, se pueden emplear
distintos mtodos para cada estrato, as, para obtener la informacin entre los estudiantes
se puede utilizar un mtodo, pero entre los profesores y personal administrativo otro
distinto.

Luego de que se han definido los estratos, entonces es necesario efectuar la afijacin. La
afijacin es la distribucin del total de la muestra entre cada uno de los estratos establecidos.

La afijacin puede hacerse de distintas maneras. La ms comn es la denominada afijacin


proporcional. Esto se hace distribuyendo la muestra entre los estratos proporcionalmente al
nmero de unidades de la poblacin que corresponden a cada estrato.

Cabe aclarar que esta imagen solo ilustra la conformacin de la muestra a partir de los estratos
ya establecidos. No ilustra el modo en que deben ser establecidos los estratos en la poblacin.

Ejemplo Los empleados de una empresa se pueden dividir en estratos por su


antigedad de laborar en la compaa. Del total de 1.000 empleados, hay
200 empleados con menos de 5 aos de trabajar para la compaa, hay 500

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
354

con una antigedad de 5 aos o ms pero menos de 10 aos en la empresa,


y 300 con una antigedad de 10 o ms aos. Se va a seleccionar una
muestra de 50 empleados para conocer la opinin de los empleados sobre
la posibilidad de implementar la modalidad del teletrabajo en la empresa.
Cuntos empleados deben seleccionarse de cada estrato?

Solucin Para establecer cuntos empleados deben seleccionarse de cada uno de los
estratos establecidos, si se emplea la afijacin proporcional, primero se
debe determinar la frecuencia relativa de cada uno de los estratos en la
poblacin:

Nmero de Frecuencia Muestra


Estrato Antigedad empleados relativa por estrato
1 Menos de 5 aos 200 0,20 10
2 De 5 a 10 aos 500 0,50 25
3 10 aos o ms 300 0,30 15
Total 1.000 1,00 50

Tal como se observa en la tabla, para obtener la frecuencia relativa de cada


estrato se divide el nmero de elementos del estrato entre el total de la
poblacin:

Estrato 1: 200/1.000 = 0,20


Estrato 2: 500/1.000 = 0,50
Estrato 3: 300/1.000 = 0,30

Observe que la suma de las frecuencias relativas debe ser exactamente


uno.

Luego para determinar el nmero de empleados que se incluirn en la


muestra por cada estrato se multiplica cada frecuencia relativa por el
tamao de muestra, que en este caso es 50:

Estrato 1: 0,20 x 50 = 10
Estrato 2: 0,50 x 50 = 25
Estrato 3: 0,30 x 50 = 15

La suma de los tamaos de muestra por estrato debe ser igual al tamao de
la muestra total, que en este caso es 50.

Podemos decir que se requiere incluir en la muestra a 10 empleados con


una antigedad de menos de 5 aos, a 25 con una antigedad de ms de 5
aos pero menos de 10 aos en la empresa, y a 15 con una antigedad de
10 o ms aos de laborar para la empresa.

La afijacin proporcional no es la nica forma de establecer la distribucin de la muestra entre


los distintos estratos, pero s es la ms sencilla y prctica, adems de que concede a todos los
miembros de la poblacin la misma probabilidad de ser incluidos en la muestra, tal como en el

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
355

muestreo simple al azar. Adems, los clculos son ms sencillos al no requerirse factores de
ponderacin.

Muestreo aleatorio por conglomerados


Con mucha frecuencia se tiene una poblacin dispersa geogrficamente y no se posee un
marco muestral bien establecido. Por ejemplo, si se desea efectuar una investigacin entre
estudiantes de secundaria en todo el pas, los cuales se encuentran dispersos en todo el
territorio nacional y, adems, no se posee una lista de todos los estudiantes matriculados en
todos los colegios del pas. Entonces, el muestreo por conglomerados es una buena alternativa
para seleccionar la muestra.

MUESTREO ALEATORIO POR CONGLOMERADOS Tcnica de muestreo que


divide la poblacin en conglomerados a partir de sus lmites naturales geogrficos o de
otra clase, para luego seleccionar aleatoriamente conglomerados y tomar una muestra
al azar con elementos de cada uno de ellos.

Observe que en este tipo de muestreo inicialmente no se seleccionan las unidades de estudio,
sino que se seleccionan unidades primarias, es decir, se seleccionan primero regiones, o
barrios, o colegios, entre otros posibles conglomerados. Cabe sealar que no todos los
conglomerados son muestreados en esta tcnica.

Este tipo de muestreo es empleado por distintas razones:

En ciertos casos no se posee un marco muestral que indique todas las unidades de estudio,
pero s se puede contar con una lista de los conglomerados. Por ejemplo, tal vez no se
tenga una lista de todos los empleados de las micro y pequeas empresas del pas, pero s
podra tenerse una lista de dichas empresas. As podra seleccionarse al azar una muestra
de las empresas, y en cada empresa obtener una muestra al azar de algunos de sus
empleados.
Este tipo de muestreo permite disminuir los costos, especialmente en cuanto al recurso
humano. El hecho de que las unidades estn agrupadas dentro de los conglomerados es lo
que facilita la reduccin de los costos.
Las unidades individuales dentro de cada "conglomerado", por lo general, tienden
usualmente a ser similares. Por ejemplo, las familias de altos ingresos viven en el mismo
barrio, mientras que las familias de clase media viviran en otra zona.

Empleando el muestreo de conglomerados, generalmente, se produce un menor nivel de


precisin (mayor error muestral) que en una muestra simple al azar del mismo tamao.
Frecuentemente la variacin entre los elementos obtenidos de los conglomerados
seleccionados es mayor que en las muestras aleatorias simples. Esta debilidad puede
enfrentarse si se incrementa el tamao de la muestra de cada conglomerado.

Ejemplo En un proyecto de investigacin se desea conocer el grado de satisfaccin


laboral de los profesores universitarios del pas. Se requiere una muestra
total de 300 profesores, pero no se posee una lista de todos los profesores
de las universidades del pas. Cmo podra obtenerse la muestra en este
estudio?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
356

Solucin Dado que ya est establecido el tamao de la muestra, el problema consiste


en seleccionar los 300 miembros de la muestra. Como no se cuenta con un
marco muestral, podra emplearse el muestreo por conglomerados. Para
ello se toma una lista de las universidades del pas. Cada universidad ser
una unidad primaria, es decir, se seleccionar una muestra aleatoria de
varias universidades, para luego tomar una muestra de profesores de cada
una de ellas. Cada muestra de profesores se puede obtener por muestreo
simple al azar o muestreo sistemtico.

Muestreo no aleatorio
Existen otras tcnicas de muestreo aleatorio como el muestreo por etapas (multietpico),
muestreo proporcional al tamao, entre otros. De igual manera existen diversos tipos de
muestreo no aleatorio, tales como:

Muestreo de juicio: En este tipo de muestreo las unidades son seleccionadas mediante el
juicio personal del investigador. Esta persona usualmente es un experto en la materia
relacionada con la investigacin. Este tipo de muestra no es una muestra probabilstica,
pues este mtodo est basado en el punto de vista subjetivo de una persona, lo cual
ocasiona que la teora de la probabilidad no pueda ser aplicada para medir el error de
muestreo.
Muestreo por conveniencia: En este caso el investigador selecciona para conformar la
muestra aquellas unidades que sean ms fciles de acceder. En otras palabras, la muestra
se elige de acuerdo con la comodidad del investigador. En este tipo de muestreo la
representatividad la determinara el investigador de modo subjetivo, por lo que tampoco se
puede emplear la teora de la probabilidad para determinar el nivel de error.
Otros tipos de muestreo no aleatorio. En ocasiones se habla del muestreo por cuotas, de
las muestras autogeneradas, entre otras formas de obtener una muestra no probabilstica.
Todos estos mtodos tienen la desventaja de que no es posible establecer la
representatividad de la muestra de forma objetivo, es decir, no se puede determinar un
nivel de confianza y medir el margen de error de la estimacin.

Aplicacin Auditora
Aunque existen muchos tipos de auditora, en este captulo se har nfasis
en la auditora financiera. La informacin financiera es fundamental para
la toma de decisiones tanto para usuarios internos de la empresa, la
gerencia, por ejemplo, como para usuarios externos, como los acreedores,
el fisco e inversionistas, entre otros. Es por eso que es fundamental que los
estados financieros de la empresa sean fiel reflejo de la realidad econmica
y financiera de una empresa.

La auditora juega un papel muy importante como un instrumento para


garantizar, hasta donde sea posible, que la informacin financiera sea
veraz y confiable. En el mbito financiero la auditora consiste en una
revisin objetiva de los estados financieros que han sido elaborados en una

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
357

organizacin, sea esta una empresa privada, una entidad sin fines de lucro
o una institucin pblica, entre otras. Entonces, dentro del trabajo del
auditor est el obtener las evidencias suficientes para poder ofrecer una
opinin objetiva sobre la veracidad y confiabilidad de la informacin
financiera presentada.

Dado que una empresa efecta miles, e incluso hasta millones de


transacciones, un auditor no puede examinar todas y cada una de estas
operaciones que son las que forman los saldos finales. Es por eso que debe
aplicar los procedimientos de auditora a una muestra representativa de
estas transacciones o partidas para obtener la evidencia que requiere.

Entonces, el muestreo en la auditora es el proceso de seleccin de una


muestra entre un grupo ms grande de partidas (poblacin), de modo que
se emplean las caractersticas de la muestra para llegar a conclusiones
sobre las caractersticas de la poblacin.

La normativa que rige el trabajo del auditor hace nfasis en la necesidad


del uso de muestreo estadstico. Las evidencias se recolectan a partir de
muestras representativas, de modo que las inferencias que se efecten
posean altos niveles de confianza. Por eso debe tenerse cuidado en la
determinacin del tamao de la muestra y la seleccin de las unidades de
observacin que se seleccionan. Todo el procedimiento estadstico
empleado debe justificarse y debe permitir al auditor valorar el nivel de
riesgo que existe en su interpretacin de los datos muestrales y un cierto
grado de confiabilidad en la interpretacin de los resultados.

Entre las principales ventajas del muestreo en la auditora estn las


siguientes:

1. Permite que el criterio del auditor se base en cifras objetivas, no en


juicios de valor.
2. Reduce el costo de la auditora al no tener que examinar el 100% de los
datos, registros, documentos, etc.
3. Reduce el riesgo de la auditora, pues al trabajar con una muestra el
auditor puede asegurarse de controlar mejor su trabajo.
4. En general puede decirse que el proceso de la auditora es ms eficaz y
eficiente, pues puede cumplir su propsito y a un costo menor.

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
358

info@auladeeconomia.com. Para ello deber indicar el nmero de su


factura de compra de texto.

Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios siguientes (las respuestas a los ejercicios se encuentran en la pgina de
internet del texto: www.auladeeconomia.com/raeep.html).

1. Un investigador est interesado en conocer ciertos datos relacionados con la calidad de vida
de un pueblo en una zona rural del pas. Entre las variables que desea estimar est el nivel de
caloras que en promedio consumen los nios de 7 a 12 aos de esa poblacin por da.
Conoce, por un estudio anterior, que la desviacin estndar de la citada variable es 185
caloras. Adems sabe que habitan en ese poblado 745 nios. Segn datos del gobierno local
el consumo medio de caloras de los nios de esa edad es de 1170 caloras por da, pero el
investigador duda de la veracidad de dicha informacin. El desea que sus estimaciones tengan
altos niveles de confiabilidad (por lo menos el 99%), entonces decide realizar un estudio
estadstico. Toma una muestra de 27 nios y evala su situacin nutricional.

a) Cul podra ser el marco muestral a emplear?


b) Cul sera la unidad de estudio, la unidad de muestreo y la informacin?
c) Por qu necesita este investigador emplear una muestra?
d) Cul es el parmetro que el investigador desea estimar?
e) Qu tipo de muestreo debera emplear, un muestreo aleatorio o no aleatorio?
f) Tom el tamao de muestra adecuado? Explique.

2. Una asociacin de profesionales desea fomentar el uso de las tecnologas entre sus
afiliados. Para lograr dicho objetivo, se quiere establecer un convenio con alguna empresa
vendedora de equipo de cmputo, para posteriormente poder un sistema de financiamiento
para los miembros de la asociacin. A fin de poder realizar la negociacin, primero se quiere
estimar la proporcin de profesionales afiliados que estaran interesados en adquirir una
computadora, tanto para el trabajo como para el hogar. Por esta razn, solicita un estudio por
muestreo.

a) Cul podra ser el marco muestral a emplear?


b) Cul sera la unidad de estudio, la unidad de muestreo y la informacin?
c) Por qu necesita este investigador emplear una muestra?
d) Cul es el parmetro que el investigador desea estimar?
e) Qu tipo de muestreo debera emplear, un muestreo aleatorio o no aleatorio?

3. En los siguientes casos, cul puede ser la razn principal por la cual se va a emplear una
muestra?

a) Una fbrica de refrescos desea conocer si el nivel de azcar en los refrescos que se
producen est dentro de los niveles aceptables.
b) Un banco desea evaluar la satisfaccin de sus clientes.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
359

c) Una tienda en lnea desea saber la proporcin de usuarios del internet que creen que es
seguro efectuar pagos en lnea.
d) Un gestor ambiental desea conocer el nivel de determinados contaminantes que se
encuentran en las aguas de un ro.

4. En los siguientes casos, cul puede ser la razn principal por la cual se va a emplear una
muestra?

a) Un supervisor de calidad desea saber la cantidad de piezas defectuosas que salen de un


proceso de produccin.
b) Un distribuidor de ropa femenina desea conocer la proporcin de mujeres entre 20 y 40
aos que reconocen las marcas que vende.
c) Una universidad desea conocer cules son las destrezas principales que deben poseer los
profesionales en administracin de negocios que contratan las empresas.
d) Una compaa de seguros desea saber la proporcin de personas que poseen algn tipo de
seguro para vehculos.

5. Se desea realizar un estudio para determinar los gastos familiares mensuales promedio en
educacin que efectan los empleados de una compaa. El gerente desea tener un 95% de
confianza de que los gastos no difieran en ms de $40 con respecto al valor verdadero.

a) En una encuesta previa se determin que la varianza es de $6.400. De qu tamao deber


ser la muestra?
b) De qu tamao debe ser la muestra si la empresa tiene un total de 5.500 empleados?
c) Cules especificaciones del estudio podran cambiarse, si se deseara un tamao de
muestra menor? (Conteste sin clculos, slo con palabras)

6. Una asociacin de profesionales desea fomentar el uso de las tecnologas entre sus
afiliados. Para lograr dicho objetivo, se quiere establecer un convenio con alguna empresa
vendedora de equipo de cmputo, para posteriormente poder un sistema de financiamiento
para los miembros de la asociacin. A fin de poder realizar la negociacin, primero se quiere
estimar la proporcin de profesionales afiliados que estaran interesados en adquirir una
computadora, tanto para el trabajo como para el hogar. Por esta razn, solicita un estudio por
muestreo. Cul debera ser el tamao de muestra, si el margen de error mximo permitido es
3,5%, la asociacin posee 5.000 afiliados actualmente y se quiere un nivel de confianza del
95%?

7. El Presidente de la Repblica desea una estimacin del porcentaje de la poblacin que


apoya su poltica econmica actual. El mandatario espera que la estimacin est dentro del
0.05 de la proporcin verdadera, utilizando un nivel de confianza del 95%. De qu tamao
debe ser la muestra?

8. El encargado de capacitacin de una institucin con 3.200 empleados desea hacer una
encuesta que le sirva para detectar diversas necesidades de capacitacin en el rea de idiomas.

a) Si desea que la estimacin de la proporcin de empleados que requieran cursos de ingls


tenga un error mximo de 2 puntos porcentuales y una confianza del 99%, de qu tamao
debe ser la muestra para llevar a cabo la encuesta?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
360

b) Si considerara el tamao de muestra anterior muy grande con relacin a los recursos que
dispone, en qu direccin (aumentar o disminuir) tiene que cambiar el nivel de confianza
o el error muestral para disminuir el tamao de la muestra?

9. Se realiza un estudio para estimar la proporcin de residentes de una zona rural del pas que
estn a favor de la construccin de una mina. De qu tamao debe ser la muestra, si se
requiere una confianza de al menos de 95%, de que la estimacin estar dentro del 0.04 de la
proporcin real de residentes de esta zona que estn a favor de la construccin de la mina?

10. Un agente de seguros est realizando una encuesta entre gerentes de empresas pblicas y
privadas para determinar la proporcin de ellos que estaran dispuestos a comprar seguros de
gastos mdicos y cunto es el nivel de gastos mensuales promedio en salud que realizan. En
una encuesta realizada hace un ao se determin que un 15% estaran anuentes a comprar
seguros de gastos mdicos y que la desviacin estndar de los gastos mensuales en salud era
de $145. Si se desea una confianza del 95% en las estimaciones:

a) Calcule el tamao de muestra para estimar la media de los gastos mensuales en salud con
un margen de error mximo de $100.
b) Calcule el tamao de muestra para estimar la proporcin de gerentes que compraran un
seguro de gastos mdicos con un margen de error mximo de 3 puntos porcentuales.

11. Se desea realizar una encuesta a entre los 10.500 profesionales en mercadeo que hay en el
pas para preguntarles si desean asistir a un congreso sobre marketing relacional. Si en la
encuesta se desea un margen de error mximo del 4% y si no se conoce algn estudio previo,
determine el tamao de muestra necesario para hacer la encuesta.

12. El comedor de un albergue infantil quiere estimar el peso promedio de los nios. Un
estudio anterior de diez nios mostr que la desviacin estndar de sus pesos es de 6,05
kilogramos. Qu tan grande debe ser una muestra para que el administrador tenga un 95% de
confianza de que el error de estimacin es a lo ms de 2 kilogramos?

13. El gerente de una empresa desea estimar las horas mensuales que trabajan los empleados
de la empresa bajo presin, ya que la entrega del entregable de los proyectos que se realizan
tiene que estar listo al final del da. Un estudio piloto revel que la desviacin estndar es de
24 horas.
a) De qu tamao se necesita una muestra si se desea tener 96% de confianza que la media
real est dentro de un margen de error de 10 horas de la media real?
b) De qu tamao debera ser la muestra si en lugar de tener un error de estimacin de 10
horas slo se requiere un error de 5 horas?
c) Suponga que se tiene una poblacin de 300 empleados, de qu tamao debe de ser la
muestra, si se desea una confianza de 96% y un error mximo de 5 horas?

14. El gerente de recursos humanos de una organizacin est analizando una serie de nuevas
polticas con el fin de mejorar el desempeo e incrementar la productividad. Por tal razn
desea conocer el rendimiento de los 230 operarios de la empresa segn la ms reciente
evaluacin del desempeo. Para ello debe seleccionar una muestra y hacer una estimacin del
desempeo medio de los empleados. De qu tamao debe ser la muestra si se quiere tener
una confianza de 90% de que el error no ser mayor de 4 puntos, conociendo que la
desviacin estndar es de 22 puntos?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
361

15. Una organizacin desea conocer cuntos de sus 3000 empleados estn satisfechos en su
puesto de trabajo. Para ello debe seleccionar una muestra y hacer una estimacin de la
proporcin de empleados que si se sienten satisfechos. De qu tamao debe ser la muestra si
se quiere tener una confianza de 95% de que el error no ser mayor de 3 puntos?

16. En un estudio anterior entre 500 familias que tienen televisores en una ciudad, se encontr
que 340 estn suscritas a algn servicio de televisin por cable. Qu tan grande se requiere
que sea una muestra si se quiere tener 95% de confianza de que la estimacin de la proporcin
de familias que posee algn servicio de cable est dentro de 0,02?

17. La tabla siguiente contiene los nombres de 30 empleados del departamento de inversiones
de una aseguradora. Se va a tomar una muestra de 6 de empleados. Con base en la
informacin anterior, determine, si se emplea un muestreo simple al azar:

a) Cules empleados se seleccionaran si los nmeros aleatorios que genera un paquete de


software son 13, 22, 16, 08, 02 y 24?
b) Ahora utilice la tabla de nmeros aleatorios del apndice 10 para generar su propia
muestra.

# Nombre del empleado # Nombre del empleado


1 Magally Castillo 16 Ricardo Lpez
2 Andrs Gonzlez 17 Andrs Mndez
3 Sergio Vargas 18 Daniela Rojas
4 Patricia Chinchilla 19 Javier Hidalgo
5 Jos Cordero 20 Alberto Aguilar
6 Melisa Prez 21 Norman Monge
7 Ana Cristina Campos 22 Rolando Madriz
8 Victoria Fonseca 23 Felipe Salas
9 Sandra Gamboa 24 Vernica Gonzlez
10 Vanesa Gmez 25 Laura Solano
11 Rolando Rojas 26 Mara Vargas
12 Esteban Gonzlez 27 Gustavo Meja
13 Mario Leiva 28 lvaro Bustamante
14 Tatiana Fuentes 29 Luis Ziga
15 Mara Gamboa 30 Susan Alfaro

18. Tomando como base el ejercicio de 17, se extraer una muestra de tamao 6 empleando la
tcnica de muestreo aleatorio sistemtico:

a) Cules elementos seleccionara en la muestra si el punto inicial es el quinto elemento de


la poblacin?
b) Ahora utilice la tabla de nmeros aleatorios del apndice 10 para generar su propia
muestra.

19. Tomando como base el ejercicio de 17, se extraer una muestra de tamao 8 empleando la
tcnica de muestreo aleatorio sistemtico:

a. Cules elementos seleccionara en la muestra si el punto inicial es el segundo


elemento de la poblacin?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
362

b. Ahora utilice la tabla de nmeros aleatorios del apndice 10 para generar su propia
muestra.

20. Una empresa tiene 2.000 empleados y desea tomar una muestra de 200 de colaboradores
para aplicar un cuestionario para conocer su disposicin a participar en comits de educacin
y gestin ambiental. Explique cmo se seleccionaran los miembros de la muestra si se
emplea el muestreo aleatorio sistemtico.

21. Un investigador desea conocer el nivel nutricional de los jvenes que ingresan a las
secundarias del pas. Se requiere una muestra total de 3.600 estudiantes de primer ao de
secundaria (no se posee una lista de todos los estudiantes de secundaria del pas). Explique
cmo podra obtenerse la muestra en este estudio.

22. A continuacin se presenta una lista de investigaciones que se realizarn empleando un


muestreo estadstico (aleatorio), en cada caso indique cul considera usted que es el diseo
muestral ms adecuado (simple al azar, sistemtico, estratificado, conglomerados):
a. En un hospital se desea determinar el tiempo medio de espera de los pacientes en el
servicio de consulta externa.
b. Se desea conocer la efectividad de un programa de prevencin de enfermedades
cardiovasculares aplicado en la poblacin de la ciudad capital de julio a noviembre del
ao 2012.
c. Un laboratorio farmacutico ha desarrollado un nuevo medicamento y desea evaluar
la posible interaccin con otras sustancias, para lo cual posee una muestra de ratas en
las cuales va a efectuarse el experimento.
d. Un investigador est preocupado por el continuo uso de computadoras, televisores y
otros aparatos y su efecto en la agudeza visual de los nios de 6 a 12 aos. El estudio
se realizar a nivel nacional.
e. Como consecuencia del calentamiento global se considera que cierto tipo de ranas
han ido desapareciendo, por lo que se requiere conocer cuntas ranas habitan aun en
las zonas montaosas del pas.
f. Se requiere conocer qu porcentaje de la poblacin del pas alcanza ciertos niveles
de peso, para saber cunta es la prevalencia de la obesidad en el pas durante el ltimo
ao.
g. Se va a determinar el estado de las viviendas del pas. El estudio se efectuar de
enero a marzo del prximo ao.
h. En un proceso de produccin se requiere saber la proporcin de artculos
defectuosos, adems de conocer las posibles causas de los defectos.
i. Se desea saber la resistencia de determinados componentes electrnicos ante ciertas
circunstancias extremas (sobrecargas, calentamiento, etc.).
j. Se va a realizar un estudio sobre las medidas de seguridad informtica que las
empresas financieras implementan. Para esto se va a efectuar una encuesta a los
gerentes de tecnologas de informacin de bancos, cooperativas, mutuales, etc.
k. Ante el lanzamiento al mercado de un nuevo sistema operativo se va a estimar la
proporcin de empresas que estn dispuestas a implementar este nuevo sistema en el
transcurso de los prximos doce meses.
l. Un inversionista est buscando nuevas opciones para colocar su capital, por lo que
decide invertir en la Bolsa de Valores de Nueva York. Ha reunido informacin de
distinta empresas para conocer cmo han variado los precios de sus acciones y los
pagos de dividendos.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
363

m. Una nueva empresa de telecomunicaciones est efectuando un estudio de mercado


para conocer las preferencias de los consumidores nacionales en lo que respecta al uso
del telfono celular, uso de internet, etc.
n. El encargado de recursos humanos de una empresa va a estimar el nivel de
satisfaccin de los empleados de la empresa para la cual labora.
o. En una auditora se van a examinar las cuentas por cobrar de una empresa.
p. Se requiere conocer cmo afectara un nuevo paquete de impuestos a los diferentes
sectores productivos del pas. Para tal fin se efectuar una encuesta entre empresarios,
lderes de organizaciones empresariales y expertos en el tema.
q. El gobierno desea saber qu tan efectiva ha sido una campaa para promocionar al
pas como destino turstico. Para ello se aplicar un cuestionario a turistas que ingresan
al pas por los distintos aeropuertos y fronteras terrestres.
r. Una educadora est investigando el impacto de las tecnologas de la informacin y
la comunicacin en los hbitos de estudio de los estudiantes de secundaria del pas.
s. Un psiclogo en una empresa aplica un test para identificar distintos tipos de
personalidad de los candidatos a una serie de puestos vacantes en la empresa.
t. Se est investigando el efecto que tienen las redes sociales en internet en las
relaciones familiares, para esto se tomar una muestra de familias del rea
metropolitana durante los prximos 6 meses.
u. Un investigador de una institucin desea conocer el estado general (salud,
emocional, etc.) de los nios dados en adopcin durante el ltimo ao en el pas.
v. El gobierno est analizando el efecto que han tenido algunas manifestaciones
estudiantes en su imagen. Para esto va a realizar una encuesta a nivel de las zonas
urbanas del pas.
w. Un periodista est preocupado porque considera que algunas acciones del gobierno
afectan la libertad de prensa. Va a realizar una encuesta aplicando a una muestra
representativa de sus colegas para valorar la percepcin que tiene de esos mismos
sucesos.
x. Para determinar la efectividad de una campaa publicitaria, se va a evaluar la
exposicin de los consumidores a los comerciales pautados y el volumen de ventas de
la compaa en el mismo periodo. Se tomar una muestra de consumidores del rea
metropolitana.

23. Suponga que se desea estimar la prevalencia de diabetes en la comunidad de Nuevo


Volcn para luego poder someter a algunos de ellos en un plan especial del Seguro Social.
Cul es el tamao de la muestra requerido para estimar la prevalencia de diabetes en una
poblacin de 2.000 habitantes? Se sabe por un estudio previo que prevalencia de diabetes en
esta poblacin fue de 8%. Se desea que la proporcin estimada no difiera en ms de un 1%
con respecto a la verdadera y una confianza del 99%.

24. Cul es el tamao de la muestra requerido para estimar la hemoglobina promedio en


gestantes en una poblacin de 1800 gestantes? Se conoce que la desviacin estndar en un
estudio previo fue de 1,2 mg/dl y se desea una precisin de 0,7mg/dl.

25. Segn una revista sobre salud, en una encuesta a 20 familias, se encontr que las primas
anuales de seguros promediaron $10.979 con una desviacin estndar de $1.000. De qu
tamao debe ser la muestra debe ser la muestra para que la media poblacional se encuentre
dentro de un margen de $250 con 99% de confianza?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
364

26. Un artculo publicado en la British Medical Journal


(http://www.bmj.com/content/345/bmj.e4737) cuestiona los estudios que respaldan el efecto
supuestamente positivo de las bebidas hidratantes como Gatorade, Powerade y otras. En el
artculo se indica que en 106 estudios realizados, el tamao de muestra promedio era de 9
participantes y que en solo un estudio la muestra era superior a 100 deportistas.
a. Si se quisiera estimar la proporcin de deportistas para los cuales una bebida
hidratante genera un efecto positivo con una confianza de 90% y error mximo de
10%, de qu tamao debera ser la muestra?
b. Si se empleara una muestra de 100 deportistas, a un 95% de confianza, cul sera el
nivel del error permitido en la estimacin?

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. La unidad estadstica es:


(a) Una porcin o parte de la poblacin de inters
(b) La unidad de inters en un estudio estadstico
(c) La unidad bsica en trminos de la cual se aplica una tcnica de muestreo
(d) La unidad que proporciona los datos relacionados con la unidad de estudio

2. La unidad de informacin en un estudio es:


(a) Una porcin o parte de la poblacin de inters
(b) La unidad de inters en un estudio estadstico
(c) La unidad bsica en trminos de la cual se aplica una tcnica de muestreo
(d) La unidad que proporciona los datos relacionados con la unidad de estudio

3. La unidad de muestreo es:


(a) Una porcin o parte de la poblacin de inters
(b) La unidad de inters en un estudio estadstico
(c) La unidad bsica en trminos de la cual se aplica una tcnica de muestreo
(d) La unidad que proporciona los datos relacionados con la unidad de estudio

4. Un banco est estudiando el nivel de satisfaccin de los clientes con sus servicios y para tal
fin realizar un estudio por muestreo. Al respecto el investigador a cargo expres que:

A. La unidad de estudio y la unidad de informacin son las mismas en este caso.


B. La unidad de muestreo es un cliente del banco.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

5. Una trabajadora social desea investigar algunos aspectos relacionados con la calidad de
vida de los adultos mayores que residen en hogares de ancianos. Para tal fin selecciona una
muestra aleatoria y visita varios hogares de ancianos para valorar si dichas organizaciones
poseen planes e infraestructura adecuados. Al respecto la trabajadora social considera que:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
365

A. La unidad de informacin corresponde a los ancianos que residen en el hogar visitado.


B. La unidad de muestreo corresponde al director del hogar visitado.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

6. Una nutricionista est investigando la calidad de la nutricin que reciben los nios de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los nios y
entrevista a sus padres. Con relacin a esta situacin la nutricionista considera que:

A. La unidad de informacin corresponde a los nios de la escuela.


B. La unidad de muestreo corresponde a los padres de cada uno de los nios seleccionados.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

7. Una nutricionista est investigando la calidad de la nutricin que reciben los nios de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los nios y
entrevista a sus padres. Con relacin a esta situacin la nutricionista considera que:

A. El marco muestra es una lista de todos los nios de la escuela.


B. La unidad de estudio corresponde a los padres de cada uno de los nios seleccionados.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

8. Una nutricionista est investigando la calidad de la nutricin que reciben los nios de una
escuela. Para este fin selecciona una muestra aleatoria y visita los hogares de los nios y
entrevista a sus padres. Con relacin a esta situacin la nutricionista considera que es
necesario emplear una muestra porque:

A. Visitar todos los hogares de todos los nios de la escuela requiere demasiado tiempo.
B. El estudio de la variable en cuestin implica la destruccin de la unidad de inters.

Con respecto a las dos afirmaciones anteriores, es incorrecto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

9. De las siguientes, no es una razn para trabajar con muestras:


(a) Se mejora la calidad de la informacin recopilada
(b) Se reducen los costos
(c) En ocasiones la poblacin se destruye al ser observada
(d) Se eliminan el riesgo de definir mal la poblacin

10. Una fbrica de fusibles prueba la calidad de su producto terminado. El ingeniero a cargo
afirma que es estrictamente necesario emplear un muestreo porque:
(a) Estudiar la poblacin requerira demasiado tiempo

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
366

(b) Estudiar la muestra es ms barato


(c) La prueba del producto es destructiva
(d) La poblacin es infinita

11. Una ___________ es una coleccin de todos los elementos de un grupo. Una coleccin de
algunos de esos elementos es una ___________. Las opciones que mejor completan la frase
anterior son:
(a) muestra, poblacin
(b) poblacin, muestra por conveniencia
(c) poblacin, muestra aleatoria
(d) poblacin, muestra

12. Con respecto al tamao de la muestra es verdadero que:


(a) Depende del tamao de la poblacin
(b) El nivel de confianza en la estimacin no es importante
(c) La variabilidad de la caracterstica que se estima influye fuertemente
(d) Ninguna de las anteriores

13. Con respecto al tamao de muestra un investigador realiz las siguientes dos
afirmaciones:

A. El costo es determinante del tamao de muestra, aunque no est en la frmula.


B. El nivel de precisin se refiere al nivel de error permitido en la estimacin.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

14. Con respecto al uso de muestras un investigador realiz las siguientes dos afirmaciones:

A. Toda investigacin estadstica requiere la utilizacin del muestreo.


B. Cuando se estudia la poblacin completa, se dice que se realiza un censo.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (d) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

15. Se desea estimar la media poblacional de una variable x. Se conoce que la desviacin
estndar es de 87 unidades. Se requiere una confianza en la estimacin del 90% y que el error
no sea mayor que 20 unidades. Entonces, el tamao de muestra requerido es:
(a) 520 (b) 73 (c) 52 (d) Ninguna de las anteriores

16. Se desea estimar la media poblacional de una variable x. Se conoce que la desviacin
estndar es de 87 unidades y que la poblacin est compuesta por 200 unidades. Se requiere
una confianza en la estimacin del 95% y que el error no sea mayor que 15 unidades.
Entonces, el tamao de muestra requerido es:
(a) 130 (b) 92 (c) 79 (d) Ninguna de las anteriores

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
367

17. Se desea estimar una proporcin poblacional para una cierta variable. Se cuenta con una
estimacin previa del 20%. Se requiere una confianza en la estimacin del 95% y que el error
no sea mayor que 5%. Entonces, el tamao de muestra requerido es:
(a) 174 (b) 246 (c) 385 (d) Ninguna de las anteriores

18. Se desea estimar una proporcin poblacional para una cierta variable. Se requiere una
confianza en la estimacin del 99% y que el error no sea mayor que 3,5%. Entonces, el
tamao de muestra requerido es:
(a) 1105 (b) 1355 (d) 867 (d) Ninguna de las anteriores

19. Se desea estimar una proporcin poblacional para una cierta variable. La poblacin tiene
un tamao de 220 individuos. Se requiere una confianza en la estimacin del 90% y que el
error no sea mayor que 3%. Entonces, el tamao de muestra requerido es:
(a) 171 (b) 752 (c) 457 (d) 149

20. En un estudio por muestreo se desea estimar la talla promedio de las 400 mujeres que
laboran en una empresa. Por un estudio previo se sabe que la desviacin estndar es de 22 cm
y se ha establecido una precisin de 5 cm con una confianza del 99%. Entonces, el tamao de
muestra requerido es, en nmero de mujeres:
(a) 98 (b) 129 (c) 105 (d) 84

21. En un estudio por muestreo se desea estimar la proporcin de las 400 mujeres que laboran
en una empresa que poseen hijos menores de 10 aos. Se ha establecido una precisin de 5%
con una confianza del 95%. Entonces, el tamao de muestra requerido es, en nmero de
mujeres:
(a) 385 (b) 271 (c) 162 (d) 197

22. Un noticiero en la televisin decide realizar una encuesta sobre la calidad de la educacin
en el pas. Los televidentes que desean participar llaman a un nmero telefnico y votan por la
opcin que consideran ms apropiada. Durante el noticiero votaron 5.500 personas, y el 75%
considera que la educacin del pas debe mejorarse. El tipo de muestreo empleado por este
noticiero es:
(a) Aleatorio
(b) Por conveniencia
(c) Voluntario
(d) De juicio

23. Un noticiero en la televisin decide realizar una encuesta sobre la calidad de la educacin
en el pas. Los televidentes que desean participar llaman a un nmero telefnico y votan por la
opcin que consideran ms apropiada. Durante el noticiero votaron 5.500 personas, y el 75%
considera que la educacin del pas debe mejorarse. Con respecto a este muestreo es falso
que:
(a) Es una muestra representativa por ser muy grande
(b) Se presenta un posible sesgo de seleccin
(c) Es un muestreo no aleatorio
(d) La muestra no es representativa a pesar de su tamao

24. La principal ventaja de un muestreo aleatorio es que:


(a) Elimina los sesgos de seleccin
(b) Permite la cuantificacin y control del error de muestreo

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
368

(c) Reduce los costos del estudio


(d) Emplea muestras de menor tamao

25. La discrepancia, debida al azar, entre la estimacin de una caracterstica obtenida a travs
de una muestra y su verdadero valor en la poblacin corresponde al concepto de:
(a) Sesgo de seleccin
(b) Error de muestreo
(c) Sesgo de medicin
(d) Aleatoriedad

26. El error sistemtico, no debido al azar, y que ocasiona que diferencias entre el valor
estimado a travs de la muestra y el valor verdadero corresponde al concepto de:
(a) Sesgo
(b) Error de muestreo
(c) Variabilidad
(d) No aleatoriedad

27. Un gerente est haciendo un estudio de mercado. Ha seleccionado una muestra aleatoria
de 385 consumidores, pero hubo 50 de ellos que no contestaron el cuestionario. Esta
situacin:
(a) No es problema porque la mayora s lo contestaron
(b) Es un problema porque el tamao de la muestra efectivamente tomada es menor
(c) Es un problema, pero se resuelve sustituyendo los valores faltantes por sus valores
esperados
(d) No es un problema porque no fue causado intencionalmente por el investigador

28. Con respecto al muestreo un investigador realiz las siguientes dos afirmaciones:

A. La seleccin de la tcnica apropiada no es tan importante como la determinacin del


tamao de la muestra para lograr una muestra representativa.
B. La existencia de un marco muestral bien definido es clave para seleccionar la tcnica de
muestreo.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

29. El departamento de recursos humanos de una empresa va a efectuar un estudio por


muestreo sobre la satisfaccin de los empleados. La empresa tiene 2500 empleados y el
tamao de la muestra es de 250 empleados. El encargado tom una lista de todos los
funcionarios de la empresa y con ayuda de un software obtuvo 250 nmeros aleatorios, los
cuales emple para seleccionar a los empleados que conformaran la muestra. En esta
situacin el tiempo de muestreo empleado es:
(a) Muestreo sistemtico
(b) Muestreo simple al azar
(c) Muestreo estratificado
(d) Muestreo por conglomerados

30. El departamento de recursos humanos de una empresa va a efectuar un estudio por


muestreo sobre la satisfaccin de los empleados. La empresa tiene 2500 empleados y el

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
369

tamao de la muestra es de 250 empleados. El encargado calculo un valor k = 2500/250 = 10,


entonces tom una lista de todos los funcionarios de la empresa, con ayuda de un software
obtuvo un nmero aleatorio entre uno y diez, y a ese nmero empez a sumar 10 una y otra
vez hasta completar 250 nmeros, los cuales emple para seleccionar a los empleados que
conformaran la muestra. En esta situacin el tiempo de muestreo empleado es:
(a) Muestreo sistemtico
(b) Muestreo simple al azar
(c) Muestreo estratificado
(d) Muestreo por conglomerados

31. El departamento de recursos humanos de una empresa va a efectuar un estudio por


muestreo sobre la satisfaccin de los empleados. La empresa tiene 2500 empleados y el
tamao de la muestra es de 250 empleados. El encargado dividi la empresa en sus distintos
departamentos, por considerar que los empleados en cada uno de ellos tienden a ser ms
homogneos entre s con respecto a la variable estudiada. Luego tom una muestra de cada
uno de estos subgrupos, de modo que la muestra total resultante refleje en forma proporcional
la cantidad de empleados que hay en cada departamento. En esta situacin el tiempo de
muestreo empleado es:
(a) Muestreo sistemtico
(b) Muestreo simple al azar
(c) Muestreo estratificado
(d) Muestreo por conglomerados

32. Con respecto a una muestra sea representativa de una poblacin es correcto que:
(a) Basta con que sea del tamao apropiado
(b) Debe ser obtenida al azar sin importar su tamao
(c) Debe al menos el 20% de la poblacin
(d) Ninguna de las anteriores

Respuesta a ejercicios de seleccin nica:

1. b 2. d 3. c 4. a 5. c
6. c 7. b 8. d 9. d 10. c
11. d 12. c 13. a 14. d 15. c
16. c 17. b 18. b 19. a 20. a
21. d 22. c 23. a 24. b 25. b
26. a 27. b 28. d 29. b 30. a
31. c 32. d

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
370

10 .

Pruebas de hiptesis
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Plantear las hiptesis nula y alternativa en problemas de decisin con respecto a la media o
la proporcin poblacional
2. Identificar los posibles errores que se pueden cometer al tomar decisiones con base en
muestras
3. Describir los pasos del procedimiento de prueba de hiptesis
4. Calcular los estadsticos de prueba adecuados segn el tipo de problema
5. Tomar decisiones con base en el procedimiento de prueba de hiptesis

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
371

Inferencia mediante pruebas de hiptesis


Conceptos generales
Muchas veces la inferencia que se debe realizar no se refiere a la estimacin de un parmetro,
sino que se deben tomar decisiones sobre afirmaciones hechas sobre un parmetro. Esto es, se
debe decidir, con base en evidencia experimental, si una afirmacin (hiptesis) hecha acerca
de un parmetro es falsa o verdadera. Por ejemplo un ingeniero tendra que decidir, basndose
en datos muestrales, si existe diferencia en la precisin de dos diferentes aparatos de medicin
o si la media de un proceso de llenado ha cambiado de tal manera que la mquina debe ser
calibrada ya que el proceso est fuera de control.

Digamos que en el ejemplo de la media del proceso, sta debe ser 250 gramos, por lo tanto
para tratar de confirmarlo el ingeniero toma la informacin de una muestra de 40 bolsas
salidas de esta mquina. Supngase que la media de la muestra es de 255 gramos por lo que se
decide que la mquina requiere ajustes. Dado que la decisin se basa en una muestra podr
ocurrir que, aunque la media muestral sea mayor, la media de la poblacin sea realmente de
250 gramos. Incluso podra ser que la media del proceso sea mayor de 255, por ejemplo de
260 gramos. Para evitar la toma de decisiones errneas, en vez de tomar la decisin basndose
en los resultados de una muestra se debe realizar un proceso formal mediante una prueba de
hiptesis. Aunque nunca se sabe con certeza absoluta la verdad o falsedad de una hiptesis, a
menos que se examine toda la poblacin, el proceso es mucho ms seguro que si la decisin
se basa en una muestra.

PRUEBA DE HIPTESIS Procedimiento basado en evidencia de la muestra y la


teora de probabilidades para determinar si la hiptesis es una afirmacin razonable.

Algunas definiciones
Los siguientes son algunos de los trminos usados con ms frecuencia en el contexto de las
pruebas de hiptesis:

HIPTESIS ESTADSTICA Es una afirmacin o conjetura acerca de una o ms


poblaciones.

HIPTESIS NULA Es cualquier hiptesis que se desea probar. Se denota por H0.

HIPTESIS ALTERNATIVA Es la hiptesis que se acepta cuando la hiptesis nula


es rechazada. Se denota por H1.

Tomando el ejemplo anterior, el ingeniero cree que la mquina podra estar llenando las
bolsas con una cantidad superior a la especificada, as que esa es su hiptesis de investigacin,
y para decidir si debe realizar ajustes, entonces toma la muestra. El valor especificado
constituir su hiptesis nula. La hiptesis nula es aquello que se desea probar. En este caso el
ingeniero desea probar si el peso promedio de las bolsas es efectivamente igual a 250 gramos.
Esta hiptesis nula podra ser aceptada o rechazada. En caso de rechazarla, entonces tomar
aceptar la hiptesis alternativa. La evidencia que posee sugiere que las bolsas tienen un peso

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
372

superior a 250 gramos, por lo que su hiptesis alternativa sera que el peso de las bolsas es
mayor que 250 gramos.

Ejemplo Se sabe por estudios previos que los recin nacidos de cierta poblacin
tienen una talla promedio de 49,5 cm. Una enfermera estudi un grupo de
40 recin nacidos, y obtuvo una media de 53,4 cm.

La enfermera desea saber si estos resultados apoyan los estudios previos.


Cules seran sus hiptesis nula y alternativa?

Solucin En esta situacin la enfermera tiene un valor poblacional establecido, que


es que los recin nacidos miden, en promedio, una talla de 49,5 cm. Por
tanto, su hiptesis nula ser:

H0: La talla media de los recin nacidos es 49,5 cm.

Pero los datos recopilados sugieren que este promedio podra ser mayor
que 49,5 cm, por lo que, de descartar la hiptesis nula anterior, se aceptara
la hiptesis alternativa:

H1: La talla media de los recin nacidos es mayor que 49,5 cm.

Generalmente las hiptesis se expresan en trminos de smbolos:

H0: = 49,5
H1: > 49,5

Ejemplo En cada uno de los siguientes casos plantee la hiptesis nula y la


alternativa:

1. Un cierto material viene en cajas de peso promedio 17 libras y


desviacin estndar 0,4 libras. Se recibe un cargamento grande y se tiene
la sospecha de que el peso promedio de las cajas es inferior al usual. Para
verificar la sospecha se toma una muestra al azar de 86 cajas y se pesan,
obtenindose un promedio de 16,5 libras. Se puede afirmar que
efectivamente el peso de las cajas es inferior al acostumbrado?

2. En una granja bastante grande se producen pollos. Segn los estndares


establecidos, el peso medio de los pollos debe ser de 4,2 Kg. con varianza
1,96. Se desea determinar si es cierta la queja de un grupo de clientes de
que el peso medio ha disminuido durante las ltimas semanas. Para
verificar tal afirmacin se contrata un ingeniero avcola, el cual toma una
muestra de 65 pollos, y encuentra un peso medio de 3,86 Kg. Significa
esto que efectivamente el peso medio es inferior al usual?

3. De acuerdo con datos de un estudio realizado en un pas europeo la edad


promedio de diagnstico del cncer de prstata es 75 aos. Un
investigador nacional considera que en nuestro pas esa edad de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
373

diagnstico es menor. Se tom una muestra de 80 casos diagnosticados y


encontr una edad promedio de 69 aos con una desviacin estndar
muestral de 9 aos. Qu puede concluirse con base en estos datos?

4. Segn un estudio los nios de los estratos socio econmicos medios y


altos inician alguna prctica de cuidado de su salud buco dental a los 15,6
meses. En una muestra de 35 nios de familias de estratos bajos se
encontr una edad media de inicio de la higiene bucal a los 18,2 meses,
con una desviacin estndar de 8,5 meses. Puede considerarse que la edad
de los nios de familias de estratos bajos es mayor que 15,6 meses?

Solucin 1. En esta situacin se indica que el peso promedio de las cajas en que
viene el material es 17 libras, por tanto se querr verificar que se satisface
esta especificacin, de manera que la hiptesis nula ser que el peso
promedio es 17 libras. Por otro lado, en la muestra de 86 cajas se obtuvo
un peso promedio inferior, lo cual tambin sugiere la pregunta, entonces la
hiptesis nula ser que la media es inferior a 17 libras. En resumen:

H0: = 17
H1: < 17

2. De acuerdo con este problema existe un estndar de 4,2 Kg. en


promedio por animal, por lo que la hiptesis nula es que el promedio sea
igual a 4,2 Kg. En la muestra se encuentra un peso medio inferior a 4,2
Kg., de modo que la hiptesis nula es que el peso medio es inferior:

H0: = 4,2
H1: < 4,2

3. De acuerdo con los datos la edad promedio de diagnstico del cncer de


prstata es 75 aos, de manera que se plantea la hiptesis nula de que el
promedio es igual a 75. En la muestra se obtiene una edad promedio menor
que 75, as que la hiptesis alternativa sera que la media es menor que 75
aos:

H0: = 75
H1: < 75

4. Segn el estudio la media es 15,6 meses, de modo que la hiptesis nula


ser que la media es igual a 15,6. En la muestra se obtuvo un valor ms
alto, de manera que la hiptesis alternativa ser que la media es mayor que
15,6:

H0: = 15,6
H1: > 15,6

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
374

Ejercicio Un ingeniero est estudiando la vida til de distintos proyectos construidos


con cierto tipo de pavimento. Se sabe que los camiones pesados producen
de un dao elevado y que reducen la vida til de las vas. Se realiza un
revisin estudio para saber qu proporcin de los camiones llevan una carga
excesiva. En el caso de los camiones de 3 ejes se cuenta con un estudio
previo en el que se indica que el 10% de estos vehculos portaban un peso
superior al permitido. En una muestra de 40 de estos camiones, se encontr
que 6 de ellos portaba una carga excesiva. Cules es la hiptesis nula y
cules es la hiptesis alternativa de este problema?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Las pruebas de hiptesis pueden hacer referencia a una media de una poblacin, como en el
ejemplo anterior, pero tambin podran referirse a una proporcin. Este sera el caso en el cual
lo que se desea probar es una afirmacin que se relaciona con el porcentaje de ciudadanos que
votaran por un determinado candidato, la tasa de prevalencia de una enfermedad, la
proporcin de artculos defectuosos en una produccin, la tasa de desempleo, entre otros casos
de distintas proporciones poblacionales.

Ejemplo Un empresario es el nico distribuidor de electrodomsticos y productos


tecnolgicos de su zona. Ley en un medio que hasta un 74% de los
internautas ha realizado alguna compra por internet en el transcurso de los
ltimos 3 meses. Para comprobar si en su zona esta proporcin es similar a
la publicada, aplic un cuestionario a una muestra de 50 personas que
fueran residentes de la zona y que usaran internet regularmente, y les
pregunt si haban realizado compras en lnea en el ltimo trimestre. La
encuesta revel que 30 internautas de la zona han realizado compras por
internet en ese periodo. O sea, que solo el 60% de los entrevistados
respondi afirmativamente. Cul sera la hiptesis nula y alternativa en
este caso?

Solucin El empresario desea probar que si es cierto que el 74% de los usuarios de
internet han realizado compras por internet en el ltimo trimestre, por
tanto, su hiptesis nula ser:

H0: La proporcin de usuarios que internet que ha realizado compras


por internet es igual a 74%.

Pero los datos recopilados indican que ese porcentaje podra ser menor,
por lo que, de descartar la hiptesis nula anterior, se aceptara la hiptesis
alternativa:

H1: La proporcin de usuarios que internet que ha realizado compras


por internet es menor que 74%.

Generalmente las hiptesis se expresan en trminos de smbolos:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
375

H0: P = 0,74
H1: P < 0,74

Tambin, las pruebas de hiptesis pueden referirse a dos o ms medias poblacionales. En


estos casos se cuenta con dos o ms medias, o bien, dos o ms proporciones, las cuales se
desea comparar para determinar si presentan diferencia significativa. El caso especfico de
pruebas de hiptesis con dos medias o dos proporciones se trata en el captulo siguiente.
Tambin cabe sealar que las pruebas pueden referirse, adems de medias y proporciones, a
otros parmetros, como varianzas, coeficientes de correlacin, coeficientes de ecuaciones de
regresin, entre muchos otros.

Ahora bien, en las pruebas de hiptesis las decisiones se toman con base en datos muestrales.
Suponga que se toman varias muestras aleatorias de una misma poblacin y se calcula cada
una de las medias muestrales. La media en cada muestra va a ser distinta. Estas diferencias se
deben al azar. Entonces, simplemente por el azar, a veces el valor de muestra va a estar muy
cercano al verdadero valor poblacional, y otras veces, tambin por el azar, el valor muestral
estar alejado del valor verdadero. Esto significa que en las pruebas de hiptesis existe el
riesgo de tomar una decisin equivocada, cuando sea alguno de esos casos en los cuales la
media muestral queda muy alejada del valor verdadero. Es decir, podra cometerse un error en
la decisin a la cual conduce la prueba. El nico modo de eliminar dicha posibilidad sera
estudiar toda la poblacin, lo cual podra ser demasiado costo, e incluso, imposible.

Entonces, al realizar pruebas de hiptesis se pueden cometer dos tipos de errores, llamados
error tipo I y error tipo II.

ERROR TIPO I Es el error que se comete cuando se rechaza una hiptesis que es
correcta y la probabilidad de cometer este error se denota por .

ERROR TIPO II Es el error que se comete cuando se acepta una hiptesis que es
incorrecta y la probabilidad de cometer este error se denota .

Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra y
probar la hiptesis nula de que los bombillos tienen una vida media de
1000 horas, contra la hiptesis alterna de que la vida media de los
bombillos es menor que dicha especificacin. Cmo podran darse y qu
significan los errores tipo I y tipo II en esta situacin?

Solucin En esta situacin los errores tipo I y tipo II podran darse si la muestra no
representa bien a la poblacin. Esto puede darse de los modos siguientes:

1. El proceso de produccin de la empresa est bien controlado, y la vida


media de los bombillos es 1000 horas, pero en la muestra usada en la
prueba de hiptesis se seleccionaron, por cuestin del azar, muchos
bombillos con una vida media inferior a 1000 horas, por lo que se

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
376

rechaz la hiptesis nula de que la vida media de los bombillos es 1000


horas, a pesar de que era verdadera. Este es el error tipo I. Este error
llevara a la empresa a tratar de mejorar su produccin
innecesariamente, lo cual le generara costos adicionales.
2. El proceso de produccin de la empresa no est bien controlado, por lo
que, efectivamente, la vida media de los bombillos es inferior a 1000
horas, como lo han indicado los clientes que se han quejado, pero en la
muestra, por cuestin del azar, se seleccionaron muchos bombillos con
una media cercana a 1000 horas, por lo que no se rechaz la hiptesis
nula, a pesar de que era falsa. Este es el error tipo II. Este error
llevara a la empresa a no mejorar una produccin que s requiere
mejoras, por lo cual sus clientes podran dejar de comprar sus
productos.

Ejercicio Una empresa realiza un estudio de mercado en una muestra de 150


consumidores y se plantea probar la hiptesis de que al menos el 30% de
de ellos comprara su producto. Cules seran las hiptesis nula y
revisin alternativa? En qu consistiran los errores tipo I y tipo II?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar varias presentaciones que
audiovisual explican el tema de las pruebas de
hiptesis.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Aplicacin Mtodos analticos


Actualmente se realizan en laboratorios de todo el mundo anlisis de la
composicin de diferentes productos o materiales, y para ello se emplean
diversas tcnicas analticas, como por ejemplo, un anlisis de aguas. Los
resultados de estos anlisis son de gran importancia en diferentes
industrias, e incluso para algunas oficinas del gobierno, pues, adems de
impactar la actividad empresarial, podran afectar la salud y la vida de las
personas. Esto quiere decir que los errores que se comentan en estos
estudios pueden producir graves consecuencias para la sociedad.

Por supuesto, que al realizar estos anlisis son necesarias muestras


representativas, la aplicacin de las tcnicas apropiadas y el uso de equipo
adecuado. Aun as, va a haber un cierto nivel de incertidumbre en los
resultados.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
377

Cuando se efecta un anlisis qumico existe la posibilidad de cometer un


falso positivo, o sea, un error tipo I. Tambin es posible cometer un falso
negativo, es decir, un error tipo II. En muchsimos casos se requiere que
estas probabilidades sean mnimas, por lo que se emplean altos niveles de
confianza (1 ) y elevadas potencias de las pruebas de hiptesis (1 ).

Procedimiento para pruebas de hiptesis sobre la media


El siguiente es un procedimiento que puede seguir cuando se desea efectuar una prueba de
hiptesis con respecto a la media aritmtica.

Paso 1. Plantear las hiptesis. Se establece la hiptesis nula y la hiptesis alternativa.


Paso 2. Determinar el nivel de significancia. Se selecciona un nivel de significancia
para la prueba.
Paso 3. Identificar el estadstico de prueba. Dependiendo del tipo de prueba, del
tamao de la muestra y otras condiciones se selecciona el estadstico apropiado para
realizar la prueba.
Paso 4. Se formula una regla para tomar la decisin. Con base en el estadstico de
prueba se establece el criterio especfico para aceptar o rechazar la hiptesis nula.
Paso 5. Se toma una muestra y se llega a una decisin: se acepta o se rechaza la
hiptesis nula.

Se explicar el procedimiento general para realizar una prueba de hiptesis realizando una
prueba para una media aritmtica mediante el siguiente ejemplo:

Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra de
50 bombillos y desea probar que los bombillos tienen una vida media de
1000 horas. La media obtenida a partir de la muestra es de 970 horas. Se
conoce que la desviacin estndar es 60 horas. Determine, a un nivel de
significacin del 5%, si la media poblacional de estos bombillos es
efectivamente de 1000 horas.

Solucin Paso 1. Plantear las hiptesis. Toda prueba inicia planteando las hiptesis.
La hiptesis nula se plantea como H0: = o, donde o es el valor a probar
(en este caso 1000 horas), y la hiptesis alternativa podra ser como alguna
de las siguientes:

H1: > o
H1: < o
H1: o

La hiptesis alternativa se formula dependiendo del valor obtenido en la


muestra o de lo que se desee plantear como hiptesis alternativa. Es decir,
si en vez de querer saber si > o o < o, se desea simplemente saber si
o.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
378

En este ejemplo se desea probar que la media verdadera es de 1000 horas


(o = 1000), por lo tanto la hiptesis nula es:

H0: = 1000

Como x (valor muestral que representa a ) es igual a 970, que es un


valor menor que 1000, entonces la hiptesis alternativa lgica sera que la
media es menor que 1000, o sea, H1: < 1000. En resumen se tiene que las
hiptesis son:

H0: = 1000
H1: < 1000

Paso 2. Especificar el nivel de significacin (la probabilidad de cometer


el error tipo I) con que se desea trabajar. Los valores usualmente usados
son 5% y 1%. Si se escoge una probabilidad de error tipo I muy pequea
esto hace que la probabilidad de error tipo II sera muy grande. En el
ejemplo se especifica un valor de de 0,05.

Paso 3. Se usa el estadstico de prueba apropiado. En el caso de la media,


dependiendo del tamao de la muestra y si se conoce o no la desviacin
estndar poblacional, se usa:

x
zc con n 30 con conocida o con n < 30 y conocida
/ n

x
zc con n 30 con desconocida
s/ n

x
tc con n < 30 y desconocida
s/ n

A este valor se le llamar z calculada o t calculada, segn el caso. En


el ejemplo se tiene n > 30 y conocida, pues n = 50 y = 60 horas, por lo
que se calcula z (segn el problema se tiene que x = 970 y de la hiptesis
nula se obtiene que = 1000):

x 970 1000
zc 3,54
/ n 60 / 50

Paso 4. Se especifica un criterio de aceptacin o rechazo de la hiptesis


nula segn el estadstico de prueba usado en el paso anterior. En las
hiptesis para la media el criterio es:

Prueba de una cola: Cuando se plantea la hiptesis alternativa como


H1: > 0

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
379

Prueba de una cola: Cuando se plantea la hiptesis alternativa como


H1: < 0

Prueba de dos colas: Cuando se plantea la hiptesis alternativa como


H1: 0

Puede observarse que cuando la hiptesis alternativa se ha planteado como


H1: < 0 o como H1: < 0, entonces se dice que la prueba es de una
cola, y la zona de aceptacin queda definida por el valor de 1 .

Cuando la hiptesis alternativa se ha planteado como H1: 0, entonces


se dice que la prueba es de dos colas, y la zona de aceptacin queda
definida por el valor de 1 /2.

El valor de Z o de t se obtiene de la tabla respectiva con una probabilidad


igual a 1 en el caso de Z y en el caso de t en las pruebas de una cola
y con una probabilidad igual a 1 /2 en el caso de Z y /2 en el caso de t
en las pruebas de dos colas. A este valor de z se le llamar z tabular o z
de la tabla (por ser obtenida de la tabla de la distribucin normal), o en el
caso de t, t de la tabla.

Puede establecerse la regla siguiente en trminos de z:

Si z c z t se rechaza la hiptesis nula Ho y se acepta la hiptesis


alternativa H1.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
380

Si z c z t se mantiene la hiptesis nula Ho.

En trminos de t sera:

Si t c t t se rechaza la hiptesis nula Ho y se acepta la hiptesis


alternativa H1.
Si t c t t se mantiene la hiptesis nula Ho.

En el ejemplo que se est desarrollando, la prueba es de una cola, porque


H1: < 1000, por lo tanto se tiene la cola izquierda (porque la hiptesis
alternativa es de menor). De la tabla normal (Apndice 6) con = 0,05, se
obtiene Zt = 1,645.

Como |Zc| = 3,54 > |Zt| = 1,645, entonces Zc cae en zona de rechazo de la
H0.

Paso 5. Se acepta o se rechaza la H0 y se toma la decisin. En este ejemplo


se rechaza la hiptesis nula H0. Es decir, se rechaza que = 1000 y se
acepta la H1: 1000.

La conclusin es que a un nivel de significacin del 5% se rechaza la


hiptesis nula de que la vida media de los bombillos es de 1000 horas y se
considera que existe evidencia estadstica para aceptar la hiptesis
alternativa de que la vida til de los focos es menor de 1000 horas.

Ejercicio Una institucin del gobierno peridicamente verifica que las empresas y
los comercios no realicen prcticas abusivas contra los consumidores.
de Recientemente ha verificado una muestra de 200 latas de atn cuya
revisin etiqueta indica que contienen 130 grs. como peso escurrido. El promedio
en la muestra fue 112 grs. como peso escurrido Por un estudio anterior se
conoce que la desviacin estndar es 20,5 grs.

Constituyen estos datos muestrales evidencia suficiente para considerar


que las latas de atn poseen un peso escurrido inferior al ofrecido?

Use un nivel de significancia de 5%.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Prueba de hiptesis con muestras pequeas


Tal como se indic en el ejemplo anterior, si el tamao de la muestra es menor que 30 y se
desconoce la desviacin estndar poblacional no se conoce, entonces no se emplea la

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
381

distribucin normal para realizar la prueba, sino que se utiliza la distribucin t, segn el caso
con una o dos colas, y n 1 grados de libertad.

En el siguiente ejemplo se muestra la prueba empleado la distribucin t.

Ejemplo Una muestra aleatoria de frascos de mantequilla de man presentaron pesos


de (en gramos):

252, 251, 249, 253, 250, 255, 248, 258

La empresa ha tratado de ajustar el proceso de llenado para que cada frasco


contenga 250 gramos. Verifique, a un nivel de significacin del 5% si ese
valor esperado se mantiene sin cambio.

Solucin Se tiene que hay un peso especificado para los frascos de mantequilla de
man de 250 gramos, por lo que 0 = 250 y adems n = 8.

De los datos de la muestra se obtiene una media x = 252 y una desviacin


estndar s = 3,3. Como la media muestral x que representa a la media
poblacional es mayor que 0, entonces se plantear una hiptesis
alternativa de > 0.

Paso 1. Planteamiento de las hiptesis:


H0: = 250
H1: > 250

Paso 2. Como n < 30 y desconocida, se calcula tc:

x 252 250
tc 1,72
s/ n 3,3 / 8

Paso 3. De la tabla, con una cola, para un nivel de significancia = 0,05 y


grados de libertad gl = n 1 = 8 1 = 7, se obtiene t = 1,895.

Paso 4. Como t c t t , se acepta H0 con = 0,05.


Paso 5. Se concluye que no hay evidencia suficiente para considerar que el
peso promedio de los frascos de mantequilla de man es mayor que 250
gramos.

Ejercicio Una compaa de tarjetas de crdito desea probar si el saldo promedio de


sus clientes es superior a $500. En una muestra de 15 tarjetahabientes se
de obtuvo un saldo promedio de $535 con una desviacin estndar de $215.
revisin Qu puede concluirse a un nivel de significacin del 5%?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
382

Prueba de hiptesis para la proporcin poblacional


En estas pruebas de hiptesis se debe comprobar, con base en los resultados obtenidos en una
muestra, si el valor verdadero de una proporcin es igual a una constante determinada o si las
proporciones de dos o ms poblaciones son iguales. En este captulo se abordar solo el
primer caso, en el cual se prueba si una proporcin es igual a una constante establecida.

Los pasos para la realizacin de estas pruebas de hiptesis son los mismos expuestos
anteriormente.

Entonces, en el caso de una sola proporcin P la hiptesis nula sera:

Ho: P = p0

donde p0 es la constante determinada. La hiptesis alternativa tiene las siguientes tres


posibilidades:

H1: P > p0
H1: P < p0
H1: P p0

El estadstico de prueba es:

ESTADSTICO DE PRUEBA x nP
z
PARA LA PROPORCIN POBLACIONAL nPQ

Donde x es el nmero de eventos observados en la muestra, n es el tamao de la muestra o


nmero de ensayos, P es la proporcin poblacional que se estableci en la hiptesis nula, y Q
es el complemento de P, es decir, Q = 1 P.

El criterio de aceptacin o rechazo de la hiptesis nula H0 es igual al de la prueba de las


medias, es decir, si:

Si z c z t se rechaza la hiptesis nula Ho y se acepta la hiptesis alternativa H1.


Si z c z t se mantiene la hiptesis nula Ho.

Ejemplo Pruebe la aseveracin de que la proporcin de adultos que realizaron algn


tipo de ejercicio fsico al menos una vez durante la semana pasada es
menor de 20%, si se tom una muestra de 1.200 personas, de los cuales
215 dicen que realizaron actividad fsica la semana pasada. Use = 0.01.

Solucin Hay que distinguir claramente que en los problemas de pruebas de


hiptesis relacionados con proporciones no aparece una variable mtrica,
es decir, no aparece un promedio que se pueda medir en centmetros,

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
383

gramos, dlares, minutos u otra unidad de medida. En este caso el


problema se relaciona con un porcentaje supuesto de adultos que
realizaron ejercicio fsico y el conteo de esas personas en la muestra. En
todos los casos de pruebas de hiptesis sobre una proporcin se va a
presentar esta situacin, no hay una variable medible y se presentan datos
de una variable que se obtiene por conteo y que se relaciona con respecto a
un total poblacional o muestral (una proporcin).

Una vez que se tiene bien definida la naturaleza del problema, entonces se
siguen los mismos 5 pasos expuestos para el caso de las pruebas de
hiptesis sobre la media poblacional.

Paso 1. Planteamiento de las hiptesis: El problema seala que se desea


probar si el 20% de los adultos realizaron ejercicio fsico al menos una vez
durante la semana pasada, por lo que la hiptesis nula ser:

H0: P = 0,20

Por otro lado, los datos muestrales indican que de los 1200 adultos
encuestados, 215 realizaron ejercicio fsico la semana pasada, por lo que se
tendra una proporcin muestral equivalente a:

p = 215 / 1200 = 0,1792

Este dato muestral sugiere que la proporcin de adultos que realizaron


ejercicio fsico es menor que 0,20, por lo que las hiptesis se plantearan
como:

H0: P = 0,20
H1: P < 0,20

Paso 2. El problema indica que la prueba debe realizar a un nivel de


significancia de un 1%.

Paso 3. Como el problema es una prueba de una proporcin se calcula zc:

x nP 215 1200 0,20


z = 1,80
nPQ 1200 0,20 0,80

De la tabla de la curva normal, para un nivel de significancia = 0,01, con


una cola, o sea, una confianza de 0,99, se obtiene z = 2,33.

Paso 4. Como z c z t , se acepta H0 con = 0,01.

Paso 5. Se concluye que no se tiene evidencia estadstica suficiente para


rechazar la hiptesis de que la proporcin de adultos que realizaron
ejercicio fsico al menos una vez durante la semana pasada es menor que
20%, a un nivel de significacin del 1%.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
384

Ejercicio Un laboratorio farmacutico considera que uno de sus frmacos alcanza en


el 80% de los casos su mxima absorcin en un plazo de 2 horas. En una
de muestra de 120 personas se obtuvo el resultado esperado en 80 casos.
revisin Puede sostenerse la afirmacin de la empresa a un nivel de significancia
del 95%?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar videos que explican el
audiovisual tema de las pruebas de hiptesis y el uso
de software para este procedimiento.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Uso de Minitab para realizar la prueba de hiptesis y uso del valor P


Un modo alternativo para decidir sobre la aceptacin o rechazo de una hiptesis es emplear el
valor P o valor de probabilidad. El valor P es la probabilidad de obtener un estadstico de
prueba (sea z, t u otro, segn la prueba) que sea tan extremo como el que se obtuvo a partir de
los datos muestrales, bajo el supuesto de que la hiptesis nula es verdadera. En otras palabras,
el valor P es el menor nivel de significacin al que se puede rechazar la hiptesis nula cuando
esta sea verdadera. La hiptesis nula se rechaza si el valor P es muy pequeo, inferior al nivel
de significancia (). En caso de que el valor P sea mayor o igual que el nivel de significancia,
entonces se acepta la hiptesis nula. Veamos que esto es as porque, si suponemos que
tenemos un valor P pequeo, como 0,005, entonces este valor nos indica que la probabilidad
de que la hiptesis nula sea verdadera es muy baja. Al ser una probabilidad, este valor P
siempre tomar valores entre 0 y 1.

La mayora de los paquetes de cmputo calculan el valor P, adems de los otros estadsticos
de prueba, por lo que su uso en la investigacin y en la industria es frecuente. Un ejemplo de
un software til para realizar la prueba de una hiptesis es Minitab.

Ejemplo Una empresa fabrica bombillos. Cada bombillo tiene una vida esperada de
1000 horas, pero algunos clientes se han quejado de que los bombillos se
queman antes de las 1000 horas. La gerencia decide tomar una muestra de
50 bombillos y desea probar que los bombillos tienen una vida media de
1000 horas. La media obtenida a partir de la muestra es de 970 horas. Se
conoce que la desviacin estndar es 60 horas. Utilice Minitab para
determinar, a un nivel de significacin del 5%, si la media poblacional de
estos bombillos es efectivamente de 1000 horas.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
385

Solucin Como en cualquier prueba de hiptesis, se inicia por plantear las hiptesis.
Tal como se expuso anteriormente, las hiptesis son:

H0: = 1000
H1: < 1000

Luego se especifica el nivel de significacin . En este ejemplo se


especifica un valor de de 0,05.

Despus se selecciona el estadstico de prueba apropiado. En este ejemplo


se tiene n > 30 y conocida, pues n = 50 y = 60 horas, por lo que se
calcula z. As, en Minitab se debe dar clic en el men Estadsticas, luego
en el submen Estadstica bsica, y ah se elige la opcin Z de 1
Muestra. Ahora se completa el cuadro de dilogo siguiente:

Se selecciona Muestras en columnas cuando se tiene la serie original de


datos muestrales, pero en este caso ya se tiene calculada la media muestral,
por lo que se escoge Datos resumidos, y se digita el tamao de la muestra
y la media muestral. Debe marcarse la casilla Realizar prueba de
hiptesis, pues de otro modo Minitab solo dar el intervalo de confianza.
En la celda se digita la media poblacional indicada en la hiptesis nula.

Luego debe darse clic en el botn Opciones, pues es ah donde se indica el


nivel de significancia y se selecciona la hiptesis alternativa:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
386

Dado que el nivel de significancia de este ejercicio es 5%, entonces el


nivel de confianza ser de 95%. En la opcin de hiptesis alterna se elige
la que dice menor que, pues la hiptesis alternativa indicada
anteriormente fue H1: < 1000.

Luego se da clic en Aceptar, y nuevamente clic en Aceptar, y se obtiene la


siguiente salida en la ventana Sesin de Minitab:

Puede verse que Minitab indica que el valor del estadstico de prueba Zc es
3,54, que coincide con el valor calculado anteriormente en este captulo.
De la tabla de la curva normal, o bien, del mismo Minitab se calcula el
valor Zt, que es 1,645, por lo que Zc cae en zona de rechazo de la H0.

Adems, observe que Minitab calcul el valor P, que en este caso es 0,000,
un valor inferior al nivel de significancia del 5%, por lo que se rechazara
la hiptesis nula.

Por cualquiera de los dos criterios (z o valor P), la conclusin es la misma,


que a un nivel de significacin del 5% se rechaza la hiptesis nula de que
la vida media de los bombillos es de 1000 horas y se considera que existe
evidencia estadstica para aceptar la hiptesis alternativa de que la vida til
de los bombillos es menor de 1000 horas.

Cuando el estadstico de prueba sea t, entonces la opcin del men Estadsticas > Estadstica
bsica que se emplea es t de una Muestra, y cuando la prueba se refiere a una proporcin,
entonces se elige 1 Proporcin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
387

Ejemplo Pruebe la aseveracin de que la proporcin de adultos que realizaron algn


tipo de ejercicio fsico al menos una vez durante la semana pasada es
menor de 20%, si se tom una muestra de 1.200 personas, de los cuales
215 dicen que realizaron actividad fsica la semana pasada. Use = 0.01.

Solucin Las hiptesis se plantearan como (pues este ejemplo ya se explic


anteriormente en este captulo):

H0: P = 0,20
H1: P < 0,20

El problema indica que la prueba debe realizar a un nivel de significancia


de un 1%.

Como el problema es una prueba de una proporcin, entonces la opcin del


men Estadsticas > Estadstica bsica que se emplea es 1 Proporcin.
Se debe completar el cuadro de dilogo siguiente:

Se selecciona Muestras en columnas cuando se tiene la serie original de


datos muestrales, pero en este caso ya se tiene calculada la cantidad de
eventos o xitos de la muestra, por lo que se escoge Datos resumidos, y se
digita el nmero de eventos, que en este caso es 215, y el tamao de la
muestra o nmero de ensayos, que es 1200 en este caso. Debe marcarse la
casilla Realizar prueba de hiptesis, pues de otro modo Minitab solo
dar el intervalo de confianza. En la celda se digita la proporcin
hipottica, que es la proporcin indicada en la hiptesis nula.

Luego debe darse clic en el botn Opciones, pues es ah donde se indica el


nivel de significancia y se selecciona la hiptesis alternativa:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
388

En este caso, como se indic un nivel de significancia del 1%, entonces se


digita el nivel de confianza del 99%. En la hiptesis alternativa se haba
establecido que era H1: P < 0,20, por lo que se elige menor que, y
finalmente se marca la casilla Utilice la prueba y el intervalo basado en
la distribucin normal, pues as Minitab va a utilizar la aproximacin
normal para la distribucin binomial para calcular la prueba de hiptesis y
el intervalo de confianza, tal como se expuso en ese captulo en la teora
relacionada con las pruebas de hiptesis sobre la proporcin. Finalmente se
da clic en Aceptar, y luego en Aceptar, y en la ventana Sesin de Minitab
se obtiene el resultado siguiente:

En esta ventana se observa que Minitab ha calculado el valor del


estadstico de prueba z, que es 1,80, y el valor P, que es 0,071. Por
cualquiera de los dos criterios se acepta la hiptesis nula (ya que de la
tabla de la curva normal, para un nivel de significancia = 0,01, con una
cola, o sea, una confianza de 0,99, se obtiene z = 2,33, o bien, el valor P
de 0,071 es mayor que el de significancia = 0,01. Se concluye que no se
tiene evidencia estadstica suficiente para rechazar la hiptesis de que la
proporcin de adultos que realizaron ejercicio fsico durante la semana
pasada es menor que 20%, a un nivel de significacin del 1%.

Intervalos de confianza y prueba de hiptesis


Los intervalos de confianza calculados anteriormente en este texto tambin se pueden usar
para realizar la prueba de una hiptesis. As, si el valor hipottico indicado en la hiptesis
nula se encuentra dentro de los lmites establecidos por el intervalo de confianza, entonces

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
389

podra aceptarse la hiptesis nula. Pero si el valor hipottico est fuera de dicho intervalo,
entonces podra rechazarse la hiptesis nula.

Ejemplo La nueva directora de desarrollo de sistemas de una empresa consider que


el tiempo medio de 28 das para resolver los requerimientos de sus
usuarios era demasiado. Ante esta situacin opt por implementar una
serie de cambios para acelerar el proceso. Seis meses despus, en una
muestra de 27 nuevos requerimientos se obtuvo que el tiempo promedio
para resolverlos fue de 26,9 das, con una desviacin estndar de 8 das.
Sin embargo, algunos empleados se han quejado, y piensan que los
cambios ms bien retrasan el proceso. Utilizando un 1% de significancia,
evalu si el tiempo medio para resolver los requerimientos de los usuarios
ha cambiado.

Solucin Se inicia por plantear las hiptesis. Se desea probar que el tiempo medio
para resolver los requerimientos de los usuarios es de 28 das, por lo que
esa ser la hiptesis nula. Por otro lado, la evidencia muestral indica que
dicho tiempo se ha disminuido, pero algunos empleados opinan lo
contrario, por lo que se podra plantear la hiptesis alternativa como que el
tiempo medio es diferente de 28 das. En resumen, las hiptesis son:

H0: = 28
H1: 28

Luego se especifica el nivel de significacin . En este ejemplo se


especifica un valor de de 0,01.

Despus se selecciona el estadstico de prueba apropiado. Se tiene n < 30 y


que la desviacin estndar poblacional es desconocida, por lo que se
calcular el intervalo de confianza usando t. Tomando una media muestral
x 26,9 das, n = 27, s = 8 y = 0,01 (t con dos colas y 26 grados de
libertad es 2,779), por lo que el intervalo de confianza ser:

22,62
x t s / n 26,9 2,779 8 27
31,18

La media planteada en la hiptesis nula es = 28 das, valor que se


encuentra dentro del intervalo de confianza calculado, por lo que no podra
rechazarse la hiptesis nula.

Si se calculara el estadstico t se obtendra:

x 26,9 28
tc 0,714
s/ n 8 / 27

Ese valor calculado de t es inferior que el valor crtico de 2,779,


confirmando que la hiptesis nula se acepta.

Usando Minitab se obtendra un valor P = 0,481, mayor que el nivel de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
390

significancia, por lo que se acepta la hiptesis nula.

Por cualquiera de los criterios se llega a la misma conclusin, de que se


acepta la hiptesis nula, por lo que no hay evidencia suficiente para
concluir que los tiempos medios para resolver los requerimientos de los
usuarios haya cambiado.

Aplicacin Farmacocintica y farmacometra


Cuando usted emplea un medicamento, esa sustancia ingresa a su cuerpo y
es absorbida. Luego se distribuye por el organismo y es metabolizada, es
decir, el organismo detecta que es una sustancia extraa, de modo que
busca eliminarla. Todo ese proceso que realiza el frmaco a su paso por su
cuerpo es estudiado por la farmacocintica. Estos efectos del frmaco
requieren ser medidos. De esto ltimo se encarga la farmacometra, la cual
se ocupa de desarrollar y aplicar mtodos matemticos y estadsticos para
comprender y predecir los resultados que un frmaco pueda tener. Para
esto se realizan diversas mediciones y anlisis que permiten obtener
herramientas tiles para los profesionales en el rea, como las curvas
dosisrespuesta, e identificar el impacto de los factores que pueden influir
sobre la accin farmacolgica.

El uso de las probabilidades es importante, pues distintos individuos


pueden tener diferentes respuestas ante la misma dosis. As, es necesario
efectuar pruebas de hiptesis sobre los eventuales efectos farmacolgicos.
Los errores tipo I y tipo II y el poder estadstico del estudio son muy
importantes, dadas las posibles repercusiones que estos tendran sobre un
problema o una enfermedad en un paciente o en un conjunto de pacientes.

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Ejercicios:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
391

Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

1. Un cierto material viene en cajas de peso promedio 17 libras y desviacin estndar 0,4
libras. Se recibe un cargamento grande y se tiene la sospecha de que el peso promedio de las
cajas es inferior al usual. Para verificar la sospecha se toma una muestra al azar de 86 cajas y
se pesan, obtenindose un promedio de 16,5 libras. Se puede afirmar que efectivamente el
peso de las cajas es inferior al acostumbrado? Use un nivel de significancia de 5%.

2. En una granja bastante grande se producen pollos. Segn los estndares establecidos, el
peso medio de los pollos debe ser de 4,2 Kg. con varianza 1,96. Se desea determinar si es
cierta la queja de un grupo de clientes de que el peso medio ha disminuido durante las ltimas
semanas. Para verificar tal afirmacin se contrata un ingeniero avcola, el cual toma una
muestra de 65 pollos, y encuentra un peso medio de 3,86 Kg. Significa esto que
efectivamente el peso medio es inferior al usual? Use un nivel de significancia de 0,01.

3. De acuerdo con datos de un estudio realizado en un pas europeo la edad promedio de


diagnstico del cncer de prstata es 75 aos. Un investigador nacional considera que en
nuestro pas esa edad de diagnstico es menor. Se tom una muestra de 80 casos
diagnosticados y encontr una edad promedio de 69 aos con una desviacin estndar
muestral de 9 aos. Qu puede concluirse a un nivel de significancia del 6%?

4. Segn un estudio los nios de los estratos socio econmicos medios y altos inician alguna
prctica de cuidado de su salud buco dental a los 15,6 meses. En una muestra de 35 nios de
familias de estratos bajos se encontr una edad media de inicio de la higiene bucal a los 18,2
meses, con una desviacin estndar de 8,5 meses. Puede considerarse, a una significancia del
1%, que la edad de los nios de familias de estratos bajos es mayor que 15,6 meses?

5. El jefe de produccin de una planta de productos electrnicos desea estimar la produccin


diaria promedio de un cierto producto. La produccin diaria durante los ltimos 40 das da
una media de 418 unidades y una desviacin estndar de 45 unidades. Con estos datos pruebe
la hiptesis de que la produccin diaria promedio es 450 unidades, con un nivel de
significancia de 0,025.

6. El gerente de una empresa procesadora de caf est preocupado porque sus proveedores le
entregan con frecuencia caf verde. Se tomaron como muestras 36 probetas de 250 ml cada
una y encontr que en promedio se entreg 30 ml de grano verde por probeta con una
desviacin de 10 ml. A un nivel de significacin de 98%, se cumple la especificacin de que
la cantidad de grano verde por probeta no supere 25 ml?

7. Un investigador est interesado en conocer ciertos datos relacionados con la calidad de vida
de una poblacin, entre ellos se interesa por el nivel de caloras que en promedio consumen
los nios de 7 a 12 aos de esa poblacin por da. Conoce, por un estudio anterior, que la
desviacin estndar de la citada variable es 185 caloras, adems sabe que habitan en ese
poblado 745 nios. Segn datos del gobierno local el consumo medio de caloras de los nios
de esa edad es de 1170 caloras por da, pero el investigador duda de la veracidad de dicha
informacin. El desea que sus estimaciones tengan altos niveles de confiabilidad (por lo
menos el 97%), entonces decide realizar un estudio estadstico. Toma una muestra de 27 nios
y evala su situacin nutricional. Si una vez realizado el estudio en muestra de 27 nios,

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
392

obtuvo una media de 1100 caloras diarias. Es estadsticamente correcta la afirmacin


gubernamental, o existe evidencia estadstica para rechazarla, a un nivel de significancia del
5%?

8. Se sabe que para cierto tipo de bombillo elctrico, que su duracin media es de 1250 horas.
Se introduce una nueva tcnica que pretende mejorar su duracin, y luego se somete a una
prueba una muestra al azar de 60 bombillos fabricados con el nuevo procedimiento,
obtenindose una duracin media de 1271 horas y varianza de 3600. Existe base para pensar
que el nuevo procedimiento aumenta la duracin de los bombillos?

9. El gerente de una empresa procesadora de caf est preocupado porque considera que la
mitad de las veces sus proveedores le entregan demasiado caf verde. Se tomaron como
muestras 36 probetas de 250 ml cada una y encontr que en 125 de ellas haba una cantidad
de grano verde que superaba lo especificado. A un nivel de significacin de 99%, puede
considerarse que la mitad de las veces los proveedores entregan ms grano verde del
establecido?

10. En una muestra de 10 distintas acciones de empresas tecnolgicas elegidas al azar entre
todas las acciones que se negocian en la Bolsa de Valores de Nueva York se obtuvo una razn
promedio de precio/utilidades (p/u) de $12,89 con una desviacin estndar de $6,98. Si se
sabe que la tasa precio/utilidades promedio para todas las empresas que cotizan en la bolsa fue
de $10,97. Es esta evidencia suficiente para concluir, a un nivel de significancia del 5%, que
la tasa precio/utilidades promedio para las empresas tecnolgicas es superior al resto de
acciones negociadas en la Bolsa?

11. Un laboratorio afirma que el tiempo promedio de eliminacin del ibuprofeno en sujetos
sanos es de 2,3 horas. Para determinar la validez de esa afirmacin se tom una muestra de 15
personas y se obtuvo un tiempo medio de 2,9 horas. Se conoce que la desviacin estndar es
1,1 horas. A qu conclusin se llega a un nivel de significancia del 5%?

12. Una persona considera que los habitantes de nuestro pas tienen un cociente intelectual
superior a 100 puntos, pues los niveles educativos han mejorado en aos recientes. Los
siguientes datos corresponden a una muestra de personas que aplicaron un test para medir su
cociente intelectual: 102, 99, 96, 100, 99, 112, 125, 85, 83, 105, 98, 129, 78, 109, 116, 101,
112, 101, 96, 100, 103, 97, 104, 97, 98, 99, 113, 102, 95, 121, 98, 100, 98, 99, 111, 102, 99,
103, 108. Indicar estos datos que esa persona tiene razn, al nivel de significancia de 5%?

13. En un artculo reciente de una revista se compar el costo de adopcin de nios en China
y en Rusia. En una muestra de 16 adopciones en China, el costo medio fue de $11045, con
desviacin estndar de $835. En una muestra de 18 adopciones de nios en Rusia, el costo
medio fue de $12840, con una desviacin estndar de $1545. Se puede concluir que el costo
medio de adoptar un nio es mayor en Rusia? Utilice el nivel de significancia del 5%.

14. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es menor que 3,13?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
393

15. Segn un estudio la duracin promedio de la ciruga de correccin de Incontinencia de


Orina de Esfuerzo (IOE) es de 39,3 minutos. Para comprobar estos datos se tom una muestra
de 10 de estos tipos de ciruga obteniendo los siguientes tiempos operatorios (en minutos): 25,
38, 42, 74, 68, 58, 31, 21, 26 y 32. Son estos datos evidencia suficiente para apoyar que el
tiempo medio operatorio es de 39,3 minutos? Utilice una significancia de 1%.

16. Un arquitecto considera que actualmente las casas tienen un rea construida inferior a la
de hace dos o ms dcadas. En una muestra de 15 viviendas construidas en el transcurso de
los dos ltimos aos se encontr un rea construida promedio de 92 metros cuadrados y una
desviacin estndar de 30 metros cuadrados. A un nivel de significancia de 5%, qu puede
concluirse si se sabe, por otro estudio, que las viviendas construidas hace dos dcadas o ms
tenan un rea construida promedio de 130 metros cuadrados?

17. Un ingeniero ha recopilado datos sobre la vida til de una muestra de filtros de gasolina
del mismo tipo y marca. Los datos son los siguientes (en miles de kilmetros): 12, 14, 16, 15,
10, 12, 13, 15, 16. Pruebe la hiptesis de que la vida media de los filtros es de 15000
kilmetros. Use un nivel de significancia del 5%.

18. El cable coaxial RG-174 debe tener un dimetro de 2,6 mm. En una muestra de 25 metros
de cable coaxial RG-174 fabricado por una empresa se obtuvo un dimetro medio de 2,65
mm. Se sabe que la desviacin estndar es 0,9 mm. Est cumplindose la especificacin?
Use un nivel de significancia del 5%.

19. Un contador est realizando una auditora de los cheques extendidos por una compaa.
En una muestra de 20 cheques se obtuvieron los siguientes montos, en miles dlares:

15, 17, 22, 8, 4, 2, 16, 6, 8, 14, 15, 25, 20, 5, 6, 8, 12, 19, 11, 12

20. El director financiero considera que el monto promedio de los cheques de la compaa es
$11 mil dlares y el jefe del departamento contable cree que la proporcin de cheques con
montos superiores a $12 mil dlares no es mayor que 45%.

a. Pruebe, al 5% de significancia, la afirmacin del director financiero contra la


alternativa de que es diferente de ese monto.
b. Pruebe, al 1% de significancia, la afirmacin del jefe del departamento contable
contra la alternativa de que la proporcin es diferente del 45%.

21. El ingreso medio de los habitantes del pas es $10.420 y la distribucin del ingreso se
comporta normalmente. Una muestra aleatoria de 10 residentes de una ciudad presenta una
media de $8.540 con una desviacin estndar de $3.560. A un nivel de significancia del 5%,
existe evidencia suficiente para considerar que los habitantes de esta ciudad tienen ingresos
inferiores a la media nacional?

22. La desnutricin contina siendo un problema importante en los pases en desarrollo


especialmente en nios. Segn las recomendaciones de organismos internacionales la racin
diaria no debera ser inferior a 2000 Kcal en edades de 8 a 10 aos. En una zona de bajos
ingresos del pas se realiz un estudio entre 25 escolares y se determin una ingesta promedio
de 1875 Kcal/da. Se supone una desviacin estndar de 315 Kcal. Puede concluirse que se
presenta algn grado de desnutricin a un nivel de significancia de 1%?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
394

23. En una muestra de 12 motores para automvil de cierto tipo se obtuvo una vida til
promedio de 320000 kilmetros. La desviacin estndar muestral es de 90000 kilmetros. Si
el vendedor ofrece una vida til de 350000 kilmetros, podra considerarse que engaa a los
clientes? Use un nivel de significancia de 1%.

24. Una institucin realiz un plan de capacitacin entre mujeres emprendedoras de una zona
marginal del pas. El objetivo es que estas mujeres lograran incrementar los ingresos de sus
microempresas. Luego de implementadas las capacitaciones se compararon los ingresos de
una muestra de 12 microempresas y se registraron los siguientes ingresos (en dlares al mes):

1 2 3 4 5 6 7 8 9 10 11 12
Antes 320 290 421 510 210 402 625 560 360 431 506 505
Despus 340 285 475 510 210 500 631 560 365 431 525 619

Hubo un aumento significativo en los niveles de ingresos de las microempresarias de la


zona? Utilice el nivel de significancia del 5%.

25. El gerente de una empresa considera que el 70% de sus clientes estaran dispuestos a
efectuar compras a travs de internet. Para comprobar esta afirmacin se efecta una encuesta
entre 20 clientes, de los cuales 11 dijeron que no estaban dispuestos a comprar por este medio.
Se puede decir que el gerente tena razn o que el resultado de la encuesta se debe a
fluctuaciones del muestreo? Use a = 1%.

26. El encargado de reclutamiento y seleccin de personal de una empresa considera que las
habilidades sociales, como la buena comunicacin y un adecuado manejo de los conflictos,
son fundamentales para lograr un buen desempeo en la compaa, y considera que menos del
25% de las personas han desarrollado estas destrezas a un nivel suficiente para laborar en la
organizacin. En las entrevistas y pruebas que aplican a los candidatos para los puestos que
demanda la empresa se evalan estas destrezas. En una muestra aleatoria de 45 candidatos, se
encontr que 19 haban obtenido una evaluacin suficientemente buena. Puede concluirse
que el encargado de reclutamiento y seleccin est equivocado? Use un nivel de significancia
del 5%.

27. Un candidato de un partido poltico considera que el 54% de los electores indecisos tienen
una opinin favorable acerca de sus planteamientos. Para comprobar si su expectativa es
acertada, se decidi efectuar una encuesta entre un grupo de electores, de los cuales 210
dijeron no haber definido su candidato para las prximas elecciones, y se logr determinar
que 80 de esas personas tienen cierta simpata por este candidato. Puede el candidato
mantener vigente su expectativa, o ms bien esta informacin muestra lo contrario? Use =
0,05.

28. De acuerdo con un artculo publicado en una revista cientfica la vasectoma es exitosa en
el 99% de los casos. Un investigador seleccion 2400 casos realizados recientemente en el
pas y encontr 29 fallos. Puede considerarse que la tasa de xito es inferior a 99%? Use una
significancia de 5%.

29. La aminotriptilina se ha aprobado para el tratamiento de la depresin. Un laboratorio


indica que este frmaco es efectivo en el 85% de los casos. En una muestra de 60 pacientes
con un cuadro depresivo se encontr que 45 de ellos afirmaron que la aminotriptilina les haba

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
395

resultado efectiva. Son estos datos evidencia suficiente, al 3% de significancia, para


respaldar la afirmacin del laboratorio?

30. Segn un artculo publicado en una revista cientfica la miopa podra afectar al 25% de la
poblacin de un pas como Estados Unidos. Un investigador desea saber si a nivel nacional
esa tasa podra ser similar. En una muestra de 120 adultos residentes en nuestro pas se
encontr que 18 personas tenan miopa. Son estos datos evidencia suficiente de que la
poblacin de nuestro pas se ve menos afectada por la miopa? Use una significancia del 5%.

31. El encargado de seguridad ocupacional de una empresa considera que en su organizacin


ocurren menos accidentes que en la mayora de las empresas del mismo sector econmico.
Segn sus datos, en el pas, 8 de cada 100 trabajadores se ven afectados por algn tipo de
accidente. Para tratar de comprobar su afirmacin se toma una muestra de 21 empleados de la
empresa y se determina que 2 de ellos han sufrido algn accidente laboral este ao.
Confirman estos datos las aseveraciones del encargado de seguridad ocupacional de la
empresa? Utilice un nivel de significancia del 5%.

32. Segn un estudio solo el 40% de los nios entre los 3 y 5 aos de edad tienen hbitos de
cuidado de su salud bucal. Luego de una campaa se tom una muestra de 25 nios y se
determin que 13 de ellos posea buenos hbitos en este sentido. Podra concluirse que la
campaa fue exitosa? Utilice un nivel de significancia de 1%.

33. Un consultor en el rea de tecnologas de informacin considera que al menos la mitad de


los proyectos informticos no se concluyen a tiempo. En una muestra de 120 proyectos
realizados en distintas empresas, se encontr que 56 no se haban concluido a tiempo. Qu
puede concluirse a partir de esta informacin? Utilice un nivel de significancia de 1%.

34. Una institucin de asistencia social indic que el ao pasado el 44% de los nios de sexto
grado que asisten a la escuela de una localidad solicitaron una beca para continuar sus
estudios de secundaria. A inicios de este mes se seleccion una muestra de 200 nios de sexto
grado de la misma escuela y se descubri que 96 solicitaran la beca. Hubo un incremento
significativo en el porcentaje de nios que solicitaran la beca en la secundaria? Lleve a cabo
la prueba al 5%.

35. Una empresa pauta publicidad en televisin todos los meses. Recientemente ha lanzado
una campaa muy agresiva, y se espera que al menos el 55% de los consumidores de menos
de 40 aos recuerden el anuncio de la empresa. Se ha tomado una muestra de 120
consumidores de menos de 40 aos y el 48% dijeron que recordaban el anuncio de la empresa.
Puede considerarse, al 5% de significancia, que se ha alcanzado la meta?

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. Cuando se debe decidir, con base en evidencia experimental, si una afirmacin hecha
acerca de un parmetro es falsa o verdadera, es necesario realizar:
(a) Una estimacin por intervalos
(b) Una prueba de hiptesis

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
396

(c) Un anlisis de correlacin


(d) Un estudio por muestreo

2. Una __________ es una afirmacin acerca de un __________ de una o ms poblaciones y


que est sujeta a verificacin. La opcin que mejor completa la frase anterior es:
(a) hiptesis; parmetro
(b) prueba de hiptesis; estimador
(c) prueba de hiptesis; parmetro
(d) hiptesis; estimador

3. Una prueba de hiptesis es un procedimiento basado en evidencia de la __________ y la


teora __________ para determinar si la hiptesis es una afirmacin razonable. La opcin que
mejor completa la frase anterior es:
(a) poblacin; estadstica
(b) muestra; de probabilidades
(c) probabilidad; de muestreo
(d) poblacin; de probabilidades

4. En una prueba de hiptesis:

A. La hiptesis alternativa es cualquier hiptesis que se desea probar.


B. La hiptesis nula es la hiptesis que se acepta cuando la hiptesis nula es rechazada.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

5. Un investigador desea probar la hiptesis de que la media de una determinada variable x es


igual a 500. En una muestra obtuvo una media de 350, entonces debe:
(a) rechazar la hiptesis nula porque la diferencia con respecto a la media muestral es muy
grande
(b) rechazar la hiptesis nula porque la media muestral es menor que la media hipottica
(c) aceptar la hiptesis nula porque la diferencia encontrada es muy pequea
(d) ninguna de las anteriores

6. El nivel de significancia es la probabilidad de:


(a) rechazar la hiptesis nula cuando es falsa
(b) rechazar la hiptesis nula cuando es verdadera
(c) aceptar la hiptesis nula cuando es falsa
(d) aceptar la hiptesis nula cuando es verdadera

7. El error tipo II se comete cuando se:


(a) rechaza la hiptesis nula cuando es falsa
(b) rechaza la hiptesis nula cuando es verdadera
(c) acepta la hiptesis nula cuando es falsa
(d) acepta la hiptesis nula cuando es verdadera

8. El error tipo I se comete cuando se:


(a) rechaza la hiptesis nula cuando es falsa
(b) rechaza la hiptesis nula cuando es verdadera

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
397

(c) acepta la hiptesis nula cuando es falsa


(d) acepta la hiptesis nula cuando es verdadera

9. El gerente de una empresa espera que el 60% de sus clientes actuales estn dispuestos a
efectuar compras a travs de internet. Para comprobar esta afirmacin se efecta una encuesta
entre una muestra de clientes, en la cual se encuentra que solo el 40% de los clientes
efectuaran compras por internet. Segn los estudios financieros de la empresa, se requiere
que al menos el 60% de los clientes actuales realicen compras en lnea para que valga la pena
implementar dicha modalidad de negocios. Con respecto a esta situacin se han realizado dos
afirmaciones:

A. Cometer el error tipo I significara perder una buena oportunidad de negocios.


B. Cometer el error tipo II significara enfrentarse a prdidas econmicas en un sistema
que no es rentable.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

10. Un candidato de un partido poltico considera que al menos el 40% de los electores tienen
una opinin favorable acerca de sus planteamientos y, por tanto, votaran por l en las
prximas elecciones. Para comprobar si su expectativa es acertada, decidi efectuar una
encuesta entre un grupo de 200 electores, de los cuales 70 dijeron tener simpata por este
candidato. Las elecciones se ganan con al menos el 40% de los votos y el candidato
participar solo si posee posibilidades de contar con al menos el 40% de los votos. Con
respecto a esta situacin se han realizado dos afirmaciones:

A. Cometer el error tipo II significara no participar en una eleccin que pudo haber
ganado.
B. Cometer el error tipo I significara gastar muchos recursos en propaganda en una
eleccin que no ganara.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

11. Las autoridades sanitarias consideran que los recin nacidos procedentes de zonas rurales
deberan pesar al menos 2500 gramos al nacer, en promedio. De presentarse una media
inferior, valdra la pena implementar un programa para la mejora de la atencin prenatal en
las zonas rurales. Se decide hacer un estudio por muestreo para valorar esta decisin. Con
respecto a esta situacin se han realizado dos afirmaciones:

A. Cometer el error tipo II significara un deterioro de las condiciones de salud de una


poblacin.
B. Cometer el error tipo I significara destinar recursos a un programa innecesario.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
398

12. Con respecto al nivel de significancia usado en las pruebas de hiptesis se han realizado
dos afirmaciones:

A. Generalmente es de 1% o de 5%.
B. Representa la posibilidad de aceptar una hiptesis incorrecta.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

13. Un contrato laboral exige los operarios realicen una produccin diaria no menor de 50
unidades. Una muestra de 150 das de produccin revela una media de 47,3 unidades, con una
desviacin estndar de 5,7 unidades, se cumple con la disposicin del contrato?

En este problema la hiptesis nula es:


(a) La produccin media diaria es de 50 unidades.
(b) La produccin media diaria es menor que 50 unidades.
(c) La produccin media diaria es de 47,3 unidades.
(d) La produccin media diaria es mayor que 50 unidades.

14. Un contrato laboral exige los operarios realicen una produccin diaria no menor de 50
unidades. Una muestra de 150 das de produccin revela una media de 47,3 unidades, con una
desviacin estndar de 5,7 unidades, se cumple con la disposicin del contrato?

En este problema la hiptesis alternativa es:


(a) La produccin media diaria es de 47,3 unidades.
(b) La produccin media diaria es menor que 50 unidades.
(c) La produccin media diaria es de 47,3 unidades.
(d) La produccin media diaria es mayor que 47,3 unidades.

15. En un colegio se estima que, cuando mucho, 25% de los estudiantes se traslada a clases en
bicicleta. Parecera esta ser una estimacin vlida si, en una muestra aleatoria de 180
estudiantes, se encuentra que 60 utilizan este transporte?

En este problema la hiptesis nula es:


(a) Una proporcin de 33,33% de los estudiantes se traslada en bicicleta a clases.
(b) Una proporcin de 25% de los estudiantes se traslada en bicicleta a clases.
(c) Una media de 25% de los estudiantes se traslada en bicicleta a clases.
(d) Una proporcin mayor que 25% de los estudiantes se traslada en bicicleta a clases.

16. En un colegio se estima que, cuando mucho, 25% de los estudiantes se traslada a clases en
bicicleta. Parecera esta ser una estimacin vlida si, en una muestra aleatoria de 180
estudiantes, se encuentra que 60 utilizan este transporte?

En este problema la hiptesis alternativa es:


(a) Una proporcin de 33,33% de los estudiantes se traslada en bicicleta a clases.
(b) Una proporcin menor que 33,33% de los estudiantes se traslada en bicicleta a clases.
(c) Una media mayor de 25% de los estudiantes se traslada en bicicleta a clases.
(d) Una proporcin mayor que 25% de los estudiantes se traslada en bicicleta a clases.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
399

17. Con respecto al procedimiento de prueba de hiptesis se han realizado dos afirmaciones:

A. La prueba de hiptesis solo indica si la hiptesis es apoyada o no por los datos


disponibles.
B. Cuando no se rechaza la hiptesis nula, no se dice que sea verdadera, sino que
probablemente es verdadera.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

18. Con respecto al valor P (que ofrecen la mayora de los programas de computacin como
parte de la prueba de hiptesis) se han realizado dos afirmaciones:

A. El valor P es la probabilidad de obtener un valor muestral ms extremo que el


observado cuando la hiptesis nula es falsa.
B. El valor P es el menor nivel de significacin al que se puede rechazar la hiptesis nula
cuando sea verdadera.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

19. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se cuenta con
datos de una muestra de 58 observaciones y se conoce el valor de la desviacin estndar
poblacional, entonces se emplea como estadstico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ

20. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se cuenta con
datos de una muestra de 17 observaciones y se conoce el valor de la desviacin estndar
poblacional, entonces se emplea como estadstico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ

21. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se cuenta con
datos de una muestra de 17 observaciones y no se conoce el valor de la desviacin estndar
poblacional, entonces se emplea como estadstico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
400

22. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se cuenta con
datos de una muestra de 90 observaciones y no se conoce el valor de la desviacin estndar
poblacional, entonces se emplea como estadstico de prueba:
x x
(a) zc (b) zc
/ n s/ n
x x nP
(c) tc (d) z
s/ n nPQ

23. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se dice que la
prueba es de dos colas, entonces es verdadero que la hiptesis alternativa puede ser (donde 0
es el valor hipottico de la media poblacional):
(a) H1: > 0 (b) H1: < 0
(c) H1: 0 (d) H1: = 0

24. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se sabe que no se
rechaz la hiptesis nula, entonces puede ser verdadero que:
(a) zc zt (b) tc tt
(c) tc tt (d) Ninguna de las anteriores

25. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se sabe que se
rechaz la hiptesis nula, entonces puede ser verdadero que:
(a) z c z t (b) t c t t
(c) z c z t (d) Ninguna de las anteriores

26. Si al realizar una prueba de hiptesis sobre una media de una poblacin, se sabe que se
rechaz la hiptesis nula, entonces puede ser verdadero que:
(a) z c z t (b) valor P <
(c) tc tt (d) valor P >

27. Si se realiza una prueba de hiptesis de dos colas, con un nivel de significancia del 5%,
entonces el valor z crtico es:
(a) 2,00 (b) 1,645 (c) 1,28 (d) 1,96

28. Si se realiza una prueba de hiptesis de dos colas, con un tamao de muestra de 10
observaciones y un nivel de significancia del 5%, entonces el valor t crtico es:
(a) 1,96 (b) 2,262 (c) 1,833 (d) 2,228

29. Observe la grfica:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
401

Con respecto a la grfica anterior, es falso que:


(a) Si zc es 2,56, se rechaza la hiptesis nula.
(b) Si zc es 1,88, se acepta la hiptesis nula.
(c) Si zc es 3,02, el valor P es menor que el nivel de significancia.
(d) Si |zc| es 2,33, se rechaza la hiptesis nula.

30. Observe la grfica:

Con respecto a la grfica anterior, es falso que:


(a) La prueba es de una cola.
(b) El nivel de significancia es 1%.
(c) La hiptesis nula puede ser H1: < 50.
(d) Ninguna de las anteriores.

31. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, la hiptesis nula es:
(a) H0: = 2,86 (b) H0: = 3,13
(c) H0: < 3,13 (d) H0: = 1,2

32. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, la hiptesis alternativa es:
(a) H1: = 2,86 (b) H1: = 3,13
(c) H1: < 3,13 (d) H1: > 2,86

33. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, es cierto que:
(a) Debe calcularse z porque el tamao de muestra es menor que 30 y se desconoce
(b) Debe calcularse z porque el tamao de muestra es menor que 30 y se conoce
(c) Debe calcularse t porque el tamao de muestra es menor que 30 y se desconoce

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
402

(d) Debe calcularse t porque el tamao de muestra es menor que 30 y se conoce

34. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, es cierto que:
(a) Es una prueba de una cola porque en la hiptesis nula se emplea el signo <
(b) Es una prueba de una cola porque en la hiptesis alternativa se emplea el signo <
(c) Es una prueba de una cola porque en la hiptesis alternativa se emplea el signo
(d) Es una prueba de dos colas porque en la hiptesis alternativa se emplea el signo <

35. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, el valor del estadstico de prueba es:
(a) z = 1,13 (b) t = 1,13
(c) t = 1,711 (d) Ninguna de las anteriores

36. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al calcular el valor tabular crtico para hacer la prueba es cierto que:
(a) Los grados de libertad son 25
(b) Los grados de libertad son 24
(c) Los grados de libertad son 26
(d) No se necesita determinar los grados de libertad

37. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, el valor tabular crtico para hacer la prueba es:
(a) z = 1,645 (b) t = 1,711
(c) t = 1,711 (d) t = 2,064

38. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al hacer la prueba es verdadero que:
(a) Se acepta la hiptesis nula porque tc < tt
(b) Se acepta la hiptesis nula porque |tc| < |tt|

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
403

(c) Se rechaza la hiptesis nula porque tc > tt


(d) Se acepta la hiptesis nula porque |zc|< |zt|

39. De acuerdo con el Instituto de Estadstica y Censos, un hogar tpico en nuestro pas tiene
3,13 miembros. Una muestra de 25 hogares del rea metropolitana presenta un nmero medio
de 2,86 miembros. La desviacin estndar de esta muestra era de 1,2 residentes. A un nivel de
significancia del 5%, es razonable concluir que el nmero medio de residentes de esta ciudad
es igual a la media nacional?
Para este problema, al hacer la prueba se puede concluir, con respecto al tamao medio de los
hogares del rea metropolitana, que:
(a) El tamao medio es 2,86 miembros
(b) El tamao medio es 3,13 miembros
(c) No hay evidencia suficiente para decir que el tamao medio es menor que 3,13 miembros
(d) Hay evidencia suficiente para decir que el tamao medio es menor que 3,13 miembros

Respuestas a los ejercicios de seleccin nica:

1. b 2. a 3. b 4. c 5. d
6. b 7. c 8. a 9. a 10. c
11. a 12. a 13. a 14. b 15. b
16. d 17. a 18. d 19. a 20. a
21. c 22. b 23. c 24. c 25. a
26. b 27. d 28. b 29. d 30. d
31. b 32. c 33. d 34. b 35. b
36. b 37. c 38. b 39. c

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
404

11 .

Pruebas de hiptesis para la


diferencia de dos medias o
proporciones poblacionales
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Identificar los distintos tipos de problemas para la diferencia de dos medias poblacionales
2. Aplicar el procedimiento de prueba de hiptesis para problemas de medias de dos
poblaciones independientes con distintos tamaos de muestra
3. Aplicar el procedimiento de prueba de hiptesis para problemas de medias con datos
apareados
4. Aplicar el procedimiento de prueba de hiptesis para problemas de diferencia de dos
proporciones

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
405

Prueba de hiptesis para la diferencias entre medias


Una empresa posee operaciones en dos pases distintos y en cada pas posee una planta de
produccin. En uno de los pases se tienen 2000 empleados y en el otro 3000. En ambas
plantas se realizan los mismos procesos, pero se ha observado que, segn algunos datos
muestrales, la productividad de los operarios tiende a ser mayor en uno de los pases que en el
otro. Dado que los datos provienen de muestras, es necesario saber si las diferencias
observadas entre ambas plantas son significativas, o si pueden ser atribuidas al azar. Para
resolver este problema se necesita realizar una prueba de hiptesis para la media de dos
poblaciones distintas.

Tal como en el ejemplo, muchas veces es necesario decidir si la diferencia entre dos medias
muestrales se puede atribuir al azar, o si en realidad las dos muestras provienen de
poblaciones con medias diferentes. Otros ejemplos de problemas en que se comparan dos
medias se pueden referir a comparar dos mtodos de soldadura para encontrar cul es ms
resistente, comparar el rendimiento de llantas radiales versus llantas con neumtico, comparar
dos mtodos de enseanza, etc. A continuacin se expone el procedimiento que se utilizar
para probar si la diferencia observada entre las dos medias muestrales es estadsticamente
significativa.

Diferencia entre medias en poblaciones independientes


Si x1 y x 2 son las medias de dos muestras aleatorias independientes, entonces la distribucin
12 22
muestral de la diferencia x1 x 2 tiene la media 1 2 y la desviacin estndar
n1 n2
donde 1, 2, 1, y 2 son las medias y las desviaciones estndar de las dos poblaciones
muestreadas.

En estos casos se plantea la hiptesis nula como:

H0: 1 2 =

donde es la diferencia que se desea probar. Este valor es una constante determinada con
base en muestras aleatorias e independientes de tamao n1 y n2. La mayor parte de las veces
se tendr que = 0, es decir, se prueba si las dos medias son iguales, por lo que la hiptesis
nula podra plantearse como:

H0: 1 = 2

La hiptesis alternativa se puede formular como cualquiera de las tres siguientes:

H1: 1 2 >
H1: 1 2 <
H1: 1 2

El estadstico de prueba es:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
406

( x1 x 2 )
z
12 22

n1 n2

cuando las muestras son grandes y las varianzas poblacionales conocidas.

Los criterios de aceptacin o rechazo son iguales a los de la prueba para una media.

Ejemplo Una empresa posee operaciones en dos pases distintos y en cada pas
posee una planta de produccin. En uno de los pases se tienen 2000
empleados y en el otro 3000. En ambas plantas se realizan los mismos
procesos, pero se ha observado que, segn algunos datos muestrales, la
productividad de los operarios tiende a ser mayor en uno de los pases que
en el otro.

Los datos recopilados se muestran en la tabla (la media y la desviacin


estndar se expresan en nmero de unidades producidas correctamente por
hora):

Tamao de Desviacin
Planta de muestra Media estndar
produccin n x
En el pas 1 40 22 3,1
En el pas 2 50 31 4,2

Determine, a un nivel de significacin del 5%, si se presenta diferencia


entre los dos promedios.

Solucin Se tiene que n1 = 40, n2 = 50, x1 = 22, x 2 = 31, 1 = 3,1 y 2 = 4,2.

El ejercicio busca determinar si existe diferencia, por lo que se tendr que


probar si = 0.

Adems, se indica que = 0,05.

Entonces, se plantea la hiptesis nula como:

H0: 1 2 = 0

Como x1 = 22 < x 2 = 31, entonces se formula la hiptesis alternativa


como:

H1: 1 2 < 0

Se usa Z porque aunque las desviaciones estndar poblacionales son


desconocidas, se tienen muestras grandes (n 30):

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
407

( x1 x 2 ) (22 31) 0
z 11,69
2
2
3,12 4,2 2
1
2

n1 n2 40 50

De la tabla normal con un nivel de significacin del 5% se obtiene Z =


1,645. El valor de Z calculado con la frmula es menor que el Z por lo
tanto cae en la zona de rechazo de la hiptesis nula. Se concluye que se
rechaza Ho con = 0,05. Se puede decir que existe evidencia suficiente
para creer que la productividad en el primer pas es menor que en el
segundo.

Ejemplo Un vendedor de equipo tecnolgico quiere determinar si hay diferencias en


el consumo de este tipo de productos por parte de entre los profesionales
en ciencias econmicas y profesionales en ingeniera, pues ha tenido muy
buena experiencia vendiendo equipos para el primer profesional
mencionado.

Seleccion una muestra al azar de 80 profesionales en ciencias econmicas


y 70 ingenieros, encontrando que los primeros gastaron un promedio de
$1.250 en productos tecnolgicos durante el ltimo ao, con una
desviacin estndar de $400. Los ingenieros gastaron en promedio $980,
con una desviacin estndar de $620. Existe diferencia significativa, al
1% de significancia entre ambas poblaciones?

Solucin En esta situacin se tienen los datos para los dos grupos de profesionales,
las cuales se pueden resumir del modo siguiente:

1 2
Grupo Ciencias econmicas Ingeniera
Tamao de muestra 80 70
Promedio $1.250 $980
Desviacin estndar $400 $620

Se plantean la hiptesis nula como la igual de las dos medias, o sea, que la
diferencia es cero:

H0: 1 2 = 0

Tambin podran plantearse la hiptesis nula como:

H0: 1 = 2

De acuerdo con la evidencia de la muestra, el promedio para los


profesionales en ciencias econmicas es mayor, por lo que la hiptesis
alternativa podra plantearse como:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
408

H1: 1 > 2

As, las hiptesis seran:

H0: 1 = 2
H1: 1 > 2

Dado que se cuenta con tamaos de muestra superiores a 30 unidades, y se


conocen las desviaciones estndares poblacionales, entonces se aplica el
estadstico de prueba z:

( x1 x 2 ) (1250 980) 0
z 3,12
2
2
400 2 620 2
1
2

n1 n2 80 70

La prueba se realiza a un nivel de significancia del 1%, por lo que de la


tabla de la curva normal estndar se obtiene zt = 2,33.

Dado que el valor crtico | zc | = 3,12 es mayor que | zt | = 2,33, entonces se


rechaza la hiptesis nula. Se concluye que a un nivel de significancia del
1% existe evidencia suficiente para considerar que el consumo de
productos tecnolgicos por parte de entre los profesionales en ciencias
econmicas es mayor que el de los profesionales en ingeniera.

Ejercicio Un analista de inversiones requiere asesorar a un cliente con respecto a los


riesgos de invertir en las acciones de dos compaas distintas llamadas
de MuchMoney y VeryRich. Para ello toma una muestra de 40 variaciones
revisin diarias en los precios de MuchMoney y obtiene un promedio de $2,8 con
una desviacin estndar de $1,2; y una muestra de 50 variaciones diarias
de los precios de VeryRich, las cuales dan una media de $3,5 con una
desviacin estndar de $1,8. Es esta evidencia suficiente para considerar
que el comportamiento de ambas acciones es el mismo o son diferentes?

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar varias presentaciones que
audiovisual explican el tema de las pruebas de
hiptesis para comparar dos medias.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
409

Uso de Minitab para realizar la prueba de dos medias

Ejemplo Utilice Minitab para resolver el problema: Un vendedor de equipo


tecnolgico quiere determinar si hay diferencias en el consumo de este tipo
de productos por parte de entre los profesionales en ciencias econmicas y
profesionales en ingeniera, pues ha tenido muy buena experiencia
vendiendo equipos para el primer profesional mencionado. Seleccion una
muestra al azar de 80 profesionales en ciencias econmicas y 70
ingenieros, encontrando que los primeros gastaron un promedio de $1.250
en productos tecnolgicos durante el ltimo ao, con una desviacin
estndar de $400. Los ingenieros gastaron en promedio $980, con una
desviacin estndar de $620. Existe diferencia significativa, al 1% de
significancia entre ambas poblaciones?

Solucin En esta situacin se tienen los datos para los dos grupos de profesionales,
las cuales se pueden resumir del modo siguiente:

1 2
Grupo Ciencias econmicas Ingeniera
Tamao de muestra 80 70
Promedio $1.250 $980
Desviacin estndar $400 $620

Se plantean la hiptesis nula y la hiptesis alternativa:

H0: 1 = 2
H1: 1 > 2

Dado que se cuenta con tamaos de muestra superiores a 30 unidades, y se


conocen las desviaciones estndares poblacionales, entonces se aplica el
estadstico de prueba z, pero en Minitab no aparece en el men Estadsticas
/ Estadstica bsica una prueba "z de 2 muestras", sino que solo aparece "t
de 2 muestras". Sin embargo, la distribucin normal y la distribucin t
convergen conforme se incrementa el tamao de la muestra, por lo que
usando el men "t de 2 muestras" se obtendrn resultados bastante
aproximados. Entonces, se da clic al men Estadsticas, luego Estadstica
bsica y se selecciona t de 2 muestras, y se completa el cuadro de dilogo
siguiente:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
410

En el cuadro anterior se marc la opcin datos resumidos, pues ya se


cuenta con los clculos de la media y la desviacin estndar en cada caso.
En el botn opciones se indica el nivel de confianza, que en este caso sera
de 99%, pues la significancia es de 1%. La diferencia de la prueba es cero,
ya que se prueba la hiptesis nula de que ambas medias son iguales. Y la
hiptesis alternativa corresponde a que la primera media es mayor que la
segunda, por lo que se indica "mayor que":

Despus se da clic en Aceptar, y luego Aceptar en el primer cuadro de


dilogo, y en la ventana Sesin se obtiene:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
411

Se observa el valor de T = 3,12, que en este caso es igual al valor calculado


de z, y adems se cuenta con el valor P = 0,001. Por cualquiera de los dos
criterios se rechaza la hiptesis nula.

Material En la pgina de internet de este texto


podr encontrar videos que explican el
audiovisual tema de las pruebas de hiptesis y el uso
de software para este procedimiento.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Diferencias entre medias (muestras pequeas)


Cuando n1 o n2, o ambas, son menores de 30 y se desconocen las varianzas poblacionales, se
usa el estadstico t, siempre que se pueda suponer razonablemente que las poblaciones son
normales y que 1 = 2 = . El estadstico de prueba corresponde a:

( x1 x 2 )
t
2 2

n1 n2

donde:

(n1 1) s12 (n2 1) s 22


2

n1 n2 2

Los grados de libertad son gl = n1 + n2 2. Se emplea la tabla t (Apndice 7) para obtener los
valores t tabulares.

Ejemplo Una empresa desea capacitar en gestin de proyectos a todos sus

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
412

profesionales. Una muestra de 15 empleados realiz la capacitacin y


efectuaron la prueba para obtener la certificacin en dicho tema. De los 15
colaboradores que hicieron, 9 la realizaron en modalidad presencial
(asistiendo a clases) y 6 la efectuaron en lnea (a travs de internet). La
tabla muestra los resultados obtenidos en la prueba final de cada curso.

Presencial 79 88 54 81 73 56 79 64 58
En lnea 70 80 72 52 70 61

El departamento de recursos humanos desea saber si una modalidad de


estudio es ms efectiva que la otra. Utilice un nivel de significacin del
5%.

Solucin Se tienen los datos:

Modalidad presencial: n1 = 9, x1 = 70,2, s1 = 12,5


Modalidad en lnea: n2 = 6, x 2 = 67,50, s2 = 9,71

Adems, = 0,05.

Como no se especifica el valor de la diferencia, puede suponerse que va a


ser cero, por lo que = 0. Adems como x1 > x 2 , se plantean las hiptesis
como:

H0: 1 2 = 0
H1: 1 2 > 0

Tambin, podran plantearse las hiptesis como:

H0: 1 = 2
H1: 1 > 2

Debido a que las desviaciones estndar poblacionales son desconocidas y


se tienen muestras pequeas (n < 30) se usa t. Para esto se supone que las
poblaciones son normales y que 1 = 2. Se calcula:

(n1 1) s12 (n2 1) s 22 (9 1)12,5 (6 1)9,71


2 2


2
132,42
n1 n2 2 962

Luego se calcula t:

( x1 x 2 ) (70,2 67,5) 0
t 0,45
2 2 132,42 132,42

9 6
n1 n2

Aplicando la distribucin t:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
413

gl = n1 + n2 2 = 9 + 6 2 = 13

Entonces de la tabla con = 0,05, se obtiene t = 1,771.

El valor de t calculado con la frmula es menor que el t, por lo tanto, cae


en la zona de aceptacin de la hiptesis nula. Se acepta Ho con = 0,05. Se
puede decir que la diferencia entre los promedios de ambas modalidades
de estudio no es estadsticamente significativa.

Ejemplo Los datos corresponden a los tiempos, en minutos, requeridos por una
muestra de empleados de dos departamentos distintos de una empresa en
un simulacro de evacuacin de las instalaciones, esto como parte de la
preparacin que se realiza ante eventuales situaciones de emergencia,
como terremotos o incendios.

Depto. 1 5 3 4 1 3 4 9 2
Depto. 2 4 2 5 4 6 3 2

Se desea saber a un nivel de significacin del 5% si la diferencia de los


tiempos promedio de los dos grupos es significativa.

Solucin Se tienen los datos: n1 = 8, x1 = 3,875, s1 = 2,416, n2 = 7, x 2 = 3,714, s2 =


1,496, = 0,05. Como no se especifica el valor de la diferencia, puede
suponerse que va a ser cero, por lo que = 0. Adems como x1 > x 2 , se
plantean las hiptesis como:

H0: 1 = 2
H1: 1 > 2

Debido a que las desviaciones estndar poblacionales son desconocidas y


se tienen muestras pequeas (n < 30) se usa t. Para esto se supone que las
poblaciones de los tiempos son normales y que 1 = 2. Se calcula:

(n1 1) s12 (n2 1) s 22 (8 1)2,416 (7 1)1,496


2 2

2 4,176
n1 n2 2 872

Luego se calcula t:

( x1 x 2 ) (3,875 3,714) 0
t 0,152
2
2
4,176 4,176

8 7
n1 n2

Aplicando la distribucin t:

gl = n1 + n2 2 = 8 + 7 2 = 13

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
414

Entonces t = 1,771 de la tabla con = 0,05.

El valor de t calculado con la frmula es menor que el t, por lo tanto, cae


en la zona de aceptacin de la hiptesis nula. Se acepta Ho con = 0,05. Se
puede decir que la diferencia entre los promedios de los tiempos de
evacuacin de los dos departamentos no es estadsticamente significativa.

Ejercicio Un investigador desea determinar si la tasa de mortalidad anestsica se ha


incrementado en los hospitales del pas durante el ltimo ao. Toma una
de muestra de 15 casos de pacientes anestesiados durante este ltimo mes, de
revisin los cuales fallecieron por anestesia dos de ellos, y una muestra de 13 casos
de pacientes anestesiados para el mismo mes del ao pasado, y los
registros indican que falleci solamente uno. Son estos datos evidencia
suficiente para concluir que la mortalidad anestsica se ha incrementado?
Use un nivel de significancia del 1%.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Minitab para realizar la prueba de dos medias con n pequea

Ejemplo Utilice Minitab para resolver el problema: Los datos corresponden a los
tiempos, en minutos, requeridos por una muestra de empleados de dos
departamentos distintos de una empresa en un simulacro de evacuacin de
las instalaciones, esto como parte de la preparacin que se realiza ante
eventuales situaciones de emergencia, como terremotos o incendios.

Depto. 1 5 3 4 1 3 4 9 2
Depto. 2 4 2 5 4 6 3 2

Se desea saber a un nivel de significacin del 5% si la diferencia de los


tiempos promedio de los dos grupos es significativa.

Solucin Primero que todo se introducen los datos en columnas de la hoja de trabajo
de Minitab:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
415

Resulta til calcular cada una de las medias, para saber que x1 = 3,875 y
que x 2 = 3,714, y se plantean las hiptesis como:

H0: 1 = 2
H1: 1 > 2

Debido a que las desviaciones estndar poblacionales son desconocidas y


se tienen muestras pequeas (n < 30) se usa t. Para esto se da clic en el
men Estadsticas / Estadstica bsica / t de 2 muestras, y se completa el
cuadro de dilogo siguiente:

En el cuadro de dilogo anterior se marca la opcin de Muestras en


diferentes columnas, pues los datos de cada departamento se introdujeron
en una columna separada. Adems es necesario marcar la casilla Asumir
varianza iguales. Luego en el botn opciones se indica el nivel de
confianza, que sera de 95%, la diferencia de la prueba, que es cero, y el
signo de la hiptesis alternativa, que es mayor que:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
416

Al dar clic en Aceptar se obtiene en la ventana Sesin la solucin


siguiente:

Se observa que el valor calculado de t es 0,15, menor que el t, por lo


tanto, cae en la zona de aceptacin de la hiptesis nula. O bien, se usa el
valor P = 0,441. Se acepta Ho con = 0,05. Se puede decir que la
diferencia entre los promedios de los tiempos de evacuacin de los dos
departamentos no es estadsticamente significativa.

Observaciones pareadas
Suponga la situacin siguiente. Los empleados de un departamento de una empresa han
realizado un simulacro de evacuacin de las instalaciones, esto como parte de la preparacin
que se realiza ante eventuales situaciones de emergencia, como terremotos o incendios, y se
obtuvo, en una muestra de 8 empleados un tiempo medio de evacuacin de 5,25 minutos. Se
considera que ese tiempo es muy alto, por lo que se implementa un plan para informar al
personal sobre los planes de emergencias de la empresa. Luego de estas medidas se vuelve a
realizar el simulacro, y los mismos 8 empleados promedian 4,5 minutos. Aunque se presenta
una mejora, existe la duda de si esa diferencia es significativa estadsticamente. Para resolver
un problema de este tipo tambin debe realizarse una prueba de hiptesis para la diferencia de
dos medias, como en las secciones anteriores, pero con la diferencia de que en este caso las
observaciones son pareadas, es decir, la segunda muestra de datos corresponde a las mismas

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
417

unidades de estudio de la primera muestra, por lo que los datos de la primera muestra y la
segunda no son independientes.

Si las poblaciones de donde se toman las muestras no son independientes, como en el caso de
experimentos de antes y despus y muchas otras situaciones en las que los datos estn
naturalmente apareados, se usa la prueba t para la diferencia de los datos apareados.

La hiptesis nula es Ho: d = 0, porque si d que es el promedio poblacional de las diferencias


entre las dos poblaciones es cero, es porque, en promedio, las dos poblaciones son iguales.

Si se denota como x d al promedio de la diferencia de las dos muestras, la hiptesis alternativa


puede ser:

H1: d > 0 si x d > 0


H1: d < 0 si x d < 0
H1: d 0

El estadstico de prueba es:

xd
t
sd n

Y los grados de libertad son gl = n 1.

Ejemplo Los empleados de un departamento de una empresa han realizado un


simulacro de evacuacin de las instalaciones, esto como parte de la
preparacin que se realiza ante eventuales situaciones de emergencia,
como terremotos o incendios, y se obtuvo, en una muestra de 8 empleados
un tiempo medio de evacuacin de 5,25 minutos. Se considera que ese
tiempo es muy alto, por lo que se implementa un plan para informar al
personal sobre los planes de emergencias de la empresa. Luego de estas
medidas se vuelve a realizar el simulacro, y los mismos 8 empleados
promedian 4,5 minutos. La tabla muestra los tiempos antes y despus de
las medidas implementadas. Aunque se presenta una mejora, existe la duda
de si esa diferencia es significativa estadsticamente.

Antes 7 4 5 3 4 5 10 4
Despus 5 3 5 4 6 4 6 3

Se desea saber a un nivel de significacin del 5% si la diferencia de los


tiempos promedio es significativa.

Solucin Primero se calculan las diferencias, di, entre el "antes" y el "despus" para
cada una de las observaciones, o sea, se resta el dato "antes" menos el dato
"despus":

Antes 7 4 5 3 4 5 10 4
Despus 5 3 5 4 6 4 6 3

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
418

Diferencia 2 1 0 -1 -2 1 4 1

Con estas diferencias se calcula la media de las diferencias y su desviacin


estndar:

x d = 0,75
sd = 1,832

Se plantean las hiptesis:

Ho: d = 0
H1: d > 0

Se calcula t:

xd 0,75
t 1,158
sd n 1,832 8

Se tienen gl = n 1 = 8 1 = 7, con = 0,05, con una cola, por lo que, de


la tabla, t = 1,895.

El valor de t calculado es menor que el t, por lo tanto, cae en la zona de


aceptacin de la hiptesis nula. Se rechaza Ho con = 0,05. Se puede decir
que las medidas implementadas no han sido efectivas.

Ejemplo La tabla muestra las cantidades producidas por hora elaboradas por 8
operarios antes de recibir un entrenamiento y las cantidades producidas
luego de la misma.

Antes 8 8 9 6 9 7 12 12
Despus 6 10 7 11 9 12 14 8

Pruebe la afirmacin de que la capacitacin ha sido efectiva, al nivel de


significancia de 0,05.

Solucin Primero se calculan las diferencias, di: 2, 2, 2, 5, 0, 5, 2, 4.

Con estas diferencias se calcula: x d = 0,75 y sd = 3,33.

Se plantean las hiptesis:

Ho: d = 0
H1: d < 0

Se calcula t:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
419

xd 0,75
t 0,637
sd n 3,33 8

Se tienen gl = n 1 = 8 1 = 7, con = 0,05, por lo que, de la tabla de la


distribucin t se obtiene t = 1,895.

El valor de t calculado, en valor absoluto, es menor que el t, por lo tanto,


cae en la zona de aceptacin de la hiptesis nula. Se acepta Ho con =
0,05. Se puede decir que no hay evidencia estadstica suficiente para
concluir que el entrenamiento ha sido efectivo.

Ejercicio Un ingeniero desea probar la hiptesis de que los neumticos para


automviles fabricados en el pas son de tanta calidad como los
de importados. Con este fin toma una muestra de 7 vehculos los cuales sern
revisin acelerados hasta 100 km/h y luego sern frenados en seco y en cada caso
se medir la distancia de frenado. La prueba ser aplicada a los mismos 7
vehculos, primero con los neumticos nacionales y luego con los
importados. Despus de realizar las pruebas se obtuvieron los siguientes
datos (distancias de frenado en metros):

Automvil 1 2 3 4 5 6 7
Neumtico nacional 142 138 144 146 150 137 141
Neumtico importado 140 139 142 139 141 137 135

Pruebe la hiptesis al 5% de significancia.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Minitab para realizar la prueba con observaciones pareadas

Ejemplo Utilice Minitab para resolver el siguiente problema. La tabla muestra las
cantidades producidas por hora elaboradas por 8 operarios antes de recibir
un entrenamiento y las cantidades producidas luego de la misma.

Antes 8 8 9 6 9 7 12 12
Despus 6 10 7 11 9 12 14 8

Pruebe la afirmacin al nivel de 0,05, de que la capacitacin ha sido


efectiva.

Solucin En Minitab lo primero que se realiza es la introduccin de los datos en dos


columnas distintas de la hoja de trabajo:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
420

Se plantean las hiptesis:

Ho: d = 0
H1: d < 0

Para esto se da clic en el men Estadsticas / Estadstica bsica / t pareada, y


se completa el cuadro de dilogo siguiente, indicando en Muestras en
columnas las columnas en que se hallan los datos:

En el botn Opciones se indica la diferencia de la prueba, que en este caso es


cero, y el signo de la prueba, que es el menor que de la hiptesis alternativa:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
421

Luego se da clic en Aceptar y Minitab da el resultado en la ventana Sesin:

En esta salida se observa el valor de t calculado de -0,64, que es necesario


comparar con el valor t tabular. Tambin se puede hacer la prueba
empleando el valor P = 0,272. En cualquier caso, se acepta Ho con = 0,05.
Se puede decir que no hay evidencia estadstica suficiente para concluir que
el entrenamiento ha sido efectivo.

Pruebas para la diferencia de dos proporciones


Un investigador en el rea de tecnologa tiene la hiptesis de que los hombres tienden a
emplear las tecnologas de la informacin y comunicacin ms que las mujeres.
Especficamente, quiere determinar si hay diferencias entre hombres y mujeres en el uso de
las redes sociales en internet. Para este fin toma una muestra de 40 hombres y 50 mujeres, y
obtuvo que de ellos 28 hombres empleaban a diario al menos una de estas redes y 25 mujeres
tambin usaban a diario al menos una de las redes. Estos datos muestran que 28 de los 40
hombres, o sea, un 70% emplean estos medios a diario, mientras que ese porcentaje es de solo
50% entre las mujeres (25 de 50). En un problema de este tipo se desea determinar si la
proporcin de hombres que emplean a diario las redes sociales es significativamente mayor
que la de las mujeres que tambin lo hacen. Se tiene una prueba de hiptesis para la diferencia
de dos proporciones.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
422

As, cuando se trata de comparar dos proporciones, las hiptesis se pueden plantear del modo
siguiente:

Hiptesis nula:

Ho: p1 = p2

Hiptesis alternativa: Se tienen las siguientes tres posibilidades:

H1: p1 > p2
H1: p1 < p2
H1: p1 p2

Para muestras grandes el estadstico de prueba es:

p1 p 2
z
1 1
pq
n1 n2

donde se tiene que:

p1 p 2
p
n1 n2

q = 1 p.

El criterio de aceptacin o rechazo de la prueba es igual a los casos anteriores estudiados.

Ejemplo Un investigador en el rea de tecnologa quiere determinar si hay


diferencias en el uso de las redes sociales en internet entre hombres y
mujeres. Para este fin toma una muestra de 40 hombres y 50 mujeres, y
obtuvo que de ellos 28 hombres empleaban a diario al menos una de estas
redes y 25 mujeres tambin usaban a diario al menos una de las redes. Con
base en esos datos y a un nivel de significancia de 5%, puede concluirse
que existe diferencia significativa entre hombres y mujeres e n cuanto a su
frecuencia de uso de las redes sociales en internet?

Solucin Se cuenta con la siguiente informacin:

Hombres: p1 = 28/40 = 0,70


Mujeres: p2 = 25/50 = 0,50

Se plantean las hiptesis:

Ho: p1 = p2
H1: p1 > p2

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
423

Primero se calculan p y q:

p1 p 2 28 25
p 0,59
n1 n2 40 50

q = 1 0,5889 = 0,41

Luego se calcula z:

p1 p 2 0,70 0,50
z 1,92
1 1 1 1
pq 0,59 0,41
n1 n2 40 50

De la tabla se obtiene Z/2 = 1,96. Como puede verse en el grfico, el valor


de Zc cae en la zona de aceptacin de H0, por lo tanto se acepta H0 con =
0,05. La diferencia no es estadsticamente significativa. La proporcin de
hombres que emplea a diario las redes sociales en internet no es
significativamente diferente de la proporcin de mujeres que realizan esta
actividad.

Ejemplo En un lote de 500 piezas fabricadas esta semana en una lnea de


ensamblado se obtuvieron 18 con defectos. En otro lote de 400 piezas
tomadas de otra lnea de ensamblado se obtuvieron 25 defectuosas.
Determine si las lneas producen la misma proporcin de piezas con
defectos, al nivel de significacin de 5%.

Solucin Se cuenta con la siguiente informacin:

p1 = 18/500 = 0,036
p2 = 25/400 = 0,0625

Entonces se calcula p:

p1 p 2 18 25
p 0,0478
n1 n2 500 400

q = 1 0,0478 = 0,9522

Se plantean las hiptesis:

Ho: p1 = p2
H1: p1 p2

Luego se calcula z:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
424

p1 p 2 0,036 0,0625
zc 1,852
1 1 1 1
pq 0,0478 0,9522
n1 n2 500 400

De la tabla se obtiene Z/2 = 1,96. El valor de Zc cae en la zona de


aceptacin de H0, por lo tanto se acepta H0 con = 0,05. La diferencia no
es estadsticamente significativa. La proporcin de piezas con defectos
mayores es igual en las dos lneas de ensamble.

Ejercicio Un investigador cree que las mujeres emplean la tarjeta de crdito ms que
los hombres. Para probar su hiptesis toma una muestra de 90 mujeres y
de encuentra que 64 de ellas emplea regularmente la tarjeta de crdito. Por
revisin otro lado, una muestra de 120 hombres arroj que 76 empleaban la tarjeta
de crdito con regularidad. Tiene razn el investigador? Utilice un nivel
de significancia del 1%.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Minitab para la prueba de dos proporciones

Ejemplo Utilice Minitab para resolver el problema siguiente: En un lote de 500


piezas fabricadas esta semana en una lnea de ensamblado se obtuvieron 18
con defectos. En otro lote de 400 piezas tomadas de otra lnea de
ensamblado se obtuvieron 25 defectuosas. Determine si las lneas
producen la misma proporcin de piezas con defectos, al nivel de
significacin de 5%.

Solucin Se cuenta con la siguiente informacin:

p1 = 18/500 = 0,036
p2 = 25/400 = 0,0625

Entonces, se plantean las hiptesis:

Ho: p1 = p2
H1: p1 p2

Ahora se da clic en el men Estadsticas / Estadstica bsica / 2


proporciones, y se completa el cuadro de dilogo siguiente, indicando en
Datos resumidos los valores correspondientes:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
425

Luego en el botn Opciones se indica el nivel de confianza, el signo de la


prueba (mayor, menor o diferente en la hiptesis alternativa) y se debe
marcar la casilla Utilice el clculo agrupado de p para la prueba:

Despus se da clic en Aceptar y la salida se obtiene en la ventana sesin:

Se observa el valor de z de -1,85, que cae en la zona de aceptacin de H0, o


bien, se emplear el valor P = 0,064, que es mayor que el nivel de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
426

significancia de 0,05. Por lo tanto, se acepta concluye que la diferencia en


la proporcin de piezas con defectos mayores no es estadsticamente
significativa.

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

1. Un investigador desea evaluar si los pesos al nacer de los recin nacidos en una zona
urbana tienen diferencia significativa con respecto a una zona rural cercana. En una muestra
de 77 recin nacidos de la zona urbana se obtuvo una media de 3317 gramos con una
desviacin estndar de 415 gramos, mientras que en una muestra de 51 recin nacidos de la
zona rural se obtuvo una media de 3257 gramos con una desviacin estndar de 508 gramos.
A qu conclusin puede llegarse a un nivel de significancia del 5%?

2. La exposicin al slice se puede dar en distintas actividades productivas y puede generar


ciertos problemas en los pulmones. Se ha tomado una muestra de 60 trabajadores que han
laborado en minera. Se ha determinado que 40 de ellos se han visto expuestos al slice.
Adems, de los 60 trabajadores se encontr que 36 presentaban fibrosis pulmonar. De esos 36,
22 haban tenido exposicin al slice. Con respecto a los trabajadores que presentan fibrosis
pulmonar, puede concluirse, al 1% de significancia, que la proporcin de trabajadores que
han sido expuestos al slice es la misma que la de los trabajadores que no han sido expuestos a
esa sustancia?

3. Un investigador desea conocer cmo evoluciona el peso de las mujeres luego de la


gestacin. Para ello toma una muestra de 10 mujeres y determina su peso un ao antes de la
gestacin, obteniendo los siguientes resultados (en kilogramos): 60, 56, 80, 67, 62, 65, 52, 59,
51 y 53. Posteriormente determina su peso un ao despus de la gestacin y obtiene los
valores siguientes (en kilogramos, en el mismo orden anterior): 62, 59, 89, 62, 60, 72, 61, 66,

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
427

58 y 57. Puede concluirse, a un nivel de significancia del 5%, que el peso promedio de las
mujeres es mayor un ao despus de la gestacin?

4. Una compaa de productos nutricionales desea determinar qu tan efectivo es un


suplemento para reducir de peso. Una muestra de 16 mujeres ha participado en el estudio.
Antes de empezar a consumir el suplemento los pesos de las mujeres fueron (en kilogramos):
60, 75, 82, 96, 105, 116, 79, 83, 90, 81, 65, 77, 84, 85, 101 y 99. Luego de tres meses de
consumo del producto y de seguimiento por parte de los profesionales de la compaa se
volvieron a tomar los pesos, que fueron los siguientes (en kilogramos, en el mismo orden
anterior): 56, 74, 80, 86, 107, 120, 74, 80, 80, 78, 63, 79, 84, 82, 99 y 98. Puede concluirse, a
un nivel de significancia del 1%, que realmente el producto ayuda a reducir el peso de las
mujeres?

5. Un arquitecto considera que actualmente las casas tienen un rea construida inferior a la de
hace dos o ms dcadas. En una muestra de 15 viviendas construidas en el transcurso de los
dos ltimos aos se encontr un rea construida promedio de 92 metros cuadrados y una
desviacin estndar de 30 metros cuadrados. En otra muestra de 20 viviendas construidas
hace dos o ms dcadas se encontr un rea construida promedio de 132 metros cuadrados y
una desviacin estndar de 45 metros cuadrados. A un nivel de significancia de 5%, qu
puede concluirse que ha habido un cambio significativo en las dimensiones de las viviendas?

6. El jefe de produccin de una planta de productos electrnicos desea estimar la produccin


diaria promedio de un cierto producto. La produccin diaria durante 7 das elegidos al azar
durante el trimestre pasado es (en unidades): 415, 425, 398, 456, 384, 410, 440. La gerencia
considera que con los mismos recursos podran producirse al menos 450 unidades al da, por
lo que implementa algunos cambios para incrementar la productividad en este trimestre. En
una nueva muestra de 9 das elegidos al azar se obtuvieron los siguientes niveles de
produccin diarios: 425, 435, 375, 486, 394, 440, 460, 455, 410. Con estos datos, con un nivel
de significancia de 0,025, podra decirse que los cambios fueron efectivos?

7. Un ingeniero ha recopilado datos sobre la vida til de filtros de gasolina de dos marcas
distintas. Los datos son los siguientes (en miles de kilmetros):

Marca 1 12 14 16 15 10 12 13 15 16
Marca 2 13 15 17 17 12 14 13 18 15

Pruebe la hiptesis de que la marca 2 tiene una vida til que excede en al menos 2 mil
kilmetros a la vida til de la marca 1. Use un nivel de significancia de 5%.

8. Dos profesores de estadstica discuten sobre el efecto del uso de un software en la


enseanza de la estadstica. Uno de ellos cree que es mejor no utilizar el software, pues as los
estudiantes se concentrarn ms en los conceptos y los procedimientos. El segundo profesor
piensa que empleando un software es mejor, pues as los estudiantes se esfuerzan ms en la
formulacin de los problemas y en la interpretacin de los resultados. Para determinar quin
tiene la razn, deciden aplicar el mismo examen final, primero a un grupo sin el uso del
software y luego a un segundo que s lo utilice. El primer grupo estaba compuesto por 14
estudiantes, los cuales obtuvieron una calificacin promedio de 73 puntos y una desviacin
estndar de 12 puntos. El segundo grupo estaba compuesto por 15 estudiantes y obtuvieron un
promedio de 77 puntos y una desviacin estndar de 17 puntos. A qu conclusin puede
llegarse a un nivel de significancia del 10%?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
428

9. En una muestra de 10 distintas acciones de empresas tecnolgicas elegidas al azar entre


todas las acciones que se negocian en la Bolsa de Valores de Nueva York se obtuvo una razn
promedio de precio/utilidades (p/u) de $12,89 con una desviacin estndar de $6,98. En otra
muestra de 12 distintas acciones de empresas industriales elegidas al azar entre todas las
acciones que se negocian en la Bolsa de Valores de Nueva York se obtuvo una razn
promedio de precio/utilidades (p/u) de $9,92 con una desviacin estndar de $7,15. Es esta
evidencia suficiente para concluir, a un nivel de significancia del 5%, que la tasa
precio/utilidades promedio para las empresas tecnolgicas es superior a la razn obtenida por
las empresas industriales?

10. Un contador est realizando una auditora de los cheques extendidos por una compaa.
En una muestra de 15 cheques para agosto de este ao se obtuvieron los siguientes montos, en
miles dlares:

15, 17, 22, 8, 4, 2, 16, 6, 8, 14, 15, 25, 20, 5, 6

11. En una muestra de 10 cheques para agosto del ao pasado se obtuvieron los montos
siguientes:

8, 12, 9, 11, 12, 10, 9, 4, 6, 8

Pruebe, al 5% de significancia, si el monto medio de los cheques se ha mantenido al comparar


estos dos periodos.

12. Una persona considera que los asiticos poseen un cociente intelectual promedio superior
al de los habitantes de nuestro pas. Los siguientes datos corresponden a una muestra de
asiticos que aplicaron un test para medir su cociente intelectual: 102, 100, 97, 101, 100, 113,
126, 86, 85, 106, 99, 130, 79, 110, 117, 102, 113, 102. Los siguientes datos corresponden a
una muestra de nacionales que aplicaron un test para medir su cociente intelectual: 95, 99,
102, 96, 103, 96, 97, 98, 112, 101, 94, 120, 97, 99, 97, 98, 110, 101, 98, 102, 107. Indicar
estos datos que esa persona tiene razn, al nivel de significancia de 5%?

13. Los siguientes datos muestran el nmero promedio semanal de horas de uso internet de
estudiantes de secundaria para hacer trabajos acadmicos en una muestra de 8 estudiantes de
colegios pblicos y de 7 estudiantes de colegios privados:

Colegios pblicos 2,0 2,5 4,0 3,5 1,0 4,0 5,0 4,5
Colegios privados 1,5 2,5 5,0 3,5 4,0 2,0 3,5 5,5

Puede concluirse, a un nivel de significancia del 5%, que existen diferencias entre los niveles
de uso de internet de estudiantes de secundaria para hacer trabajos acadmicos segn el tipo
de colegio?

14. Una investigadora ha aplicado un instrumento estandarizado para la medicin de los


aprendizajes en preescolares de 5 aos. La prueba fue desarrollada por la investigadora y
utiliza una seleccin de aprendizajes esperados y cubre distintos mbitos, como la formacin
social, la comunicacin, la relacin con el medio natural, entre otros. Al final se obtiene un
puntaje total luego de la aplicacin de todos los tems de la prueba. Posteriormente se aplic a

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
429

la misma muestra una segunda prueba para la medicin de los aprendizajes en preescolares de
5 aos. Los siguientes son los resultados de ambas pruebas:

Nio 1 2 3 4 5 6 7 8 9
Prueba 1 60 53 47 29 38 45 56 49 42
Prueba 2 110 85 88 66 60 67 72 78 76

Puede considerarse que existe diferencia significativa entre los dos resultados? Use un nivel
de significancia del 1%.

15. Una institucin realiz un plan de capacitacin entre mujeres emprendedoras de una zona
marginal del pas. El objetivo es que estas mujeres lograran incrementar los ingresos de sus
microempresas. Luego de implementadas las capacitaciones se compararon los ingresos de
una muestra de 12 microempresas y se registraron los siguientes ingresos (en dlares al mes):

Empresaria 1 2 3 4 5 6 7 8 9 10 11 12
Antes 320 290 421 510 210 402 625 560 360 431 506 505
Despus 340 285 475 510 210 500 631 560 365 431 525 619

Hubo un aumento significativo en los niveles de ingresos de las microempresarias de la


zona? Utilice el nivel de significancia del 5%.

16. La cefixima es un antibitico de cefalosporina usado para tratar infecciones causadas


ciertas bacterias. En un estudio se analiz la concentracin srica mxima (Cmax) alcanzada
con una solucin oral y se compar con la concentracin srica mxima alcanzada con
cpsulas. El estudio incluy a 16 voluntarios masculinos sanos con edades de entre 21 y 43
aos, los cuales no haban consumido ningn frmaco durante los 7 das previos al estudio.
Ocho de ellos recibieron durante 4 semanas, con un intervalo de una semana entre cada dosis,
200 mg del frmaco como solucin oral. Los otros ocho recibieron en el mismo rgimen 200
mg de la droga como una cpsula nica. En cada fase y a intervalos regulares luego de
administrada la dosis se tomaron muestras de sangre y orina, en las cuales se determin la
concentracin de cefixima mediante cromatografa lquida de alta resolucin. Para la solucin
oral se encontr un promedio de 3,22 g/ml con una desviacin estndar de 0,88 g/ml. Para
las cpsulas el promedio fue 2,92 g/ml con una desviacin estndar de 0,86 g/ml. Puede
considerarse que existe diferencia en la concentracin srica mxima entre ambas
presentaciones del antibitico? Use un nivel de significancia del 5%.

17. Una compaa ha desarrollado dos nuevos motores de gasolina. Para valorar su consumo
de combustible efecta 15 recorridos para cada motor. El primer motor consumi en
promedio 8,7 galones de gasolina por minuto con una desviacin estndar de 1,2 galones. El
segundo motor consumi en promedio 9,6 galones de gasolina por minuto con una desviacin
estndar de 2,1 galones. Qu se podra afirmar, con un 1% de significancia, acerca de la
diferencia en el consumo medio de combustible de estos dos motores?

18. En una muestra de 6 distintas acciones de empresas tecnolgicas elegidas al azar entre
todas las acciones que se negocian en la Bolsa de Valores de Nueva York se obtuvieron las
siguientes razones precio/utilidades (p/u) antes de la crisis financiera (en dlares): 12, 15, 17,
18, 16, 10. Luego de la crisis financiera se tomaron los datos de la razn precio/utilidad (p/u)
para esas mismas 6 empresas obteniendo los siguientes datos (en dlares y en el mismo orden
anterior): 9, 19, 12, 7, 25, 8. Es esta evidencia suficiente para concluir, a un nivel de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
430

significancia del 5%, que la tasa precio/utilidades promedio despus de la crisis es igual a la
que se tena antes de la crisis?

19. Segn un estudio el 25% de las viviendas de zonas urbanas del pas estn en estado malo
o regular y que ese porcentaje se incrementa a 35% en las zonas rurales. Si los tamaos de
muestra fueron de 40 y 50 viviendas, respectivamente, pueden considerarse que hay
diferencias significativas en el estado de la vivienda entre ambas zonas? Use un nivel de
significancia de 1%.

20. Un consultor en el rea de tecnologas de informacin considera que las empresas


pequeas pueden ser ms giles que las empresas grandes a la hora de adoptar nuevas
tecnologas. Para probar su hiptesis toma una muestra de 12 empresas pequeas y determina
que 3 estaran en capacidad de reemplazar sus equipos tecnolgicos en un plazo corto. En otra
muestra de 17 empresas grandes encuentra que 3 podran reemplazar sus equipos en ese
mismo plazo. Respaldan estos datos la creencia del consultor o podra argumentarse que no
son evidencia suficiente? Utilice un nivel de significancia del 2%.

21. El encargado de reclutamiento y seleccin de personal de una empresa considera que las
habilidades sociales, como la buena comunicacin y un adecuado manejo de los conflictos,
son fundamentales para lograr un buen desempeo en la compaa, y considera que hombres y
mujeres no desarrollan por igual estas destrezas. En las entrevistas y pruebas que aplican a los
candidatos para los puestos que demanda la empresa se evalan estas destrezas. En una
muestra aleatoria de 35 hombres que aplicaron para algn puesto en la empresa se obtuvo que
10 de ellos tuvieron una evaluacin satisfactoria y en una muestra aleatoria de 50 mujeres que
aplicaron para algn puesto en la empresa 18 presentaron una evaluacin satisfactoria en este
sentido. Apoyan estos datos la apreciacin del encargado de reclutamiento y seleccin de
personal de esta empresa? Utilice un nivel de significancia de 1%.

22. En un pas dos candidatos presidenciales aparecen en las encuestas con preferencias entre
los electores muy similares. En una encuesta realizada entre 1000 electores uno de los
candidatos obtuvo la preferencia de 480 personas, mientras que en otra encuesta con una
muestra de 1200 personas obtuvo la intencin de voto de 500 votantes. Existe diferencia
significativa entre los resultados de las dos encuestas? Utilice un nivel de significancia de 5%.

23. Hace un ao 120 periodistas de una muestra de 250 indicaron que no perciban que
hubiera importantes amenazas a la libertad de prensa en el pas. Luego de la aprobacin de
una ley que regula las publicaciones en medios digitales 315 periodistas de una muestra de
400 perciban la existencia de amenazas a la libertad de prensa. Podra considerarse que la
opinin de los periodistas ha cambiado? Use un nivel de significancia del 2%.

24. Una empresa pauta publicidad en televisin todos los meses. Recientemente ha lanzado
una campaa muy agresiva, sin embargo la gerencia cree que esta campaa est impactando
principalmente a los consumidores ms jvenes. Para comprobar esta creencia de la gerencia
se han tomado dos muestras, una de 80 consumidores de menos de 40 aos y otra de 90
consumidores de 40 aos o ms. El 58% de los consumidores de menos de 40 aos dijeron
que recordaban el anuncio de la empresa, mientras que solo el 42% de los consumidores de 40
aos o ms recordaban el anuncio. Puede considerarse, al 1% de significancia, que existe
diferencia entre los dos segmentos de consumidores?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
431

25. Un asesor empresarial considera que los proyectos empresariales que implican la
participacin de miembros de ms de un departamento de la empresa fracasan con ms
frecuencia que aquellos que se realizan a lo interno de un departamento de la empresa. En una
muestra de 40 proyectos del primer tipo fracasaron 15, y en una muestra de 30 proyectos del
segundo tipo, fracasaron 9. A un nivel de significancia del 5%, a qu conclusin podra
llegarse?

26. Un fabricante de helados desarroll hace un tiempo una lnea de productos con menor
contenido de caloras, pues pensaba abarcar el mercado de personas con problemas de
obesidad. Sin embargo, muchas personas que no poseen problemas de obesidad tambin
compran este tipo de producto con regularidad. La empresa se cuestiona si su participacin de
mercado en el mercado de personas con problemas de obesidad es realmente mayor que en el
mercado de personas que no poseen este problema. Se efectu un estudio en el que se
entrevist a 80 personas con obesidad y 35 dijeron que consuman este producto con
frecuencia. Tambin se entrevist a 130 personas sin obesidad y 40 de ellas indicaron que
consuma el producto con frecuencia. A qu conclusin puede llegarse al 2% de
significancia?

27. Un economista sostiene que el monto del ingreso del deudor no es un factor que influya en
una mayor morosidad a la hora de pagar las deudas. Para comprobar su hiptesis toma una
muestra de deudores de un banco. Entre 60 deudores de bajo ingreso encontr que 5 de ellos
estaban atrasados en el pago de su deuda. En una muestra de 70 deudores de alto ingreso se
encontr 8 tenan algn grado de morosidad en sus obligaciones con el banco. Son estos
datos evidencia suficiente para darle la razn al economista? Use un nivel de significacin del
1%.

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de
empleados de la primera empresa, que oyen msica, y se midi su productividad. Tambin se
tom una muestra de empleados de la segunda empresa, que no oyen msica, y se midi la
productividad empleando los mismos mtodos que en la primera empresa.
En un problema como este, la hiptesis nula se podra expresar como, si 1 es la
productividad media en la primera empresa y 2 es la productividad media en la segunda
empresa:
(a) H1: 1 = 2 (b) H0: 1 > 2
(c) H0: 1 - 2 = 0 (d) H0: 1 2

2. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de
empleados de la primera empresa, que oyen msica, y se midi su productividad. Tambin se

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
432

tom una muestra de empleados de la segunda empresa, que no oyen msica, y se midi la
productividad empleando los mismos mtodos que en la primera empresa.
En un problema como este, la hiptesis alternativa se podra expresar como, si 1 es la
productividad media en la primera empresa y 2 es la productividad media en la segunda
empresa:
(a) H0: 1 > 2 (b) H1: 1 - 2 > 0
(c) H1: 1 = 2 (d) H1: 1 2

3. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de
empleados de la primera empresa, que oyen msica, y se midi su productividad. Tambin se
tom una muestra de empleados de la segunda empresa, que no oyen msica, y se midi la
productividad empleando los mismos mtodos que en la primera empresa.
En este problema, si las muestras son grandes y las varianzas poblacionales conocidas, se
emplea el siguiente estadstico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2 2 sd n

n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2

4. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de
empleados de la primera empresa, que oyen msica, y se midi su productividad. Tambin se
tom una muestra de empleados de la segunda empresa, que no oyen msica, y se midi la
productividad empleando los mismos mtodos que en la primera empresa.
En este problema, si las muestras son pequeas y las varianzas poblacionales desconocidas, se
emplea el siguiente estadstico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2 2 sd n

n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2

5. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
433

elaboradas por hora por operario. Se tom una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
Con base en estos datos se puede calcular el estadstico de prueba:
(a) z = 2,09 (b) z = 1,96
(c) t = 2,09 (d) Ninguna de las anteriores

6. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
En este problema, el valor crtico o tabular para hacer la prueba es, al 5% de significancia:
(a) z = 2,09 (b) z = 1,645
(c) t = 1,96 (d) Ninguna de las anteriores

7. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
En este problema, es correcto que, al 5% de significancia:
(a) Se rechaza la hiptesis alternativa porque |zc| > |zt|
(b) Se acepta la hiptesis nula porque |zc| > |zt|
(c) Se rechaza la hiptesis nula porque |zc| > |zt|
(d) Ninguna de las anteriores

8. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 50
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 60 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente. Al realizar la prueba de hiptesis el gerente de la
primera empresa indica que "hay evidencia muestral suficiente para considerar que la msica
s tiene efecto positivo sobre la productividad", y el gerente de la segunda empresa expresa
que "la evidencia muestral seala que la diferencia entre las productividades medias entre las
dos empresas es significativa". Con respecto a estas dos afirmaciones, es correcto que, al 5%
de significancia:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
434

(a) Ambas son verdaderas (b) Ambas son falsas


(c) Solo el primer gerente tiene razn (d) Solo el segundo gerente tiene razn

9. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que los
operarios que realizan tareas repetitivas son ms productivos cuando oyen msica empleando
algn aparato con audfonos. El gerente de produccin de otra empresa no cree que la msica
genere ese efecto positivo. Para determinar quin tiene la razn se tom una muestra de 10
empleados de la primera empresa y se obtuvo una productividad media de 40 unidades
elaboradas por hora por operario. Se tom una muestra de 15 empleados de la segunda
empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se conoce
que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la primera y
la segunda empresa, respectivamente.
Con base en estos datos se puede calcular el estadstico de prueba:
(a) t = 2,09 (b) z = 2,09
(c) t = 0,92 (d) Ninguna de las anteriores

10. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que
los operarios que realizan tareas repetitivas son ms productivos cuando oyen msica
empleando algn aparato con audfonos. El gerente de produccin de otra empresa no cree
que la msica genere ese efecto positivo. Para determinar quin tiene la razn se tom una
muestra de 10 empleados de la primera empresa y se obtuvo una productividad media de 40
unidades elaboradas por hora por operario. Se tom una muestra de 15 empleados de la
segunda empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se
conoce que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la
primera y la segunda empresa, respectivamente.
En este problema, el valor crtico o tabular para hacer la prueba es, al 5% de significancia:
(a) t = 1,714 (b) z = 1,96
(c) t = 1,645 (d) Ninguna de las anteriores

11. Considere la siguiente situacin: El gerente de produccin de una fbrica considera que
los operarios que realizan tareas repetitivas son ms productivos cuando oyen msica
empleando algn aparato con audfonos. El gerente de produccin de otra empresa no cree
que la msica genere ese efecto positivo. Para determinar quin tiene la razn se tom una
muestra de 10 empleados de la primera empresa y se obtuvo una productividad media de 40
unidades elaboradas por hora por operario. Se tom una muestra de 15 empleados de la
segunda empresa y se obtuvo una productividad media de 36 unidades elaboradas por hora. Se
conoce que las desviaciones estndar poblacionales son de 8 y 12 unidades por hora para la
primera y la segunda empresa, respectivamente.
En este problema, es correcto que, al 5% de significancia:
(a) Se acepta la hiptesis alternativa porque |tc| < |tt|
(b) Se acepta la hiptesis nula porque |tc| < |tt|
(c) Se rechaza la hiptesis nula porque |tc| < |tt|
(d) Ninguna de las anteriores

12. Con respecto a los problemas cuando n1 o n2, o ambas, son menores de 30 y se
desconocen las varianzas poblacionales, se afirma que:
12 22
A. Se usa el estadstico z ( x1 x 2 )
n1 n2

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
435

B. Se usa el estadstico t si se puede suponer que las poblaciones son normales y que
1 = 2 = .

Con respecto a estas dos afirmaciones, es correcto que:


(a) Ambas son verdaderas (b) Ambas son falsas
(c) Solo la afirmacin A es verdadera (d) Solo la afirmacin B es verdadera

13. Con respecto a los problemas cuando n1 o n2, o ambas, son menores de 30 y se
desconocen las varianzas poblacionales, se afirma que:
(n1 1) s12 (n2 1) s 22
A. Se calcula la varianza como 2

n1 n2 2
B. Los grados de libertad son gl = n1 + n2 2.

Con respecto a estas dos afirmaciones, es correcto que:


(a) Ambas son verdaderas (b) Ambas son falsas
(c) Solo la afirmacin A es verdadera (d) Solo la afirmacin B es verdadera

14. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:

Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8

En este problema, la hiptesis nula se podra expresar como, si 1 es la evaluacin media de


los adultos y 2 es la evaluacin media de los nios:
(a) H1: 1 = 2 (b) H0: 1 > 2
(c) H0: 1 - 2 = 0 (d) H0: 1 2

15. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:

Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8

En este problema, la hiptesis alternativa se podra expresar como, si 1 es la evaluacin


media de los adultos y 2 es la evaluacin media de los nios:
(a) H1: 1 < 2 (b) H1: 1 = 2
(c) H0: 1 - 2 < 0 (d) H1: 1 2

16. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:

Adultos 8 5 6 4 5 6 7 3

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
436

Nios 9 10 7 8 9 6 8 6 8

En este problema, se puede calcular el estadstico de prueba:


(a) |z| = 3,32 (b) t = 1,771
(c) t = -3,32 (d) Ninguna de las anteriores

17. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:

Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8

En este problema, se puede calcular el valor crtico o tabular, al 5% de significancia:


(a) z = -1,645 (b) t = -1,753
(c) t = -1,746 (d) Ninguna de las anteriores

18. Este mes se ha estrenado una nueva pelcula de dibujos animados en los cines del pas. Se
desea saber si los adultos y los nios valoran de igual manera la pelcula. Por lo tanto, se pidi
a una muestra de adultos evaluar la pelcula en una escala de 0 a 10, donde 0 es el mnimo y
10 el mximo. Lo mismo se aplic a una muestra de nios. Los resultados obtenidos fueron:

Adultos 8 5 6 4 5 6 7 3
Nios 9 10 7 8 9 6 8 6 8

En este problema, es correcto que, al 5% de significancia:


(a) Se rechaza la hiptesis alternativa porque |tc| > |tt|
(b) Se acepta la hiptesis nula porque |tc| > |tt|
(c) Se rechaza la hiptesis nula porque |tc| > |tt|
(d) Ninguna de las anteriores

19. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):

Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8

En este problema se puede plantear la hiptesis nula, donde d es la media de las diferencias
entre los tiempos con y sin uso del celular:
(a) Ho: d = 0 (b) Ho: d 0
(c) H1: d = 0 (d) Ninguna de las anteriores

20. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
437

cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):

Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8

En este problema no se puede plantear la hiptesis alternativa del modo siguiente, donde d es
la media de las diferencias entre los tiempos con y sin uso del celular:
(a) H1: d < 0 (b) H1: d 0
(c) H1: d > 0 (d) Ninguna de las anteriores

21. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):

Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8

La desviacin estndar de las diferencias es:


(a) 1,033 (b) 1,067
(c) 2,2 (d) Ninguna de las anteriores

22. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):

Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8

En este problema se emplea el siguiente estadstico de prueba:


(a) z = 6,74 (b) t = 2,12
(c) t = 6,74 (d) Ninguna de las anteriores

23. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
438

Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8

En este problema, es correcto que, al 5% de significancia:


(a) Se rechaza la hiptesis alternativa porque |tc| > |tt|
(b) Se acepta la hiptesis nula porque |tc| > |tt|
(c) Se rechaza la hiptesis nula porque |tc| > |tt|
(d) Ninguna de las anteriores

24. Un instituto que trabaja en la investigacin de riesgos analiz el tiempo que las personas
duran en cruzar una calle cuando hablan por telfono celular o envan mensajes de texto y
cuando no lo hacen, pues se considera que distraerse puede incrementar la probabilidad de ser
atropellado. Se seleccion una calle y una muestra de 10 personas hicieron la prueba de cruzar
la calle usando su celular y luego volvieron a hacer la prueba sin emplear ese dispositivo. Los
resultados obtenidos son los siguientes (tiempo en segundos para cruzar la calle):

Persona 1 2 3 4 5 6 7 8 9 10
Usando celular 6 8 10 9 7 12 8 9 15 9
Sin usar celular 5 6 7 6 5 8 7 7 12 8

En este problema, se puede concluir que, al 5% de significancia:


(a) No existe diferencia significativa entre los tiempos promedio de los peatones que cruzan la
calle usando el telfono celular y los que no lo hacen.
(b) Los tiempos promedio de los peatones que cruzan la calle usando el telfono celular y los
que no lo hacen son iguales.
(c) Los tiempos promedio de los peatones que cruzan la calle usando el telfono celular son
menores que los tiempos de los que no lo hacen.
(d) Ninguna de las anteriores

25. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema, la hiptesis nula se puede plantear como:
(a) H1: P1 = P2 (b) H0: P1 > P2
(c) H0: P1 - P2 = 0 (d) H0: P1 P2

26. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
439

En este problema, si P1 es la proporcin de usuarios actuales que compraran el nuevo modelo


en la semana del lanzamiento y P2 es la proporcin de no usuarios actuales que compraran el
nuevo modelo en la semana del lanzamiento, la hiptesis alternativa se puede plantear como:
(a) H1: P1 = P2 (b) H1: P1 > P2
(c) H1: P1 - P2 < 0 (d) H1: P1 P2

27. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema, si las muestras son grandes, se emplea el siguiente estadstico de prueba:
( x x2 ) xd
(a) t 1 (b) t
2
2
sd n

n1 n2
p1 p 2 ( x1 x 2 )
(c) z (d) z
1 1 12 22
pq
n1 n2 n1 n2

28. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema se emplea el siguiente estadstico de prueba:
(a) z = 1,07 (b) z = 1,96
(c) z = 1,10 (d) Ninguna de las anteriores

29. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del
lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema el clculo agrupado de p da por resultado:
(a) 0,25 (b) 0,2429
(c) 0,4857 (d) Ninguna de las anteriores

30. Un fabricante de telfonos celulares lder en el mercado ha anunciado que pronto lanzar
un nuevo modelo de su principal producto. La empresa realiz un estudio en el que descubri
que, en una muestra de 70 usuarios actuales de sus productos, que 20 compraran el nuevo
modelo en la misma semana del lanzamiento. En una muestra de 50 consumidores que no son
usuarios de sus productos, 10 compraran el nuevo modelo en la misma semana del

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
440

lanzamiento. Constituyen estos datos evidencia suficiente para considerar que los usuarios
actuales tienen mayor disposicin para comprar el nuevo modelo?
En este problema, al 1% de significancia, se puede concluir con respecto a la diferencia entre
la proporcin de clientes actuales que compraran el nuevo modelo y la proporcin de los que
no son usuarios actuales que tambin compraran el nuevo modelo que:
(a) Existe diferencia significativa entre ambas proporciones.
(b) Ambas proporciones son iguales.
(c) La evidencia muestral no indica que haya diferencia significativa.
(d) Ninguna de las anteriores

Respuestas a los ejercicios de seleccin nica:

1. c 2. b 3. d 4. a 5. a
6. b 7. c 8. a 9. c 10. a
11. b 12. d 13. a 14. c 15. a
16. c 17. b 18. c 19. a 20. d
21. a 22. c 23. c 24. d 25. c
26. b 27. c 28. a 29. a 30. c

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
441

12 .

Correlacin lineal y regresin lineal


simple
OBJETIVOS:
Al concluir el captulo, ser capaz de:
1. Aplicar el concepto de correlacin para analizar la relacin dos variables
2. Calcular e interpretar el coeficiente de correlacin lineal simple
3. Distinguir los conceptos de correlacin y causalidad
4. Calcular e interpretar los coeficientes de la recta de regresin lineal simple
5. Calcular e interpretar el coeficiente de determinacin
6. Emplear la ecuacin de la recta de regresin para interpolar y extrapolar nuevos valores de
las variables del modelo

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
442

Asociacin estadstica entre dos variables


Con frecuencia aparecen en los distintos medios de comunicacin noticias sobre estudios
realizados en diferentes partes del mundo. Muchas veces estos estudios analizan si dos o ms
variables tienen algn tipo de relacin entre ellas. Por ejemplo:

Se investiga si las personas que tienen un elevado consumo de sal en las comidas tambin
tienen una presin arterial ms elevada.
Se trata de encontrar si un fenmeno como la desigualdad social se relaciona con mayores
niveles de inseguridad y criminalidad en los pases.
Se examina si el ingreso de la economa est relacionado con mayores niveles de consumo
y ahorro.

Ahora bien, a nivel de la empresa y la industria tambin hay muchas relaciones que los
tomadores de decisiones desean estudiar:

La relacin entre el nivel de un puesto (medida en puntos segn el grado de


responsabilidad del cargo, los riesgos, etc.) y la remuneracin que en el mercado laboral
se ofrece.
El efecto que tienen los cambios en los precios sobre la cantidad demandada de los
productos que una empresa vende.
El impacto que tienen las tasas de inters sobre las ventas de bienes como los vehculos y
las viviendas, que generalmente las personas compran a crdito.
La relacin entre la cantidad de horas extra que trabajan los operarios de una fbrica y el
nmero de defectos encontrados en la produccin que ellos realizan.

Segn el nivel de medicin de las variables en cuestin as se mide el grado de la asociacin


estadstica entre ellas. En este captulo se trabajar nicamente con variables cuantitativas, ya
sea que se midan en escala de intervalo o de razn, y no variables cualitativas.

Cuando se tienen dos variables cuantitativas resulta necesario conocer cmo es la relacin
establecida en cuanto a dos aspectos principales:

1. La naturaleza o direccin de la asociacin entre las variables, o sea, determinar si


cuando una variable se incrementa, la otra tambin aumenta (relacin directa), o si cuando
una se incrementa, la otra disminuye (relacin inversa). Observe a continuacin en la
grfica de la izquierda, como conforme el valor de la variable x es mayor, tambin se
incrementa la variable y, lo cual corresponde a una relacin directa, como puede ser el
caso entre el ingreso y el consumo, pues a mayor ingreso, tambin se da un mayor
consumo, y viceversa. Del lado izquierdo, se observa que conforme aumenta la variable x
se reduce la variable y, lo cual corresponde a una relacin inversa, como puede ser el caso
entre el precio y la cantidad demandada de un producto, pues a mayor precio, se espera
una cantidad demandada menor, y viceversa.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
443

Relacin directa entre x y y. Relacin inversa entre x y y.

2. La fuerza o intensidad de la asociacin entre las variables, es decir, si generalmente


mayores cambios en los valores de una de las variables se asocian con cambios mayores
(o menores) en valores de la otra variable (relacin fuerte), o si los cambios en una de las
variables no se relacionan en forma consistente con cambios en la otra variable (relacin
dbil). A continuacin, en la grfica de la izquierda se observa que los puntos siguen una
clara relacin lineal, pues si se trazara una recta en medio de ellos, estos quedaran
bastante cercanos a dicha recta, por lo que hay una fuerte asociacin lineal entre las
variables. En el caso de la grfica de la derecha los puntos estn mucho ms dispersos, por
lo que la relacin entre las dos variables es dbil.

Relacin fuerte entre x y y. Relacin dbil entre x y y.

Correlacin lineal
Tal como se expuso anteriormente, es posible establecer qu tanto es el grado de asociacin
estadstica entre dos variables. Generalmente se trata de determinar el grado de correlacin
lineal entre dos variables, es decir, qu tanto se aproxima la relacin entre las variables a una
lnea recta. Para ilustrar este tema emplearemos un caso hipottico.

Ejemplo Un investigador desea analizar la relacin entre el nmero de horas que un


grupo de estudiantes dedica a prepararse para un examen de estadstica y la
nota que cada uno de ellos obtiene en dicha prueba. Cules son las
variables de este problema y cules son los datos que el investigador podra
buscar?

Solucin En este caso el investigador analiza la relacin entre las dos variables
mencionadas, nmero de horas que un grupo de estudiantes dedica a
prepararse para un examen de estadstica (variable x) y la nota que cada uno
de ellos obtiene en dicha prueba (variable y).

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
444

El investigador debe tomar una muestra de estudiantes y registrar los valores


de ambas variables. Suponga que los resultados de observar ocho estudiantes
se resumen en la tabla (las notas estn expresadas en una escala de 0 a 100):

Nmero de estudiante Horas de estudio (X) Calificacin en el examen (Y)


1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50

En problemas como el anterior el objetivo del investigador es observar si existe correlacin


entre las dos variables se correlacionan, o sea, determinar estas dos variables se relacionan en
algn grado.

CORRELACIN Relacin recproca entre dos variables.

Una herramienta til para observar si existe algn grado de correlacin entre dos variables
cuantitativas es el diagrama o grfico de dispersin. En este grfico cada eje representa una
variable y se dibujan puntos que asocian cada valor de x con su correspondiente valor de y.

DIAGRAMA DE DISPERSIN Grfico que utiliza las coordenadas cartesianas para


mostrar la relacin entre dos variables cuantitativas.

El comportamiento de los puntos en el diagrama de dispersin es un indicador grfico de la


presencia de correlacin entre las variables.

Ejemplo Construya el diagrama de dispersin para los datos recopilados en el caso


del investigador que analiza la relacin entre el nmero de horas que un
grupo de estudiantes dedica a prepararse para un examen de estadstica y la
nota que cada uno de ellos obtiene en dicha prueba.

Nmero de estudiante Horas de estudio (X) Calificacin en el examen (Y)


1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
445

8 12 50

Solucin Para construir el diagrama de dispersin se trazan primero los dos ejes
cartesianos, y luego cada par de valores (x, y) se representa como un punto
en el grfico. En este caso, por ejemplo, el punto que se encuentra ms arriba
a la derecha representa al estudiante nmero 1, que estudi 21 horas para su
examen y obtuvo una calificacin de 80 puntos. El punto que se encuentra
ms a la izquierda representa al estudiante nmero 7, que estudi solo 6
horas y obtuvo una nota de 50.

90
80
Calificacin examen (Y)

70
60
50
40
30
20
10
0
0 5 10 15 20 25
Horas de estudio (X)

Ejercicio En un estudio se desea determinar si existe relacin entre el ingreso familiar


mensual y los gastos mensuales en esparcimiento de las familias. La tabla
de muestra los datos para una muestra de 12 familias:
revisin
Nmero Ingreso familiar mensual Gasto mensual en esparcimiento
de familia (X, en $) (Y, en $)
1 500 60
2 1200 100
3 1800 150
4 2500 300
5 750 50
6 800 30
7 900 80
8 1000 75
9 400 25
10 650 60
11 825 95
12 750 60

Construya el diagrama de dispersin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
446

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para la construccin del diagrama de dispersin


Los paquetes de software, tales como Excel o Minitab, construyen los diagramas de
dispersin. Se mostrar a continuacin cmo construir las grficas de dispersin empleando
Excel y Minitab.

Ejemplo Construya el diagrama de dispersin, usando Excel y Minitab, para los datos
recopilados en el caso del investigador que analiza la relacin entre el
nmero de horas que un grupo de estudiantes dedica a prepararse para un
examen de estadstica y la nota que cada uno de ellos obtiene en dicha
prueba.

Nmero de estudiante Horas de estudio (X) Calificacin en el examen (Y)


1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50

Solucin En Excel se introducen los datos de X y Y cada uno en una columna
separada:

Luego se seleccionan los datos, se da clic en la pestaa Insertar, se


selecciona en la seccin Grficos y se elige la primera opcin de Dispersin:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
447

As, aparecer en la hoja de Excel el grfico construido:

90
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25

En Minitab se introducen los datos de X y Y cada uno en una columna


separada de la hoja de trabajo:

Luego se da clic en el men Grfica, y se elige Dispersin. En el cuadro de


dilogo se escoge la opcin Simple y se completa el cuadro de dilogo
siguiente:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
448

Al dar clic en el botn Aceptar se obtiene el grfico en una ventana separada


en Minitab:

En el grfico anterior es claro que mientras ms horas dedica a prepararse cada uno de los
estudiantes, mayor tiende a ser su calificacin, por lo que se podra decir que s hay
correlacin entre las dos variables.

Si se observa el grfico siguiente resulta evidente que las dos variables x y y representadas
prcticamente no se correlacionan, pues no se muestra que sistemticamente haya algn tipo
de variacin en la variable x que se asocie con su correspondiente variacin en la variable y.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
449

Ahora bien, muchas veces se observa que los puntos en el diagrama de dispersin se acercan a
una lnea recta, tal como se muestra en la grfica siguiente. En estos casos puede decirse que
existe correlacin lineal.

90
80
70
60
50
40
30
20
10
0
0 5 10 15 20 25

La correlacin lineal puede medirse a travs del coeficiente de correlacin lineal de Pearson,
denotado por r.

COEFICIENTE DE CORRELACIN LINEAL DE PEARSON Es un coeficiente


que mide la fuerza o intensidad de la relacin lineal entre dos variables cuantitativas.

Este coeficiente solo toma valores en el intervalo de 1 a 1. El coeficiente de correlacin


lineal indica, a travs de su signo, la naturaleza o direccin de la relacin, pues cuando sea
positivo denota una relacin directa entre las dos variables, pero cuando sea negativo es
porque esta relacin es inversa entre las dos variables. Pero tambin el coeficiente r seala la
fuerza o intensidad de la relacin, la cual ser fuerte en la medida en que r sea cercano a 1 o
1, pero la relacin es dbil si es cercano a cero. En el caso de que sea exactamente igual a 1,
indicar una relacin lineal perfecta, y los puntos del diagrama de dispersin estarn sobre
una misma recta con pendiente positiva. En el caso de que sea exactamente igual a 1,
tambin indicar una relacin lineal perfecta, pero en esta situacin los puntos del diagrama
de dispersin estarn sobre una misma recta con pendiente negativa.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
450

Los siguientes intervalos pueden ser empleados para definir el grado de intensidad de la
relacin, aunque no existe un criterio nico para determinar a partir de cul valor la relacin
es fuerte o dbil:

De 0 a 0.20, o de 0 a 0.20, entonces la correlacin es muy baja o muy dbil.


De 0.20 a 0.40, o de 0.20 a 0.40, entonces la correlacin es baja o dbil.
De 0.40 a 0.70, o de 0.40 a 0.70, entonces la correlacin es moderada.
De 0.70 a 0.90, o de 0.70 a 0.90, entonces la correlacin es alta o fuerte.
De 0.90 a 1.00, o de 0.90 a 1.00, entonces la correlacin es muy alta o muy fuerte.

Interpretacin grfica del coeficiente de correlacin de Pearson:

Coeficiente de correlacin r Coeficiente de correlacin r


positivo y cercano a 1: igual a 1:
relacin directa y fuerte relacin perfecta lineal
Y Y

X X

Coeficiente de correlacin r Coeficiente de correlacin r


positivo y cercano a 0: negativo y cercano a 1:
relacin directa y dbil relacin inversa y fuerte
Y Y

X X

Coeficiente de correlacin r Coeficiente de correlacin r


negativo y cercano a 0: muy cercano a 0:
relacin inversa y dbil ausencia de relacin
Y Y

X
X

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
451

Coeficiente de correlacin r Coeficiente de correlacin r


muy igual a 0: muy cercano a 0:
ausencia de relacin ausencia de relacin lineal
Y Y

X X

La siguiente figura resume los conceptos expuestos anteriormente sobre la interpretacin del
coeficiente de correlacin lineal de Pearson r:

Clculo del coeficiente de correlacin lineal de Pearson


Existen diferentes maneras de calcular el coeficiente de correlacin lineal de Pearson. Tal vez
la ms sencilla es emplear la frmula de clculo siguiente:

FRMULA DEL COEFICIENTE N XY ( X )( Y )


DE CORRELACIN LINEAL r
DE PEARSON ( N X 2 ( X ) 2 )( N Y 2 ( Y ) 2 )

donde N corresponde al nmero de pares de valores X y Y observados, XY es la sumatoria de


los productos de cada valor de X por cada valor de Y, X es la sumatoria de todos los valores
de X, Y es la sumatoria de todos los valores de Y, X2 es la sumatoria de los cuadrados de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
452

cada uno de los valores de X, y Y2 es la sumatoria de los cuadrados de cada uno de los
valores de Y.

Ejemplo Calcule el coeficiente de correlacin lineal de Pearson para los datos


recopilados en el caso del investigador que analiza la relacin entre el
nmero de horas que un grupo de estudiantes dedica a prepararse para un
examen de estadstica y la nota que cada uno de ellos obtiene en dicha
prueba.

Nmero de estudiante Horas de estudio (X) Calificacin en el examen (Y)


1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50

Solucin Para el clculo del coeficiente conviene preparar una tabla como la
siguiente, en la cual se han agregado tres columnas ms, una para los
productos de cada valor de X por cada valor de Y, otra para calcular los
cuadrados de cada valor de X, y una ms para cada calcular los cuadrados de
cada valor de Y. Al final se agreg una lnea ms para calcular las sumatorias
de cada una de las columnas.

X Y XY X2 Y2
1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50
Total

Ahora se completan las tres columnas nuevas. La columna XY se completa


multiplicando cada X por cada Y. Por ejemplo, se multiplica 21 por 80, y as
obtiene 1680, despus multiplica 15 por 60, que es 900, y as sucesivamente.
La columna X2 se completa elevando al cuadrado cada valor de X. Por
ejemplo, se eleva al cuadrado 21, y as obtiene 441, despus eleva al
cuadrado 15, que es 225, y as sucesivamente se completa la columna. La
columna Y se completa elevando al cuadrado cada Y. Por ejemplo, se eleva
80 al cuadrado, y as obtiene 6400, despus eleva al cuadrado 60, que es
3600, y as sucesivamente.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
453

X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total

Luego se calculan las sumatorias o totales de cada una de las columnas:

X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total 108 480 6870 1620 30000

X Y XY X2 Y2

Finalmente se sustituyen los valores en la frmula del coeficiente de


correlacin lineal:

N XY ( X )( Y )
r
( N X 2 ( X ) 2 )( N Y 2 ( Y ) 2 )

Los valores a sustituir son:


N = 8, X = 108, Y = 480, XY = 6870, X2 = 1620, Y2 = 30000:

8 6870 108 480


r
(8 1620 (108) 2 )(8 30000 (480) 2 )

r = 0,885

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
454

Ejercicio En un estudio se desea determinar si existe relacin entre el ingreso familiar


mensual y los gastos mensuales en esparcimiento de las familias. La tabla
de muestra los datos para una muestra de 12 familias:
revisin
Nmero Ingreso familiar mensual Gasto mensual en esparcimiento
de familia (X, en $) (Y, en $)
1 500 60
2 1200 100
3 1800 150
4 2500 300
5 750 50
6 800 30
7 900 80
8 1000 75
9 400 25
10 650 60
11 825 95
12 750 60

Calcule el coeficiente de correlacin lineal de Pearson.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Material En la pgina de internet de este texto


podr encontrar una presentacin y un
audiovisual video que exponen el tema de regresin y
correlacin lineal simple.

Solicite su usuario y contrasea escribiendo al


correo electrnico info@auladeeconomia.com.
Para ello deber indicar el nmero de su factura de
compra de texto.

Uso de Excel y Minitab para el clculo del coeficiente de correlacin lineal


Los paquetes de software, tales como Excel o Minitab, e incluso la mayora de las
calculadoras cientficas, calculan el coeficiente de correlacin lineal. Se mostrar a
continuacin cmo calcular el coeficiente de correlacin empleando Excel y Minitab.

Ejemplo Calcule el coeficiente de correlacin lineal de Pearson, usando Excel y


Minitab, para los datos recopilados en el caso del investigador que analiza la
relacin entre el nmero de horas que un grupo de estudiantes dedica a
prepararse para un examen de estadstica y la nota que cada uno de ellos
obtiene en dicha prueba.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
455

Nmero de estudiante Horas de estudio (X) Calificacin en el examen (Y)


1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50

Solucin En Excel se introducen los datos de X y Y cada uno en una columna
separada:

Luego en una celda separada se introduce la funcin:

=COEF.DE.CORREL(matriz1;matriz2)

Como los valores de X se encuentran en el rango A2:A9, y los valores de Y


se encuentran en el rango B2:B9, entonces la funcin se completa del modo
siguiente:

=COEF.DE.CORREL(A2:A9;B2:B9)

Al presionar la tecla Enter (o Intro) se obtiene el valor del coeficiente de


correlacin r = 0,885.

En Minitab se introducen los datos de X y Y cada uno en una columna


separada de la hoja de trabajo:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
456

Luego se da clic en el men Estadsticas, se selecciona Estadstica bsica y


ah se busca la opcin Correlacin. Se debe completar el siguiente cuadro de
dilogo seleccionando las variables de la lista de la izquierda (debe dar doble
clic sobre cada una):

Al dar clic en el botn Aceptar se obtiene el valor del coeficiente de


correlacin r = 0,885 en la ventana Sesin de Minitab:

Aplicacin Diversificacin financiera


Cuando se decide invertir en activo financieros es muy importante
diversificar la cartera o portafolio de inversiones. La idea de diversificar es
no poner todos los huevos en la misma canasta, o sea, distribuir el riesgo

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
457

entre activos diferentes. As, si se tiene prdida en alguno de los activos se


esperara compensar con ganancias en los otros. Ahora bien, para que la
diversificacin sea efectiva la correlacin de los rendimientos de los
activos en que se invierte debe ser negativa, y no positiva.

Tal como se muestra en la grfica, la correlacin entre los rendimientos de


los activos M y N es negativa, pues cuando el rendimiento de uno de ellos
aumenta, el del otro disminuye, por lo que una cartera con estos dos
activos correspondera a una adecuada diversificacin.

40
N
35
30
Rendimiento (%)

25
20
15 M
10
5
0
0 1 2 3 4 5 6 7 8
Tiempo

Por supuesto que si se tiene una gran cantidad de activos es ms difcil


establecer las correlaciones y conformar una cartera con una adecuada
diversificacin, pero existen sistemas informticos que ayudan a realizar
esta tarea.

Correlaciones espurias y causalidad


En muchas ocasiones es posible encontrar un elevado coeficiente de correlacin entre dos
variables que no tienen relacin alguna, es decir, variables que no presentan relacin
justificada a travs de alguna teora especfica presentan altos coeficientes de correlacin. Un
ejemplo de esto se present en estudios realizados por Neyman en 1952, quien analiz la
relacin entre la tasa de nacimientos y la poblacin de cigeas en varias regiones de Europa,
y encontr un alto coeficiente de correlacin entre estas variables, a pesar de que todos
sabemos que las cigeas no traen a los nios. Cuando sucede esto, se dice que la correlacin
estadstica existente entre estas variables es una correlacin espuria o sin sentido. Esto se
puede dar cuando ocurre la presencia de un tercer factor y no debido a la existencia de una
relacin con sentido entre las variables analizadas.

Es importante indicar que algunas investigaciones son de nivel correlacional, y por tanto solo
buscan establecer la existencia de correlacin entre las variables de estudio. Pero otras
investigaciones son de nivel explicativo, y por tanto buscan determinar no solo correlacin,
sino la existencia de relaciones causa efecto. Cuando se trata de establecer causalidad entre
las variables resulta importante emplear algunos criterios que permitan diferencias aquellas

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
458

correlaciones debidas al azar o debidas a otras variables intervinientes. Algunos criterios de


causalidad son:

1. La asociacin entre X y Y debe ser fuerte. Esto es que haya un coeficiente de correlacin
alto entre las variables X y Y.
2. La asociacin entre X y Y debe ser consistente y replicable. La relacin entre las variables
debe poder constatarse en diferentes pocas y lugares.
3. Mayores dosis de X deben producir mayor efecto en Y. Mayores cambios en la variable
X debera asociarse sistemticamente con cambios mayores (positivos o negativos) en la
variable Y.
4. Relacin temporal, es decir, la causa X debe preceder en el tiempo al efecto Y.
5. Coherencia o plausibilidad terica o biolgica. La relacin entre las variables debe poder
sustentarse en la teora disponible.
6. Especificidad. Los cambios en una variable deben provocar cambios especficos en la otra
variable.

Diversos autores han planteado otros criterios para establecer relaciones causales, sin
embargo los 6 anteriores son algunos de los ms utilizados por los investigadores.

Regresin lineal simple


Cuando se logra encontrar variables con un nivel de correlacin aceptable y que sea razonable
plantear un modelo que permita establecer la relacin lineal entre ellas, entonces se puede
emplear la tcnica de la regresin lineal simple para determinar la ecuacin de una recta que
permita pronosticar el comportamiento de y en trminos de x.

REGRESIN LINEAL SIMPLE Es un mtodo matemtico que modela la relacin


lineal entre una variable dependiente Y y una variable independiente X.

Cabe sealar que en este captulo solo se expone la regresin lineal simple, es decir, la
variable Y en trminos de solo una variable independiente X, pero es posible expresar a Y en
trminos de varias variables independientes. En ese caso se habla de regresin mltiple.
Adems, la relacin entre Y y X podra ser cuadrtica, cbica u otras formas matemticas, en
cuyo caso se hablara de regresin no lineal.

Para el caso de la regresin lineal simple, la ecuacin de regresin es la ecuacin de una lnea
recta tiene una forma algebraica dada por la expresin:

y = a + bx

donde a es la constante o interseccin con el eje vertical, y b es el coeficiente de pendiente,


que da la inclinacin de la recta, o bien, el cambio ocurrido en la variable y cuando x vara en
una unidad. Grficamente la recta de regresin se muestra del modo siguiente:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
459

Ecuacin de la recta: Y = a + bX

b = Pendiente de la recta
Interseccin
con el eje Y a
X

Ejemplo Para el caso del investigador que desea analizar la relacin entre el nmero
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadstica y la nota que cada uno de ellos obtiene en dicha prueba.
Cul sera el modelo que se podra plantear?

Solucin En este caso el investigador analiza la relacin entre las dos variables
mencionadas, nmero de horas que un grupo de estudiantes dedica a
prepararse para un examen de estadstica (variable x) y la nota que cada
uno de ellos obtiene en dicha prueba (variable y).

El investigador tom una muestra de estudiantes y registr los valores de


ambas variables y obtuvo un coeficiente de correlacin lineal de Pearson
de r = 0,885, que indica una correlacin lineal directa y fuerte entre las dos
variables. Conceptualmente es razonable considerar que la variable
nmero de horas que un estudiante dedica a prepararse para un examen de
estadstica (variable x) pueda ser determinante de la nota que obtiene en
dicha prueba (variable y), por lo que podra formularse un modelo lineal
del tipo:

y = a + bx

donde y es la nota obtenida en el examen, y x es el nmero de horas


dedicadas a la preparacin para el examen.

La constante a indicara la nota que se obtendra si no se estudiara para el


examen (cero horas de preparacin) y la pendiente b indicara lo que se
esperara que aumente la nota en el examen por cada hora adicional
dedicada a la preparacin para esta prueba. Tambin podra expresarse:

Nota = a + b * Horas de preparacin

Los coeficientes de la ecuacin de la recta se obtienen por el criterio de los mnimos


cuadrados, esto es que la recta de mejor ajuste es aquella que minimiza la suma de las
desviaciones al cuadrado de los puntos de la grfica desde los puntos de la lnea recta. El
objetivo de los mnimos cuadrados es minimizar:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
460

(Y Y )
i 1
i i
2

y as obtener la recta que mejor se ajusta a los pares (x, y) dados. Los coeficientes de la
ecuacin de la recta a y b se obtienen por las frmulas siguientes:

FRMULA DEL COEFICIENTE N XY ( X )( Y )


b
DE PENDIENTE N X 2 ( X ) 2

FRMULA DEL COEFICIENTE


a
Y b X
CONSTANTE N N

La frmula para el coeficiente a tambin podra expresarse como:

FRMULA DEL COEFICIENTE CONSTANTE a Y bX

Ejemplo Construya el modelo de regresin lineal para los datos recopilados en el caso
del investigador que analiza la relacin entre el nmero de horas que un
grupo de estudiantes dedica a prepararse para un examen de estadstica y la
nota que cada uno de ellos obtiene en dicha prueba.

Nmero de estudiante Horas de estudio (X) Calificacin en el examen (Y)


1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50

Solucin Las frmulas de los coeficientes de la recta de regresin emplean los mismos
datos utilizados en el clculo del coeficiente de correlacin lineal, por lo que
se emplear la misma tabla que se construy cuando se calcul r. Entonces
los datos disponibles son los siguientes:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
461

X Y XY X2 Y2
1 21 80 1680 441 6400
2 15 60 900 225 3600
3 15 70 1050 225 4900
4 9 40 360 81 1600
5 12 60 720 144 3600
6 18 70 1260 324 4900
7 6 50 300 36 2500
8 12 50 600 144 2500
Total 108 480 6870 1620 30000

X Y XY X2 Y2

Primero se sustituyen los valores en la frmula del coeficiente de pendiente:

N XY ( X )( Y )
b
N X 2 ( X ) 2

8 6870 108 480


b
8 1620 (108) 2

b = 2,41

Despus se sustituye en la frmula de la constante a:

a
Y b X
N N

480 108
a 2,41
8 8

a = 27,5

As, el modelo de regresin es:

y = 27,5 + 2,41x

O bien, Nota= 27,5 + 2,41 * Nmero de horas de preparacin.

Ejercicio En un estudio se desea determinar si existe relacin entre el ingreso familiar


mensual y los gastos mensuales en esparcimiento de las familias. La tabla
de muestra los datos para una muestra de 12 familias:
revisin

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
462

Nmero Ingreso familiar mensual Gasto mensual en esparcimiento


de familia (X, en $) (Y, en $)
1 500 60
2 1200 100
3 1800 150
4 2500 300
5 750 50
6 800 30
7 900 80
8 1000 75
9 400 25
10 650 60
11 825 95
12 750 60

Calcule la ecuacin de regresin.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Uso de Excel y Minitab para el clculo de la ecuacin de regresin

Ejemplo Construya, usando Excel y Minitab, el modelo de regresin lineal para los
datos recopilados en el caso del investigador que analiza la relacin entre el
nmero de horas que un grupo de estudiantes dedica a prepararse para un
examen de estadstica y la nota que cada uno de ellos obtiene en dicha
prueba.

Nmero de estudiante Horas de estudio (X) Calificacin en el examen (Y)


1 21 80
2 15 60
3 15 70
4 9 40
5 12 60
6 18 70
7 6 50
8 12 50

Solucin En Excel se introducen los datos de X y Y cada uno en una columna
separada:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
463

Luego en una celda separada se introduce la funcin:

=INTERSECCION.EJE(conocido_y;conocido_x)

Como los valores de X se encuentran en el rango A2:A9, y los valores de Y


se encuentran en el rango B2:B9, entonces la funcin se completa del modo
siguiente:

=INTERSECCION.EJE(B2:B9;A2:A9)

Al presionar la tecla Enter (o Intro) se obtiene el valor del coeficiente de


interseccin a = 27,5.

Despus, en otra celda se introduce la funcin:

=PENDIENTE(conocido_y;conocido_x)

Dado que los valores de X se encuentran en el rango A2:A9, y los valores de


Y se encuentran en el rango B2:B9, entonces la funcin se completa del
modo siguiente:

=PENDIENTE(B2:B9;A2:A9)

Al presionar la tecla Enter (o Intro) se obtiene el valor del coeficiente de


pendiente b = 2,407 2,41.

En Minitab se introducen los datos de X y Y cada uno en una columna


separada de la hoja de trabajo:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
464

Luego se da clic en el men Estadsticas, se selecciona Regresin y ah se


busca la opcin Regresin. Se debe completar el siguiente cuadro de dilogo
seleccionando la variable y como Respuesta y la variable x como Predictor:

Luego, en la ventana Sesin de Minitab se obtiene:

En la salida de Minitab aparece claramente la ecuacin y otros datos sobre el


anlisis de regresin, principalmente en lo relacionado con la significancia
estadstica del modelo. A continuacin, en este captulo se expone el valor
que Minitab llama Rcuad.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
465

Aplicacin Econometra
Muchas veces vemos en los medios de comunicacin noticias que hablan
de diversas proyecciones econmicas. Se ha preguntado usted cmo se
realizan esas proyecciones? Los economistas se basan en la teora
econmica, pero para poder aplicarla se requieren datos sobre las variables
que esa teora abarca. Por ejemplo, se desea conocer cules factores
influyen sobre el consumo de bienes y servicios del pas. La teora indica
que el ingreso disponible puede ser un factor determinante y que la
relacin entre ambas variables se puede describir a travs de una funcin
lineal. Entonces se rene informacin sobre ambas variables y se emplea la
regresin lineal para determinar si efectivamente se presenta el
comportamiento esperado.

Vemos, a travs de este sencillo ejemplo, que la econometra busca


expresar las distintas teoras econmicas a travs de modelos matemticos,
y que se utilizan mtodos estadsticos para verificar esas teoras. En caso
de que las teoras se validen, entonces pueden ser utilizadas para
desarrollar pronsticos de las variables y determinar el posible efecto de
una variable sobre otra, y as poder realizar recomendaciones de poltica
econmica.

La econometra emplea mtodos como la regresin lineal, pero no solo la


regresin lineal simple, como la estudiada en este captulo, sino tambin la
regresin lineal mltiple, la regresin no lineal, regresiones de sistemas de
ecuaciones, entre otros temas relacionados.

Bondad de ajuste: el coeficiente de determinacin


Cuando se ha construido un modelo de regresin, resultado importante contar con una medida
de qu tan bien se ajusta la recta estimada a los datos observados. Esa medida es el coeficiente
de determinacin R2. El coeficiente de determinacin se calcula como el cuadrado del
coeficiente de correlacin de Pearson:

FRMULA DEL COEFICIENTE DE DETERMINACIN R2 = r2

Mientras ms cercano a uno sea este coeficiente indica un mejor ajuste de la recta. Es por eso,
que tambin se puede interpretar este coeficiente como la proporcin de la variabilidad
explicada por el modelo.

Ejemplo Para el caso del investigador que desea analizar la relacin entre el nmero
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadstica y la nota que cada uno de ellos obtiene en dicha prueba, y

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
466

para el cual se conoce que el coeficiente de correlacin lineal de Pearson


es r = 0,885. Calcule e interprete el coeficiente de determinacin R2.

Solucin Dado que ya se conoce que el coeficiente de correlacin lineal de Pearson


es r = 0,885, basta con elevar ese nmero al cuadrado para obtener el
coeficiente de determinacin R2:

R2 = r2 = (0,885)2 = 0,7832

Este resultado quiere decir que el modelo de regresin planteado explica el


78,32% de la variabilidad de y, o sea, que la relacin lineal entre la nota en
el examen de estadstica y el nmero de horas de preparacin explica el
78,32% de la variabilidad de las notas.

Este valor de R2 indicara que es un modelo bastante bueno, pues posee un


poder explicativo alto.

Ejercicio En un estudio se desea determinar si existe relacin entre el ingreso


familiar mensual (X, en dlares) y los gastos mensuales en esparcimiento
de de las familias (Y, en dlares). La ecuacin de regresin que se ha obtenido
revisin es Y = -29,0 + 0,119X y se obtuvo el coeficiente de correlacin lineal de
Pearson r = 0,951. Calcule el coeficiente de determinacin.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Interpolacin y extrapolacin
La ecuacin de regresin se puede emplear para obtener valores de Y correspondientes a
nuevos valores de X que no fueron observados en la muestra. Cuando se obtienen esos nuevos
valores de Y se dice que se est interpolando o extrapolando. La interpolacin es cuando, para
calcular el nuevo valor de Y, se toma un valor de X que se encuentra en el rango de valores de
X observados. La extrapolacin es cuando, para calcular el nuevo valor de Y, se toma un valor
de X que no se encuentra en el rango de valores de X observados.

Ejemplo Para el caso del investigador que desea analizar la relacin entre el nmero
de horas que un grupo de estudiantes dedica a prepararse para un examen
de estadstica y la nota que cada uno de ellos obtiene en dicha prueba, en el
cual se haba obtenido el modelo y = 27,5 + 2,41x, donde y es la nota en el
examen, y x es el nmero de horas de preparacin para la prueba:

a. Interpole la calificacin de un estudiante que haya estudiado 13 horas.


b. Extrapole la calificacin de un estudiante que haya estudiado 25 horas.

Solucin a. En este primer ejercicio se habla de interpolacin ya que el rango de

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
467

valores observados de X, los cuales, si se observa en la tabla de datos de


las dos variables, el menor valor de x fue 6 y el mayor 21, por lo que 13 se
encuentra dentro del rango observado. Entonces, para hallar y se sustituye
el valor x = 13 en la ecuacin:

y = 27,5 + 2,41x

y = 27,5 + 2,41 * 13

y = 58,83

b. En este segundo ejercicio se habla de extrapolacin ya que x = 13 se


encuentra dentro del rango observado. Entonces, para hallar y se sustituye
el valor x = 25 en la ecuacin:

y = 27,5 + 2,41x

y = 27,5 + 2,41 * 25

y = 87,75

Lo anterior se ilustra en la grfica siguiente:

Ejercicio En un estudio se desea determinar si existe relacin entre el ingreso


familiar mensual (X, en dlares) y los gastos mensuales en esparcimiento
de de las familias (Y, en dlares). La ecuacin de regresin que ha obtenido es
revisin Y = -29,0 + 0,119X. Las familias estudiadas tenan ingresos que varan
entre $400 y $2500.

a. Interpole el gasto mensual en esparcimiento para una familia con un


ingreso mensual de $800.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
468

b. Extrapole el gasto mensual en esparcimiento para una familia con un


ingreso mensual de $3000.

Ver solucin de este ejercicio en la pgina de internet de este texto:


www.auladeeconomia.com/raeep.html

Apoyo En la pgina de internet www.auladeeconomia.com podr encontrar una


presentacin de diapositivas que expone este tema y es una parte
audiovisual importante de este texto. Esta presentacin presenta el tema en forma
y uso de la visual, pues emplea fotografas, esquemas u otros recursos visuales, e
tecnologa incluso recursos resueltos paso a paso.

Adicionalmente puede encontrar algunos videos explicativos.

Solicite su usuario y contrasea escribiendo al correo electrnico


info@auladeeconomia.com. Para ello deber indicar el nmero de su
factura de compra de texto.

Ejercicios:
Ejercicios de desarrollo:
Resuelva los ejercicios que a continuacin se presentan (las respuestas a los ejercicios se
encuentran en la pgina de internet del texto: www.auladeeconomia.com/raeep.html).

1. A continuacin se presenta una lista de investigaciones que se han correlacionado dos


variables, en cada caso indique si considera que se presenta una correlacin positiva, negativa
o nula entre las dos variables indicadas:
a. Satisfaccin de los pacientes de un hospital en el servicio de consulta externa y su
tiempo medio de espera.
b. Tasa mensual de prevalencia de enfermedades cardiovasculares y el nmero de
actividades de prevencin realizadas cada mes en la ciudad capital de julio a
noviembre del ao 2012.
c. Frecuencia cardiaca de las ratas en un laboratorio segn distintas dosis de un nuevo
medicamento.
d. Nmero de horas promedio diarias de uso continuo uso de computadoras y agudeza
visual de los nios de 12 aos.
e. Temperatura atmosfrica media anual en las zonas montaosas del pas y poblacin
estimada de ranas cuyo hbitat son las zonas montaosas del pas.
f. Peso en kilogramos de adultos y nmero promedio mensual de horas de actividad
fsica.
g. rea construida de viviendas de la ciudad capital y precio de la vivienda.
h. Nmero de artculos defectuosos por da y nmero de horas extra pagadas en la
fbrica.
i. Tiempo de fusin de determinados componentes electrnicos y nivel de sobrecarga.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
469

j. Presupuesto destinado a seguridad informtica de las empresas financieras y nmero


de empleados de la empresa.
k. Nmero de licencias de un nuevo sistema operativo que las empresas estara
dispuestas a adquirir y el nmero de empleados de la empresa.
l. Rendimiento sobre la inversin promedio de las empresas que cotizan en la Bolsa de
Valores de Nueva York y nivel de endeudamiento de la empresa.
m. Nmero de mensajes mensuales enviados por los usuarios de telfonos y edad del
usuario del telfono.
n. Nivel de satisfaccin de los empleados de una empresa y nmeros de aos de
servicio en la empresa.
o. Monto de cada cuenta por cobrar y antigedad, en das, de la cuenta por cobrar.
p. Nmero de turistas que visitan el pas por mes y monto gastado por el gobierno para
promocionar al pas como destino turstico.
q. Nmero de horas de uso internet de estudiantes de secundaria y edad del estudiante.
r. Volumen mensual de ventas de una compaa y la exposicin mensual de los
consumidores a los comerciales pautados por la misma empresa.

2. Un equipo de investigadores est realizando un estudio entre la poblacin adulta mayor del
pas. En el Hogar de Ancianos La Florida, que solo posee 12 ancianos actualmente, se ha
recopilado la siguiente informacin:

# caso Edad (aos) Presin arterial sistlica (mmHg)


1 66 147
2 72 165
3 72 160
4 86 168
5 73 199
6 97 178
7 85 170
8 89 175
9 78 145
10 82 192
11 68 152
12 90 195

Tomando como base la informacin anterior se desea relacionar la presin arterial con la
edad:

a. Construya el diagrama de dispersin que muestre la relacin entre las dos variables.
b. Calcule el coeficiente de correlacin lineal de Pearson.
c. Interprete el resultado del coeficiente de correlacin lineal de Pearson.
d. Determine la ecuacin de regresin que permita predecir el nivel de presin arterial
segn la edad del anciano.
e. Si uno de estos ancianos tiene una edad de 85 aos, cul sera su nivel esperado de
presin sangunea?
f. Calcule el coeficiente de determinacin.
g. Interprete el coeficiente de determinacin.

3. En un hospital se evala la satisfaccin de los pacientes en el servicio de consulta externa.


Los administradores del hospital consideran que el tiempo de espera afecta negativamente la

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
470

satisfaccin del paciente. Los siguientes datos corresponden a una muestra de 10 pacientes. La
satisfaccin se mide a travs de un cuestionario en una escala de 0 a 20 puntos y el tiempo de
espera est medido en minutos.

Paciente 1 2 3 4 5 6 7 8 9 10
Satisfaccin 11 12 5 8 15 16 18 12 15 14
Tiempo espera 30 45 60 55 20 25 30 40 20 25

a. Construya el diagrama de dispersin y analcelo.


b. Calcule el coeficiente de correlacin lineal e indique su significado en esta
situacin.
c. Calcule la ecuacin de regresin e interprete sus coeficientes.
d. Cul sera el nivel de satisfaccin esperado para un paciente que esper 30 minutos
por su servicio?
e. Calcule el coeficiente de determinacin e interprtelo.

4. En una muestra de 12 personas con miopa elevada superior a 12,00 D se midieron algunos
parmetros biomtricos de sus ojos, como la longitud axial y el equivalente esfrico. Los
resultados fueron los siguientes:

Paciente Longitud axial (mm) Equivalente esfrico (D)


1 24 -18
2 28 -13
3 34 -22
4 30 -14
5 28 -11
6 27 -14
7 25 -16
8 29 -17
9 31 -21
10 30 -19
11 31 -18
12 33 -22

5. Con base en estos datos se desea determinar qu tanta relacin existe entre la longitud axial
y el grado de miopa de estos pacientes. Para esto efecte lo siguiente:
a. Construya el diagrama de dispersin y observe qu tipo de correlacin se presenta
entre las dos variables.
b. Calcule e interprete el coeficiente de correlacin lineal entre la longitud axial y el
equivalente esfrico.
c. Calcule la ecuacin de regresin entre la longitud axial y el equivalente esfrico.
d. Calcule e interprete el coeficiente de determinacin.

6. En un experimento se ha tratado de medir la relacin entre el porcentaje de frecuencia


cardaca de reserva (%HRR) y el mximo volumen de oxgeno en la sangre (medido como
%VO2 mximo) en deportistas. En un grupo de 12 deportistas que se ejercit en el escalador
elptico se obtuvieron los siguientes resultados:

%HRR 50 55 60 65 70 75 90 45 80 75 85 45

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
471

%VO2max. 55 50 65 75 75 60 95 40 90 80 80 50

a. Construya el diagrama de dispersin.


b. Calcule e interprete el coeficiente de correlacin lineal de Pearson.
c. Determine la ecuacin de regresin que permita predecir el nivel de HRR segn el
nivel de VO2.
d. Calcule e interprete el coeficiente de determinacin.

7. Los siguientes datos muestran el rea construida de una muestra de 8 viviendas nuevas en
la ciudad capital y su respectivo precio. El rea se expresa en metros cuadrados y el precio en
miles de dlares.

Vivienda 1 2 3 4 5 6 7 8
rea construida 180 250 100 120 75 150 300 210
Precio 200 350 90 145 80 120 300 250

a. Construya el diagrama de dispersin y analcelo.


b. Calcule el coeficiente de correlacin lineal e indique su significado en esta
situacin.
c. Calcule la ecuacin de regresin e interprete sus coeficientes.
d. Cul sera el precio esperado de una vivienda de 160 metros cuadrados de
construccin?
e. Calcule el coeficiente de determinacin e interprtelo. Cules otros factores
tambin explicaran la variabilidad del precio de la vivienda?
f. Si una vivienda tiene un precio de $190 mil, cul sera, segn este modelo, su rea
construida?

8. Los siguientes datos muestran el nmero de artculos defectuosos por da obtenidos en una
fbrica en una muestra de 8 das y el nmero de horas extra laboradas ese da en la fbrica.

Da 1 2 3 4 5 6 7 8
Unidades defectuosas 5 12 8 2 16 24 13 4
Horas extra 6 20 16 6 25 30 20 10

a. Construya el diagrama de dispersin y analcelo.


b. Calcule el coeficiente de correlacin lineal e indique su significado en esta
situacin.
c. Calcule la ecuacin de regresin e interprete sus coeficientes.
d. Calcule el coeficiente de determinacin e interprtelo.

9. Los siguientes datos muestran el presupuesto destinado a seguridad informtica (en miles
de dlares) en una muestra de 8 bancos y el nmero de empleados de la empresa (en miles).

Banco 1 2 3 4 5 6 7 8
Presupuesto 100 145 80 180 125 130 75 240
Nmero de empleados 3,5 7,0 2,4 12,1 6,2 5,7 4,8 10,6

a. Construya el diagrama de dispersin y analcelo.


b. Calcule el coeficiente de correlacin lineal e indique su significado en esta
situacin.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
472

c. Calcule la ecuacin de regresin e interprete sus coeficientes.


d. Calcule el coeficiente de determinacin e interprtelo.

10. Los siguientes datos muestran el nmero de mensajes mensuales enviados por los usuarios
de telfonos celulares en una muestra de 8 personas y edad del usuario del telfono.

Usuario 1 2 3 4 5 6 7 8
Nmero de mensajes 342 249 128 61 12 37 98 166
Edad 15 23 34 48 62 40 29 19

a. Construya el diagrama de dispersin y analcelo.


b. Calcule el coeficiente de correlacin lineal e indique su significado en esta
situacin.
c. Calcule la ecuacin de regresin e interprete sus coeficientes.
d. Calcule el coeficiente de determinacin e interprtelo.

11. La tabla presenta los reportes de ventas anuales y los aos de experiencia de 10
vendedores de una prestigiosa empresa.

Aos experiencia 1 3 4 4 6 8 10 10 11 13
Ventas (miles $/ao) 80 97 92 102 103 111 119 123 117 136

a. Establezca e interprete la ecuacin de regresin que permita predecir las ventas con
base en la experiencia del vendedor.
b. En qu proporcin este modelo explica las variaciones en las ventas?
c. Estime las ventas de un vendedor con 7,5 aos de experiencia.
d. Cuntos aos de experiencia se esperara que tenga un vendedor que logre vender
$100.000?

12. Un banco que se especializa en crditos para la vivienda intenta analizar el mercado,
midiendo el poder explicativo que las tasas de inters tienen sobre el nmero de casas
vendidas en el rea. Se compilaron los datos para un perodo de seis aos:

Semestre 1 2 3 4 5 6 7 8 9 10
Inters 12,3 10,5 15,6 9,5 10,5 9,3 8,7 14,2 15,2 12,0
Casas 196 285 125 225 248 303 265 102 105 114

a. Haga un diagrama de dispersin para los datos.


b. Calcule el coeficiente de correlacin lineal e interprtelo.
c. Calcule e interprete el modelo de regresin. Qu dice este modelo sobre la relacin
entre las tasas de inters y las ventas de vivienda?
d. Calcule el coeficiente de determinacin e interprtelo.
e. Si la tasa de inters es del 9.5%, cuntas casas se venderan de acuerdo con el
modelo?
f. Obtenga una ecuacin de regresin que permita predecir la tendencia de las ventas
de casas (o sea, solo en funcin del tiempo). Qu puede decirse de la calidad de los
pronsticos elaborados con base en esa ecuacin?

13. Un mercadlogo ha logrado obtener la siguiente informacin relacionada con el nivel


medio de ingreso de los consumidores y la cantidad demandada de un cierto producto.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
473

Cantidad demandada por consumidor Nivel de ingreso medio


Ao (en miles de unidades por ao) (en dlares por mes)
2002 48 1592
2003 52 1600
2004 60 1607
2005 84 1620
2006 92 1689
2007 98 1734
2008 96 1830
2009 106 1835
2010 116 1741
2011 120 1755
2012 122 1867

El mercadlogo desea conocer lo siguiente:

a. Qu tanta relacin existe entre ambas variables? Conteste en trminos del


coeficiente de correlacin lineal. Interprete claramente los resultados.
b. Trace el diagrama de dispersin.
c. Determinar una ecuacin para poder estimar la cantidad demandada del artculo en
funcin del ingreso del consumidor. Interprete los componentes de la ecuacin de
regresin. Trace la recta de la ecuacin calculada.
d. Qu tan bien se ajustan los datos obtenidos a la ecuacin obtenida en el inciso c?
e. Si se espera que para el 2013 el nivel de ingreso sea de $1895 por consumidor,
Cul sera la cantidad demandada segn este modelo?
f. Cunto es el valor del error de la regresin para 2010?
g. A qu nivel tendra que aumentar el ingreso para poder vender 132.000 unidades
en el 2013?
h. Interpole la cantidad demandada si el nivel de ingreso es de $1730.
i. Extrapole la cantidad demandada si el nivel de ingreso es de $1950.
j. Obtenga una ecuacin de regresin que permita predecir la tendencia del ingreso de
medio de los consumidores (o sea, solo en funcin del tiempo). Qu puede decirse de
la calidad de los pronsticos elaborados con base en esa ecuacin?

14. Se ha establecido que la relacin entre el nmero de aos de experiencia de un vendedor


(X) y los montos que logra vender por mes (Y, en miles de $) est dada por la ecuacin Y = 0,3
+ 2X, entonces:

( 1 ) Por cada ao de experiencia se espera que sus ventas aumenten en $2 mil al mes.
( 2 ) Si tuviera cero experiencia, se esperara que venda $0,3 mil.

Son verdaderas ambas afirmaciones?

15. Un contador est analizando el comportamiento de los costos de produccin con respecto
al volumen total producido. Ha reunido informacin para varios periodos segn la tabla
siguiente:

Unidades producidas (miles/periodo) 5 9 14 11 17 20 17


Costos totales (miles $/periodo) 125 200 375 300 425 450 385

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
474

a. Construya el diagrama de dispersin. Utilice el nmero de unidades producidas en


el eje horizontal.
b. Calcule e interprete el coeficiente de correlacin lineal entre estas dos variables.
c. Calcule e interprete la ecuacin de regresin entre estas dos variables.
d. Cul sera el nivel de costo total esperado al nivel de produccin de 15 mil
unidades?

16. Usted ha logrado obtener la siguiente informacin relacionada con el nivel medio de
ingreso de los consumidores, la cantidad demandada de un cierto producto y las tasas de
inters.

Ao Cantidad demandada por consumidor Nivel de ingreso medio Tasa de


(en miles de unidades por ao) (en dlares por mes) inters (%)
2000 48 892 18
2001 52 900 16
2002 60 1007 17
2003 84 1020 15
2004 92 1129 14
2005 98 1134 17
2006 96 1230 16
2007 106 1335 12
2008 116 1401 10
2009 120 1455 13
2010 122 1567 15

Usted desea conocer lo siguiente:

a. Qu tanta relacin lineal existe entre las variables demanda y tasas de inters?
Conteste en trminos del coeficiente de correlacin lineal. Interprete claramente los
resultados. Trace el diagrama de dispersin.
b. Determinar una ecuacin lineal para poder estimar la cantidad demandada del
artculo en funcin del ingreso del consumidor. Interprete los componentes de la
ecuacin de regresin. Trace la recta de la ecuacin calculada.
c. Qu tan bien se ajustan los datos obtenidos a la ecuacin obtenida en el inciso b?
d. Con base en la ecuacin del inciso b, si se espera que para el 2011 el nivel de
ingreso sea de 1575 mil por consumidor, Cul sera la cantidad demandada segn
este modelo?
d. A qu nivel tendra que aumentar el ingreso para poder vender 130.000 unidades
en el 2011?
e. Obtenga una ecuacin de regresin que permita predecir la tendencia de la cantidad
demandada del producto (o sea, solo en funcin del tiempo). Qu puede decirse de la
calidad de los pronsticos elaborados con base en esa ecuacin?

17. Un analista considera que la demanda de los diferentes tipos de seguros (de vida,
automviles, etc.) se relaciona con el producto interno bruto (PIB) del pas. Para comprobar
su hiptesis reuni datos de ambas variables para varios aos (PIB en miles de millones de
dlares y ventas de seguros en millones de dlares):

Ao 1 2 3 4 5 6 7 8 9

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
475

PIB 1438 1575 1642 1739 1891 2041 2097 2076 2176
Ventas 1238 1382 1512 1680 1705 1914 1945 1965 2010

a. Calcule el coeficiente de correlacin lineal e interprtelo.


b. Calcule la ecuacin de regresin lineal.
c. Si para el ao 10 se espera un PIB de 2264 miles de millones de dlares, cunto se
esperara que sea la venta total de seguros en el pas?
Obtenga una ecuacin de regresin que permita predecir la tendencia de las ventas de
seguros (o sea, solo en funcin del tiempo). Qu puede decirse de la calidad de los
pronsticos elaborados con base en esa ecuacin?

18. Se ha establecido que la relacin entre el gasto en publicidad de una empresa (X) y los
montos que logra vender por mes (Y, en millones de $), est dada por Y = 4,3 + 1,5X,
entonces:

a. Interpole el valor de las ventas cuando el gasto en publicidad sea de $5 millones.


b. Extrapole el valor de las ventas cuando el gasto en publicidad sea de $7,5 millones.

19. Una investigadora ha aplicado un instrumento estandarizado para la medicin de los


aprendizajes en preescolares de 5 aos. La prueba fue desarrollada por la investigadora y
utiliza una seleccin de aprendizajes esperados y cubre distintos mbitos, como la formacin
social, la comunicacin, la relacin con el medio natural, entre otros. Al final se obtiene un
puntaje total luego de la aplicacin de todos los tems de la prueba. Posteriormente se aplic a
la misma muestra una segunda prueba para la medicin de los aprendizajes en preescolares de
5 aos. Los siguientes son los resultados de ambas pruebas:

Nio 1 2 3 4 5 6 7 8 9
Prueba 1 60 53 47 29 38 45 56 49 42
Prueba 2 110 85 88 66 60 67 72 78 76

Determine qu tanta correlacin hay entre los resultados de las dos pruebas. Calcule para ello
el coeficiente de correlacin de Pearson e interprete su resultado.

20. Los siguientes datos muestran el nmero promedio semanal de horas de uso internet de
estudiantes de secundaria para hacer trabajos acadmicos en una muestra de 8 estudiantes y
edad del estudiante.

Estudiante 1 2 3 4 5 6 7 8
Horas de uso 2,0 2,5 4 3,5 1,0 4,0 5,0 4,5
Edad 13 15 17 16 14 12 13 15

a. Construya el diagrama de dispersin y analcelo.


b. Calcule el coeficiente de correlacin lineal e indique su significado en esta
situacin.
c. Calcule el coeficiente de determinacin e interprtelo.

21. Un investigador ha logrado obtener la siguiente informacin relacionada con el nivel


medio de ingreso de hogares de diferentes barrios, la cantidad de hijos por hogar y el nmero
de aos de estudios formales del jefe del hogar.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
476

Cantidad de Nivel de ingreso mensual Aos de educacin formal


Hogar # hijos ($) del jefe del hogar
1 5 1200 11
2 2 1534 15
3 3 585 8
4 4 560 6
5 1 1930 16
6 2 910 18
7 4 435 6
8 3 510 9
9 2 866 13
10 1 1190 17

El investigador desea conocer lo siguiente:

a. Qu tanta relacin lineal existe entre las variables ingreso y aos de educacin
formal del jefe del hogar? Se puede afirmar que existe una alta correlacin entre las
variables o no? Qu tipo de relacin se da entre las variables? Trace el diagrama de
dispersin.
b. Una ecuacin para poder estimar la el nmero de hijos del hogar en funcin de su
ingreso.
c. Qu tan bien se ajustan los datos obtenidos a la ecuacin obtenida en el inciso b?
d. Si se analiza una familia cuyo ingreso es de $630, cuntos hijos se esperara que
tuviera segn este modelo?
e. Comente sobre la relacin existente entre el nivel de ingreso y la cantidad de hijos
habidos en el hogar. Qu otras variables influyen y que pueden afectar la validez del
modelo? Explique por qu.

22. Una persona considera que mientras ms aos se estudia, mayor ser el cociente
intelectual. Para probar esta relacin se toma una muestra de 12 personas, que han estudiado
las siguientes cantidades de aos (aos de estudios formales): 11, 9, 8, 15, 18, 10, 14, 16, 20,
5, 17, 16. Estas mismas personas realizaron un test para medir su cociente intelectual (los
resultados corresponden al mismo orden anterior): 102, 100, 97, 101, 110, 113, 116, 96, 115,
106, 99, 104. Con base en estos datos:

a. Construya el diagrama de dispersin.


b. Calcule el coeficiente de correlacin lineal de Pearson e interprtelo.
c. Vale la pena construir una ecuacin de regresin para pronosticar el cociente
intelectual de una persona con base en sus aos de estudios formales?

23. Se ha establecido que la relacin entre el gasto en publicidad de una empresa (X) y los
montos que logra vender por mes (Y, en millones de $), est dada por Y = 4,3 + 1,5X,
entonces:

a. Si la empresa no gasta en publicidad, entonces sus ventas seran de $1,5 millones.


b. Si la empresa gasta $1 milln ms en publicidad, se esperara que sus ventas
aumenten en $4,3 millones.

Son verdaderas ambas afirmaciones?

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
477

24. Los siguientes datos muestran el volumen mensual de ventas de una compaa (en
millones de dlares) en una muestra de 9 meses. Cada mes la empresa mide la exposicin de
los consumidores a los comerciales pautados por medio de una encuesta y determina el
porcentaje de ellos que indican recordar los anuncios de la compaa.

Mes 1 2 3 4 5 6 7 8 9
Ventas 18 19 23 32 27 22 19 26 30
Exposicin 40 42 45 46 43 45 38 40 42

a. Construya el diagrama de dispersin y analcelo.


b. Calcule el coeficiente de correlacin lineal e indique su significado en esta
situacin.
c. Calcule el coeficiente de determinacin e interprtelo.

25. El gobierno del pas est preocupado por las crticas que las personas realizan a travs de
las redes sociales en Internet, por lo que decide tratar de contrarrestarlas publicando en esos
mismos medios informacin relacionada con sus actividades y logros. Cada tres meses se
realiza una encuesta en la que se evala la imagen del gobierno. La tabla muestra el nmero
de publicaciones realizadas a su favor por el gobierno en las redes sociales en cada trimestre
(X) y la opinin de los ciudadanos sobre su gestin (Y, medida como porcentaje de opiniones
favorables en la encuesta al final de cada trimestre):

Trimestre 1 2 3 4 5 6 7 8 9 10
X 12 18 36 42 77 112 130 100 92 150
Y 29 36 40 42 40 46 38 35 31 24

a. Construya el diagrama de dispersin y analice el comportamiento de las opiniones


favorables con respecto al nmero de publicaciones efectuadas por el gobierno en las
redes sociales.
b. Calcule el coeficiente de correlacin lineal de Pearson entre las dos variables e
indique qu significa este coeficiente en este problema.
c. Vale la pena calcula la ecuacin de regresin entre estas dos variables? Sera
razonable pronosticar la opinin de los ciudadanos sobre el gobierno a travs del
nmero de sus publicaciones en las redes sociales? Explique.

Examen del captulo:


En cada caso seleccione la opcin que mejor contesta cada pregunta (las respuestas a los
ejercicios se encuentran en la pgina de internet del texto:
www.auladeeconomia.com/raeep.html).

1. Si un investigador descubre que conforme aumenta el nmero de usuarios de Facebook que


son casados, tambin aumenta el nmero de divorcios, entonces podra considerar que:
(a) El mayor uso de Facebook podra ser causante del aumento en el nmero de divorcios.
(b) Existe una relacin causa efecto entre las dos variables.
(c) Estas dos variables podran correlacionarse.
(d) La relacin entre las dos variables es fuerte y directa.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
478

2. Con relacin a la determinacin del grado de asociacin estadstica entre dos variables, un
investigador efectu las siguientes dos afirmaciones:

A. Solo se trata de establecer la fuerza o intensidad de la relacin.


B. Se determina la naturaleza o direccin de la relacin, pero no su intensidad.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

3. Con relacin a la determinacin del grado de asociacin estadstica entre dos variables, un
investigador efectu las siguientes dos afirmaciones:

A. Una fuerte relacin entre dos variables implica que exista causalidad.
B. Una fuerte relacin entre dos variables es condicin necesaria de la existencia de
causalidad entre ellas.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

4. Con relacin a la determinacin del grado de asociacin estadstica entre dos variables, un
investigador efectu las siguientes dos afirmaciones:

A. Es posible encontrar un elevado coeficiente de correlacin entre dos variables que no


tienen relacin alguna.
B. Un alto coeficiente de correlacin entre dos variables es espurio si ste se explica por
la presencia de un tercer factor.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

5. Con relacin a la determinacin de la causalidad entre dos variables, sera falso que la
variable x causa a la variable y, si:
(a) El coeficiente de correlacin entre x y y es cercano a 1.
(b) Las variaciones en x en un periodo podran asociarse con las variaciones de y en el periodo
siguiente.
(c) Cambios de mayor magnitud en x no se asocian con cambios mayores en y.
(d) Existe teora que respalda la relacin causal entre x y y.

6. Al observar la grfica, podra afirmarse que es verdadero que:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
479

(a) El coeficiente de correlacin de Pearson entre x y y es cercano a 1.


(b) El coeficiente de correlacin de Pearson entre x y y es cercano a 1.
(c) El coeficiente de correlacin de Pearson entre x y y es cercano a 0.
(d) El coeficiente de correlacin de Pearson entre x y y es mayor que 1.

7. Al observar la grfica, podra afirmarse que es verdadero que:

(a) La relacin entre las variables x y y es fuerte e inversa.


(b) La relacin entre las variables x y y es dbil e inversa.
(c) La relacin entre las variables x y y es fuerte y directa.
(d) La relacin entre las variables x y y es dbil y directa.

8. Al observar la grfica, podra afirmarse que es verdadero que:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
480

(a) El coeficiente de correlacin de Pearson entre x y y es cercano a 1.


(b) El coeficiente de correlacin de Pearson entre x y y es cercano a 1.
(c) El coeficiente de correlacin de Pearson entre x y y es positivo y cercano a 0.
(d) El coeficiente de correlacin de Pearson entre x y y es negativo y cercano a 0.

9. Al observar la grfica, podra afirmarse que es verdadero que:

(a) La relacin entre las variables x y y es fuerte e inversa.


(b) La relacin entre las variables x y y es dbil e inversa.
(c) La relacin entre las variables x y y es fuerte y directa.
(d) La relacin entre las variables x y y es dbil y directa.

10. Al observar la grfica, podra afirmarse que es verdadero que:

(a) El coeficiente de correlacin de Pearson entre x y y es cercano a 1.


(b) El coeficiente de correlacin de Pearson entre x y y es cercano a 1.
(c) El coeficiente de correlacin de Pearson entre x y y es positivo y cercano a 0.
(d) El coeficiente de correlacin de Pearson entre x y y es negativo y cercano a 0.

11. Al observar la grfica, podra afirmarse que es verdadero que:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
481

X 2

(a) La relacin entre las variables x y y es fuerte e inversa.


(b) La relacin entre las variables x y y es dbil e inversa.
(c) La relacin entre las variables x y y es fuerte y directa.
(d) La relacin entre las variables x y y es dbil y directa.

12. Al observar la grfica, podra afirmarse que es verdadero que:

(a) El coeficiente de correlacin de Pearson entre x y y es cercano a 1.


(b) El coeficiente de correlacin de Pearson entre x y y es cercano a 1.
(c) El coeficiente de correlacin de Pearson entre x y y es cercano a 0.
(d) Ninguna de las anteriores.

13. Al observar la grfica, podra afirmarse que es verdadero que:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
482

(a) La relacin entre las variables x y y es fuerte e inversa.


(b) La relacin entre las variables x y y es dbil e inversa.
(c) La relacin entre las variables x y y es fuerte y directa.
(d) No hay relacin entre x y y.

14. Si al correlacionar la variable x y la variable y, se obtiene un coeficiente r = 0,87, puede


afirmarse que:
(a) La correlacin entre x y y es directa y fuerte.
(b) La asociacin lineal entre x y y es directa y moderada.
(c) Las variables x y y tienen una escasa correlacin inversa.
(d) Incrementos en x podran asociarse sistemticamente con disminuciones en y.

15. Si al correlacionar la variable x y la variable y, se obtiene un coeficiente r = 0,16, puede


afirmarse que:
(a) La correlacin entre x y y es directa y fuerte.
(b) La asociacin lineal entre x y y es directa y moderada.
(c) Las variables x y y tienen una escasa correlacin inversa.
(d) Un aumento fuerte en x no podra asociarse sistemticamente con un aumento en y.

16. Si se correlacionan las tasas de inters de los prstamos con la cantidad de viviendas
vendidas por periodo, entonces se esperara que el coeficiente de correlacin entre estas dos
variables sea:
(a) Cercano a cero.
(b) Positivo y cercano a uno.
(c) Negativo.
(d) Ninguna de las anteriores.

17. Si se correlaciona el ingreso disponible de un pas con el nivel de consumo agregado,


entonces se esperara que el coeficiente de correlacin entre estas dos variables sea:
(a) Cercano a cero.
(b) Positivo y cercano a uno.
(c) Negativo.
(d) Ninguna de las anteriores.

18. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:

X 11 15 18 22 14 18 17 24

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
483

Y 61 68 73 78 69 71 74 76

Entonces el coeficiente de correlacin lineal de Pearson equivale a:


(a) 0,83 (b) 1,16 (c) 0,911 (d) Ninguna de las anteriores

19. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el nmero de casos de neumona que se presentaron en un determinado
periodo:

X 86 88 93 91 90 87 88 90
Y 11 9 15 17 10 13 16 17

Entonces el coeficiente de correlacin lineal de Pearson equivale a:


(a) 0,456 (b) 0,208 (c) 0,637 (d) Ninguna de las anteriores

20. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el nmero de casos de neumona que se presentaron en un determinado
periodo:

Humedad relativa 86 88 93 91 90 87 88 90
Casos de neumona 11 9 15 17 10 13 16 17

Entonces puede concluirse que:


(a) La correlacin entre la humedad relativa y el nmero de casos de neumona es alta
(b) La humedad relativa es claro determinante del nmero de casos de neumona
(c) Los puntos del diagrama de dispersin estarn muy cercanos a una lnea recta
(d) Ninguna de las anteriores

21. Al observar la grfica, donde la lnea corresponde a la recta de regresin obtenida por el
mtodo de mnimos cuadrados, podra afirmarse que es falso que:

100
Y
90

80

70

60

50

40

30

20

10

0
0 2 4 6 8 10 12 14 16

(a) El coeficiente de correlacin de Pearson entre x y y es positivo.


(b) La pendiente de la ecuacin de regresin es positiva.
(c) La suma de los cuadrados de los residuos es mxima.
(d) El intercepto de la recta es cercano a 20.

22. Al observar la grfica, donde la lnea corresponde a la recta de regresin obtenida por el
mtodo de mnimos cuadrados, la variable x es el nmero semanal de unidades producidas en

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
484

una fbrica y la variable y corresponde a los costos totales de produccin, entonces es falso
que:

100
Y
90

80

70

60

50

40

30

20

10

0
0 2 4 6 8 10 12 14 16

(a) La pendiente de la recta es el costo incremental de una unidad producida.


(b) La recta estima los costos totales de la fbrica a distintos niveles de produccin.
(c) La pendiente de la recta da el costo unitario de produccin.
(d) El intercepto de la recta equivale a los costos fijos de produccin.

23. Se ha establecido que la relacin entre el nmero de aos de experiencia de un vendedor


(X) y los montos que logra vender por mes (Y, en miles de $) est dada por Y = 0,3 + 2X,
entonces no es verdadero que:
(a) Por cada ao de experiencia se espera que sus ventas aumenten en $2 mil al mes.
(b) Si tuviera cero experiencia, se esperara que venda $0,3 mil.
(c) Si tuviera dos aos de experiencia, se esperara que venda $4,6 millones.
(d) Si tuviera un ao de experiencia, se esperara que venda $2,3 millones.

24. Se ha establecido que la relacin entre el gasto en publicidad de una empresa (X) y los
montos que logra vender por mes (Y, en millones de $), est dada por Y = 4,3 + 1,5X, entonces
es verdadero que:
(a) Si la empresa no gasta en publicidad, entonces sus ventas seran de $1,5 millones.
(b) Si la empresa gasta $1 milln ms en publicidad, se esperara que sus ventas aumenten en
$4,3 millones.
(c) El coeficiente de correlacin lineal entre el gasto en publicidad y las ventas de la empresa
es positivo.
(d) Ninguna de las anteriores.

25. Suponga que se cuenta con los siguientes datos sobre dos variables, la humedad relativa
en distintas zonas, y el nmero de casos de neumona que se presentaron en un determinado
periodo:

Humedad relativa 86 88 93 91 90 87 88 90
Casos de neumona 11 9 15 17 10 13 16 17

Entonces puede concluirse que:


(a) La pendiente de la ecuacin de regresin es 43,3.
(b) La pendiente de la ecuacin de regresin es 0,637.
(c) La pendiente de la ecuacin de regresin es 0,456.
(d) Ninguna de las anteriores.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
485

26. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:

X 11 15 18 22 14 18 17 24
Y 61 68 73 78 69 71 74 76

Entonces la ecuacin de regresin lineal, tomando a x como variable independiente, es:


(a) y = 51,2 1,16x
(b) y = 33,8 + 0,718x
(c) y = 1,16x + 51,2
(d) Ninguna de las anteriores

27. Si al relacionar la variable x y la variable y, se obtiene un coeficiente R2 = 0,87, entonces


es falso con certeza que:
(a) La correlacin entre x y y es fuerte.
(b) El modelo lineal entre x y y explica el 93,3% de la variabilidad de y.
(c) El modelo lineal entre x y y explica el 87% de la variabilidad de y.
(d) El coeficiente de correlacin lineal entre las dos variables 0,933.

28. Al relacionar la variable x y la variable y, se obtiene un coeficiente R2 = 0,96. Un


investigador efectu las siguientes dos afirmaciones:

A. El modelo lineal entre x y y no es un buen modelo, porque tiene escaso poder


explicativo.
B. El ajuste de la recta es muy bueno.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

29. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:

X 11 15 18 22 14 18 17 24
Y 61 68 73 78 69 71 74 76

Un investigador efectu las siguientes dos afirmaciones:

A. Al realizar la interpolacin del valor x = 10, se obtiene y = 62,8.


B. Al realizar la extrapolacin del valor x = 12, se obtiene y = 65,12.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

30. Suponga que se cuenta con los siguientes datos sobre dos variables x y y:

X 14 18 11 20 23 14 17 19 15 16
Y 65 72 60 75 80 63 70 74 66 64

Un investigador efectu las siguientes dos afirmaciones:

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
486

A. Al realizar la extrapolacin del valor x = 10, se obtiene y = 57.


B. Al realizar la interpolacin del valor x = 12, se obtiene y = 60,54.

Con respecto a las dos afirmaciones anteriores, es correcto que:


(a) Ambas son verdaderas (b) Solo A es verdadera
(c) Ambas son falsas (d) Solo B es verdadera

Respuestas a los ejercicios de seleccin nica:

31. c 32. c 33. d 34. a 35. c


36. b 37. c 38. c 39. d 40. a
41. b 42. c 43. d 44. d 45. d
46. c 47. b 48. c 49. a 50. d
51. c 52. c 53. c 54. c 55. b
56. c 57. b 58. d 59. c 60. a

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
487

Otros temas .

Los siguientes temas slo se encuentran desarrollados en la pgina de internet de este texto:

Anlisis de varianza (ANOVA)

Chi-cuadrado: Pruebas de bondad de ajuste, Pruebas de independencia y Pruebas de


homogeneidad

Regresin mltiple

Modelos de series de tiempo y mtodos de pronstico

Nmeros ndice

Indicadores estadsticos: Indicadores econmicos, indicadores sociales y de salud

Correlacin en variables cualitativas: coeficiente Q y coeficiente de correlacin de


Spearman

Es necesario ingresar a www.auladeeconomia.com/raeep.html y emplear su usuario y


contrasea para acceder a estos materiales.

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
488

Apndice .

Tablas y frmulas

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
489

Apndice 1: Frmulas de estadstica descriptiva

Medidas de posicin:
Datos sin agrupar Datos agrupados
Media aritmtica: Media aritmtica:
n

x i k

x i 1
x i fi
n x i 1

n
Media aritmtica ponderada:
a. Caso de valores repetidos:
k Mediana:
x i fi
x i 1

n
n Fi 1
b. Caso de valores con diferente importancia: Med Li c 2
fi
k
x w i i
x i 1
k Moda:
wi
i 1

d1
Media geomtrica: M o Li c
d1 d 2
Mg n x1 x2 ... xn

Moda: Percentiles:
Valor que se repite ms veces

Mediana:
m
PMed
N 1 100 n Fi 1
2 Pm Li c
fi

Percentiles:
Pm 100
m
n 1

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
490

Medidas de variabilidad
Datos sin agrupar Datos agrupados
Varianza: Varianza:
Poblacin Poblacin
N

(x i )2 N

2 i 1
(x i )2 fi
N 2 i 1
N
Muestra
n Muestra
(x i x )2
s2 i 1 n
n 1 (x i x )2 fi
s2 i 1
Desviacin estndar: n 1
Poblacin
Frmula alternativa para calcular la varianza:
N

(x )2 n
2

xi f i
i
i 1
2

xi f i i 1
n
N
2

n
s 2 i 1
Muestra n 1

n Desviacin estndar:
(x i x) 2
Poblacin
s i 1
s2
n 1 2
Frmula alternativa para calcular la Muestra
desviacin estndar:
2
n s s2
xi
i 1
n

x
2
i
n
s i 1
Coeficiente de variacin:
n 1
Poblacin:
Coeficiente de variacin:

Poblacin: CV 100

CV 100

Muestra:
Muestra:
s
s CV 100
CV 100 x
x

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
491

Apndice 2: Frmulas de probabilidad:

Factorial: Teoremas de probabilidad:

n! = n (n1) (n2) 2 1 0 P( A) 1

Permutaciones: P( E C ) 1 P( E )

n!
P(n, r )
(n r ) ! P( AB )
P( B / A)
P( A)

Combinaciones:
Reglas de adicin de probabilidad:
n!
C (n, r )
r ! (n r ) ! P( A B) P( A) P( B)

Permutaciones con repeticin: P( A B) P( A) P( B) P( AB)

n!
n1 ! n2 !... nk ! Reglas de multiplicacin de probabilidad:

P( AB) P( A) P( B)
Definicin clsica de probabilidad:

a P( AB) P( A) P( B / A)
P( A)
N

Teorema de Bayes:
Frecuencia relativa como probabilidad:
P( A) P( Bi ) P( A / Bi )
F ( A)
P( A) Fr ( A)
N
P( B) P( A / B)
P( B / A)
P( B) P( A / B) P( B ) P( A / B )

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
492

Apndice 3: Frmulas de distribuciones de probabilidad:

Valor esperado: Variancia: Desviacin estndar:

E ( X ) xi P ( x i ) 2 ( xi E ( X )) 2 P( xi )

Distribuciones discretas:
Distribucin binomial: Distribucin hipergeomtrica:

P( X / n, p) C (n, x) p x q n x N a a

n X X
n! P ( X / N , a, n)
p x q n x N
x !( n x ) !
n
= np
Distribucin geomtrica:
g ( x, p) p(1 p) x1
npq

Distribucin de Poisson: Distribucin multinomial:

x e f ( x1 , x2 ,..., xk )
n! x x x
P( X / ) p1 1 p 2 2 ... p k k
X! x1 ! x2 ! ... xk !

Distribuciones continuas:
Distribucin exponencial: Distribucin normal:

P 1 e x
z


Pe
Aproximacin de la binomial por la normal:
1
E ( x) x x np
z
1 npq
V ( x)
2

= np

2 = npq

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
493

Apndice 4: Frmulas de inferencia estadstica

N n
Error estndar x x
n n N 1

Intervalos de confianza para n


x Z / 2 / n x Z s/ n
30 o conocida

Intervalos de confianza para n


< 30 y desconocida x ts/ n
Intervalos de confianza para
una proporcin
p+Z pq n

Z / 2
2
Tamao de muestra en
poblaciones infinitas n n = P(1 - P) (Z / E)2
E
n
Tamao de muestra en n0
n
poblaciones finitas 1
N
Prueba de hiptesis para la x x
media con n 30 o zc zc
conocida / n s/ n
Prueba de hiptesis para la x
media con n < 30 y tc
desconocida s/ n
x nP
Prueba de hiptesis para una z
proporcin nPQ
( x1 x2 )
Prueba de hiptesis para la z
diferencia de dos medias con 12 22
n 30 o conocida

n1 n2
( x1 x2 )
Prueba de hiptesis para la t (n1 1) s12 (n2 1) s22
diferencia de dos medias con 2 2 2
n < 30 y desconocida n1 n2 2
n1 n2
Prueba de hiptesis para la xd
diferencia de dos medias con t
datos pareados sd n
p1 p2
z x1 x 2
Prueba de hiptesis para la p
1 1
diferencia de dos proporciones pq n1 n2
n1 n2

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
494

Apndice 5: Frmulas de regresin y correlacin lineal simple

Coeficiente de correlacin lineal de Pearson:

N XY ( X )( Y )
r
( N X 2 ( X ) 2 )( N Y 2 ( Y ) 2 )

Interseccin de la recta de regresin:

a
Y b X
N N
a Y bX

Pendiente de la recta de regresin:

N XY ( X )( Y )
b
N X 2 ( X ) 2

Coeficiente de determinacin:

R2 = r2

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
495

Apndice 6: Distribucin normal estndar acumulada

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
496

Apndice 7: Distribucin T de Student

Nivel de significancia para pruebas de una cola


0,1 0,05 0,025 0,01 0,005 0,0005
Nivel de significancia para pruebas de dos colas
gl 0,2 0,1 0,05 0,02 0,01 0,001
1 3,078 6,314 12,706 31,821 63,657 636,619
2 1,886 2,920 4,303 6,965 9,925 31,599
3 1,638 2,353 3,182 4,541 5,841 12,924
4 1,533 2,132 2,776 3,747 4,604 8,610
5 1,476 2,015 2,571 3,365 4,032 6,869
6 1,440 1,943 2,447 3,143 3,707 5,959
7 1,415 1,895 2,365 2,998 3,499 5,408
8 1,397 1,860 2,306 2,896 3,355 5,041
9 1,383 1,833 2,262 2,821 3,250 4,781
10 1,372 1,812 2,228 2,764 3,169 4,587
11 1,363 1,796 2,201 2,718 3,106 4,437
12 1,356 1,782 2,179 2,681 3,055 4,318
13 1,350 1,771 2,160 2,650 3,012 4,221
14 1,345 1,761 2,145 2,624 2,977 4,140
15 1,341 1,753 2,131 2,602 2,947 4,073
16 1,337 1,746 2,120 2,583 2,921 4,015
17 1,333 1,740 2,110 2,567 2,898 3,965
18 1,330 1,734 2,101 2,552 2,878 3,922
19 1,328 1,729 2,093 2,539 2,861 3,883
20 1,325 1,725 2,086 2,528 2,845 3,850
21 1,323 1,721 2,080 2,518 2,831 3,819
22 1,321 1,717 2,074 2,508 2,819 3,792
23 1,319 1,714 2,069 2,500 2,807 3,768
24 1,318 1,711 2,064 2,492 2,797 3,745
25 1,316 1,708 2,060 2,485 2,787 3,725
26 1,315 1,706 2,056 2,479 2,779 3,707
27 1,314 1,703 2,052 2,473 2,771 3,690
28 1,313 1,701 2,048 2,467 2,763 3,674
29 1,311 1,699 2,045 2,462 2,756 3,659
30 1,310 1,697 2,042 2,457 2,750 3,646

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
497

Apndice 8: Percentiles de la distribucin ChiCuadrado

Valores de alfa
gl 0,995 0,990 0,975 0,900 0,500 0,100 0,050 0,025 0,010 0,005
1 0,00 0,00 0,00 0,02 0,45 2,71 3,84 5,02 6,63 7,88
2 0,01 0,02 0,05 0,21 1,39 4,61 5,99 7,38 9,21 10,60
3 0,07 0,11 0,22 0,58 2,37 6,25 7,81 9,35 11,34 12,84
4 0,21 0,30 0,48 1,06 3,36 7,78 9,49 11,14 13,28 14,86
5 0,41 0,55 0,83 1,61 4,35 9,24 11,07 12,83 15,09 16,75
6 0,68 0,87 1,24 2,20 5,35 10,64 12,59 14,45 16,81 18,55
7 0,99 1,24 1,69 2,83 6,35 12,02 14,07 16,01 18,48 20,28
8 1,34 1,65 2,18 3,49 7,34 13,36 15,51 17,53 20,09 21,95
9 1,73 2,09 2,70 4,17 8,34 14,68 16,92 19,02 21,67 23,59
10 2,16 2,56 3,25 4,87 9,34 15,99 18,31 20,48 23,21 25,19
11 2,60 3,05 3,82 5,58 10,34 17,28 19,68 21,92 24,72 26,76
12 3,07 3,57 4,40 6,30 11,34 18,55 21,03 23,34 26,22 28,30
13 3,57 4,11 5,01 7,04 12,34 19,81 22,36 24,74 27,69 29,82
14 4,07 4,66 5,63 7,79 13,34 21,06 23,68 26,12 29,14 31,32
15 4,60 5,23 6,26 8,55 14,34 22,31 25,00 27,49 30,58 32,80
16 5,14 5,81 6,91 9,31 15,34 23,54 26,30 28,85 32,00 34,27
17 5,70 6,41 7,56 10,09 16,34 24,77 27,59 30,19 33,41 35,72
18 6,26 7,01 8,23 10,86 17,34 25,99 28,87 31,53 34,81 37,16
19 6,84 7,63 8,91 11,65 18,34 27,20 30,14 32,85 36,19 38,58
20 7,43 8,26 9,59 12,44 19,34 28,41 31,41 34,17 37,57 40,00
21 8,03 8,90 10,28 13,24 20,34 29,62 32,67 35,48 38,93 41,40
22 8,64 9,54 10,98 14,04 21,34 30,81 33,92 36,78 40,29 42,80
23 9,26 10,20 11,69 14,85 22,34 32,01 35,17 38,08 41,64 44,18
24 9,89 10,86 12,40 15,66 23,34 33,20 36,42 39,36 42,98 45,56
25 10,52 11,52 13,12 16,47 24,34 34,38 37,65 40,65 44,31 46,93
26 11,16 12,20 13,84 17,29 25,34 35,56 38,89 41,92 45,64 48,29
27 11,81 12,88 14,57 18,11 26,34 36,74 40,11 43,19 46,96 49,64
28 12,46 13,56 15,31 18,94 27,34 37,92 41,34 44,46 48,28 50,99
29 13,12 14,26 16,05 19,77 28,34 39,09 42,56 45,72 49,59 52,34
30 13,79 14,95 16,79 20,60 29,34 40,26 43,77 46,98 50,89 53,67

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
498

Apndice 9: Valores de F con probabilidad de 5%

gl (numerador)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 161,4 199,5 215,7 224,6 230,2 234 236,8 238,9 240,5 241,9 243 243,9 244,7 245,4 245,9
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,40 19,41 19,42 19,42 19,43
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,76 8,74 8,73 8,71 8,70
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,94 5,91 5,89 5,87 5,86
5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,70 4,68 4,66 4,64 4,62
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,03 4,00 3,98 3,96 3,94
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,60 3,57 3,55 3,53 3,51
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,31 3,28 3,26 3,24 3,22
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,10 3,07 3,05 3,03 3,01
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,94 2,91 2,89 2,86 2,85
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,82 2,79 2,76 2,74 2,72
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,72 2,69 2,66 2,64 2,62
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,63 2,60 2,58 2,55 2,53
gl (denominador)

14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,57 2,53 2,51 2,48 2,46
15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,51 2,48 2,45 2,42 2,40
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,46 2,42 2,40 2,37 2,35
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,41 2,38 2,35 2,33 2,31
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,37 2,34 2,31 2,29 2,27
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,34 2,31 2,28 2,26 2,23
20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,31 2,28 2,25 2,22 2,20
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,28 2,25 2,22 2,20 2,18
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,26 2,23 2,20 2,17 2,15
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,24 2,20 2,18 2,15 2,13
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,22 2,18 2,15 2,13 2,11
25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,20 2,16 2,14 2,11 2,09
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,18 2,15 2,12 2,09 2,07
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,17 2,13 2,10 2,08 2,06
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,15 2,12 2,09 2,06 2,04
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,14 2,10 2,08 2,05 2,03
30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,13 2,09 2,06 2,04 2,01

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
499

Apndice 10: Tabla de nmeros aleatorios

00-04 05-08 09-12 13-16 17-20 21-24 25-28 29-32


1 7726 9142 0509 3417 6443 7468 5143 7968
2 8801 6002 5259 9768 4499 2696 0877 9978
3 6009 5547 8606 9887 1964 8545 5722 7317
4 3481 2006 3831 9038 2583 1540 4953 0512
5 7797 4644 4293 9271 6062 7156 7326 8991
6 8752 2020 5904 7433 8420 6919 6927 2910
7 2791 4235 0722 8137 7215 3097 4187 4456
8 9875 9842 1686 5214 0793 6291 9259 0477
9 1221 5661 9184 0084 3971 1472 9627 1873
10 7123 8801 8455 6712 0954 4398 0655 9439
11 4899 0310 2029 7702 2743 9840 6441 0177
12 6606 5232 9366 9322 2790 2250 8859 822
13 1940 5929 7398 2336 2025 1655 8210 8216
14 1588 2678 4960 7533 5305 5142 1695 7840
15 7480 0040 2576 5797 9105 8726 9761 3024
16 7975 4093 5796 7168 8284 6291 9852 3314
17 5431 3722 3443 8111 7779 5324 8626 8356
18 1122 5219 8457 1967 8211 2308 7645 8414
19 9966 3483 1878 0115 7024 6604 7065 7372
20 5004 3073 1012 1344 9928 5689 6501 8544
21 2676 4479 1260 9629 1788 8160 3228 4977
22 8884 8927 736 8064 5324 9759 9538 3602
23 3098 9329 6283 6973 9107 0693 1650 6601
24 8199 2133 2267 5986 4630 0478 5626 9605
25 7005 5128 2380 4769 6022 0098 6130 0601

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
500

INDICE:
Distribucin geomtrica, 239
Distribucin hipergeomtrica, 223
A Distribucin muestral, 296
Anlisis de varianza, ANOVA, 488 Distribucin multinomial, 237
Aproximacin de la distribucin de Poisson a la binomial, Distribucin normal, 259
235 Distribucin normal estndar, 260
Aproximacin de la distribucin normal a la binomial, Distribucin t, 301, 310, 382
276 Distribuciones continuas de probabilidad, 259
Asimetra, 93 Distribuciones de probabilidad, 210
Distribuciones discretas de probabilidad, 215
B
E
Bondad de ajuste, 466
Ecuacin de regresin, 459
Entrevista personal, 26
C Entrevista telefnica, 26
Clculo del tamao de la muestra, 337, 344 Error de estimacin, 303
Campana de Gauss, 260 Error de muestreo, 20, 334
Caractersticas, 16 Error estndar, 299
Causalidad, 458 Error tipo I, 376
Error tipo II, 376
Escala de intervalo, 31
Ch Escala de razn, 31
Chi-cuadrado, 488 Escala nominal, 29
Escala ordinal, 30
Escalas de medida, 29
C Espacio muestral, 178
Coeficiente de correlacin de Spearman, 488 Esperanza matemtica, 212
Coeficiente de correlacin lineal de Pearson, 450 Estadstica, 12
Coeficiente de determinacin, 466 Estadstica descriptiva, 12
Coeficiente Q, 488 Estimador, 333
Coeficientes de la ecuacin de la recta, 461 Evento complementario, 191
Combinaciones, 183 Eventos, 178
Confiabilidad, 27 Eventos dependientes, 194
Confianza, 303 Eventos excluyentes, 188
Conglomerados, 355 Eventos independientes, 193, 194
Constante de espaciamiento, 350 Eventos mutuamente excluyentes, 188
Conteo, 179 Eventos no excluyentes, 188
Correccin por continuidad, 277 Experimento estadstico, 210
Correlacin, 445 Extrapolacin, 467
Correlacin en variables cualitativas, 488
Correlacin espuria, 458 F
Correlacin lineal, 444
Correo, 26 Factor de correccin, 299, 339, 345
Criterios de causalidad, 459 Factorial, 180
Cuadros estadsticos, 46 Frmula de Sturges, 150
Cuantilos, 97 Fuentes de informacin, 24
Cuartiles, 97, 164 Fuentes primarias, 25
Cuestionario, 28 Fuentes secundarias, 25
Funciones de la estadstica, 14

D
G
Deciles, 98
Desviacin cuartil, 111 Grados de libertad, 312
Desviacin estndar, 116, 166 Grfica de caja, 106
Diagrama de dispersin, 66, 445 Grficas lineales, 62
Dispersin, 114 Grfico circular, 60
Distribucin binomial, 215 Grfico de barra 100 %, 56
Distribucin de frecuencias, 149 Grfico de barras comparativas, 54
Distribucin de Poisson, 230 Grfico de barras compuestas, 57
Distribucin exponencial, 280 Grfico de barras de doble direccin, 59

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
501

Grfico de barras simples, 51 O


Grficos, 49
Grficos de barras, 51 Observacin, 17, 26
Observaciones pareadas, 417
H
P
Hiptesis, 372
Hiptesis alternativa, 372 Parmetro, 18, 333
Hiptesis nula, 372 Percentiles, 98, 164
Histograma, 155 Permutaciones, 181
Pictogramas, 65
Poblacin, 17, 331
I Poblacin finita, 17
Indicadores econmicos, 488 Poblacin infinita, 17
Indicadores sociales y de salud, 488 Poblaciones finitas, 338
Inferencia estadstica, 12, 296 Poblaciones infinitas, 345
Inferencia mediante pruebas de hiptesis, 372 Polgono de frecuencias, 158
Inferencia para la media, 302 Pregunta abierta, 28
Inferencia para proporciones, 314 Pregunta cerrada, 28
Instrumentos de recoleccin de informacin, 25 Presentacin textual, 45
Interpolacin, 467 Primer cuartil, 98
Intervalo de clase, 150 Principio de multiplicacin de conteo, 179
Intervalo de confianza, 304 Probabilidad, 178
Intervalos de confianza y prueba de hiptesis, 389 Probabilidad condicional, 192
Investigacin estadstica, 23 Procedimiento para pruebas de hiptesis, 378
Procesamiento, 45
Proporcin, 343
L Prueba de dos colas, 378
Lmites de clase, 151 Prueba de hiptesis con muestras pequeas, 381
Lmites de estimacin, 304 Prueba de hiptesis para diferencias entre medias, 406
Prueba de hiptesis para la proporcin poblacional, 383
Prueba de una cola, 378
M Pruebas de bondad de ajuste, 488
Marco muestral, 347 Pruebas de hiptesis, 372
Media aritmtica, 80, 162 Pruebas de homogeneidad, 488
Media geomtrica, 85 Pruebas de independencia, 488
Media ponderada, 83 Pruebas para la diferencia de dos proporciones, 422
Mediana, 90, 161 Puntajes estandarizados, 124
Medidas de posicin, 79 Punto medio, 152
Medidas de posicin central, 79
Medidas de variabilidad, 114 Q
Mtodos de pronstico, 488
Mnimos cuadrados, 460 Quintiles, 98
Moda, 88, 159
Modelos de series de tiempo, 488 R
Muestra, 18, 331
Muestreo aleatorio, 19, 334 Rango intercuartil, 111
Muestreo aleatorio estratificado, 353 Registro, 26
Muestreo aleatorio por conglomerados, 355 Regla de la suma o adicin de probabilidades, 189
Muestreo aleatorio sistemtico, 350 Regla de multiplicacin de probabilidades, 194
Muestreo de juicio, 356 Regla emprica, 121
Muestreo estadstico, 19 Regresin, 459
Muestreo no aleatorio, 19, 334, 356 Regresin lineal simple, 459
Muestreo por conveniencia, 356 Regresin mltiple, 488
Muestreo simple al azar, 347 Relacin directa, 443
Relacin inversa, 443
N
S
Nivel de confianza, 303, 336
Nivel de significancia, 378 Sesgo, 20, 335
Nmeros ndice, 488 Simetra, 93

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html
502

T V
Tabla de nmeros aleatorios, 347 Validez, 27
Tamao de la muestra, 336 Valor esperado, 212
Tcnicas de muestreo, 346 Valor P, 385
Teorema de Bayes, 195 Valores atpicos o extremos, 110
Teorema de Chebyshev, 311 Variabilidad, 114
Teorema de Chebyshev, 123 Variabilidad relativa, 126
Teorema del lmite central, 300 Variable continua, 16
Tercer cuartil, 98 Variable discreta, 16
Test, 26 Variables, 16
Variables aleatorias, 210
Variables aleatorias continuas, 210
U Variables aleatorias discretas, 210
Unidad de informacin, 332 Variables cualitativas, 16
Unidad de muestreo, 332 Variables cuantitativas, 16
Unidad estadstica, 15, 330 Varianza, 116, 166, 212
Unidades primarias, 355

Recursos para el Aprendizaje Efectivo de la Estadstica y la Probabilidad


www.auladeeconomia.com/raeep.html

You might also like