You are on page 1of 92

PROBABILIDAD Y ESTADISTICA

MC Ada Salazar Compa


aida.sc@itesm.mx
PROBABILIDAD Y ESTADISTICA. 1
Aplicaciones de la Estadstica
Media 5.676
Error estndar 1.4956
Mediana 3.4
Moda 2
Desviacin Estndar 7.47
Varianza Muestral 55.92
Curtosis 16.13
Sesgo 3.806
Amplitud de la variacin 36.5
Mnimo 1.8
Mximo 38.3
Suma 141.9
Conteo 25
La tabla siguiente posee el resumen de una poblacin.
Qu podra decir acerca de los datos, son simtricos o sesgados?
La seora Katy Ball de AutoUSA quera desarrollar algunas tablas y grficas para mostrar el
precio de venta tpico en diversas distribuidoras. La siguiente tabla reporta slo el precio
de los 80 vehculos vendidos el mes pasado en Whitner Autoplex.
a. Cul es el precio de venta tpico?

b. Cul es el precio de venta ms alto ?
c. Cul es el precio de venta ms bajo?
d. Alrededor de qu valor tienden a agruparse los precios de venta?

$23 197 23 372 20 454 23 591 26 651 27 453 17 266
18 021 28 683 30 872 19 587 23 169 35 851 19 251
20 047 24 285 24 324 24 609 28 670 15 546 15 935
19 873 25 251 25 277 28 034 24 533 27 443 19 889
20 004 17 357 20 155 19 688 23 657 26 613 20 895
20 203 23 765 25 783 26 661 32 277 20 642 21 981
24 052 25 799 15 794 18 263 35 925 17 399 17 968
20 356 21 442 21 722 19 331 22 817 19 766 20 633
20 962 22 845 26 285 27 896 29 076 32 492 18 890
21 740 22 374 24 571 25 449 28 337 20 642 23 613
24 220 30 655 22 442 17 891 20 818 26 237 20 445
21 556 21 639 24 296
EJEMPLO
Se lanzan dos dados al aire y se anota la suma de los
puntos obtenidos. Se pide:
a. La probabilidad de que salga el 7.
b. La probabilidad de que el nmero obtenido
sea par.
c. La probabilidad de que el nmero obtenido
sea mltiplo de tres.

PROBABILIDAD Y ESTADISTICA. 4
Si se contesta sin pensar un test de 10 preguntas en las que hay que
contestar si es cierto o falso.
a. Cul es la probabilidad de acertar el 70 % o ms de las preguntas?,
b. y exactamente 7 de las 10 respuestas?


El tiempo de reparacin de unas mquinas de escribir tiene una
distribucin aproximadamente exponencial, con media 22 minutos.
a. Hallar la probabilidad de que el tiempo de reparacin sea menor que diez
minutos.
b. El costo de reparacin es de 2000 pts. por cada media hora o fraccin.
Cul es la probabilidad de que una reparacin cueste 4000 pts?


PROBABILIDAD Y ESTADISTICA. 5
Una empresa de material elctrico fabrica bombillas de luz que tienen
una duracin aproximadamente distribuida de forma normal, con una
desviacin estndar de 40 horas. Si una muestra de 30 bombillas tiene
una duracin promedio de 780 horas, encuentre un intervalo de
confianza de 96% para la media de la poblacin de todas las bombillas
que produce esta empresa.
PROBABILIDAD Y ESTADISTICA. 6
Se comparan las resistencias de dos clases de hilo. Cincuenta piezas de
cada clase de hilo se prueban bajo condiciones similares. La marca A tiene
una resistencia a la tensin promedio de 78.3 kilogramos con una
desviacin estndar de 5.6 kilogramos; en tanto que la marca B tiene una
resistencia a la tensin promedio de 87.2 kilogramos con una desviacin
estndar de 6.3 kilogramos. Construye un intervalo de confianza de 95%
para la diferencia de las medias poblacionales.
Intencin del curso
Es un curso de nivel bsico que tiene la intencin de
desarrollar en el alumno su capacidad de abstraccin y la
habilidad de resolucin de problemas. Esto se lograr
mediante la exposicin a problemas que involucran
incertidumbre en una o varias dimensiones, expresndolos
y explicndolos en trminos de probabilidad y estadstica y a
partir de esto encontrando soluciones de los mismos.


PROBABILIDAD Y ESTADISTICA. 7
Objetivos Generales
Al finalizar el alumno ser capaz de:
1. Comprender los conceptos bsicos de
probabilidad y solucin a problemas con tcnicas de
conteo, probabilidad condicional, variables aleatorias
discretas y continuas y sus distribuciones

2. Analizar un conjunto de datos experimentales y
sacar inferencia estadsticas de los datos.

PROBABILIDAD Y ESTADISTICA. 8
TEMAS Y SUBTEMAS DEL CURSO
1. Estadstica descriptiva
1.1 Experimentacin
1.2 Presentacin de Datos
1.3 Medidas Estadsticas

2. Teora de probabilidad
2.1 Probabilidad
2.2 Probabilidades de eventos simples y compuestos
2.3 Tcnicas de Conteo
2.4 Probabilidad Condicional e independencia de eventos
2.5 Teorema de Bayes


PROBABILIDAD Y ESTADISTICA. 9
3. Variables aleatorias
3.1 Variables Aleatorias Discretas
3.2 Variables Aleatorias Continuas
3.3 Valor Esperado y Varianza de una Variable Aleatoria
3.4 Bernoulli y Binomial
3.5 Geomtrica y Binomial negativa.
3.6 Hipergeomtrica
3.7 Poisson
3.8 Distribucin Uniforme
3.9 Distribucin Normal
3.10 Distribucin Gama y Exponencial
3.11 Distribucin Weibull

PROBABILIDAD Y ESTADISTICA. 10
4. Estadstica Inferencial Bsica
4.1 Distribuciones Relacionadas con la Distribucin Normal
t-Student,
Ji(chi)-Cuadrada y
F de Fisher-Snedecor
4.2 Estimadores Puntuales
4.3 Propiedades de los Estimadores Puntuales
4.4 Distribuciones muestrales
4.5 Intervalos de Confianza para una poblacin
4.6 Pruebas de Hiptesis para una poblacin


PROBABILIDAD Y ESTADISTICA. 11
BIBLIOGRAFA

WACKERLY - MENDENHALL - SCHEAFFER
Estadstica Matemtica con Aplicaciones.
7 edicin, Mxico: CENGAGE LEARNING EDITORES , S.A. de C.V. 2010
ISBN-10: 970-830-010-1

I. Devore, Jay L.
Probabilidad y estadstica para ingeniera y ciencias
6a ed., Mxico : International Thomson Editores, 2005.
ISBN 970-686-457-1

II. Walpole, Ronald E.
Probabilidad y estadstica para ingenieros
9a ed., Mxico : Prentice-Hall, 1999.
ISBN 970-17-0264-6


PROBABILIDAD Y ESTADISTICA. 12
III. Navidi William.
Estadstica para ingenieros y cientficos.
1a ed., Mxico : McGraw-Hill, 2006.
ISBN 970-10-5629-9

IV. Ross Sheldon.
Probabilidad y Estadstica para ingenieros.
2a ed., Mxico : McGraw-Hill, 2002.
ISBN 0-12-598472-3

PROBABILIDAD Y ESTADISTICA. 13
V. Montgomery Douglas.
Diseo y Anlisis de Experimentos.
2a ed., Mxico : Limusa S.A. de C. V., 2004.
ISBN 968-18-6156-6

VI. Box George E. P, Hunter William G., Hunter J. Stuart.
Estadstica para investigadores.
Mxico : Revert Ediciones, 2002.
ISBN 968-6708-40-5

PROBABILIDAD Y ESTADISTICA. 14


POLTICAS GENERALES Y CDIGO DE TICA
Faltas. Lo sealado por el reglamento. Ninguna falta es justificable.
Inicio y fin de clase. Inicio: 5 minutos despus de la hora sealada. Fin:
5 minutos antes de la hora sealada.
Tareas y actividades Las formas de entrega y evaluacin se especifican
en cada una de ellas. Todas las tareas y actividades debern ser
entregadas en formato y tiempo de entrega sealados. No se califican
tareas extemporneas. Solo se calificarn tareas que cumplan con las
instrucciones de formatos y colocacin. No se califican prcticas en el
saln de clase, ni exmenes rpidos a los alumnos que no asistan a la
sesin en la que se lleven a cabo.

PROBABILIDAD Y ESTADISTICA. 15
Tareas y proyectos colaborativos de programacin. Se realizarn tareas
parciales de programacin (medianas) y un proyecto final. Las
especificaciones sern publicadas y establecidas en la plataforma. Todas
las fechas de entrega son previamente definidas y NO sern modificadas.
Exmenes parciales: Est estrictamente prohibido el uso de herramientas
de correo electrnico, mensajera instantnea y telfonos celulares
durante los exmenes. Su uso causar inmediatamente la cancelacin del
examen y se har acreedor a una calificacin de cero.
Examen final: 1 (terico-prctico en fecha y hora establecidos por la
oficina de servicios escolares)

PROBABILIDAD Y ESTADISTICA. 16
POLITICAS DE EVALUACION
Primer examen parcial 20%
Segundo examen parcial 20%
Tercer examen parcial 20%
Examen final 30%
Tareas 10%



PROBABILIDAD Y ESTADISTICA. 17
Exmenes Fechas de Examen
JUNIO
Primer Parcial MIERCOLES 11

Segundo Parcial MIERCOLES 18

Tercer Parcial MIERCOLES 25

ULTIMO DIA DE CLASES VIERNES 4 DE JULIO

ASESORIAS MARTES Y JUEVES 13:00 14:00



Razones para estudiar
ESTADSTICA
Se emplean tcnicas estadsticas en casi todas las fases de la vida. La
informacin est por todas partes.
Sin importar cul sea su profesin, tomar decisiones ms profesionales
que comprenden informacin.
Se disean encuestas para recabar los primeros informes en da de
elecciones y pronosticar el resultado de una eleccin .
Se hacen muestreos de consumidores para obtener informacin para
predecir preferencias de productos.
Mdicos investigadores realizan experimentos para determinar el efecto
de diversos medicamentos y condiciones ambientales controladas en
seres humanos para inferir el tratamiento adecuado para varias
enfermedades.


PROBABILIDAD Y ESTADISTICA. 18
Razones para estudiar
ESTADSTICA
Los ingenieros muestrean la caracterstica de calidad de un producto y
diversas variables de procesos controlables para identificar variables
clave relacionadas con la calidad de un producto .
Aparatos electrnicos recin manufacturados se muestrean antes de
enviarlos para decidir si se embarcan o se mantienen lotes individuales.
Los economistas observan varios ndices del estado de la economa en un
periodo y usan la informacin para pronosticar las condiciones de la
economa en el futuro.
Conceptos fundamentales de imgenes, operaciones bsicas con pixeles,
en sistemas de video los fundamentos de color.


PROBABILIDAD Y ESTADISTICA. 19
ESTADSTICA
La Estadstica es una rama de las matemticas que estudia la
recoleccin, anlisis, interpretacin y presentacin de masas
de informacin numrica.

La Estadstica es la ciencia que se ocupa de la toma de
decisiones bajo incertidumbre.

La Estadstica es una de las herramientas ms ampliamente
utilizadas en la investigacin cientfica.
La estadstica se divide es dos ramas.


Estadstica descriptiva: Parte de la estadstica que trata con la obtencin, ordenacin y
presentacin de informacin en un proceso especfico que presente variabilidad o
incertidumbre.

Estadstica Inferencial: Parte de la estadstica que analiza la informacin de un
proceso con el fin de emitir juicios que lleven a la mejora del proceso en si. La
herramienta principal de la estadstica inferencial es la probabilidad.
PROBABILIDAD Y ESTADISTICA. 21
Cmo reunir la informacin en un proceso especfico?

Estudio observacional: Donde los factores no pueden manejarse y simplemente se
observa el comportamiento de tal proceso a travs del tiempo.
Ejemplo: Observacin del comportamiento de la energa elctrica consumida en una
planta en funcin de las condiciones ambientales.
Estudio experimental bien diseado. Donde los factores pueden manejarse y
controlarse y se observa el comportamiento del proceso en funcin de tales
factores.
Ejemplo: Estudio sobre la corrosin en aluminio en funcin de la cantidad de sustancia
retardadora en su recubrimiento, en una cierta cadena de produccin.
PROBABILIDAD Y ESTADISTICA. 22
Cmo se eligen los elementos a estudiar?

!De una buena eleccin de los elementos a estudiar depender la fuerza de las
conclusiones respecto a la poblacin en general!

Poblacin: Conjunto de observaciones de todos los elementos sobre los cuales
queremos obtener conclusiones o tomar decisiones.

Al estudio de toda la poblacin se le llama CENSO.

Desventajas del censo: La poblacin es muy grande, las caractersticas de la poblacin
pueden variar en el tiempo, puede resultar muy costoso y tardado.
PROBABILIDAD Y ESTADISTICA. 23
Muestra: Subconjunto de individuos de una poblacin.

!Se puede inferir informacin de la poblacin total, estudiando la muestra!

!La muestra debe ser representativa de la poblacin!

Cmo elegir tal muestra?

Aleatoriamente!!


PROBABILIDAD Y ESTADISTICA. 24
Muestra aleatoria: Es un subconjunto representativo de la poblacin, que se elige de
tal forma que sea igualmente probable elegir esta muestra o cualquier otra.


PROBABILIDAD Y ESTADISTICA. 25
Poblacin
Muestra
Estadstica
Inferencial
Probabilidad
Elegida la muestra y tomados los datos, como los presentamos?


Organizacin de datos.
Tipos de organizacin.
Arreglo: Colocar las observaciones en orden de magnitud, esto puede ser en orden
ascendente o descendente.

La organizacin de los datos generalmente implica el arreglo de las observaciones en clases, c.
Al arreglo de los datos para expresar la frecuencia de ocurrencias de las observaciones en cada
una de estas se conoce como distribucin de frecuencias.

Distribucin de frecuencias: Presentacin de los datos distribuyndolos en clases y
categoras, se determina tambin las frecuencias (nmero de elementos que
pertenecen a una clase) de las clases.

PROBABILIDAD Y ESTADISTICA. 26
Ejercicio 1. La siguiente muestra tiene los ingresos ganados cierto sbado por
los estudiantes universitarios que trabajan. Las datos estn en dlares.
30, 11, 42, 8, 30, 18, 25, 25, 17, 30,
39, 21, 23, 25, 15, 35, 26, 13, 21, 26.
Cmo organizaras los datos?

Solucin.
Arreglo: 8, 11, 13, 15, 17, 18, 21, 21, 23, 25, 25, 25, 26, 29, 30, 30, 30, 35, 36,
42.
El ingreso ms alto es de 42 dlares y el menor es de 8 dlares. La diferencia
entre los dos es de 34 dlares.

PROBABILIDAD Y ESTADISTICA. 27
Reglas tiles para la seleccin de intervalos de clase
Cmo seleccionamos los intervalos de las clases?
Depende de los datos.

1. El nmero de clases no deber de ser tan pequeo o tan grande que no permita
ver la verdadera naturaleza de la distribucin (aunque el nmero de clases crece
conforme crece el nmero de datos).
2. Con frecuencia el nmero de intervalos de clase se elige como la raz cuadrada
del nmero de datos (o el entero ms aproximado).
3. Los intervalos de clases deben ser del mismo ancho.
4. La longitud de los intervalos de clase se obtienen dividiendo el rango entre el
nmero de clases.
5. Los extremos de los intervalos de clase se llaman extremos de clase y sus puntos
medios se llaman marcas de clase.
6. Los puntos medios o marca de la clase m, debern ser valores fciles de
manejar, con este fin es recomendable que la longitud de cada clase sea un
nmero impar. As, las marcas de clase tendrn los mismos dgitos que los datos.
PROBABILIDAD Y ESTADISTICA. 28
Frecuencia absoluta. Es el nmero de veces que aparece en la muestra dicho valor
de la variable .
(depende del tamao de la muestra)
Frecuencia relativa. Cociente entre la frecuencia absoluta y el tamao de la
muestra .

(no depende del tamao de la muestra)

Frecuencia absoluta acumulada. Es la suma de las frecuencias absolutas
acumuladas para valores de la variable menores o iguales a el (requiere
ordenar en forma creciente los datos).



i
n
N
n
f
i
i
=
PROBABILIDAD Y ESTADISTICA. 29

=
=
k
j
j i
n N
1
Frecuencia relativa acumulada. Es el cociente entre la frecuencia absoluta
acumulada y el tamao de la muestra.







N
N
F
i
i
=
N
n
k
j
i
=
=
1
PROBABILIDAD Y ESTADISTICA. 30
Diagrama de tallo y hojas. Es un diagrama de frecuencias donde la clase esta
caracterizada como el valor entero del dato y la hoja est caracterizada por el valor
decimal. Se seala adems la frecuencia en tal clase.

PROBABILIDAD Y ESTADISTICA. 31
Tallo Hoja Frecuencia
Tabla de distribucin de frecuencias. Es una tabla donde se muestra las clases en que
se divide el rango, las marcas de clases, y las frecuencias absolutas y relativas.

PROBABILIDAD Y ESTADISTICA. 32
Creacin de una distribucin de frecuencias
La estadstica descriptiva se utiliza para organizar la informacin de diversas
maneras, a fin de sealar el lugar donde los valores de los datos tienden a
concentrarse y ayudar a distinguir los valores ms altos y ms bajos.

El primer paso que seguimos para describir un conjunto de datos es una
distribucin de frecuencias.

DISTRIBUCIN DE FRECUENCIAS.- Agrupacin de los datos en clases
mutuamente excluyentes mostrando el nmero de observaciones en cada
una.

Cmo desarrollamos una distribucin de frecuencias?

EJERCICIO 1:
La seora Kathryn Ball de AutoUSA quera desarrollar algunas tablas y grficas para
mostrar el precio de venta tpico en diversas distribuidoras. La siguiente tabla reporta slo
el precio de los 80 vehculos vendidos el mes pasado en Whitner Autoplex. Cul es el
precio de venta tpico? Cul es el precio de venta ms alto ? Cul es el precio de venta
ms bajo? Alrededor de qu valor tienden a agruparse los precios de venta?

$23 197 23 372 20 454 23 591 26 651 27 453 17 266
18 021 28 683 30 872 19 587 23 169 35 851 19 251
20 047 24 285 24 324 24 609 28 670 15 546 15 935
19 873 25 251 25 277 28 034 24 533 27 443 19 889
20 004 17 357 20 155 19 688 23 657 26 613 20 895
20 203 23 765 25 783 26 661 32 277 20 642 21 981
24 052 25 799 15 794 18 263 35 925 17 399 17 968
20 356 21 442 21 722 19 331 22 817 19 766 20 633
20 962 22 845 26 285 27 896 29 076 32 492 18 890
21 740 22 374 24 571 25 449 28 337 20 642 23 613
24 220 30 655 22 442 17 891 20 818 26 237 20 445
21 556 21 639 24 296
A la informacin de la tabla sin organizar se la llama datos en bruto o datos
no agrupados.
PASOS PARA ORGANIZAR UNA DISTRIBUCION DE FRECUENCIA.
Paso 1. Decidir el nmero de clases. El objetivo es utilizar suficientes grupos o
clases para revelar la forma de la distribucin.
n = k
k nmero de clases
n - nmero de observaciones
En nuestro ejemplo se vendieron 80 vehculos entonces n = 80, y hay que encontrar k
80 = 8.9.
Por lo tanto el nmero recomendado de clases es 9.
PASO 2. Determinar el intervalo o ancho de clase . El intervalo o ancho de clase debe ser
el mismo para todas las clases. Se utilizar la siguiente frmula.
i H - L

Donde i es el intervalo de clase, H es el valor observado ms alto, L es el valor
observado ms bajo y k es el nmero de clases.
k
Para nuestro ejemplo
H = $ 35 925. L = $ 15 546. k = 9
i ( 35 925 15 546) / 9 = $ 2 264.33
En la prctica un intervalo de este tamao se redondea a cifras convenientes,
como mltiplos de 5 o 10 o 100. Por lo tanto podramos utilizar el valor de
$ 2 265.
PASO 3. ESTABLECER LOS LIMITES DE CADA CLASE.





15 546 A 17811
17811 A 20076
20076 A 22341
22341 A 24606
24606 A 26871
26871 A 29136
29136 A 31401
31401 A 33666
33666 A 35931
PASO 4. Contar el nmero de elementos de cada clase. El nmero de
observaciones en cada clase se conoce como frecuencia de clase.





Precios de venta

FRECUENCIA
ABSOLUTA
15 546 A 17811
17811 A 20076
20076 A 22341
22341 A 24606
24606 A 26871
26871 A 29136
29136 A 31401
31401 A 33666
33666 A 35931
TOTAL
6
14
17
18
11
8
2
2
2
80
Distribucin de frecuencia de los precios de venta en Whitner Autoplex el mes
pasado.
Resumen del patrn en los precios de venta de los
vehculos para el lote AutoUSA de Whitner
AutoPlex.
1. Los precios de venta van de aproximadamente $15 546 a
alrededor de $35 931.
2. Los precios de venta estn concentrados entre $20 076 y
24 606. En este rango se vendieron 35 vehculos en total o
43.75%.
3. La mayor concentracin o la frecuencia ms alta, se
encuentra en la clase de $22 341 a $24 606. El punto
medio de esta clase es $23 473.50 . Entonces decimos
que $23 473.50 es el precio de venta tpico.
4. Dos de los vehculos se vendieron en $33 666.00 o ms y 6
se vendieron en menos de $17 811.00
Distribucin de frecuencias relativas
Es conveniente convertir las frecuencias de clase en frecuencias de clase
relativas para mostrar la fraccin del nmero total de observaciones o
porcentaje en cada clase.
Para convertir una distribucin de frecuencia en una distribucin de
frecuencia relativa, cada una de las frecuencias de clase se divide entre el
nmero total de observaciones.









PRECIOS DE VENTA

FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
OPERACION
15 546 A 17 811 6 0.075 6/80
17 811 A 20 076 14 0.175 14/80
20 076 A 22 341 17 0.2125 17/80
22 341 A 24 606 18 0.225 18/80
24 606 A 26 871 11 0.1375 11/80
26 871 A 29 136 8 0.100 8/80
29 136 A 31 401
31 401 A 33 666
33 666 A 35 931
2
2
2
0.025
0.025
0.025
2/80
2/80
2/80
TOTAL 80 1.0000 80/80




PRECIOS DE VENTA

FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
FRECUENCIA
ABSOLUTA ACUMULADA
15 546 A 17 811 6 0.075 6
17 811 A 20 076 14 0.175 20
20 076 A 22 341 17 0.2125 37
22 341 A 24 606 18 0.225 55
24 606 A 26 871 11 0.1375 66
26 871 A 29 136 8 0.100 74
29 136 A 31 401
31 401 A 33 666
33 666 A 35 931
2
2
2
0.025
0.025
0.025
76
78
80
TOTAL 80 1.0000

FRECUENCIA
ABSOLUTA ACUMULADA
41
PRECIOS DE VENTA

FRECUENCIA
ABSOLUTA
FRECUENCIA
RELATIVA
FRECUENCIA
RELATIVA ACUMULADA
15 546 A 17 811 6 0.075 0.075
17 811 A 20 076 14 0.175 0.250
20 076 A 22 341 17 0.2125 0.4625
22 341 A 24 606 18 0.225 0.6875
24 606 A 26 871 11 0.1375 0.825
26 871 A 29 136 8 0.100 0.925
29 136 A 31 401
31 401 A 33 666
33 666 A 35 931
2
2
2
0.025
0.025
0.025
0.950
0.975
1.000
TOTAL 80 1.0000

FRECUENCIA
RELATIVA ACUMULADA
Ejercicio 2. Se registran las siguientes mediciones para el tiempo de secado
(en horas) de cierta marca de pintura esmaltada.
3.4, 2.5, 4.8, 2.9, 3.6
2.8, 3.3, 5.6, 3.7, 2.8
4.4, 4.0, 5.2, 3.0, 4.8

Construya:
1. Una tabla de frecuencias agrupando los datos, comenzando la primera
clase en 2.0 y terminando la ltima en 6.0.
2. Incluir en la tabla: las frecuencias relativas, frecuencias absolutas
acumuladas, frecuencias relativas acumuladas.
PROBABILIDAD Y ESTADISTICA. 42
Ejercicio 3. Se le hizo una prueba de hemoglobina a un grupo de pacientes
diabticos, los resultados son

6.5, 5.0, 5.6, 7.6, 4.8, 8.0, 7.5, 7.9, 8.0, 9.2
6.4, 6.0, 5.6, 6.0, 5.8, 9.2, 8.1, 8.0, 6.5, 6.6
5.0, 8.0, 6.5, 6.1, 6.4, 6.6, 7.2, 5.9, 4.0, 5.8
7.9, 6.0, 5.6, 6.0, 6.2, 7.8, 6.8, 7.8, 8.2, 9.0

Construya una tabla de frecuencias agrupando los datos.
PROBABILIDAD Y ESTADISTICA. 43
Ejercicio 4. La siguiente muestra tiene los ingresos ganados cierto sbado por los
estudiantes universitarios que trabajan. Las datos estn en dlares.
30, 11, 42, 8, 30, 18, 25, 25, 17, 30, 39, 21, 23, 25, 15, 35,
26,13, 21, 26.
Si las marcas de clase son 10, 15, 20, 25, 30, 35 y 40, representa los datos en una
Tabla de Distribucin de Frecuencias.

Ejercicio 5. La divisin de servicios alimenticios de Cedar River Amusement Park,
Inc. Estudia la cantidad que gastan al da en alimento y bebida las familias que
visitan el parque de diversiones. Una muestra de 40 familias que visit el parque
ayer revela que stas gastan las siguientes cantidades:

$77, 18, 63, 84, 38, 54, 50, 59, 54, 56, 36, 26, 50, 34, 44, 41, 58, 58, 53, 51, 62, 43,
52, 53, 63, 62, 62, 65, 61, 52, 60, 60, 45, 66, 83, 71, 63, 58, 61, 71.
a) Organice los datos en una distribucin de frecuencia utilizando 7 clases y el 15
como lmite inferior de la primera clase.
b) Describa la distribucin.
PROBABILIDAD Y ESTADISTICA. 44
Tipos de variables
Tipos de variables
Cualitativas

Cuantitativas
Marca de PC
Estado Civil
Color de cabello
Discretas Continuas
Hijos en la familia
Golpes en un hoyo
de golf
Televisores que
tiene
Cantidad de impuesto
sobre el ingreso
pagado.
Peso de un estudiante.
Precipitacin pluvial
anual en Puebla
Representacin grfica.
Datos cuantitativos.
Histograma de frecuencias. Grfica donde el eje horizontal (abscisas)
representa el eje de los datos, clasificados en clases, mientras que el eje
vertical (ordenadas) representa la frecuencia de cada clase.

Nota. Es difcil manejar un histograma de frecuencias cuando las clases no tiene la
misma longitud.

PROBABILIDAD Y ESTADISTICA. 46
Polgono de frecuencias. Serie de segmentos que unen los puntos cuyas
abscisas son las marcas de clase y cuyas ordenadas son las frecuencias
asignadas a tal clase.

PROBABILIDAD Y ESTADISTICA. 47
Ojiva de frecuencias. Es una representacin grfica donde el eje horizontal
(abscisas) representa los datos y el eje vertical las frecuencias
acumuladas. Se ubican los puntos cuyas abscisas son los limites
superiores de cada clase y cuyas ordenadas son las frecuencias
acumuladas de tal clase.
PROBABILIDAD Y ESTADISTICA. 48
Datos cualitativos.
Grfica de sectores (pastel o pie). Se forma al dividir un crculo en sectores
circulares de manera que:
a) Cada sector circular equivale al porcentaje correspondiente al dato o grupo
que representa.
b) La unin de los sectores circulares forma el crculo y la suma de sus
porcentajes es 100.

PROBABILIDAD Y ESTADISTICA. 49
Grfica de barras. Se utilizan rectngulos separados, que tienen como base a
cada uno de los datos y como altura la frecuencia de ese dato.
PROBABILIDAD Y ESTADISTICA. 50
PROBABILIDAD Y ESTADISTICA. 51
PROBABILIDAD Y ESTADISTICA. 52
PROBABILIDAD Y ESTADISTICA. 53
Datos Cualitativos.
Ejercicio. A continuacin se muestra la distribucin de frecuencias
absolutas, relativas y porcentuales de las mascotas mas comunes de los
nios, representar los datos en una grfica de barras y una grfica de
pastel.
Mascota Frecuencia
absoluta
Frecuencia
relativa
Frecuencia
porcentual
Perro
7 0.35 35%
Pjaro
4 0.20 20%
Hmster
4 0.20 20%
Gato
5 0.25 25%
PROBABILIDAD Y ESTADISTICA. 54
PROBABILIDAD Y ESTADISTICA. 55
Grfica de barras.
Grfica de pastel.
Medidas estadsticas.
Medidas de centralizacin (o de tendencia central): Sirven para determinar
los valores centrales o medios de la distribucin.

Indican valores alrededor de los cuales los datos parecen agruparse.

Media aritmtica.
Mediana.
Moda.

PROBABILIDAD Y ESTADISTICA. 56
Medidas de dispersin. Indican la mayor o menor concentracin de los datos
con respecto a las medidas de centralizacin.
Nos dan una idea sobre que tan representativos son las medidas centrales de
los datos. A mayor dispersin menor representatividad.
Una dispersin pequea indica un alto grado de uniformidad en las
observaciones y una dispersin grande indica poca uniformidad.
Varianza.
Desviacin estandar.
Coeficiente de variacin.
Rango.
PROBABILIDAD Y ESTADISTICA. 57
Medidas de posicin. Dividen un conjunto ordenado de datos en grupos con
la misma cantidad de elementos.

tiles para una clasificacin de los elementos de la muestra.

Cuartiles.
Percentiles.
PROBABILIDAD Y ESTADISTICA. 58
Media aritmtica. Es el promedio de las mediciones observadas.













Cantidad total de la variable distribuida en partes iguales entre todas las
observaciones.
Para datos agrupados m
i
es la marca de clase, f
i
es la frecuencia de clase y p
es el nmero total de clases.
59
n
X X X
X
n
+ + +
=

2 1
n
X
n
i
i
=
=
1
Datos no agrupados
MUESTRA
Datos agrupados
n
f m f m f m
X
p p
+ + +
=

2 2 1 1
n
f m
p
j
j j
=
=
1
Medidas de centralizacin
N
X X X
N
+ + +
=

2 1

N
X
N
i
i
=
=
1
Datos no agrupados
POBLACION

Mediana. La mediana de un conjunto de observaciones es el valor que queda
en la parte central de un grupo de observaciones arregladas en orden de
magnitud.







La mediana deja el mismo nmero de datos antes y despus de ese dato.


PROBABILIDAD Y ESTADISTICA. 60
2
1 +
=
n e
x m
2
1 `
2 2
+
|
|
.
|

\
|
+
=
n n
e
x x
m
Datos no agrupados
n par n impar
Datos agrupados
A
|
|
|
|
.
|

\
|

+
+ =
M
M e
f
T
n
L m
2
1
mediana. la de clase la de ancho el Es
mediana. la de clase la de antes estn que clase de
intervalos los en s frecuencia las de total el Es
mediana. la de clase de frecuencia la Es
mediana. la
de clase llamado mediana, la contiene que
clase de intervalo del inferior Lmite
= A
=
=
=
T
f
L
M
M
PROBABILIDAD Y ESTADISTICA. 61
Moda: Se define como el valor o clase que tiene la mayor frecuencia en
un conjunto de observaciones.
Algunas veces dos clases o categoras tienen un nmero de observaciones
igualmente grande. A esto se le denomina distribucin bimodal.
Si tiene una sola moda se llama unimodal.
Cuando las mediciones de una variable continua se agrupan como un
histograma de frecuencias o de frecuencias relativas, la clase que
tiene la frecuencia ms alta se llama clase modal y el punto medio de
dicha clase se toma como la moda.

A
|
.
|

\
|
+
+ =
b a
a
L m
MO o
PROBABILIDAD Y ESTADISTICA. 62
moda. la de clase la de ancho el Es
siguiente. clase la y moda la de clase la entre
frecuencia en diferencia la de absoluto Valor
anterior. clase la y moda la de clase la entre
frecuencia en diferencia la de absoluto Valor
moda. la de clase la de inferior Lmite
= A
=
=
=
b
a
L
MO
PROBABILIDAD Y ESTADISTICA. 63
PROBABILIDAD Y ESTADISTICA. 64

LAS POSICIONES RELATIVAS DE LA MEDIA, LA
MEDIANA Y LA MODA.

Se llama DISTRIBUCIN SIMTRICA, a la distribucin que tiene la misma
forma hacia cualquier lado del centro.
Para una distribucin simtrica, en forma de campana, la moda, la mediana y
la media se localizan en el centro y siempre son iguales.
Hay distribuciones simtricas que no tienen forma de campana.
Ejemplo









Simtrica ( cero sesgo )
Aos
F
r
e
c
u
e
n
c
i
a
Media = 20
Mediana = 20
Moda = 20
Si una distribucin es no simtrica o sesgada, cambia la relacin entre
las tres medidas.
En una distribucin con sesgo positivo, la media aritmtica es la
mayor de las tres medidas, por lo general, la mediana es la medida
siguiente y la moda es la menor de las tres.



Sesgada a la derecha
Ingreso semanal
F
r
e
c
u
e
n
c
i
a
Moda Mediana Media
Si una distribucin tiene un sesgo negativo, la media es la menor
de las tres medidas, la mediana es mayor que la media aritmtica y
el valor modal es el mayor.
Media Mediana Moda
Varianza: Medida de la desviacin de las mediciones muestrales respecto a
su media. Es la media del cuadrado de las desviaciones de las
mediciones respecto a su media.
PROBABILIDAD Y ESTADISTICA. 67
( )
1

1
2
2

=

=
n
X X
s
n
i
i
Datos no agrupados
MUESTRA
( )
1

1
2
2

=

=
n
f X m
s
p
j
j j
Datos agrupados
( )
n
X
n
i
i

=

=
1
2
2

o
Datos no agrupados
POBLACION
Desviacin estndar. Tambin es una medida de la desviacin de los datos
respecto a la media. Es al raz cuadrada de la varianza.
PROBABILIDAD Y ESTADISTICA. 68
( )
1
1
2

=

=
n
X X
s
n
i
i
Datos no agrupados
MUESTRA
( )
1
1
2

=

=
n
f X m
s
p
j
j j
Datos agrupados
( )
N
X
n
i
i

=

=
1
2

o
Datos no agrupados
POBLACION
Rango. Se define como la diferencia entre la medicin mayor y la menor.

R = x
mx
-x
mn


PROBABILIDAD Y ESTADISTICA. 69


EJERCICIO


PROBABILIDAD Y ESTADISTICA. 70
El sndrome de inmunodeficiencia adquirida (SIDA) se ha convertido en
una de las enfermedades ms devastadoras en la sociedad moderna.
Las cantidades de casos de SIDA (en miles) registrados en 25 ciudades
principales de los Estados Unidos en 2010 aparecen a continuacin:

38.3 6.2 3.7 2.6 2.1
14.6 5.6 3.7 2.3 2.0
11.9 5.5 3.4 2.2 2.0
6.6 4.6 3.1 2.2 1.9
6.3 4.5 2.7 2.1 1.8
Construya los histogramas de frecuencias absoluta y polgono de
frecuencias para relativas y las ojivas. Utilice el entero superior de
para el nmero de clases. Adems calcule y analice todas las
medidas estadsticas correspondientes (media, moda, mediana,
varianza, desviacin estndar)
Coeficiente de variacin

PROBABILIDAD Y ESTADISTICA. 71

En estadstica el coeficiente de variacin (de Pearson) es una
medida de dispersin til para comparar dispersiones a escalas
distintas pues es una medida invariante ante cambios de escala.
Por otro lado presenta problemas ya que a diferencia de la
desviacin tpica este coeficiente es variable ante cambios de
origen. Por ello es importante que todos los valores sean positivos
y su media de por tanto un valor positivo.
Exigimos que:

Se calcula:

Donde es la desviacin tpica. Se puede dar en tanto por ciento
calculando:

0 ) x

o
=
V
C
100 - =

o
V
C
El coeficiente de variacin permite comparar las dispersiones de
dos distribuciones distintas, siempre que sus medias sean
positivas.

Se calcula para cada una de las distribuciones y los valores que
se obtienen se comparan entre s.

La mayor dispersin corresponder al valor del coeficiente de
variacin mayor.

PROBABILIDAD Y ESTADISTICA. 72
Ejemplo.
Una distribucin tiene una media de 140 y = 28.28 y otra
con media de 150 y = 25. Cul de las dos presenta mayor
dispersin?

PROBABILIDAD Y ESTADISTICA. 73
PROBABILIDAD Y ESTADISTICA. 74
El Coeficiente de asimetra, se representa mediante la ecuacin
matemtica,






(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la media.
Este valor es difcil de conseguir por lo que se tiende a tomar los valores que
son cercanos ya sean positivos o negativos ( 0.5).

(g1 > 0): (distribucin asimtrica positiva; existe mayor concentracin de
valores a la derecha de la media que a su izquierda)

(g1 < 0): (distribucin asimtrica negativa; existe mayor concentracin de
valores a la izquierda de la media que a su derecha)

Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la
distancia que separa la aglomeracin de los valores con respecto a la media.

3
1
3
1
) ( ) / 1 (
s
x x n
g
n
i
i

=

=
PROBABILIDAD Y ESTADISTICA. 75
CURTOSIS


Esta medida determina el grado de concentracin que presentan los
valores en la regin central de la distribucin. Por medio del
Coeficiente de Curtosis, podemos identificar si existe una gran
concentracin de valores (Leptocrtica), una concentracin normal
(Mesocrtica) una baja concentracin (Platicrtica).



PROBABILIDAD Y ESTADISTICA. 76







Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de
los valores, la media de la muestra y (ni) la frecuencia de cada
valor. Los resultados de esta frmula se interpretan:

(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra
es bastante difcil encontrar un coeficiente de Curtosis de cero (0),
por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.).
(g2 > 0) la distribucin es Leptocrtica
(g2 < 0) la distribucin es Platicrtica

Cuando la distribucin de los datos cuenta con un coeficiente de
asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5),
se le denomina Curva Normal. Este criterio es de suma importancia
ya que para la mayora de los procedimientos de la estadstica de
inferencia se requiere que los datos se distribuyan normalmente.

X
3
) ( ) / 1 (
4
1
4
2

=

=
s
x x n
g
n
i
i
EJEMPLO: Los clculos para la media aritmtica para datos
agrupados en una distribucin de frecuencias. En la siguiente tabla
tenemos una distribucin de frecuencias para los precios de venta de
los vehculos. Determinar el precio de venta medio aritmtico de los
vehculos.

Precios de venta
(miles de $) FRECUENCIA


15 A 18 8
18 A 21 23
21 A 24 17
24 A 27 18
27 A 30 8
30 A 33 4
33 A 36 2

TOTAL 80

Precio de venta
(Miles de $)
Frecuencia
( f )
Punto medio
( m )
f m
De 15 hasta 18 8 $16.5 $132.0
De 18 hasta 21 23 19.5 448.5
De 21 hasta 24 17 22.5 382.5
De 24 hasta 27 18 25.5 459.0
De 27 hasta 30 8 28.5 228.0
De 30 hasta 33 4 31.5 126.0
De 33 hasta 36 2 34.5 69.0
Total 80 $1 845.0
Al calcular la media aritmtica utilizando la frmula obtenemos:


De modo que, llegamos a la conclusin de que el precio de venta medio de los
vehculos es aproximadamente de $23 100
(miles) $23.1
80
$1845

n
m f
X = = =

Precio de
venta
(miles $)
Frecuencia
( f )
Punto
Medio
( m )

(m- )

( m - )
De 15.0
hasta 18.0
8 16.5 -6.6 43.56 348.48
De 18.0
hasta 21.0
23 19.5 -3.6 12.96 298.08
De 21.0
hasta 24.0
17 22.5 -0.6 0.36 6.12
De 24.0
hasta 27.0
18 25.5 2.4 5.76 103.68
De 27.0
hasta 30.0
8 28.5 5.4 29.16 233.28
De 30.0
hasta 33.0
4 31.5 8.4 70.56 282.24
De 33.0
hasta 36.0
2 34.5 11.4 129.96 259.92
80 1531.80
X
X ( )
2
- m f X
Aplicando la frmula tenemos:


La desviacin estndar para datos agrupados es de $ 4 403, que
difieren por $49 o 1.1 % ($ 4 354 valor real (toda la poblacin)).
Con base en el diferencia porcentual los estimados estn muy cerca
de los valores reales.
EJERCICIO. Los ingresos netos de una muestra de grandes
importadores de antigedades se organizaron en la siguiente tabla:
( )
4.403
1 - 80
1531.8

1
- m f

2
= =

=

n
X
s
Ingreso neto
(millones de $)
Nmero de
importadores
De 2 hasta 6 1
De 6 hasta 10 4
De 10 hasta 14 10
De 14 hasta 18 3
De 18 hasta 22 2
a) Cmo se llama la tabla?
b) Cul es el estimado del ingreso
neto medio aritmtico?
c) Cul es el estimado de la
desviacin media estndar?
TAREA 1. Se realiza un estudio acerca de los efectos del tabaquismo sobre los
patrones de sueo. La medicin que se observa es el tiempo, en minutos, que
toma quedarse dormido. Se obtienen estos datos para una muestra.

Fumadores: 69.3, 56.0, 22.1, 47.6,
53.2, 48.1, 52.7, 34.4,
60.2, 43.8, 23.2, 13.8

No fumadores 28.6, 25.1, 34.9
29.8, 38.5, 30.2
31.8, 41.6, 21.1
36.0, 37.9, 13.9
a) Encuentre la media, la mediana y la desviacin estndar para cada grupo.
b) Encuentre la media, la mediana y la desviacin estndar para datos
agrupados
c) Comparar los resultados.

PROBABILIDAD Y ESTADISTICA. 81
La desviacin estndar o tpica se interpreta utilizando
dos medidas:
a)Teorema de Chebyshev o Tchebycheff
b)La Regla Emprica o la regla de la normal
TEOREMA DE CHEBYSHEV.
La desviacin tpica de un conjunto de observaciones se emplea para medir las
variaciones con respecto a la media de los valores de las observaciones.
Mientras ms pequea sea la desviacin tpica, es ms probable obtener un
valor cercano a la media; mientras mayor sea la desviacin tpica, es ms
probable obtener un valor alejado de la media.
El matemtico ruso P. L. Chebyshev (1821 1894) desarroll un
teorema que nos permite determinar la proporcin mnima de los
valores que se encuentran en un nmero especfico de desviaciones
estndar de la media.
Teorema de Chebyshev. Para cualquier grupo de observaciones (muestra o
poblacin), la proporcin de los valores que se encuentran dentro de k
desviaciones estndar de la media es por lo menos 1 1/ k, donde k es
cualquier constante mayor que 1.

La proporcin de veces que cualquier posible valor de X caer dentro del
intervalo construido es de al menos 1 1/k. De acuerdo con esto, la
proporcin de veces que los valores de X caern dentro del intervalo formado
por dos desviaciones tpicas medidas a partir de es 1 1/2 = 1 =
; la proporcin de veces que los valores de X caern dentro de 3
desviaciones tpicas medidas a partir de es de al menos 1 1/3 = 1
1/9 = 8/9.

EJEMPLO: La cantidad media aritmtica quincenal con la que
contribuyen los empleados de Dupree Paint al plan de participacin de
utilidades de la compaa fue $51.54 y la desviacin estndar es
$7.51. Qu porcentaje de las contribuciones se encuentra entre ms
3.5 desviaciones estndar y menos 3.5 desviaciones estndar de la
media?
SOLUCIN.


Alrededor de 92 %.
( )
0.92
25 . 12
1
1
5 . 3
1
1
1
1
2 2
= = =
k
X
X
EJEMPLOS:
1. Al menos, qu porcentaje de un conjunto de observaciones caer
a) Dentro de cinco desviaciones tpicas medidas a partir de la media.
b) Dentro de diez desviaciones tpicas medidas a partir de la media?
Solucin.
a) Al menos 1 1/5 = 1 0.04 = .96, esto es 96%, de las
observaciones caern dentro de cinco desviaciones tpicas medidas a
partir de la media.
b) Al menos 1 1/10 = 1 0.01 = 0.99, esto es 99% de las
observaciones caern dentro de diez desviaciones tpicas medidas a
partir de la media.
2. A lo ms, qu porcentaje de un conjunto de observaciones caer
a) Ms all de dos desviaciones tpicas medidas a partir de la media.
b) Ms all de tres desviaciones tpicas medidas a partir de la media?
Las palabras ms all se refieren a las partes de la distribucin que
quedan fuera del intervalo indicado. Entonces, la proporcin de la
distribucin que cae ms all del intervalo es igual a:
1 proporcin dentro del intervalo.

SOLUCIN.
a) La proporcin de observaciones que cae ms all de 2 desviaciones
tpicas medidas a partir de la media es 1 (1 1/2) = 1 =
25%.
a) La proporcin de la distribucin que cae ms all de tres
desviaciones tpicas medidas a partir de la media es 1 (1 1/3)
= 1 8/9 = 1/9 11%.
Teorema de Chebyshev
El 75% de los datos se encuentran a dos desviaciones estndar.



El 88.89% de los datos se encuentran a tres desviaciones estndar.
86
Para cualquier distribucin de los datos con respecto a la media. La
proporcin de los datos que se encuentran K desviaciones estndar
de la media es al menos:
Por lo cual,
1 -
1
k
2
1 -
1
2
2
1 -
1
4

3
4

= 75% = = =
1 -
1
k
2
1 -
1
3
2
1 -
1
9

8
9

= 88.9% = = =
1 -
1
k
2
87
x
x + 2s x + 3s x - 2s x - 3s
Al menos
75%
Al menos
89%
LA REGLA EMPRICA
El Teorema de Chebyshev se ocupa de cualquier grupo de valores, esto
es, la distribucin de los valores puede tener cualquier forma.

Sin embargo, para una distribucin simtrica en forma de campana,
podemos ser ms precisos al explicar la dispersin en relacin con la
media.
La REGLA EMPRICA, que en ocasiones se conoce como la REGLA de
la NORMAL, describe aquellas relaciones que comprenden la
desviacin estndar y la media.

REGLA EMPRICA. Para una distribucin de la frecuencia simtrica en forma de
campana, aproximadamente 68 % de las observaciones estarn entre ms y
menos una desviacin estndar de la media; alrededor de 95% de las
observaciones se encontrarn ente ms y menos dos desviaciones estndar de
la media y prcticamente todas (99.7%) estarn entre ms y menos tres
desviaciones estndar de la media.

89
X X + 1s X + 2s X + 3s X - 3s X - 2s X -1s
68%
95%
99.7%
Ejemplo:
Una muestra de las tarifas de renta en los departamentos University
Park se asemeja a una distribucin simtrica en forma de
campana. La media de la muestra es $500; la desviacin
estndar es $20. Utilizando la Regla emprica, responder las
siguientes preguntas:
1. Entre qu par de cantidades se encuentra alrededor de 68 % de
los gastos mensuales en alimentos?
2. Entre qu par de cantidades est 95 % de los gastos mensuales
en alimentos?
3. Entre qu par de cantidades estn casi todos los gastos
mensuales?
SOLUCIN:
1. Alrededor de 68 % se encuentra entre $480 y $520, calculado como sigue:

2. Aproximadamente 95 % est entre $460 y $540, calculando como sigue:

( ) $20 1 $500 s 1 = X
( ) $20 2 $500 s 2 = X
3. Casi todos (99.7%) se encuentran entre $440 y $560, calculado
como sigue:






( ) $20 3 $500 s 3 = X
PROBABILIDAD Y ESTADISTICA. 92
EJERCICIO1. Pitney Pipe Company es uno de varios fabricantes nacionales de
tubera PVC. El departamento de control de calidad tom una muestra de 600
tubos de 10 pies. A la distancia de un pie del extremo del tubo se midi el
dimetro exterior; la media fue 14.0 pulgadas y la desviacin estndar 0.1
pulgadas.
a) Si la forma de la distribucin se desconoce, por lo menos, qu porcentaje de
las observaciones estar entre 13.85 pulgadas y 14.15 pulgadas?
b) Si suponemos que la distribucin de los dimetros es simtrica y que tiene
forma de campana, entre qu par de valores estarn 95% de las
observaciones?


EJERCICIO 2. De acuerdo con el teorema de Chebyshev, qu
porcentaje de las observaciones debe caer

Dentro de 2.0 desviaciones estndar?
Dentro de 3.5 desviaciones estndar?.
Dentro de 5.0 desviaciones estndar?

You might also like