Professional Documents
Culture Documents
QUERTARO
CONTENIDO
INTRODUCCIN .................................................................................................... 3
CONCEPTOS GENERALES ................................................................................... 4
DATO, INFORMACIN Y CONOCIMIENTO ....................................................... 4
RECOLECCIN, CLASIFICACIN Y ANLISIS DE DE DATOS ....................... 8
ESTADSTICA: CONCEPTOS GENERALES ......................................................... 9
TABLA DE FRECUENCIAS .................................................................................. 21
DIAGRAMA DE PARETO: HERRAMIENTA BSICA PARA LA MEJORA DE LA
CALIDAD ........................................................................................................... 30
MEDIDAS DE TENDENCIA CENTRAL ................................................................. 39
TEORA DE CONJUNTOS .................................................................................... 58
TEORIA DE PROBABILIDAD................................................................................ 78
DISTRIBUCIN DE PROBABILIDAD ................................................................... 91
DISTRIBUCIN DE PROBABILIDAD BINOMIAL ................................................. 92
DISTRIBUCIN DE PROBABILIDAD CONTINUA .............................................. 104
ESTIMACIN DE INTERVALO DE CONFIANZA ............................................... 116
PRUEBA DE HIPOTESIS.................................................................................... 124
REGRESIN LINEAL SIMPLE .......................................................................... 133
GRFICOS DE CONTROL ................................................................................. 141
INTRODUCCIN
Todas las actividades cotidianas que realizan los seres humanos, implican la toma
de decisiones. Estas, para asumirse, requieren de informacin y conocimiento, los
cuales son resultado de la obtencin, organizacin, procesamiento y anlisis de
datos. Por ello se puede afirmar que de forma emprica o sistemtica todos los
seres humanos aplican mtodos estadsticos en su vida cotidiana, muchas de las
veces sin reconocer esta habilidad.
Este Manual de Mtodos Estadsticos tiene el objetivo de que el Tcnico Superior
Universitario reflexione diversos conceptos y ejercite habilidades en el manejo y
anlisis de datos mediante diversos mtodos estadsticos.
Lo ms relevante de estos apuntes es su orientacin hacia el autoaprendizaje o el
aprendizaje autnomo, por lo que cada apartado presenta una parte conceptual y
otra con ejercicios y repasos
Es necesario que como actividad transversal de la asignatura, los estudiantes
conformen equipos de trabajo, elijan un tema de inters relacionado con el plan de
estudios, busquen informacin bsica, elaboraren un cuestionario sobre el tema, lo
apliquen en el lugar correspondiente a un mnimo de 30 personas y procesen los
datos con las distintas tcnicas que se presentan a lo largo del curso como son
tablas de frecuencia, elaboracin de histogramas, calculo de medidas de
tendencia central y dispersin, entre otras.
Lo anterior, es con el fin de tener una aplicacin de los mtodos estadsticos,
sobre una porcin de la realidad de inters por parte de estudiantes, que
conformen cada uno de los equipos.
Este Manual de Mtodos estadsticos se complementa con procedimientos
detallados para realizar las aplicaciones o clculos en Excell, Word o Power point.
CONCEPTOS GENERALES
DATO, INFORMACIN Y CONOCIMIENTO
Para ser significativos, los datos deben constar de smbolos reconocibles, estar
completos y expresar una idea no ambigua. Los smbolos de los datos son
reconocibles cuando pueden ser correctamente interpretados.
La integridad de los datos significa que todos los datos requeridos para responder
a una pregunta especfica estn disponibles. Los datos son inequvocos cuando el
contexto es claro. Tenemos que conocer el contexto de estos smbolos antes de
poder conocer su significado.
Los datos son pertinentes o relevantes cuando son utilizados para responder a
preguntas propuestas. Como se dispone de un considerable nmero de hechos en
nuestro entorno. Solo los hechos relacionados con las necesidades de informacin
son pertinentes.
DIFERENCIA ENTRE DATOS E INFORMACIN
Los datos a diferencia de la informacin son utilizados con diversos mtodos para
organizarlos
presentarlos
fin
de
permitir
una
transmisin
almacenamiento ms eficaces.
La cantidad de informacin de un mensaje puede ser entendida como el nmero
de smbolos posibles que representan el mensaje, los smbolos que representan el
mensaje no son ms que datos significativos.
En su concepto ms elemental, la informacin es un mensaje con un contenido
determinado emitido por una entidad hacia otra y, como tal, representa un papel
primordial en el proceso de la comunicacin, a la vez que posee una evidente
funcin social.
A diferencia de los datos, la informacin tiene significado para quien la recibe, por
eso, los seres humanos siempre han tenido la necesidad de cambiar entre s
informacin que luego transforman en acciones. La informacin es un conjunto de
datos procesados con significado, propsito y utilidad.
USOS DE LA INFORMACIN
Se considera que la generacin y/o obtencin de informacin persigue estos
objetivos:
EL CONCEPTO DE CONOCIMIENTO
El conocimiento puede definirse como:
adquisicin
de
conocimiento
implica
aprendizaje, comunicacin,
procesos
asociacin
razonamiento.
Las ciencias constituyen uno de los principales tipos de conocimiento. Las ciencias
son el resultado de esfuerzos sistemticos y metdicos de investigacin en busca
de respuestas a problemas especficos, al funcionamiento y relacin de los
fenmenos, y cuya elucidacin procura ofrecernos una representacin adecuada
del universo.
Hay tambin, muchos tipos de conocimiento que, sin ser cientficos, no dejan de
estar perfectamente adaptados a sus propsitos: el saber hacer en la artesana, el
saber nadar, entre otros; el conocimiento de la lengua, de las tradiciones,
leyendas, costumbres o ideas de una cultura particular; el conocimiento que los
individuos tienen de su propia historia: su propio nombre, la historia de sus padres,
su pasado, etc., o an los conocimientos comunes a una sociedad dada, incluso a
la humanidad: saber para qu sirve un martillo, saber que el agua extingue el
fuego, etc.
Los conocimientos se
adquieren mediante
experiencia,
una
pluralidad de
razonamiento,
procesos
enseanza-
Prediccin de consecuencias.
Bsqueda de conexiones.
recoleccin
de datos se
refiere
al
uso
de
una
gran
diversidad
de tcnicas y herramientas que pueden ser utilizadas por el acopio de datos, que
permitan desarrollar sistemas de informacin, los cuales pueden ser entrevistas,
encuestas, cuestionario, observaciones, diagramas de flujo, censos, registros,
entre otros.
Todos estos instrumentos se aplican en un momento determinado, con la finalidad
de buscar informacin que ser til a una investigacin particular.
CLASIFICACIN DE DATOS
Las caractersticas o propiedades de los organismos o entidades que son
recolectados en forma de datos, son el producto de las observaciones o
mediciones que se hace sobre ellos.
8
analizados
dan
informacin
sobre
su
estado,
pueden
y no de
poblacin
es
un
factor
de
suma
importancia
en
9
para
hacerlo.
Para
solucionar
este
calculamos
para
cada
muestra
no
necesariamente
Las variables discretas sern aquellas que pueden tomar solo un nmero limitado
de valores separados y no continuos; son aquellas que solo toman un determinado
nmeros de valores, porque entre dos valores consecutivos no pueden tomar
ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable
discreta ya que solo tomar los valores 1, 2, 3, 4... no es posible encontrar valores
como 1.5 estudiantes
FORMAS DE OBSERVAR LA POBLACIN.
Observacin directa: cuando se tiene un contacto directo con los elementos o
caracteres en los cuales se presenta el fenmeno que se pretende investigar, y los
resultados obtenidos se consideran datos estadsticos originales.
Observacin Indirecta: cuando se hace uso de datos estadsticos ya conocidos en
una investigacin anterior, o de datos observados por un tercero (persona o
entidad). Con el fin de deducir otros hechos o fenmenos.
Observacin contina: cuando se lleva acabo de un modo permanente.
Observacin peridica: cuando se lleva a cabo a travs de perodos de tiempo
constantes (semanal, trimestral, semestral, anual, etc.).
Observacin circunstancial: cuando se efecta en forma ocasional o espordica.
Observacin Exhaustiva: cuando la observacin es efectuada sobre la totalidad de
los elementos de la poblacin se habla de una observacin exhaustiva.
Observacin Parcial: dados que las poblaciones en general son grandes, la
observacin de todos sus elementos se ve imposibilitada. La solucin para superar
este inconveniente es observar una parte de esta poblacin.
Observacin Mixta: en este tipo de observacin se combinan adecuadamente la
observacin exhaustiva con la observacin parcial. Por lo general, este tipo de
observaciones se lleva a cabo de tal manera que los caracteres que se consideran
12
13
cuantificacin
el
proceso
mismo
de
la
construccin de
caracterstica que queremos medir y que dicho nmeros pueden analizarse por
manipulaciones de acuerdo a ciertas reglas.
Por medio de la medicin, los atributos de nuestras percepciones se transforman
en entidades conocidas y manejables llamadas "nmeros". Es evidente que
el mundo resultara catico si no pudiramos medir nada. En este caso cabra
preguntarse
de
que
le
servira
al
fsico saber
que
el hierro tiene
una
14
15
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observ que hay
familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de
hijos que aquellas que tienen 3 hijos.
MTODO PARA LA RECOLECCIN DE DATOS:
En estadstica se emplean una variedad de mtodos distintos para obtener
informacin de los que se desea investigar.
La entrevista personal: los datos estadsticos necesarios para una investigacin,
se renen frecuentemente mediante un proceso que consiste en enviar un
entrevistador o agente, directamente a la persona investigada. El investigador
efectuar a esta persona una serie de preguntas previamente escritas en
un cuestionario o boleta, donde anotar las respuestas correspondientes. Este
procedimiento que se conoce con el nombre de entrevista personal, permite
obtener una informacin ms veraz y completa que la que proporcionan otros
mtodos, debido a que al tener contacto directo con la persona entrevistada, el
entrevistador podr aclarar cualquier duda que se presente sobre el cuestionario o
investigacin.
Desventajas:
si
el
entrevistador
no
obra
de
buena
fe
no
tiene
17
Orden de las preguntas: estas deben tener una secuencia y un orden lgico,
agruparlas procurando que se relacionen unas con otras.
TIPOS DE MUESTREO
Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos
extraer una muestra de 25 elementos, en primer lugar debemos establecer el
18
4251 5149 4751 4847 4249 4648 5047 4847 5156 8789
7227 0104 4141 1521 9104 5563 1392 8238 4882 2324
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346
8506 6348 4612 8252 1062 1757 0964 2983 2244 7654
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256
5086 0303 7423 3298 3979 2831 2257 1508 7642 1245
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235
3690 2492 7171 7720 6509 7549 2330 5733 4730 4534
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330
0813 6790 6858 1489 2669 3743 1901 4971 8280 0835
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365
6905 7127 5933 1137 7583 6450 5658 7678 3444 3754
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224
8387 5323 3753 1859 6043 0294 5110 6340 9137 6323
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902
4094 4957 0163 9717 4118 4276 9465 8820 4127 0202
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390
4951 3781 5101 1815 7068 6379 7252 1086 8919 2093
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092
9047 0199 5068 7447 1664 9278 1708 3625 2864 0204
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392
7274 9512 0074 6677 8676 0222 3335 1976 1645 3203
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303
9192 4011 0255 5458 6942 8043 6201 1587 0972 0243
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092
0554 1690 6333 1931 9433 2661 8690 2313 6999 3094
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113
9231 5627 1815 7171 8036 1832 2031 6298 6073 9044
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324
3995 9677 7765 3194 3222 4191 2734 4469 8617 3233
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443
2402 6250 9362 7373 4757 1716 1942 0417 5921 5345
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343
5295 7385 5474 2123 7035 9983 5192 1840 6176 5756
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432
5177 1191 2106 3351 5057 0967 4538 1246 3374 0304
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255
4344 4044 4549 4443 4249 4948 4151 5152 4240 4737
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854
7343 4706 4440 4646 4548 4742 4746 5253 4749 4689
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
5484 3900 3485 0741 9069 5920 4326 7704 6525 1249
20
TABLA DE FRECUENCIAS
Definicin
Las tablas de frecuencias o tabla de relaciones es una herramienta estadstica que
se usa para ordenar o tabular datos o valores, que previamente fueron obtenidos
de una o ms variables de una muestra. Con ellas, un conjunto de datos
desordenados pasa a ser una coleccin ordenada e inteligible. Para construir
cualquier tipo de histograma o representacin grfica se necesita primero agrupar
los datos en una tabla la cual se conoce como tabla de frecuencias.
En el caso de datos numricos continuos (ejemplo: 9.5, 6.7, 8.4) los datos se
agrupan en intervalos. Un intervalo es un conjunto de nmeros que se
corresponden con los puntos de una recta o segmento, en el que se encuentra un
ordenamiento interno entre ellos. El intervalo es el espacio que se da de un punto
a otro en el cual se toman en cuenta todos los puntos intermedios.
Ejemplo: en una recta tenemos un intervalo: [-2,2] entre este espacio se
encuentran los nmeros (-2-1,0,1,2), esto es un intervalo.....ya que el espacio
abarca una serie de nmeros consecutivos que se corresponden entre s.
21
Tercero, se determina el lmite superior de cada intervalo. Este valor sirve como
demarcador y corresponde al valor mayor que se encontrar en el intervalo. Para
determinar el lmite superior de cada intervalo procedemos de la manera siguiente:
Ejemplo 1: Al preparar una tabla de frecuencia de cinco intervalos para el conjunto
de los siguientes 20 datos: 5, 7, 8, 3, 7, 7, 1, 9, 6, 8 5, 6, 7, 8, 7, 9, 6, 8, 6, 6
1. Definicin de ancho de intervalo: Dato mayor- dato menor / nmero de
intervalos deseados 9-1=8 / 5= 1.6 = 2
Como el dato menor es 1, seleccionaremos a 2 como lmite superior del primer
intervalo. Entonces, el lmite superior del segundo intervalo ser 2 + 2 = 4; el del
segundo ser 4+ 2 = 6 y as sucesivamente, obtenemos que los lmites superiores
para los restantes intervalos son: 8, 10, 12. Por tanto, la tabla de frecuencia es:
Datos
Intervalo
Frecuencia
0-2
2-4
4-6
6-8
8-10
Frecuencia
absoluta
Frecuencia
relativa %
1/20= 0.05
1/20 = 0.05
7/20= 0.35
35
9/20= 0.45
45
2/20= 0.1
10
6
6
6
6
7
7
7
7
7
8
8
8
8
9
9
100
23
se seleccionan 5 celdas
contiguas: c3:c7.
Paso 5: En la barra men seleccione la opcin frmulas, seleccione el submen
ms funciones, posteriormente estadsticas y el botn de frecuencia:
=frequencia(a1:a20, b1:b4)
Observe que la primera parte contiene la lista de datos entre la a1 y la a20.
Despus se coloca una coma y un espacio. La segunda parte contiene la lista de
lmites superiores de cada intervalo b1:b4.
24
Histograma de frecuencias
En estadstica un histograma es una representacin grfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables.
Tipos de histograma
Diagramas de barras simples. Representa la frecuencia simple (absoluta o
relativa) mediante la altura de la barra la cual es proporcional a la frecuencia
simple de la categora que representa.
25
Construccin de un histograma
Paso 1 Determinar el rango de los datos. Rango es igual al dato mayor
menos el dato menor.
Ejemplo: 9-1= 8
Paso 2 Obtener los nmeros de clases, existen varios criterios para
determinar el nmero de clases (o barras), sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de cmo estn los datos y cuntos sean. Un criterio usado
frecuentemente es que el nmero de clases debe ser aproximadamente a la
raz cuadrada del nmero de datos. Por ejemplo, la raz cuadrada de 30
(nmero de datos) es mayor que cinco, por lo que se seleccionan seis
clases. Ejemplo: 20 datos, raz de 20= 4.47 = 5 clases
Paso 3 Establecer la longitud de clase: es igual al rango dividido por el
nmero de clases. Ejemplo: 8/5= 1.6 =2
Paso 4 Construir los intervalos de clases: Los intervalos resultan de dividir
el rango de los datos en relacin al resultado del PASO 2 en intervalos
iguales. 2
Paso 5 Graficar el histograma: En caso de que las clases sean todas de la
misma amplitud, se hace un grfico de barras, las bases de las barras son
los intervalos de clases y altura son la frecuencia de las clases. Si se unen
los puntos medios de la base superior de los rectngulos se obtiene el
polgono de frecuencias.
26
Histograma
Frecuencia
10
8
6
4
Frecuencia
2
0
2
y mayor...
Clase
Polgono de frecuencias
las temperaturas mximas promedio de cada mes (24, 25, 27, etc.). El polgono
de frecuencias se crea al unir, con una lnea, todas las temperaturas mximas
promedio.
Frecuencia
Polgono de Frecuencia
10
5
Frecuencia
0
2
10
Clase
28
29
El Dr. Juran aplic este concepto a la calidad, obtenindose lo que hoy se conoce
como la regla 80/20. Segn este concepto, si se tiene un problema con muchas
causas, podemos decir que el 20% de las causas resuelven el 80 % del problema
y el 80 % de las causas solo resuelven el 20 % del problema.
Se recomienda el uso del diagrama de Pareto para:
31
Tipo de defecto
Mal color
Fuera de medida
Mal terminacin
Aparicin de rebabas
Rotura
Desbalanceo
Aplastamiento
Incompleto
Mal alabeo
Otros
Otros defectos
Frec Frec.
rel %
Acum
%
Aplastamiento
42.6
42.6
Rotura
37.2
79.8
8.5
88.3
Fuera
medida
Mal color
3.2
91.5
Mal alabeo
3.2
94.7
Mal
terminacin
Aparicin de rebabas
2.1
96.8
32
Incompleto
Desbalanceo
El accesorio
adicionales
Otros
Otros defectos
TOTAL
requiere
2.1
98.9
contrapesos 1
1.1
100
100
0
94
Para hacer ms evidente los defectos que aparecen con mayor frecuencia hemos
ordenado los datos de la tabla en orden decreciente de frecuencia. Vemos que la
categora otros siempre debe ir al final, sin importar su valor. De esta manera, si
hubiese tenido un valor ms alto, igual debera haberse ubicado en la ltima fila.
33
Ahora resulta evidente cuales son los tipos de defectos ms frecuentes. Podemos
observar que los 2 primeros tipos de defectos se presentan en el 79,8 % de los
accesorios con fallas. Por el Principio de Pareto, concluimos que: La mayor parte
de los defectos encontrados en el lote pertenece slo a 2 tipos de defectos (los
pocos vitales), de manera que si se eliminan las causas que los provocan
desaparecera la mayor parte de los defectos.
REPASO No. 1
Concepto
Breve descripcin
Dato
Informacin
Conocimiento
Variable
cualitativa
Variable
cuantitativa
Estadstica
descriptiva
Estadstica
34
inferencial
hecho o fenmeno
Poblacin
Muestra
10
Censo
11
Encuesta
12
Escala nominal
13
Escala ordinal
14
Escala de
intervalo
15
Escala de razn
16
Tabla de
frecuencias
17
Intervalo
Espacio que existe entre un punto y otro, tomando en cuenta los puntos
intermedios
18
Variable
continua
19
Variable
discreta
20
Grafico
35
TAREA No. 1
Nombre:_______________________________________________________
1. Seala con una X si la variable mencionada es cualitativa o cuantitativa. Si es
cuantitativa, indica con una X si es variable discreta o continua.
Variable
Cualitativa
Cuantitativa Discreta
Continua
2.
Un funcionario pblico de la Junta de Agua Potable est interesado en
conocer el nivel de cuidado del agua que tienen los habitantes que poseen cisterna
o aljibe en sus casas. Est planeando entrevistar a 300 de esos habitantes: Define
la poblacin de estudio y menciona cual es la muestra:
MTODOS ESTADSTICOS
PRIMER EXAMEN
N0MBRE_________________________________________________________
Uno. Coloca el nmero del concepto que corresponda a la definicin apropiada
1
Estadstica descriptiva
Poblacin
10
Ejemplos de variables 6
cuantitativas
Ejemplos
discreta
variable 5
Intervalo
Variable
Ejemplos
continua
Ejemplos de variables 7
cualitativas
Muestra
10
Estadstica inferencial
de
de
variable 3
Temperatura,
luminosidad.
velocidad,
longitud,
altura,
700
838
863
902
927
946
980
1044
723
851
871
908
929
949
987
1055
776
855
873
912
929
957
1008
1083
824
855
879
914
941
974
1017
1096
Histograma
35
30
Frecuencia
25
20
15
Frecuencia
10
5
0
800
1000
1100
y mayor...
Clase
38
Alumno
Resultado
6.0
5.4
3.1
7.0
6.1
40
Propiedades
Las principales propiedades de la media aritmtica son:
Inconvenientes de su uso
Este parmetro, an teniendo mltiples propiedades que aconsejan su uso en
situaciones muy diversas, tiene tambin algunos inconvenientes, como son:
41
Moda
La moda es el dato ms repetido, el valor de la variable con mayor frecuencia
absoluta. En cierto sentido la definicin matemtica corresponde con la locucin
"estar de moda", esto es, siempre que sea lo ms usado.
La moda es la medida de tendencia central ms fcil de calcular y tambin es la
ms sujeta a fluctuaciones cuando cambian unos pocos valores de la distribucin.
Por esta razn la moda se suele usar para una evaluacin rpida de la tendencia
central. La moda se define como el valor ms frecuente de una distribucin. En
una tabla de frecuencias, la frecuencia mayor es la que contiene la moda. Su
clculo es sencillo, pues slo necesita un recuento.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-46-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.
Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima.
Cuando en una distribucin de datos se encuentran tres o ms modas, entonces
es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia
diremos que no hay moda.
Propiedades
Sus principales propiedades son:
42
Clculo sencillo.
Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.
La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Por ejemplo: Hallar la moda de la distribucin:
Datos: 2, 3, 3, 4, 4, 4, 5, 5
Mo= 4
43
Mo = 4
Clculo de la moda para datos agrupados, si todos los intervalos tienen la misma
amplitud.
44
Mediana
En el mbito de la estadstica, una mediana es el valor de la variable que deja el
mismo nmero de datos antes y despus que l, una vez ordenados estos. De
acuerdo con esta definicin el conjunto de datos menores o iguales que la
45
mediana representarn el 50% de los datos, y los que sean mayores que la
mediana representarn el otro 50% del total de datos de la muestra.
La mediana Me de un conjunto de mediciones x1, x2, x3,..xn es el valor de x
que se encuentra en el punto medio o centro cuando se ordenan los valores de
menor a mayor.
Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias,
cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que,
una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la
posicin central es 2:
Me
= (n+1) / 2
Me = (13+1) / 2
Me = 14 / 2=7
En caso de un nmero par de datos, la mediana no correspondera a ningn valor
de la variable, por lo que se conviene en tomar como mediana el valor intermedio
entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los
anteriores:
46
Existen dos estrategias para calcular la mediana: considerando los datos en forma
individual, sin agruparlos, o bien utilizando los datos agrupados en intervalos de
clase. A continuacin se describe un ejemplo con datos sin agrupar.
Datos sin agrupar
Sean
los datos han sido ordenados (en orden creciente o decreciente), porque ste es el
valor central. Es decir:
mediana de ese conjunto de datos, deja dos datos por debajo (x1, x2) y otros dos
por encima de l (x4, x5).
b) Si n es par, la mediana es la media aritmtica de las dos observaciones
centrales. Cuando n es par, los dos datos que estn en el centro de la muestra
ocupan las posiciones
. Es decir:
y otros
. Por tanto, la
47
Propiedades e inconvenientes
Las principales propiedades de la mediana son:
Es menos sensible que la media a oscilaciones de los valores de la variable. Un
error de transcripcin en la serie del ejemplo anterior en, pongamos por caso, el
ltimo nmero, deja a la mediana inalterada.
No se ve afectada por la dispersin. De hecho, es ms representativa que la
media aritmtica cuando la poblacin es bastante heterognea. Suele darse esta
circunstancia cuando se resume la informacin sobre los salarios de un pas o una
empresa. Hay unos pocos salarios muy altos que elevan la media aritmtica
haciendo que pierda representatividad respecto al grueso de la poblacin. Sin
embargo, alguien con el salario "mediano" sabra que hay tanta gente que gana
ms dinero que l, como que gana menos.
Sus principales inconvenientes son que en el caso de datos agrupados en
intervalos, su valor vara en funcin de la amplitud de estos. Por otra parte, no se
presta a clculos algebraicos tan bien como la media aritmtica.
Comparacin entre las diferentes medidas de tendencia central
Las tres medidas de tendencia central: media, mediana y moda, no son
igualmente tiles para obtener la tendencia central de una distribucin o conjunto
de valores (datos). Cada una de las medidas tiene caractersticas que hacen que
su empleo sea una ventaja en ciertas condiciones y en otras no.
48
Medida de
tendencia
central
Ventajas y desventajas
Media
Incorpora todos los datos de la variable y su valor suele ser ms estable. Su valor
es nico para una serie de datos. Se usa con frecuencia para comparar
poblaciones, es ms apropiada acompaarla de una medida de dispersin. La
afecta sobremanera la dispersin, cuanto menos homogneos son los datos,
menos informacin proporciona. Es sensible a valores extremos de la distribucin y
carece de sentido para variables medidas con un nivel nominal u ordinal.
Moda
Mediana
dentro
del
parntesis
se
colocan
los
valores,
dentro
del
parntesis
se
colocan
los
valores,
dentro
del
parntesis
se
colocan
los
valores,
del
parntesis
se
colocan
los
valores,
dentro
49
50
= n1 (xi-)2 / N
51
S=((55-76.1)2+(62-76.1)2+(67-76.1)2+(68-76.1)2+69-76.1)2+(79-76.1)2+(8876.1)2+(89-76.1)2+(92-76.1)2+(92-76.1)2) /9
S= 13.6
La varianza
La varianza mide la distancia existente entre los valores de la serie y la media. Se
calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamao de la muestra.
La varianza es la desviacin estndar elevada al cuadrado y se simboliza como
S2 cuando es muestral y 2 cuando es poblacional. Esta es una medida que se
usa en muchas pruebas de hiptesis estadsticas inferenciales. Para fines
descriptivos de prefiere usar la desviacin estndar.
S2= (x-)2 / n-1
La varianza siempre ser mayor que cero. Mientras ms se aproxima al cero, ms
concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.
52
dentro
del
parntesis
se
colocan
los
valores,
El resultado es el siguiente:
Columna1
Media
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Rango
Mnimo
Mximo
Suma
Cuenta o nmero de datos de la
distribucin
76.5
74
92
13.19301162
174.0555556
37
55
92
765
10
54
REPASO No. 2
Media de la muestra
Media de la poblacin
Formula de la media
Formula de la Moda
S=
n
1
n
1
(xi-) / N
(xi -) / n-1
Signo de sumatoria
55
Varianza muestral
Varianza poblacional
S = (x-) / n-1
Amplitud de
clase
Frecuencia
absoluta
(60,63)
(63.66)
18
(66.69)
42
(69.72)
27
(72,75)
Estadstica descriptiva
Media
Mediana
Moda
Desviacin estndar
Rango
Mnimo
Mximo
Suma
Cuenta
76.5
74
92
13.1
37
55
92
765
10
56
TAREA No. 2
Nombre:_______________________________________________________
Filtros
13.2
13.1
13.1
18.2
13.2
13.4
13.5
13.5
13.6
13.5
Con base en los datos anteriores cul de los dos filtros debe elegir el
fabricante? por qu?
Debera ser diferente la seleccin si el fabricante supiera que hubo un cambio
en la intensidad de la energa luminosa durante la cuarta medicin del modelo
A? por qu?
TEORA DE CONJUNTOS
DEFINICIONES DE CONJUNTOS
Algunas definiciones de conjunto son:
Es una coleccin de objetos; en los que a cada uno de los objetos que
componen ese conjunto se le denomina elemento del mismo.
son llamados
58
Elementos
D = Un da de la semana
Pertenencia
lD
m = mayo
M = Un mes del ao
l = lunes
mM
Z = Un nmero entero
n=2
NZ
59
1).- Enumerando todos los elementos del conjunto (solo se puede hacer si el
conjunto es finito)
2).- Por medio de una propiedad caracterstica de los elementos que forman a ese
conjunto, esta propiedad puede expresarse de forma ordinaria o utilizando alguna
simbologa lgica.
Nota: Los conjuntos se nombran con letras maysculas latinas, los elementos se
colocan entre llaves, por ejemplo:
A ={0,1,2,3,4,5,6,7,8,9}
B = {a,v,e,s}
C = {Las soluciones de la ecuacin
donde n=1,2,3,4,...}
60
POR EXTENSIN
A = { a, e, i, o, u }
POR COMPRENSIN
A = { x I x es una vocal}
61
B = { 0, 2, 4, 6, 8 }
C = {1, 3, 5, 7, 9 }
D = { c, o, n, j, u, t, s}
E = { b, c, d, f, g, h, j, .. . }
F = { Laura, Javier }
G = {mercurio}
62
x. En smbolos,
entonces
63
y tal que si
. En smbolos,
.
Los axiomas anteriores, excepto el ltimo, constituyen la teora de ZermeloFraenkel, que se representa por ZF. Existen otros axiomas consistentes con los de
ZF, como el axioma de constructibilidad y el axioma de eleccin. Una vez
incorporado el axioma de eleccin a la teora ZF, la teora de conjuntos resultante
se denota por ZFC.
Resumen de los axiomas
Para todo conjunto A existe un conjunto que tiene por elementos las partes
de A.
DIAGRAMA DE VENN-EULER
El matemtico y lgico britnico, John Venn (1834 1923) es especialmente
conocido por su mtodo de representacin grfica de proposiciones (segn su
cualidad y cantidad) y silogismos. Los diagramas de Venn permiten, adems, una
comprobacin de verdad o falsedad de un silogismo. Entre sus obras destaca
Lgica Simblica y los principios de la lgica emprica o inductiva. Sin embargo,
tambin fue importante la participacin de Euler en la esquematizacin de las
representaciones de algunas operaciones.
Cada conjunto de elementos se encuentra encerrado dentro de un circulo, o figura
geomtrica, y estos a su vez estn encerrados dentro de otra figura, por lo general
est es un rectngulo, se pueden dibujar cada elemento del conjunto o bien solo
se puede indicar su existencia. Los diagramas de Venn son una buena
herramienta, que nos permite realizar las operaciones entre los diversos conjuntos
del universo de una forma ms sencilla.
65
definir: A
B={x/x
Ayx
66
Ayx
B}
67
Cuando dos conjuntos no tienen ningn elemento en comn se dice que son
disjuntos.
68
OPERACIN
Propiedad
a) A A = A ; A A =A
IGUALATIVA
b) A B = A B; A B = B A
CONMUTATIVA
c) (A B) C = A (B C) ; (A B) C = A (B C)
ASOCIATIVA
d) A ( B C) = (A B) (A C) ;
DISTRIBUTIVA
A ( B C) = (A B) (A C)
69
71
NOTAS
Para agregar un crculo desde el panel de texto, haga clic en crculo existente,
mueva el cursor antes o despus del texto al que desea agregar el crculo y, a
continuacin, presione ENTRAR.
Para eliminar un crculo del diagrama de Venn, haga clic en el crculo que desea
eliminar y, a continuacin, presione SUPRIMIR.
Mover un crculo en el diagrama de Venn
1. Haga clic con el botn secundario en el diagrama de Venn que desea modificar y,
a continuacin, en Cambiar diseo.
2. Haga clic en Relacin y, a continuacin, siga uno de estos procedimientos:
72
NOTA Tambin puede cambiar el diseo del elemento grfico SmartArt. Para
ello, haga clic en la opcin de diseo en el grupo Diseos de la ficha Diseo en
Herramientas de SmartArt. Al sealar una opcin de diseo, el elemento grfico
SmartArt cambia para mostrar una vista previa del aspecto que tendra con ese
diseo.
Cambiar los colores del diagrama de Venn
Para agregar fcilmente una apariencia y retoques profesionales al elemento
grfico SmartArt, puede cambiar los colores o aplicar un estilo SmartArt al
diagrama de Venn. Tambin puede agregar efectos, como resplandores, bordes
suaves o efectos 3D. Mediante las presentaciones de PowerPoint 2007 podr
animar el diagrama de Venn.
Puede aplicar combinaciones de colores derivadas de los colores del tema a los
crculos del elemento grfico SmartArt.
1. Haga clic en el elemento grfico SmartArt cuyo color desea cambiar.
2. En Herramientas de SmartArt, en el grupo Estilos SmartArt de la ficha Diseo,
haga clic en Cambiar colores.
73
Para cambiar el fondo de un color que no exista en los colores del tema, haga clic
en Ms colores y, a continuacin, haga clic en el color que desea en la ficha
Estndar o cree un color personalizado en la ficha Personalizado. Los colores
personalizados y los colores de la ficha Estndar no se actualizarn si cambia
ms adelante el tema del documento.
74
Para especificar cunto se puede ver a travs del color de fondo, mueva el control
deslizante Transparencia o escriba un nmero en el cuadro situado junto a dicho
control. El porcentaje de transparencia puede oscilar entre 0% (completamente
opaco, el valor predeterminado) y 100% (completamente transparente).
Aplicar un estilo SmartArt al diagrama de Venn
Un estilo SmartArt es una combinacin de distintos efectos, por ejemplo estilo de
lnea, bisel o 3D, que se puede aplicar a los crculos del elemento grfico SmartArt
para crear una apariencia nica y de diseo profesional.
1. Haga clic en el elemento grfico SmartArt que desea cambiar.
2. En Herramientas de SmartArt, en el grupo Estilos SmartArt de la ficha Diseo,
haga clic en el estilo SmartArt que desee.
NOTAS
Al colocar el puntero sobre una miniatura, puede ver cmo afecta el estilo
SmartArt al elemento grfico SmartArt.
Tambin puede personalizar el elemento grfico SmartArt; para ello, puede mover
crculos, cambiar el tamao de los crculos, agregar un relleno o un efecto y
agregar una imagen.
Animar el diagrama de Venn
Si usa Microsoft Office PowerPoint 2007, puede animar el diagrama de Venn para
resaltar cada crculo.
75
NOTA
1. Qu es un conjunto?
2. Define unin entre conjuntos
3. Define la interseccin entre conjuntos.
4. Cul es la diferencia entre una interseccin y una unin?
5. Cul es conjunto formado por la interseccin de los conjuntos:
{e, x, i, t, o} y {t, r, i, u, n, f, o}; {l, u, n, a} y B= {t, r, i, u, n, f, o}
6. Sean los conjunto: A = { 1, 2, 3, 4, 5 }; B = { 1, 2 };C = { 1, 5 }:D = { 1,
4 };E = { 1 } Cul de todos ellos es subconjunto de todos los
dems?
7. Dados los siguientes conjuntos: A = {2,4,6,8,10}, B = {0,1,2,3 },C = {
-2,-1, 0,3}, construye los siguientes diagramas de Venn y descrbelos
formalmente a).- AUB, b).- AUC, c).- BUC
76
B ={2,4,6,8};
C ={3,4,5,6}
77
TEORIA DE PROBABILIDAD
INTRODUCCIN
78
Entonces:
Interseccin: A B
Diferencia: A B
Complemento: A B
79
Qu es una probabilidad?
Una probabilidad (p) es la cualidad de probable, es decir que un evento o
fenmeno pueda o no suceder:
La probabilidad mide la frecuencia con la que aparece un resultado determinado
cuando se realiza el experimento aleatorio, el resultado puede ser el xito (P) o el
fracaso (Q).
80
Ejemplos:
Una moneda cualquiera tiene dos lados: guila o sol, cara o cruz
= No. Caras
_________ = 1= .5000
No. De posibles resultados 2
Total
As
As
As
As
4
4
4
4
4
4
4
4
4
4
4
4
52
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
7
7
7
8
8
8
8
9
9
9
9
10
10
10
10
Jota
Jota
Jota
Jota
Quina Quina Quina Quina
Rey
Rey
Rey
Rey
13
13
13
13
81
El espacio muestral = (52 cartas diferentes); Cuando se toma una sola carta al
azar de un paquete estndar de 52 cartas
p(rey)
= 4 = .0769
52
p(7)
No. De 7 en el paquete
__ = 4 = .0769
Total e cartas en el paquete
52
p(7)
No. De 7 en el paquete
= 4 = .0769
Total e cartas en el paquete 52
p()
No. De en el paquete
= 13 = .2500
Total e cartas en el paquete
52
82
y contamos
83
Cuando tenemos un evento que tiene doble xito o une dos aspectos de xito, se
denomina ocurrencia conjunta. Para calcular la probabilidad correcta, debemos
restar cada ocurrencia conjunta para eliminar ese doble conteo.
= 21 - 2 = 19 = .3654 (correcto)
52 52 52
paquete de cartas, es decir, sacar un as, regresndolo, barajar una vez ms (es
decir al azar), y entonces sacar de nuevo un as. La regla multiplicativa para
eventos compuestos seala que la probabilidad de un evento compuesto es
igual al mltiplo de las probabilidades de las partes separadas del evento. As,
p (as luego as) = p (as) x p (as)
= 4 x 4 = 16
= .0059
52 52 2704
84
= .5 x .5 = .2500 (1 de 4)
= 4 x 3 = 12
= .0045
52 51 2652
= 4 x 4 x 3 = 48 = .0004
52 51 50 132600
Probabilidad de sucesos
Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar
dos sucesos entre s, as como de las posibles relaciones que se pueden
establecer entre los mismos. Vamos a ver ahora cmo se refleja esto en el clculo
de probabilidades.
85
P(B) = 3 / 6 = 0,50
Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es
menor que la probabilidad del suceso que lo contiene, suceso b).
b) Dos sucesos pueden ser iguales: en este caso, las probabilidades de ambos
sucesos son las mismas.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga
nmero par, y b) que salga mltiplo de 2. Las soluciones coinciden en ambos
casos.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P(A B) = 2 / 6 = 0,33
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P
Por lo tanto,
P (A u B) = (0,50 + 0,50) - 0,33 = 0,666
e) Sucesos incompatibles: la probabilidad de la unin de dos sucesos
incompatibles ser igual a la suma de las probabilidades de cada uno de los
sucesos (ya que su interseccin es el conjunto vacio y por lo tanto no hay que
restarle nada).
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un
nmero menor que 3, y b) que salga el nmero 6.
La probabilidad del suceso unin de estos dos sucesos ser igual a:
P(A) = 2 / 6 = 0,333
P(B) = 1 / 6 = 0,166
Por lo tanto,
P(A u B) = 0,33 + 0,166 = 0,50
f) Sucesos complementarios: la probabilidad de un suceso complementario a un
suceso (A) es igual a 1 - P(A)
Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un nmero par,
luego su complementario, suceso (B), es que salga un nmero impar.
La probabilidad del suceso (A) es igual a :
P(A) = 3 / 6 = 0,50
Luego, la probabilidad del suceso (B) es igual a:
P(B) = 1 - P(A) = 1 - 0,50 = 0,50
87
P(B) = 3 / 6 = 0,50
Por lo tanto,
P(A U B) = 0,50 + 0,50 = 1
88
REPASO # 4
Completa las siguientes afirmaciones:
1. La probabilidad toma valores entre ________________
2. Los resultados de la probabilidad tambin pueden ser anotado
como__________________________
3. Un suceso imposible tendr una probabilidad de_____________________
4. Un suceso seguro tendr una probabilidad de_______________________
5. Probabilidad de que al lanzar un dado salga el nmero 2: el caso
favorable es tan slo uno (que salga el dos), mientras que los casos
posibles son seis (puede salir cualquier nmero del uno al seis). Por lo
tanto: P(A) =
6. Probabilidad de que al lanzar un dado salga un nmero par: en este
caso los casos favorables son tres (que salga el dos, el cuatro o el seis),
mientras que los casos posibles siguen siendo seis. Por lo tanto: P(A) =
7. Probabilidad de que al lanzar un dado salga un nmero menor que 5:
en este caso tenemos cuatro casos favorables (que salga el uno, el dos, el
tres o el cuatro), frente a los seis casos posibles. Por lo tanto: P(A) =
8. Probabilidad de que nos toque el "Gordo" de Navidad: tan slo un caso
favorable, el nmero que jugamos (qu triste...), frente a 100.000 casos
posibles. Por lo tanto: P(A) =
9. Que en un paquete completo de naipes previamente barajados
obtengamos:
p (As de )=
p (Rey )=
p (Jota )=
p (6 )=
p ()=
PROBABILIDAD CONDICIONAL
La probabilidad condicional se refiere probabilidad de ocurrencia del evento A,
dada informacin acerca de la ocurrencia de otro evento B.
89
= 200 = 0.80
250
90
DISTRIBUCIN DE PROBABILIDAD
La distribucin de probabilidad de una variable aleatoria, es una funcin (fx) que
asigna a cada suceso definido, sobre la variable aleatoria, la probabilidad de que
dicho suceso ocurra. Indica la gama de valores que pueden representarse como
resultado de un experimento.
As mismo describe la probabilidad de que un evento se realice en el futuro,
constituye una herramienta fundamental para la prospectiva, puesto que se puede
disear un escenario de acontecimientos futuros considerando las tendencias
actuales de diversos fenmenos naturales.
Una variable es una caracterstica que al ser medida en diferentes individuos es
susceptible de adoptar diferentes datos. Los datos son los valores observados de
las variables, stas pueden ser:
Cualitativas: Son las variables que expresan distintas cualidades, caractersticas o
modalidades. Cada modalidad que se presenta se denomina atributo o categora y
la medicin consiste en una clasificacin de dichos atributos. Las variables
cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores
posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir
tres o ms valores. Dentro de ellas podemos distinguir:
91
Cuantitativas o numricas
Son las variables que se expresan mediante cantidades numricas. Las variables
cuantitativas pueden ser:
Variable
discreta:
Es
la
variable
que
presenta
separaciones
DISTRIBUCIN DE VARIABLE
PROBABILIDADES DISCRETA
DISCRETA
DISTRIBUCIN
DE
92
El trmino
El trmino
Ejemplo:
Supngase que en cierta poblacin el 52 por ciento de todos los nacimientos que
se registraron son varones. Si aleatoriamente se escogen 5 registros de
nacimientos dentro de esa poblacin, cul es la probabilidad de que exactamente
3 de ellos sean varones?
Tenemos los siguientes datos:
n = 5, nmero de ensayos, tamao de muestra o registros
X= 3, nmero de xitos (probabilidad de que sean varones)
p = 0.52, la probabilidad de xito
P(x)=
n!
p (1-p)
n-x
(n-x)! x!
P(x=20)=
5!
(5-3)! 3!
(0.52) (1-0.52)
5-3
94
PROBLEMA
Hay una campaa en un centro mdico, sobre paternidad responsable a un grupo
de mujeres. Una vez finalizada la charla se les entrega un papelito con una nica
pregunta:
Deseara usted ser esterilizada?
1. Si 2. No
Estamos interesada en investigar si las charlas tienen un efecto favorable en el
sentido de que las mujeres se decidan a ser sometidas a la esterilizacin.
Ante este tipo de situaciones, tenemos que acudir a las Distribuciones de
Probabilidades. En nuestro ejemplo, la variable Deseo ser esterilizada, es una
variable cualitativa, discreta. Por lo tanto se requieren de las Distribuciones de
Probabilidades Discretas.
VARIABLE ALEATORIA
Una variable se dice que es aleatoria, si los posibles valores que puede tomar son
determinados por el azar. Es decir se sabe qu valores puede tomar la variable
pero no se tiene certeza de su ocurrencia, slo se sabe que puede ocurrir con una
cierta probabilidad. Por ejemplo, en una epidemia de clera, se sabe que una
persona cualesquiera puede enfermar o no (eventos), pero no se sabe cul de los
95
dos eventos va a ocurrir. Solamente se puede decir que existe una probabilidad de
que la persona enferme.
Las variables aleatorias se clasifican:
1. Discretas: aquellas que resultan de contar el nmero de casos en los que el
evento de inters ocurre, por ejemplo: numero de hijos de una familia,
nmero de veces que llega una paciente al servicio de emergencia, etc.
2. Continuas: aquellas que resultan producto de una medicin, por ejemplo: el
peso, el nivel de hemoglobina, etc.
VALOR ESPERADO
El valor esperado se llama tambin esperanza matemtica. Se trata de un
operador matemtico que al ser aplicado a la funcin probabilidad permite el
clculo de ese valor en el caso discreto, mientras que en el caso continuo se lo
aplica a la funcin frecuencia:
Sigamos con nuestro ejemplo del centro mdico. Nuestra variable de inters seria:
Deseo ser esterilizada.
Supongamos que a la charla asistieron tres mujeres, entonces definimos como
variable aleatoria a:
X : Nmero de mujeres que desearan ser esterilizadas.
Antes de hacerles la pregunta sobre su deseo de ser esterilizadas, puede
considerar las posibles respuestas:
X = 0 (Ninguna deseara ser esterilizada)
X = 1 (Slo una de las mujeres deseara)
X = 2 (Dos mujeres desearan)
X = 3 (Las tres mujeres desearan)
Antes de verificar las respuestas de las 3 mujeres seleccionada; no sabe cuntas
estarn de acuerdo en ser esterilizadas, pero si conociera las probabilidades de
96
DISTRIBUCION BINOMIAL
Esta distribucin se basa en el proceso de Bernoulli. Se denominan procesos de
tipo Bernoulli, a todo experimento consistente en una serie de pruebas repetidas,
caracterizadas por tener resultados que se pueden clasificar en si verifican o no
cierta propiedad o atributo, siendo aleatorios e independientes.
Para identificar un proceso Bernoulli en una serie de pruebas repetidas, se deben
verificar tres condiciones:
1. Resultados dicotmicos: Los resultados de cada prueba se pueden
clasificar en "xito" si verifican cierta condicin, o "fracaso" en el caso
contrario.
2. Independencia de las pruebas: El resultado de una prueba cualquiera es
independiente del resultado obtenido en la prueba anterior, y no incide en el
resultado de la prueba siguiente.
3. Estabilidad de las pruebas: La probabilidad p de obtener un resultado
considerado como un xito se mantiene constante a lo largo de toda la serie
de pruebas.
Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener
exactamente r xitos, en una serie de n pruebas, con una probabilidad de xito p,
se puede aplicar la frmula de la probabilidad binomial:
X = 0, 1, 2, , n.
97
x=20
n=100
p= 0.25
n!
p (1-p)
n-x
(n-x)! x!
P(x=20)=
100!
(0.25)
(100-20)! 20!
157
20
(1-0.25)
P(x=20)= 9.3326x10
118
18
(7.1569 x 10 ) 2.4329 x 10
100-20
-13
-10
(9.09495 x 10 ) (1.01135 x 10 )
98
Para calcular el factorial (!) se utiliza excell, insertar funcin (Fx), categora
matemticas
trigonomtricas,
seleccionar
fact,
insertar
el
nmero
9.3326x10
118
18
(7.1569 x 10 ) 2.4329 x 10
99
100
n=5
p= 0.60
b) x=3
n=5
p= 0.60
x=4
n=5
p= 0.60
x=5
n=5
p= 0.60
c) x=1
n=5
p= 0.60
x=0
n=5
p= 0.60
a) P(x)=
n!
p (1-p)
(n-x)! x!
P(x=5)=
n-x
5!
(0.60) (1-0.60)
(5-5)! 5!
5-5
= 0.0778
b) P(x)=
n!
p (1-p)
(n-x)! x!
n-x
P(x3)
P(x=3)=
5-3
5-4
5-5
5!
(0.60) (1-0.60)
(5-3)! 3!
= 0.3456
P(x=4)=
5!
(0.60) (1-0.60)
(5-4)! 4!
= 0.2592
P(x=5)=
5!
(0.60) (1-0.60)
(5-5)! 5!
= 0.0778
P(x3) = P(x=3) + p(x=4)+ p(x=5)
P(x3) = 0.3456+0.2592+0.0778 = 0.6826
101
c) P(x)=
n!
p (1-p)
(n-x)! x!
n-x
P(x2)
P(x=1)=
5-1
5-0
5!
(0.60) (1-0.60)
(5-1)! 1!
= 0.0768
P(x=0)=
5!
(0.60) (1-0.60)
(5-0)! 0!
= 0.0102
P(x2) = P(x=1) + p(x=0)
P(x2) = 0.0768+0.0102 = 0.0870
Ejercicio
n!
n-x!
x!
(a2/(b2*c2))
px
1-p n-x
d2*e2*f2
distribucin
binomial
en Excel
120
120
0.07776
0.0778
0.0778
0.0778
120
120
0.07776
0.0778
0.0778
0.6826
120
10
0.216
0.16
0.3456
0.3456
120
24
0.1296
0.4
0.2592
0.2592
120
24
0.6
0.0256
0.0768
0.0768
120
120
0.01024
0.0102
0.0102
solucin
en libro
0.0870
102
Variables:
a) x=5
b) x=4
x=5
c) x=0
d) x=2
x=1
x=0
a) P(x)=
n=5
n=5
n=5
n=5
n=5
n=5
n=5
x
n!
p (1-p)
(n-x)! x!
p= 0.25
p= 0.25
p= 0.25
p= 0.25
p= 0.25
p= 0.25
p= 0.25
n-x
5-5
5-5
5-4
5-0
5-2
5-1
5-0
P(x=5)=
5!
(0.25) (1-0.25)
(5-5)! 5!
b) P(x=5)=
5!
(0.25) (1-0.25)
(5-5)! 5!
P(x=4)=
5!
(0.25) (1-0.25)
(5-4)! 4!
c) P(x=0)=
5!
(0.25) (1-0.25)
(5-0)! 0!
d) P(x=2)=
5!
(0.25) (1-0.25)
(5-2)! 2!
P(x=1)=
5!
(0.25) (1-0.25)
(5-1)! 1!
P(x=0)=
5!
(0.25) (1-0.25)
(5-0)! 0!
Ejercicio
A
B
C
D
n!
120
120
120
120
120
120
120
n-x!
1
1
1
120
6
24
120
x!
120
120
24
1
2
1
1
(a2/(b2*c2))
1
1
5
1
10
5
1
px
0.0009
0.0009
0.0039
1
0.0625
0.25
1
1-p n-x
1
1
0.75
0.2373
0.4218
0.3164
0.2373
d2*e2*f2
0.0010
0.0010
0.0146
0.2373
0.2637
0.3955
0.2373
Distribucin
binomial
en Excel
0.0010
0.0010
0.0146
0.2373
0.2637
0.3955
0.2373
Suma
0.0156
0.8965
103
LA DISTRIBUCIN NORMAL
La distribucin normal o gaussiana, es la distribucin continua que se utiliza ms
comnmente en estadstica, sta es importante por tres razones:
104
entre 7.99 y 8.01. Sin embargo, la probabilidad de que el tiempo de descarga sea
exactamente de 8 segundos es cero.
Distribucin normal estndar
La ms simple de todas las distribuciones normales, es la distribucin normal
estndar, denominada distribucin Z, est se encuentra distribuida alrededor de
una media (=0) con una desviacin estndar (=1). As por ejemplo, el valor
Z=1.5 est 1.5 desviaciones estndar por encima de la media y, en general:
Cada valor Z es el nmero de desviaciones estndar separado de la media.
= es la media
= es la desviacin estndar
x= es cualquier valor de la variable continua
105
Puesto que
media
y la desviacin estndar
combinacin particular
estndar .
Z= X
Aunque los datos originales para la variable aleatoria X tenan una media y una
desviacin estndar, la variable aleatoria estandarizada Z siempre tendr una
media=0 y una desviacin estndar=1.
Al sustituir media=0 y desviacin estndar=1 en la ecuacin de funcin de
densidad de la probabilidad de una variable normal estandarizada Z. Dicha
funcin est dada en la siguiente ecuacin:
- (1/2)Z
f(X) = _____1_____ e
2
106
Problema
Suponga que desea encontrar la probabilidad de que el tiempo de descarga para
un sitio Web sea menor a 9 segundos. La media es
=2
Primero utiliza la ecuacin Z= X-
=7 y la desviacin estndar
Encontrar P (X9)
Para transformar X=9 a unidades estandarizadas Z. Puesto que X=9 es una
desviacin estndar por arriba de la media 7+2= 9, Z= +1.00.
Z= 9-7 = 2 = +1.00
2
2
En seguida se utiliza la Tabla de distribucin normal estandarizada para encontrar
el rea acumulativa bajo la curva normal calculada menor que Z=+1.00 (es decir a
la izquierda de Z.
Para leer la probabilidad o rea bajo la curva menor que Z=+1.00 se revisa la
columna Z de la tabla, hasta localizar el valor Z de inters (en dcimos) en la fila Z
de 1.0. A continuacin se lee a travs del rengln hasta que intercepte la columna
que contiene el lugar del valor Z en los centsimos.
107
Encontrar P (X9)
Cul es la probabilidad de que el tiempo de descarga sea de ms de 9
segundos?
Solucin: La probabilidad de que el tiempo de descarga sea menor a 9 segundos
es de 0.8413. As, la probabilidad de que el tiempo de descarga sea mayor a 9
segundos es el complemento de que sea menor a 9 segundos, 1-0.8413= 0.1587.
Figura 1.
Figura 1.
108
Encontrar P (7X9)
Cul es la probabilidad de que el tiempo de descarga est entre 7 y 9 segundos?
Z= 7-7 = 0.00
2
Al utilizar la tabla de distribucin normal estandarizada acumulativa, se sabe que
el rea bajo la curva normal menor que la media de Z=0.00 es de 5.000. Por lo
tanto, el rea bajo la curva entre Z=0.00 y Z=1.00 es de 0.8413-0.5000 = 0.3413.
Figura 2.
Figura 2.
109
y la
Puesto que la media y la mediana son la misma para los datos distribuidos
normalmente, el 50% de los tiempos de descarga estn por debajo de los 7
segundos. Como se calcul, en el primer ejercicio, la probabilidad del tiempo de
descarga de ms de 9 segundos P (X9) es de 0.1587. Por lo tanto, la
probabilidad de que el tiempo de descarga est por debajo de 7 o por arriba de 9
segundos, P (X7 O X9), es 0.5000+0.1587= 0.6587. Figura 3.
Figura 3.
110
Encontrar P (5X9)
Cul es la probabilidad de que el tiempo de descarga este entre 5 y 9 segundos,
es decir P (5X9)?
El rea bajo la curva normal menor que 9 segundos es, como se mencion
anteriormente, 0.8413. Para encontrar el rea bajo la curva menor que 5 segundos
(paso 2)
Z= 5-7 = -1.00
2
111
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.1
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.2
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.3
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6406
0.6443
0.6480
0.6517
0.4
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808
0.6844
0.6879
0.5
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157
0.7190
0.7224
0.6
0.7257
0.7291
0.7324
0.7357
0.7389
0.7422
0.7454
0.7486
0.7517
0.7549
0.7
0.7580
0.7611
0.7642
0.7673
0.7704
0.7734
0.7764
0.7794
0.7823
0.7852
0.8
0.7881
0.7910
0.7939
0.7967
0.7995
0.8023
0.8051
0.8078
0.8106
0.8133
0.9
0.8159
0.8186
0.8212
0.8238
0.8264
0.8289
0.8315
0.8340
0.8365
0.8389
0.8413
0.8438
0.8461
0.8485
0.8508
0.8531
0.8554
0.8577
0.8599
0.8621
1.1
0.8643
0.8665
0.8686
0.8708
0.8729
0.8749
0.8770
0.8790
0.8810
0.8830
1.2
0.8849
0.8869
0.8888
0.8907
0.8925
0.8944
0.8962
0.8980
0.8997
0.9015
1.3
0.9032
0.9049
0.9066
0.9082
0.9099
0.9115
0.9131
0.9147
0.9162
0.9177
1.4
0.9192
0.9207
0.9222
0.9236
0.9251
0.9265
0.9279
0.9292
0.9306
0.9319
1.5
0.9332
0.9345
0.9357
0.9370
0.9382
0.9394
0.9406
0.9418
0.9429
0.9441
1.6
0.9452
0.9463
0.9474
0.9484
0.9495
0.9505
0.9515
0.9525
0.9535
0.9545
1.7
0.9554
0.9564
0.9573
0.9582
0.9591
0.9599
0.9608
0.9616
0.9625
0.9633
1.8
0.9641
0.9649
0.9656
0.9664
0.9671
0.9678
0.9686
0.9693
0.9699
0.9706
1.9
0.9713
0.9719
0.9726
0.9732
0.9738
0.9744
0.9750
0.9756
0.9761
0.9767
0.9772
0.9778
0.9783
0.9788
0.9793
0.9798
0.9803
0.9808
0.9812
0.9817
2.1
0.9821
0.9826
0.9830
0.9834
0.9838
0.9842
0.9846
0.9850
0.9854
0.9857
2.2
0.9861
0.9864
0.9868
0.9871
0.9875
0.9878
0.9881
0.9884
0.9887
0.9890
2.3
0.9893
0.9896
0.9898
0.9901
0.9904
0.9906
0.9909
0.9911
0.9913
0.9916
2.4
0.9918
0.9920
0.9922
0.9925
0.9927
0.9929
0.9931
0.9932
0.9934
0.9936
2.5
0.9938
0.9940
0.9941
0.9943
0.9945
0.9946
0.9948
0.9949
0.9951
0.9952
2.6
0.9953
0.9955
0.9956
0.9957
0.9959
0.9960
0.9961
0.9962
0.9963
0.9964
2.7
0.9965
0.9966
0.9967
0.9968
0.9969
0.9970
0.9971
0.9972
0.9973
0.9974
2.8
0.9974
0.9975
0.9976
0.9977
0.9977
0.9978
0.9979
0.9979
0.9980
0.9981
2.9
0.9981
0.9982
0.9982
0.9983
0.9984
0.9984
0.9985
0.9985
0.9986
0.9986
0.99865
0.99869
0.99874
0.99878
0.99882
0.99886
0.99889
0.99893
0.99896
0.99900
3.1
0.99903
0.99906
0.99910
0.99913
0.99916
0.99918
0.99921
0.99924
0.99926
0.99929
3.2
0.99931
0.99934
0.99936
0.99938
0.99940
0.99942
0.99944
0.99946
0.99948
0.99950
3.3
0.99952
0.99953
0.99955
0.99957
0.99958
0.99960
0.99961
0.99962
0.99964
0.99965
3.4
0.99966
0.99968
0.99969
0.99970
0.99971
0.99972
0.99973
0.99974
0.99975
0.99976
3.5
0.99977
0.99978
0.99978
0.99979
0.99980
0.99981
0.99981
0.99982
0.99983
0.99983
3.6
0.99984
0.99985
0.99985
0.99986
0.99986
0.99987
0.99987
0.99988
0.99988
0.99989
3.7
0.99989
0.99990
0.99990
0.99990
0.99991
0.99991
0.99992
0.99992
0.99992
0.99992
3.8
0.99993
0.99993
0.99993
0.99994
0.99994
0.99994
0.99994
0.99995
0.99995
0.99995
112
3.9
0.99995
0.99995
0.99996
0.99996
0.99996
0.99996
0.99996
0.99996
0.99997
0.99997
0.999968329 0.999969641
0.999970901
0.999972112 0.999973274
0.999974391
0.999975464
0.999976493
0.999977482
0.999978431
4.1
0.999979342 0.999980217
0.999981056
0.999981862 0.999982635
0.999983376
0.999984088
0.999984770
0.999985425
0.999986052
4.2
0.999986654 0.999987231
0.999987785
0.999988315 0.999988824
0.999989311
0.999989779
0.999990226
0.999990655
0.999991066
4.3
0.999991460 0.999991837
0.999992199
0.999992545 0.999992876
0.999993193
0.999993497
0.999993788
0.999994066
0.999994332
4.4
0.999994587 0.999994831
0.999995065
0.999995288 0.999995502
0.999995706
0.999995902
0.999996089
0.999996268
0.999996439
4.5
0.999996602 0.999996759
0.999996908
0.999997051 0.999997187
0.999997318
0.999997442
0.999997561
0.999997675
0.999997784
4.6
0.999997888 0.999997987
0.999998081
0.999998172 0.999998258
0.999998340
0.999998419
0.999998494
0.999998566
0.999998634
4.7
0.999998699 0.999998761
0.999998821
0.999998877 0.999998931
0.999998983
0.999999032
0.999999079
0.999999124
0.999999166
4.8
0.999999207 0.999999245
0.999999282
0.999999317 0.999999351
0.999999383
0.999999413
0.999999442
0.999999470
0.999999496
4.9
0.999999521 0.999999545
0.999999567
0.999999589 0.999999609
0.999999629
0.999999648
0.999999665
0.999999682
0.999999698
0.999999713 0.999999728
0.999999742
0.999999755 0.999999767
0.999999779
0.999999790
0.999999801
0.999999811
0.999999821
5.1
0.999999830 0.999999839
0.999999847
0.999999855 0.999999863
0.999999870
0.999999877
0.999999883
0.999999889
0.999999895
5.2
0.999999900 0.999999906
0.999999911
0.999999915 0.999999920
0.999999924
0.999999928
0.999999932
0.999999935
0.999999939
5.3
0.999999942 0.999999945
0.999999948
0.999999951 0.999999954
0.999999956
0.999999958
0.999999961
0.999999963
0.999999965
5.4
0.999999967 0.999999968
0.999999970
0.999999972 0.999999973
0.999999975
0.999999976
0.999999977
0.999999979
0.999999980
5.5
0.999999981 0.999999982
0.999999983
0.999999984 0.999999985
0.999999986
0.999999987
0.999999987
0.999999988
0.999999989
5.6
0.999999989 0.999999990
0.999999990
0.999999991 0.999999991
0.999999992
0.999999992
0.999999993
0.999999993
0.999999994
5.7
0.999999994 0.999999994
0.999999995
0.999999995 0.999999995
0.999999996
0.999999996
0.999999996
0.999999996
0.999999996
5.8
0.999999997 0.999999997
0.999999997
0.999999997 0.999999997
0.999999998
0.999999998
0.999999998
0.999999998
0.999999998
5.9
0.999999998 0.999999998
0.999999998
0.999999998 0.999999999
0.999999999
0.999999999
0.999999999
0.999999999
0.999999999
0.999999999 0.999999999
0.999999999
0.999999999 0.999999999
0.999999999
0.999999999
0.999999999
0.999999999
0.999999999
113
0.5
0.01
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.496010644 0.492021686
0.488033527
0.484046563
0.480061194
0.476077817
0.47209683
0.468118628
0.464143607
-0.1
0.448283213
0.444329995
0.440382308
0.436440537
0.432505068
0.428576284
0.424654565
-0.2
0.409045885
0.405165128
0.401293674
0.397431887
0.393580127
0.389738752
0.385908119
-0.3
0.370699981
0.366928264
0.363169349
0.359423567
0.355691245
0.351972708
0.348268273
-0.4
0.333597821
0.329968554
0.32635522
0.32275811
0.319177509
0.315613697
0.312066949
-0.5
0.298055965
0.294598516
0.291159687
0.287739719
0.284338849
0.280957309
0.277595325
-0.6
0.264347292
0.2610863
0.257846111
0.254626915
0.251428895
0.24825223
0.245097094
-0.7
0.232695092
0.229649997
0.226627352
0.223627292
0.220649946
0.217695438
0.214763884
-0.8
0.203269392
0.200454193
0.197662543
0.194894521
0.192150202
0.189429655
0.186732943
-0.9
0.184060125 0.181411255
0.17878638
0.176185542
0.17360878
0.171056126
0.168527607
0.166023246
0.163543059
0.16108706
-1
0.158655254 0.156247645
0.15386423
0.151505003
0.14916995
0.146859056
0.1445723
0.142309654
0.14007109
0.137856572
-1.1
0.129238112
0.127143151
0.125071936
0.123024403
0.121000484
0.119000107
0.117023196
-1.2
0.11506967
0.113139446 0.111232437
0.109348552
0.107487697
0.105649774
0.103834681
0.102042315
0.100272568
0.098525329
-1.3
0.091759136
0.090122672
0.088507991
0.086914962
0.085343451
0.083793322
0.082264439
-1.4
0.07635851
0.0749337
0.07352926
0.072145037
0.070780877
0.069436623
0.068112118
-1.5
0.063008364
0.061780177
0.060570758
0.059379941
0.058207556
0.057053433
0.055917403
-1.6
0.051550748
0.050502583
0.049471468
0.048457226
0.047459682
0.046478658
0.045513977
-1.7
0.041815138
0.040929509
0.040059157
0.039203903
0.03836357
0.03753798
0.036726956
-1.8
0.033624969
0.032884119
0.032156775
0.031442763
0.030741909
0.030054039
0.02937898
-1.9
0.02871656
0.02742895
0.026803419
0.026189845
0.02558806
0.024997895
0.024419185
0.023851764
0.023295468
-2
0.02117827
0.020675163
0.020182215
0.01969927
0.019226172
0.018762766
0.0183089
-2.1
0.016585807
0.016177383
0.015777607
0.015386335
0.015003423
0.014628731
0.014262118
-2.2
0.012873721
0.012545461
0.012224473
0.011910625
0.011603792
0.011303844
0.011010658
-2.3
0.01072411
0.010444077 0.010170439
0.009903076
0.00964187
0.009386706
0.009137468
0.008894043
0.008656319
0.008424186
-2.4
0.008197536
0.00797626
0.007760254
0.007549411
0.007343631
0.007142811
0.006946851
0.006755653
0.006569119
0.006387155
-2.5
0.005703126
0.005542623
0.005386146
0.005233608
0.005084926
0.004940016
0.004798797
-2.6
0.004269243
0.004145301
0.004024589
0.003907033
0.003792562
0.003681108
0.003572601
-2.7
0.003466974
0.00336416
0.003166716
0.003071959
0.002979763
0.002890068
0.002802815
0.002717945
0.002635402
-2.8
0.00255513
0.002477075 0.002401182
0.0023274
0.002255677
0.002185961
0.002118205
0.002052359
0.001988376
0.001926209
-2.9
0.00169481
0.001641061
0.00158887
0.001538195
0.001488999
0.001441242
0.001394887
0.028066607
0.02
0.003264096
-3
0.001222769
0.001182891
0.001144207
0.001106685
0.001070294
0.001035003
0.001000782
-3.1
0.000874032
0.000844739
0.000816352
0.000788846
0.000762195
0.000736375
0.000711364
-3.2
0.000618951
0.000597648
0.000577025
0.000557061
0.000537737
0.000519035
0.000500937
-3.3
0.000483424
0.000450087
0.00043423
0.000418892
0.000404058
0.000389712
0.000375841
0.000362429
0.000349463
-3.4
0.000301791
0.000290857
0.000280293
0.000270088
0.000260229
0.000250707
0.00024151
-3.5
0.00020778
0.000200064
0.000192616
0.000185427
0.000178491
0.000171797
0.000165339
-3.6
0.000141711
0.000136319
0.00013112
0.000126108
0.000121275
0.000116617
0.000112127
0.00046648
-3.7
0.0001078
0.00010363
9.96E-05
9.57E-05
9.20E-05
8.84E-05
8.50E-05
8.16E-05
7.84E-05
7.53E-05
-3.8
7.23E-05
6.95E-05
6.67E-05
6.41E-05
6.15E-05
5.91E-05
5.67E-05
5.44E-05
5.22E-05
5.01E-05
114
-3.9
4.81E-05
4.61E-05
4.43E-05
4.25E-05
4.07E-05
3.91E-05
3.75E-05
3.59E-05
3.45E-05
3.30E-05
-4
3.17E-05
3.04E-05
2.91E-05
2.79E-05
2.67E-05
2.56E-05
2.45E-05
2.35E-05
2.25E-05
2.16E-05
-4.1
2.07E-05
1.98E-05
1.89E-05
1.81E-05
1.74E-05
1.66E-05
1.59E-05
1.52E-05
1.46E-05
1.39E-05
-4.2
1.33E-05
1.28E-05
1.22E-05
1.17E-05
1.12E-05
1.07E-05
1.02E-05
9.77E-06
9.34E-06
8.93E-06
-4.3
8.54E-06
8.16E-06
7.80E-06
7.46E-06
7.12E-06
6.81E-06
6.50E-06
6.21E-06
5.93E-06
5.67E-06
-4.4
5.41E-06
5.17E-06
4.94E-06
4.71E-06
4.50E-06
4.29E-06
4.10E-06
3.91E-06
3.73E-06
3.56E-06
-4.5
3.40E-06
3.24E-06
3.09E-06
2.95E-06
2.81E-06
2.68E-06
2.56E-06
2.44E-06
2.32E-06
2.22E-06
-4.6
2.11E-06
2.01E-06
1.92E-06
1.83E-06
1.74E-06
1.66E-06
1.58E-06
1.51E-06
1.43E-06
1.37E-06
-4.7
1.30E-06
1.24E-06
1.18E-06
1.12E-06
1.07E-06
1.02E-06
9.68E-07
9.21E-07
8.76E-07
8.34E-07
-4.8
7.93E-07
7.55E-07
7.18E-07
6.83E-07
6.49E-07
6.17E-07
5.87E-07
5.58E-07
5.30E-07
5.04E-07
-4.9
4.79E-07
4.55E-07
4.33E-07
4.11E-07
3.91E-07
3.71E-07
3.52E-07
3.35E-07
3.18E-07
3.02E-07
-5
2.87E-07
2.72E-07
2.58E-07
2.45E-07
2.33E-07
2.21E-07
2.10E-07
1.99E-07
1.89E-07
1.79E-07
-5.1
1.70E-07
1.61E-07
1.53E-07
1.45E-07
1.37E-07
1.30E-07
1.23E-07
1.17E-07
1.11E-07
1.05E-07
-5.2
9.96E-08
9.44E-08
8.95E-08
8.48E-08
8.03E-08
7.60E-08
7.20E-08
6.82E-08
6.46E-08
6.12E-08
-5.3
5.79E-08
5.48E-08
5.19E-08
4.91E-08
4.65E-08
4.40E-08
4.16E-08
3.94E-08
3.72E-08
3.52E-08
-5.4
3.33E-08
3.15E-08
2.98E-08
2.82E-08
2.66E-08
2.52E-08
2.38E-08
2.25E-08
2.13E-08
2.01E-08
-5.5
1.90E-08
1.79E-08
1.70E-08
1.60E-08
1.51E-08
1.43E-08
1.35E-08
1.27E-08
1.20E-08
1.14E-08
-5.6
1.07E-08
1.01E-08
9.55E-09
9.01E-09
8.50E-09
8.02E-09
7.57E-09
7.14E-09
6.73E-09
6.35E-09
-5.7
5.99E-09
5.65E-09
5.33E-09
5.02E-09
4.73E-09
4.46E-09
4.21E-09
3.96E-09
3.74E-09
3.52E-09
-5.8
3.32E-09
3.12E-09
2.94E-09
2.77E-09
2.61E-09
2.46E-09
2.31E-09
2.18E-09
2.05E-09
1.93E-09
-5.9
1.82E-09
1.71E-09
1.61E-09
1.51E-09
1.43E-09
1.34E-09
1.26E-09
1.19E-09
1.12E-09
1.05E-09
-6
9.87E-10
9.28E-10
8.72E-10
8.20E-10
7.71E-10
7.24E-10
6.81E-10
6.40E-10
6.01E-10
5.64553E-
115
1- =95%,
1- =99%,
Z=1.96
Z=2.58
116
Nivel de
confianza
Nivel de
significancia
1-
/2
50
0.50
68.27
Sumatoria
1- + /2
0.25
0.75
Z=0.67
0.6827
0.1586
0.8413
Z=1.00
80
0.80
0.10
0.90
Z=1.28
90
0.90
0.05
0.95
Z= 1.64
95
0.95
0.025
0.975
Z= 1.96
95.45
0.9545
0.02275
0.97725
Z=2.00
96
0.96
0.02
0.98
Z=2.06
97.5
0.975
0.0125
0.9875
Z= 2.24
98
0.98
0.01
0.99
Z=2.33
99
0.99
0.005
0.995
Z= 2.58
99.73
0.9973
0.00135
0.9986
Z=2.99
La notacin /2, representa que estamos en una grfica de dos colas, por esta
razn (alfa) o nivel de significancia se divide entre dos.
Se llama valor crtico al valor de Z necesario para construir un intervalo de
confianza para la distribucin. El 95% de confianza corresponde a un valor de de
0.05. El valor crtico Z correspondiente al rea acumulativa de 0.9750 es 1.96.
117
Este valor nos dice que la media de la muestra se encuentran en un 95% de los
casos como mximo a 1.96 desviaciones tpicas de la media buscada.
Estimacin del intervalo de confianza para la media ( conocida)
Formula de intervalo de confianza para la media ( conocida)
Z /n
- Z /n - Z /n
118
= 10.998 0.00516
10.99284 11.00316
Una vez ms, puesto que el 11 est incluido dentro de la amplitud de intervalo, no
hay razn para creer que algo est mal.
Problemas a resolver
119
Ejercicio:
Una empresa de remodelaciones selecciona una muestra de 100 facturas de la
poblacin de facturas de ventas durante el mes; la media de la muestra de las 100
facturas de ventas es de $110.27, con una desviacin estndar de $28.95. Para
un nivel de confianza del 95% y 99 grados de libertad.
120
Por ejemplo, con 99 grados de libertad, si se quiere un nivel de confianza del 95%
significa que el 2.5% de los valores, es decir un rea de 0.025, se encuentra en
cada extremo de la distribucin. Buscando en la columna para un rea de la cola
superior de 0.025 y en la fila correspondiente a 99 grados de libertad, se obtiene
un valor crtico para t de 1.9842 (ver figura). Entonces sustituimos:
tn-1 S/n = 110.27 (1.9842) 28.95
100
=110.27 (1.9842) 2.895
=110.27 5.74
$104.53 $116.01
121
122
123
PRUEBA DE HIPOTESIS
Una hiptesis es una proposicin aceptable que ha sido formulada a travs de la
recoleccin de informacin y datos, aunque no est confirmada sirve para
responder de forma tentativa a un problema con base cientfica.
Una hiptesis puede usarse como una propuesta provisional que no se pretende
demostrar estrictamente, o puede ser una prediccin que debe ser verificada por
el mtodo cientfico. En el primer caso, el nivel de veracidad que se otorga a una
hiptesis depender de la medida en que los datos empricos apoyan lo afirmado
en la hiptesis. Esto es lo que se conoce como contrastacin emprica de la
hiptesis o bien proceso de validacin de la hiptesis. Este proceso puede
realizarse mediante confirmacin (corroborar, dar validez) o mediante verificacin
(demostrar o comprobar que es verdadera una cosa de la que se dudaba).
Hiptesis nula y alternativa
En un trabajo de investigacin generalmente se plantean dos hiptesis
mutuamente excluyentes: la hiptesis nula o hiptesis de nulidad (H0) y la
hiptesis alternativa o de investigacin (H1).
La hiptesis nula (H0), siempre es una de status quo: expresa que el fenmeno o
proceso est funcionando de manera adecuada, de acuerdo con la norma o las
especificaciones.
La hiptesis de investigacin (H1), es una afirmacin especial cuya validez se
pretende demostrar, si las pruebas empricas no apoyan decididamente la
hiptesis de investigacin se aceptar la hiptesis nula y se abandona la hiptesis
de investigacin. La hiptesis alternativa es opuesta a la hiptesis nula, la primera
es cierta si la segunda es falsa.
El anlisis estadstico de los datos servir para determinar si se puede o no
aceptar H1. Cuando se rechaza H0, significa que el factor estudiado ha influido
significativamente en los resultados y es informacin relevante para apoyar la
124
el
126
Error tipo I y II
Al utilizar un estadstico de muestra para tomar decisiones sobre el parmetro
poblacional, existe el riesgo de llegar a una conclusin equivocada, se puede
cometer error tipo I y el error tipo II.
El error tipo I se presenta cuando se rechaza la hiptesis nula H0 siendo cierta y
no debera rechazarse. La probabilidad de que se presente un error tipo I es .
El error tipo II se presenta cuando no se rechaza la hiptesis nula H0 siendo falsa
y debera rechazarse. La probabilidad de que se presente un error tipo II es .
La probabilidad de cometer un error tipo denotado por , se denomina nivel de
significancia del estadstico de prueba, por lo general se seleccionan nivel de
0.01, 0.5 o 0.10. Despus de especificar el valor de , usted conoce el tamao de
la regin de rechazo, porque es la probabilidad de rechazo bajo la hiptesis nula.
A partir de este hecho, se determina el valor o valores crticos que dividen las
zonas de rechazo y aceptacin.
El complemento de la probabilidad de un error tipo I (1- ) se denomina
coeficiente de confianza. Al multiplicarlo por cien (1- ) x 100, el coeficiente de
confianza produce el nivel de confianza. El coeficiente de confianza (1- ),
expresa la probabilidad de que la hiptesis nula no se rechace cuando es cierta y
no debe rechazarse. El nivel de confianza de una prueba de hiptesis es (1- ) x
100.
127
n
Si la poblacin no tiene una distribucin normal, todava se puede utilizar la prueba
Z si el tamao de la muestra es lo bastante grande como para que tenga efecto el
teorema del lmite central. La ecuacin anterior define el estadstico de prueba Z
para determinar la diferencia que existe entre la media muestral y la media
poblacional cuando se conoce la desviacin estndar poblacional .
128
Ejemplo:
El resultado del pesado de las 25 cajas indica una media muestral de =372.5
gramos y que la desviacin estndar de la poblacin es de 15 gramos
129
Z= - = 372.5-368 = +1.50
15
n
25
En los ltimos cinco aos una empresa presenta un monto medio por factura de
120 pesos. Se utiliza la prueba de hiptesis para tratar de demostrar que el monto
medio por factura est aumentando o disminuyendo.
Paso 1. Definir hiptesis nula y de investigacin.
Ho: = 120
H1: 120
131
Determinacin del valor crtico para un rea de 0.025 en cada cola, con 11
grados de libertad, a partir de la tabla de valores crticos de t.
Puesto que la hiptesis de investigacin H1 de que 120 es no direccional, el
rea en la regin de rechazo de la cola izquierda (inferior) de la distribucin t es
0.025, y el rea en la regin de rechazo de la cola derecha (superior) de la
distribucin t es de 0.025.
A partir de la tabla t, los valores crticos son 2.201. La regla de decisin es:
Rechazar Ho si t -t11 = - 2.201
O si t -t11 = + 2.201
Paso 5. Los siguientes datos son las cantidades de la muestra de 12 facturas, con
la media y la desviacin estndar S:
Media
110.59
75.71
127.46
128.58
107.26
135.11
112.85
108.98
93.32
152.22
91.97
111.45
111.56
20.79
desviacin estndar
132
t= -
S
n
=112.85-120 =-1.19
20.80
12
133
Ejemplos
El precio que pagamos por frutas, verduras u otra mercanca depende del nmero
de kilogramos que compremos.
x = Kg de mercanca
y = P r ec i o e n $
10
X es la variable independiente.
Y = f (X)
"Y est regresando por X"
Yi = 0 + 1 Xi + ei
Donde:
Yi = variable dependiente (de respuesta)
0 = interseccin en Y para la poblacin
1= pendiente para la poblacin
Xi = variable independiente (explicatoria)
ei= error aleatorio en Y para la observacin i
ECUACIN DE REGRESIN LINEL SIMPLE
136
Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,
encontrar los valores de a y b con los datos observados de la muestra. El mtodo
de estimacin es el Mtodo de Mnimos Cuadrados, mediante el cual se obtiene:
Yi=bo + b1Xi
137
TIENDA
PIES 2
VENTAS ANUALES
1.7
3.7
1.6
3.9
2.8
6.7
5.6
9.5
1.3
3.4
2.2
5.6
1.3
3.7
1.1
2.7
3.2
5.5
10
1.5
2.9
11
5.2
10.7
12
4.6
7.6
13
5.8
11.8
14
4.1
138
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones
0.95088
0.90418
0.89619
0.96638
14.00000
Regresin
Residuos
Total
Grados de
libertad
Suma de
cuadrados
1.00000
12.00000
13.00000
105.74761
11.20668
116.95429
Valor crtico de
F
105.74761
0.93389
113.23351
0.00000
Intercepcin
Variable X 1
Coeficientes
Error
tpico
0.96447 (b0)
1.66986 (b1)
0.52619
0.15693
Estadstico
Probabilidad
t
1.83293
10.64112
0.09173
0.00000
Inferior
95%
Superior
95%
Inferior
95.0%
Superior
95.0%
-0.18200
1.32795
2.11095
2.01177
-0.18200
1.32795
2.11095
2.01177
139
En la tabla 3 se observan los coeficientes b0= 0.964 y b1= 1.669. Por lo tanto, la
lnea de prediccin para estos datos es: Yi= 0.964 + 1.669i
La pendiente b1 es+ 1.669. Esto significa que para cada incremento de 1 unidad
en X, se estima que el valor promedio de Y se incrementar por 1.669 unidades.
En otras palabras por cada incremento de 1.0 mil pies cuadrados en el tamao de
la tienda, se estima que la media de ventas anuales se incrementar por 1.669
millones. Por lo tanto la pendiente representa la porcin de las ventas anuales que
se estima que variar de acuerdo con el tamao de la tienda.
Y
VENTAS ANUALES
12
10
8
6
Pronstico para Y
2
0
0
140
GRFICOS DE CONTROL
Las grficas de control son una herramienta ampliamente utilizada para analizar el
proceso de recoleccin secuencial de datos, permiten monitorear la variacin de
una caracterstica de productos o servicios a lo largo del tiempo. Con ellas se
estudia el desempeo pasado, se evalan las condiciones presentes o predicen
las condiciones futuras. La informacin obtenida al analizar una grfica de control,
constituye la base para el proceso de mejoramiento. Con ellas se analizan
variables categricas, discretas y continuas. Las grficas de control hacen nfasis
en separar las causas de variacin especiales de las causas comunes de
variacin.
De esta forma la idea convencional de inspeccionar el producto final y eliminar las
unidades que no cumplen con las especificaciones una vez terminado el proceso,
es reemplazada por una estrategia ms econmica de prevencin antes y durante
del proceso, con el fin de lograr que precisamente estos productos o servicios
lleguen al consumidor sin defectos. Pues las variaciones de calidad producidas
antes y durante el proceso pueden ser detectadas y corregidas gracias al empleo
masivo de Grficas de Control.
Como se menciono, para el enfoque de las grficas de control existen dos tipos de
variacin. El primer tipo es una variabilidad aleatoria debido a "causas al azar" o
"causas comunes". Estas representan cambios que existen en un proceso, son
fluctuaciones que operan aleatoriamente o por casualidad.
El segundo tipo de variabilidad, en cambio, representan un cambio real en el
proceso atribuible a "causas especiales" o causas asignables de variacin, las
cuales, por lo menos tericamente, pueden ser identificadas y eliminadas.
Representan grandes fluctuaciones
proceso.
141
143
Panel A. No existe un patrn aparente de los valores a lo largo del tiempo y no hay
puntos que caigan fuera del lmite de control de 3 desviaciones estndar. El
proceso parece estable y contiene causas comunes de variacin.
Panel B. Contiene dos puntos que caen fuera de los lmites de control de las 3
desviaciones estndar. Se debe investigar estos puntos para tratar de determinar
las causas especiales que llevan a su ocurrencia.
Panel C. No tienen ningn punto fuera de los lmites de control, tiene una serie de
puntos consecutivos por arriba del valor promedio y una serie de puntos
consecutivos por debajo del valor promedio. Adems se observa claramente una
tendencia global descendente, se debe investigar para determinar que ha causado
este patrn.
Cuando una grfica de control exhibe un punto fuera de los lmites de control o
una tendencia (como en B y C) est fuera de control y es impredecible. Un
proceso fuera de control contiene tanto causas comunes de variacin como
causas especiales y estas ltimas no forman parte del diseo del proceso, si las
causas especiales de variacin actan en detrimento del producto o servicio, se
requiere elaborar planes para eliminar la causa; por el contrario si stas
incrementan la calidad del producto o servicio, se debe cambiar el proceso para
incorporarla dentro del diseo del proceso.
144
145
Tabla 1
Da
Habitaciones
estudiadas
Habitaciones no
preparadas
proporcin
=c2/b2
200
16
0.080
200
0.035
200
21
0.105
200
17
0.085
200
25
0.125
200
19
0.095
200
16
0.080
200
15
0.075
200
11
0.055
10
200
12
0.060
11
200
22
0.110
12
200
20
0.100
13
200
17
0.085
14
200
26
0.130
15
200
18
0.090
16
200
13
0.065
17
200
15
0.075
18
200
10
0.050
19
200
14
0.070
20
200
25
0.125
21
200
19
0.095
22
200
12
0.060
23
200
0.030
24
200
12
0.060
25
200
18
0.090
26
200
15
0.075
27
200
20
0.100
28
200
22
0.110
k=28
n=200
2.315
pi=2.315
146
Pi= 2.315
p=
n= 200
pi
i=1
k= 28
p=
i=1
pi
=2.315
=0.0827
28
200
LSC=
0.0827+0.0584= 0.1411
LIC=
0.0827-0.0584=0.0243
147
11 13 15 17 19 21 23 25 27
148
149
150
151
k
Donde: R= Ri
i=1
k
Problema:
Se defini operacionalmente la cantidad de tiempo para entregar el equipaje. Se
registraron datos durante un periodo de 4 semanas. Se seleccionaron subgrupo
(muestras) de cinco entregas del turno de la tarde de cada da (ver tabla 2).
Tabla 2. TIEMPOS DE ENTREGA DE EQUIPAJE EN MINUTOS
DIA
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
A
6.7
7.6
9.5
9.8
11
8.3
9.4
11.2
10
8.6
10.7
10.8
9.5
12.9
7.8
11.1
9.2
B
11.7
11.4
8.9
13.2
9.9
8.4
9.3
9.8
10.7
5.8
8.6
8.3
10.5
8.9
9
9.9
9.7
C
9.7
9
9.9
6.9
11.3
9.7
8.2
10.5
9
8.7
9.1
10.6
7
8.1
12.2
8.8
12.3
D
7.5
8.4
8.7
9.3
11.6
9.8
7.1
9
8.2
9.5
10.9
10.3
8.6
9
9.1
5.5
8.1
E
7.8
9.2
10.7
9.4
8.5
7.1
6.1
9.7
11
11.4
8.6
10
10.1
7.6
11.7
9.5
8.5
MEDIA
8.68
9.12
9.54
9.72
10.46
8.66
8.02
10.04
9.78
8.8
9.58
10
9.14
9.3
9.96
8.96
9.56
RANGO
5
3.8
2
6.3
3.1
2.7
3.3
2.2
2.8
5.6
2.3
2.5
3.5
5.3
4.4
5.6
4.2
152
18
19
20
21
22
23
24
25
26
27
28
9
9.9
10.7
9
10.7
10.2
10
9.6
8.2
7.1
11.1
8.1
10.1
9.8
10
9.8
10.5
11.1
8.8
7.9
11.1
6.6
10.2
8.9
10.2
9.6
9.4
9.5
9.5
11.4
8.4
10.8
12
9.7
9.6
8
10.6
7
12.2
8.8
12.2
9.5
11
11.5
8.4
7.1
10.2
9
8.9
9.1
9.9
9.3
9.2
10.2
9.7
Sumas:
9.08
9.12
9.78
9.64
9.16
10.3
9.86
10.26
8.64
10.04
10.18
265.38
2.1
3
2.7
1.6
3.7
3.1
2.3
3.4
1.6
4
5.4
97.5
k
R= Ri = 97.5 = 3.482
i=1
28
k
n= 5
R3R d3
d2
LCS= R+3R d3
d2
LCI= R-3R d3
d2
Constantes
d2= 2.362
d3= 0.864
153
La grfica
La grfica de control utiliza subgrupos cada uno de tamao n para k periodos
consecutivos de tiempo. Para calcular los lmites de control para el promedio, se
necesita calcular la media de los promedios de los subgrupos (denominada ), y la
desviacin estndar de la media (que se denomina error estndar de la media ).
El estimado de la desviacin estndar de la media es una funcin del factor d2 ,
154
=X3 R___
d2 n
Donde
k
X=
Xi
Ri
R=
i=1
i=1
= 265.38
i=1
k
X=
Xi = 265.38 = 9.478
i=1
28
R=
Ri = 97.5 = 3.482
i=1
28
155
Aplicando
=X3 R___
d2 n
= 9.478 3 3.482 =
2.3625
= 9.478 2.008
Por tanto:
LCS= 9.478 + 2.008 = 11.486
LCI= 9.478 - 2.008 = 7.470
Graficando
La grfica no revela ningn punto fuera de los lmites de control as como tampoco
una tendencia. Aunque existe una cantidad considerable de variabilidad entre las
medias de los 28 subgrupos, y como ambas grficas R y X barra estn bajo
control, el proceso de entrega de equipaje se encuentra en estado de control
estadstico. Si se desea reducir la variacin o la media del tiempo de entrega,
entonces se necesita cambiar el proceso.
156