Professional Documents
Culture Documents
45
40
"menor que"
35
30
25
20
"mayor que"
15
10
5
ESTADSTICA I
Gua terico prctica
1.250.000
1.150.000
1.050.000
950.000
850.000
750.000
650.000
550.000
NDICE
Introduccin
1. Estadstica. Definicin y aplicaciones
2. Conceptos y notacin
3. Los datos: materia prima de la estadstica
3.1 Tipos de datos
3.2 Algunos aspectos del manejo de los datos
4. Distribuciones de frecuencias
4.1 Construccin de una distribucin de frecuencias
4.2 Frecuencias relativas y acumulativas
4.3 Grficos de frecuencias
5. Medidas de tendencia central
5.1 La Moda
5.2 La Mediana
5.3 La Media Aritmtica: Clculo de la media de una distribucin de frecuencias. Posicin
relativa de la media, mediana y moda en una distribucin.
5.4 La Media Geomtrica
5.5 La Media Armnica
5.6 Cuartiles, Deciles y Percentiles
6. Medidas de dispersin
6.1 La desviacin media
6.2 La desviacin estndar y la varianza. Clculo de la varianza para datos no agrupados.
Clculo de la varianza y la desviacin estndar para datos agrupados.
7. Probabilidades
7.1 Probabilidad. Conceptos y definiciones: Variable aleatoria. Sucesos aleatorios. Sucesos
elementales. Probabilidad. Concepto clsico de probabilidad. Concepto de probabilidad
en base a frecuencias relativas. Concepto subjetivo de probabilidad. Naturaleza de la
probabilidad. Espacio muestral. Sucesos mutuamente excluyentes. Sucesos
independientes. Sucesos dependientes y probabilidad condicionada. Teorema de Bayes.
8. Distribucin de variables aleatorias
8.1 Conceptos bsicos
8.2 Esperanza matemtica de una variable discreta
8.3 Varianza de una variable aleatoria discreta
8.4 Distribuciones de variables aleatorias discretas: Distribucin hipergeomtrica,
Distribucin binomial, Distribucin de Poisson.
8.5 Variables aleatorias continuas
8.5 Distribuciones de variables aleatorias continuas: Distribucin normal y normal standard
Bibliografa
Pg.
3
4
5
6
6
7
8
8
9
10
12
13
13
15
16
17
17
19
19
19
21
21
26
26
26
27
27
30
30
33
Introduccin
El propsito de esta gua didctica es presentar a los estudiantes de administracin y
economa una exposicin concisa y ordenada de los aspectos ms importantes de la
estadstica elemental, buscando compatibilizar el tratamiento matemtico de los tpicos
tratados con el conocimiento bsico de matemtica de los primeros aos de estudios
universitarios, sin que ello significara prdida de rigurosidad dentro del proceso de
aprendizaje.
La gua fue diseada ajustndose en lo posible al contenido programtico del curso de
Estadstica I que se imparte en las carreras de Administracin y Economa. En ella se
consideran aspectos tales como la naturaleza general de la Estadstica y sus propsitos, en
relacin con problemas y situaciones que usualmente se habrn de enfrentar durante el
ejercicio profesional de estas y otras disciplinas.
El material didctico abarca los conceptos bsicos de la estadstica, usos y notacin; la
naturaleza, tipologa y manejo de datos estadsticos; las herramientas bsicas de la
estadstica descriptiva, para luego concluir con el tema de las probabilidades y las
diferentes formas de distribucin de las variables aleatorias, como base de la estadstica
inductiva.
A ttulo de complemento, se presenta aparte una serie de lminas en formato electrnico
donde se recogen los aspectos ms significativos del curso, con vnculos automticos a un
grupo de problemas resueltos mediante el uso de la hoja de clculo de Microsoft Excel,
adems de un extracto de ejercicios seleccionados, mediante los cuales se aspira contribuir
a una mayor comprensin y reafirmacin de los temas tratados.
ESTADSTICA I
1. Estadstica. Definicin y aplicaciones.
La estadstica es una disciplina cientfica que forma parte de las matemticas aplicadas y
rene en s un conjunto de mtodos y herramientas que encuentran utilizacin prctica en
una variada gama de campos, incluyendo, entre otras, las ciencias sociales, fsicas,
biolgicas y de la salud, demostrndose de particular utilidad como medio de apoyo en los
procesos de investigacin y de toma de decisiones.
La estadstica es la ciencia de la induccin lgica, vale a decir que permite extraer
conclusiones de carcter general a partir de un reducido nmero de observaciones; en otras
palabras, la induccin permite formular generalizaciones acerca de la naturaleza o
caracterstica de una determinada clase de objetos, sobre la base de observaciones
realizadas sobre una cantidad limitada de tales objetos. La deduccin, al contrario de la
induccin, conduce a establecer, sobre la base de premisas generales acerca de las
propiedades de una clase de objetos, si todos los objetos considerados poseen tales
caractersticas. Es posible entonces decir que la deduccin es un razonamiento a priori,
mientras de la induccin es un razonamiento en base a la evidencia emprica.
Para un investigador, la estadstica proporciona los medios por los cuales se hace posible
utilizar una cantidad limitada o incompleta de informacin, para formular conclusiones
acerca de causas y efectos de algn fenmeno estudiado, para comprobar teoras o
determinar las relaciones existentes entre datos iniciales y resultados finales. De tal forma
que es posible, por ejemplo, decidir cul entre varias formulaciones qumicas de un
fertilizante agrcola es la ms conveniente para obtener las cosechas ms abundantes de un
determinado rubro.
En el rea de las ciencias sociales, las tcnicas estadsticas pueden ser usadas para predecir
el resultado de unas elecciones o la probabilidad de xito o fracaso de un cierto negocio.
Como ejemplo, en asuntos de tipo econmico, es factible usar la estadstica para elegir,
entre varias alternativas de posibles funciones tericas de consumo, aquella que mejor
explica el comportamiento de los datos reales observados.
En el campo mdico, los mtodos estadsticos son aplicables al resultado de pruebas
experimentales realizadas con un nuevo frmaco, con la finalidad de evaluar su efectividad
en el tratamiento de algn tipo de enfermedad o, en otro caso, si realmente existe una
relacin causal directa o indirecta entre el consumo de cigarrillos y el cncer pulmonar.
Aun cuando se hayan mencionado solamente algunos pocos ejemplos de la gran variedad
de situaciones en las cuales es factible utilizar los mtodos estadsticos para encontrar
soluciones a problemas de diversa naturaleza, concluyendo se puede afirmar que la teora y
las herramientas estadsticas pueden contribuir efectivamente, con un alto grado de
confianza en la validez de los resultados, a resolver el dilema de tener que tomar un curso
de accin, en escenarios donde solamente se dispone de un conocimiento parcial o limitado
de los elementos para decidir.
2. Conceptos y notacin
Se denomina poblacin o universo a la totalidad de un grupo de objetos de inters para el
estudio estadstico, mientras que por muestra se entiende una parte relativamente pequea
de la poblacin, seleccionada con el propsito de extraer conclusiones acerca de algunas
caractersticas o parmetros propios del universo.
El tratamiento estadstico considera dos categoras principales de datos: variables y
constantes. Las variables se denotan usualmente por medio de las ltimas letras del
alfabeto, tales como x, y, o z. Dentro de esta categora se incluyen tambin los
estadsticos y los parmetros. Un estadstico es una caracterstica medida u observada en
una muestra y usualmente se denota mediante una letra especfica. Por ejemplo, la media
aritmtica de una muestra se denota mediante la letra equis mayscula con un guin
superpuesto X . La caracterstica o parmetro correspondiente a la poblacin o universo al
cual pertenece la muestra seleccionada se denota mediante (la letra griega mu minscula).
Generalmente los estadsticos de una muestra se denotan mediante letras del alfabeto latino,
mientras los parmetros de la poblacin correspondiente se denotan mediante letras griegas.
En relacin a las constantes, existen dos tipos: ordinarias y naturales. Las constantes
ordinarias se denotan mediante las primeras letras minsculas del alfabeto, es decir a, b, o
c. Tambin en este caso, es necesario distinguir entre constantes basadas en la observacin
de una muestra y los parmetros de la poblacin correspondiente. Supngse por ejemplo la
siguiente relacin entre dos variables X y Y observada en una muestra: Y = a + bX. La
ecuacin correspondiente a la poblacin o universo sera: Y = + X. En el ejemplo, a y b
son estadsticos de la muestra mientras que y son los parmetros de la respectiva
poblacin.
Por constantes naturales se entienden ciertas constantes especficas utilizadas
frecuentemente en todas las ramas de las matemticas, siendo el nmero irracional e =
2,71828..... y = 3,14159... dos de las constantes naturales ms frecuentemente utilizadas.
En los procesos de cmputo se utilizan los llamados operadores es decir un smbolo para
indicar que una determinada operacin debe ser ejecutada. Los dos operadores utilizados
con mayor frecuencia son los de sumatoria y productoria. El primero se denota por medio
de (la letra griega sigma mayscula) y se interpreta como las suma de una serie de
nmeros. El segundo se denota mediante (la letra griega pi mayscula) y se interpreta
como el producto de una serie de trminos dados. A ttulo de ejemplo, si se escribe:
n
i =1
i =1
Similarmente, si se escribe:
n
i =1
i =1
4. Distribuciones de frecuencias
Una vez recolectados los datos, estos se presentan usualmente como una abundante masa de
cifras que, a primera vista, parecen carecer de significado. Es por ello que antes someter los
datos a un proceso de anlisis, estos deben ser recompuestos o arreglados de manera
ordenada o compendiados de forma tal que adquieran una cierta coherencia y sea posible
obtener una visin global acerca de su distribucin. Precisamente, las distribuciones de
frecuencias son las herramientas que hacen posible cumplir con tales propsitos.
Supngase, a ttulo de ejemplo, que la nmina mensual los trabajadores de una cierta
fbrica se presenta como muestra el Cuadro N 1
Cuadro N 1 - Salario mensual (en Bs.)
952.500
834.800
999.900
899.000
1.010.100
913.700
895.900
807.300
936.500
1.003.300
994.800
753.600
634.900
1.303.500
693.300
984.700
989.900
751.000
839.200
654.000
1.253.300
1.100.000
938.000
600.500
672.000
632.500
800.000
767.000
854.300
1.114.500
714.800
913.200
781.000
651.000
933.500
889.900
998.800
643.200
1.253.300
1.291.000
667.700
823.700
786.000
676.700
803.200
687.500
600.100
1.126.400
856.000
799.000
Tal como se presentan los datos, resultara difcil aseverar algo acerca de la forma en que se
distribuyen los salarios, ms aun si se tratara de una empresa que empleara varios cientos o
miles de trabajadores. Si se construyera una tabla donde se establecieran intervalos de
salarios y la cantidad de trabajadores cuya paga est comprendida en cada uno de los
intervalos definidos, se tendra entonces una panormica ms comprensible de la manera en
la cual se distribuyen los salarios en la nmina mensual de la empresa. Este tipo de arreglo
se denomina tabla de frecuencias o distribucin de frecuencias.
4.1 Construccin de una distribucin de frecuencias
Utilizando los datos del ejemplo anterior, se proceder a construir una tabla de frecuencias
que ilustre la distribucin de los datos. El primer paso consiste en determinar los intervalos
de clase apropiados, estableciendo sus lmites y fronteras (los lmites de las clases son
lmites nominales e indican los valores de las frecuencias contenidas en cada clase despus
del redondeo; las fronteras de las clases indican los valores reales de la frecuencias
contenidas en el intervalo antes del redondeo). Es de notar que a pesar de ser en cierta
medida arbitraria, la definicin de los intervalos de clase debe cumplir con ciertas reglas o
lineamientos generales, como se describe a continuacin:
a) No debe haber solapamiento entre intervalos consecutivos.
b) Los intervalos definidos deben contener en ellos la totalidad de los valores o datos
observados.
c) Los intervalos deben tener todos la misma amplitud y es deseable, para facilitar la
lectura e interpretacin, que sean en mltiplos de cinco.
d) No se debe incluir intervalos de clase semiabiertos (ej.: menores que XX o YY y
ms).
e) La cantidad de intervalos de clase no debe ser excesiva, pero tampoco
exageradamente limitada. Se recomienda entre cinco y quince intervalos, si bien el
nmero exacto depender de la cantidad de datos y la diferencia entre los valores
mximo y mnimo de la distribucin; cuanto mayores son ambos factores, ms
intervalos de clase deben existir.
Para construir la tabla de frecuencias (Cuadro N 2) se definen los intervalos de clases y se
realiza manualmente el conteo del nmero de empleados cuyo salario est comprendido
entre los valores establecidos para cada intervalo.
Lmites de clase
Bs.
Frecuencias
5
8
12
10
8
3
0
4
550.000
650.000
750.000
850.000
950.000
1.050.000
1.150.000
1.250.000
Total
5
8
12
10
8
3
0
4
50
550.000
650.000
750.000
850.000
950.000
1.050.000
1.150.000
1.250.000
Total
5
8
12
10
8
3
0
4
10
16
24
20
16
6
0
8
50
100
De igual manera, resulta til, a los fines del anlisis de los datos, contar con las frecuencias
expresadas en forma acumulativa. En otras palabras, se podra determinar la cantidad o
porcentaje de datos que son menores, iguales o superior a un determinado lmite
(superior o inferior) de las frecuencias de clase consideradas. El cuadro N 4 contiene los
valores acumulados menores que y superiores a las clases de frecuencia de la
distribucin, tanto en trminos absolutos como relativos. Se puede observar rpidamente
que la mitad de las frecuencias corresponden a valores por debajo de Bs. 850.000 y que el
30% de las frecuencias corresponden a valores de al menos Bs. 950.000.
Cuadro N 4- Distribucin de frecuencias acumuladas menores que o superiores a
Menores que
Superiores a
Salarios mensuales
Absoluto Relativo %
Absoluto Relativo %
Bs.
550.000
650.000
750.000
850.000
950.000
1.050.000
1.150.000
1.250.000
5
13
25
35
43
46
46
50
10
26
50
70
86
92
92
100
50
45
37
25
15
7
4
4
100
90
74
50
30
14
8
8
10
12
12
10
10
8
5
4
2
1.050.000
950.000
850.000
750.000
650.000
550.000
1.250.000
1.150.000
Cantidad de trabajadores
14
Salarios mensuales
11
1.250.000
1.150.000
15
1.050.000
35
950.000
850.000
750.000
650.000
550.000
Cantidad de trabajadores
1.399.950
1.299.950
1.199.950
1.099.950
999.950
899.950
799.950
699.950
599.950
499.950
Cantidad de trabajadores
14
12
10
Salarios m ensuales
50
45
40
30
"menor que"
25
20
"mayor que"
10
Salarios m ensuales
12
13
md =
a n/2 + a (n/2)+1
2
Es decir que, en este caso, la mediana se define como el promedio de las dos frecuencias
centrales de la distribucin.
Si los datos se encuentran agrupados en frecuencias de clase, ser posible calcular un valor
estimado de la mediana, siempre y cuando las frecuencias dentro de la clase que contiene
la mediana estn distribuidas uniformemente. En tal caso, la expresin a utilizar es la
siguiente:
L
n/2 -
f
md = L + c
fm
donde:
L = lmite inferior de la clase que contiene la mediana
c = amplitud de la clase que contiene la mediana y
L
105
105
183
288
224
512
148
660
75
735
740
Total
740
224
= 2250 + 316,96
= Bs. 2.566,96
14
xi
xi
x = i =1
n
= i =1
N
Para cada distribucin, la media constituye un valor nico, pero a diferencia de la moda y la
mediana, resulta sensiblemente afectada cuando en la distribucin existen valores
extremadamente grandes o extremadamente pequeos.
Clculo de la media de una distribucin de frecuencias
Considerando que en una distribucin de frecuencias los elementos individuales pierden su
identidad, el clculo de la media ser posible solamente si se conoce la media de los
elementos pertenecientes a cada clase. Se podr entonces calcular una media ponderada de
cada clase mediante la expresin siguiente:
N
mifi
= i =1
mifi
x = i =1
15
xi
i =1
log x i
log m g = i =1
16
n
n
(1 / x i )
i =1
lo cual equivale a decir que la media armnica es el recproco de la media aritmtica de los
recprocos de los valores observados.
Sin embargo, es oportuno resaltar que la media armnica es usada raras veces ya que todos
los problemas a los cuales se aplica, pueden ser igualmente resueltos mediante el clculo de
un promedio aritmtico ponderado.
5.6 Cuartiles, Deciles y Percentiles
Un conjunto de datos observados puede ser dividido en grupos de manera tal que cada uno
de ellos contenga valores menores que la medida calculada para el correspondiente cuartil,
decil o percentil. En el caso de los cuartiles, el primer cuartil es aquel valor por debajo del
cual se encuentra el 25 por ciento de las frecuencias observadas. El segundo cuartil (que
corresponde a la mediana de la distribucin) es el valor por debajo del cual se coloca 50 por
ciento de los valores de frecuencia. El tercero y ltimo cuartil es el valor por debajo del
cual se ubica el 75 por ciento de las frecuencias observadas.
Las frmulas para el clculo de los cuartiles son las siguientes:
Cuando n es par
Q1 = a (n +1 / 4) ; Q2 = a (n +1 / 2) ; Q3 = a3( n +1) /
Cuando n es impar
Q1 = [a (n / 4) + a(n / 4 + 1)] / 2 ; Q2 = [a (n / 2) + a(n / 2 + 1)] / 2 ; Q3 = [a3n / 4 + a(3n / 4 + 1)] / 2 ;
Los deciles son nueve y el primero es el valor por debajo del cual se coloca el 10 por ciento
de las frecuencias de la distribucin. Por debajo del segundo decil se ubica el 20% de las
frecuencias, y as sucesivamente hasta el noveno decil, por debajo del cual se encuentra el
17
90 por ciento de las frecuencias observadas. Para calcular los deciles, se emplea la frmula
siguiente:
in L
f
10
Di = Li + c
fi
100
Pi = L i + c
fi
18
6. Medidas de dispersin
A pesar de que las medidas de tendencia central o de posicin resultan sumamente valiosas
por cuanto representan valores tpicos o representativos de una distribucin, su utilidad
resulta algo restringida si no se acompaan de informacin adicional acerca de la naturaleza
de la distribucin misma. Cualquiera que sea la poblacin considerada, siempre existir
alguna variacin en las caractersticas de los elementos que la integran. Por lo tanto, no es
suficiente determinar alguna de las medidas de posicin, sino que se debe establecer as
mismo la magnitud de la variacin respecto a esa medida de tendencia central.
6.1 La desviacin media.
Desde el punto de vista matemtico, la desviacin media representa el promedio de las
diferencias en valor absoluto entre los datos observados y su media aritmtica, calculada
mediante la siguiente ecuacin:
N
xi
DM = i =1
|xi |
xi
24
20
18
18
15
12
12
10
9
8
= 146/10 = 14,6
9.4
5.4
3.4
3.4
0.4
2.6
2.6
4.6
5.6
6.6
DM = 44/10 = 4,4
Es decir, que la diferencia promedio entre los valores individuales de X y su media es igual
a 4,4.
6.2 La desviacin estndar y la varianza
Si en lugar del promedio de las diferencias en valor absoluto entre los valores de X y su
media aritmtica, se calcula el promedio de los cuadrados de dichas diferencias, se obtiene
la varianza de una poblacin, que se denota mediante el smbolo 2 cuyo valor se obtiene
mediante la ecuacin:
N
xi
2 = i =1
N
19
xi
i =1
xi x
s 2 = i =1
n -1
s =
xi x
i =1
n -1
Las formulas anteriores difieren de las expresiones usadas para una poblacin por emplear
la media de la muestra para calcular los desvos y la cantidad de datos menos 1 en el
denominador. Cabe sealar que si las muestras son suficientemente grandes, es decir de 100
o ms datos, es prcticamente indiferente usar n o n-1. De hecho, a medida que crece el
nmero de datos, la desviacin estndar s de la muestra, se aproxima cada vez ms a la
desviacin estndar de la poblacin de la cual se extrajo.
Clculo de la varianza y la desviacin estndar para datos no agrupados.
El proceso de clculo, se presenta continuacin:
Cuadro N 7
xi
(xi )
(xi )2
7.88
8.56
8.43
6.67
8.23
6.98
7.55
7.90
8.22
9.12
=79.54/10=7.954
-0.074
0.606
0.476
-1.284
0.276
-0.974
-0.404
-0.054
0.233
1.166
-
0.005476
0.367236
0.226576
1.648656
0.076176
0.948676
0.163216
0.002916
0.070756
1.359556
2 = 4.86924 /10
20
Por consiguiente, la varianza es igual a 0,49 y la desviacin estndar a 0,70. Si los datos se
refirieran al peso de un grupo de nios de dos aos de edad, significara que el peso
promedio del grupo es de 7,954 kilogramos y que los valores individuales difieren de la
media en 0,7 kilogramos.
Clculo de la varianza y la desviacin estndar para datos agrupados.
Si los datos se presentan en forma de distribuciones de frecuencias, se utilizan la siguientes
expresiones para el clculo de la varianza, respectivamente para una poblacin y una
muestra:
N
k
k
n m i2 f i m i2 f i
i =1
s 2 = i =1
n (n - 1)
mi fi
2 = i =1
Retomando los datos del ejemplo de retribuciones por hora contenidas en el cuadro N 5, el
proceso de clculo para una poblacin se realiza como sigue:
Salario en Bs./hora
1.250 y menor que 1.750
1.750 y menor que 2.250
2.250 y menor que 2.750
2.750 y menor que 3.250
3.250 y menor que 3.750
3.750 y menor que 4.250
Totales
Punto medio
mi
1.500
2.000
2.500
3.000
3.500
4.000
N de
obreros fi
105
183
224
148
75
5
740
m i . fi
157.500
366.000
560.000
444.000
262.500
20.000
1.810.000
m i . fi
23.625 E4
73.200 E4
140.000 E4
133.200 E4
91.875 E4
8.000 E4
469.900 E4
Sucesos elementales: se dice que un evento o suceso es elemental cuando no puede ser
expresado en trminos de otros eventos ms sencillos
Probabilidad: desde un punto de vista prctico, se puede asumir que la probabilidad es una
medida de la verosimilitud o expectativa de ocurrencia de un determinado suceso aleatorio,
cuya representacin matemtica es un nmero real comprendido entre cero y uno. Si el
suceso es totalmente imposible, se le asigna probabilidad cero y si el suceso es
absolutamente cierto que ocurra, se le asigna probabilidad uno. En el resto de los casos, la
probabilidad de ocurrencia del suceso estar comprendida entre estos dos lmites, y mayor
ser la certeza de que el suceso se produzca cuanto ms cercano se encuentre su valor de
probabilidad al nmero uno.
Concepto clsico de probabilidad: si un experimento aleatorio puede tener n posibles
resultados (eventos elementales) que tienen todos la misma probabilidad de ocurrir, y r de
ellos poseen una caracterstica predefinida, entonces, de acuerdo al concepto clsico, se
define la probabilidad de ocurrencia del suceso (S) como el cociente de r (casos favorables)
entre n (casos posibles) es decir:
P(S) = r / n
La aplicacin del concepto clsico de probabilidad requiere del conocimiento previo de
nmero total de posibles resultados y de los resultados favorables, as como asumir que
todos los resultados son igualmente probables.
Por ejemplo, considrese un lote de produccin 5000 calculadoras electrnicas de bolsillo.
Si se conoce que 25 unidades del lote presenta defectos de fabricacin, determnese la
probabilidad, al escoger una al azar, que sea una calculadora defectuosa.
P(S) = 25/5000 = 1/200 = 0,005
Este enfoque resulta difcilmente aplicable a situaciones reales en el campo econmicofinanciero, puesto que no es posible conocer anticipadamente la totalidad de los posibles
resultados de un determinado negocio y cules de ellos son favorables, como tampoco es
razonable pensar que todos los posibles resultados sean igualmente probables.
Concepto de probabilidad en base a frecuencias relativas: Cuando los experimentos
aleatorios son en teora indefinidamente repetibles, en la prctica se pueden repetir gran
cantidad de veces, y los resultados se aproximan en buena medida a los que se obtendran
repitiendo el experimento indefinidamente. Bajo estas condiciones, y considerando N
repeticiones, en las que un suceso A haya ocurrido NA veces (frecuencia de A) como
producto de la repeticin de uno cualquiera de los sucesos elementales que pertenecen a A,
entonces es experimentalmente observable que a medida que N aumenta, el cociente NA /
N, denominado frecuencia relativa del suceso A, tiende a aproximarse a un cierto valor,
considerado como el lmite al cual tiende la frecuencia relativa cuando N es
suficientemente grande, lo que permite utilizar el concepto de frecuencia relativa como
aproximacin numrica al concepto de probabilidad.
22
Distribucin de la demanda
0
1
2
3
4
5 ms de 5
260 150 90 70 24 10
6
23
P Ak / B =
) ( )
P(B / A ) P(A )
P B / Ak P Ak
J =1
Para ilustrar la aplicacin del teorema de Bayes, supngase que en un proceso de acabado
de rodamientos para cojinetes, la mquina utilizada para este propsito tiene cuatro
dispositivos de ajuste que deben ser calibrados correctamente. Si el reglaje de alguno de
ellos queda fuera de la norma, se producir en los rodamientos un cierto tipo de defecto
(suceso B). Supngase adems que las posibles causas del defecto son A1, A2, A3 y A4
cuyas probabilidades de ocurrencia son respectivamente 0,01; 0,03; 0,02 y 0,02, y que las
probabilidades de ocurrencia de B al ocurrir A1, A2, A3 y A4 son respectivamente 0,45;
0,30, 0,25 y 0,50. Luego, las probabilidades de Ak dado que B ha ocurrido son como se
indica en la tabla siguiente:
Sucesos Ak
P(Ak)
P(B/Ak)
P(Ak) . P(B/Ak)
P(Ak/B)
A1
A2
A3
A4
0,01
0,03
0,02
0,02
0,45
0,30
0,25
0,50
0,0045
0,0090
0,0050
0.0100
0.0285
0,16
0,32
0,17
0,35
1,00
De los resultados obtenidos se concluye que la causa ms probable del defecto (suceso B)
est en el ajuste A4 y que la segunda causa ms probables es el ajuste A2, lo que permitir
tomar decisiones y actuar de consecuencia respecto a los puntos de regulacin.
Aun cuando en la vida real es improbable que se conozcan con precisin las probabilidades
de los sucesos causales y los sucesos condicionados, especialmente en problemas ligados a
procesos administrativos o de tipo econmico-financiero, ser siempre posible asignarlas
sobre la base de experiencias pasadas, de acuerdo con el concepto subjetivo de probabilidad
referido en prrafos anteriores, teniendo presente que gran parte de la teora de decisiones
sobre bases estadsticas se fundamenta en estas nociones bsicas.
25
Por cada valor de x existe su correspondiente f(x) que equivale a la probabilidad que la
variable X asuma ese valor en particular. La expresin f(x) se denomina funcin de
densidad de probabilidades, o simplemente funcin de densidad de X. Es de notar que las x
son mutuamente excluyentes, de manera que la sumatoria de sus probabilidades es igual a
la unidad.
De igual manera, para las variables aleatorias existe una funcin de distribucin F(a) que se
define como
a
F(a ) = f ( x ) = P(X a )
min X
f(x)
x.f(x)
0
1
2
3
4
5
0,3679
0,3679
0,1839
0,0613
0,0153
0,0037
0,0000
0,3679
0,3678
0,1839
0,0612
0,0185
_________________________________
E(X) = (x . f(x))
donde
= x 2 f (x) 2
27
A N - a
x n - x
f(x) =
N
n
donde A = N . P; la funcin de distribucin se obtiene mediante:
A N - a
x n-x
f(x) =
N
x =0
n
c
E ( x ) = E ( n p) = n .
A
N
N - n p. q
.
n
n
Distribucin Binomial
En este caso se considera una variable discreta xi cuyo campo de variacin es xi: 1, 2, 3, . . .
c y se desea calcular la probabilidad de x xitos en n intentos. Si se define como P la
proporcin de elementos con una caracterstica 1 en una poblacin N, se tiene:
P=
A
, siendo A la suma de los elementos que presentan una caracterstica que se ha
N
28
F(x) = n P x Q n x
x
x =0
la Esperanza Matemtica de esta distribucin es:
E (x) = n P
y su varianza
2 = n . P . Q
Distribucin de Poisson
La distribucin de Poisson es aquella en la cual la variable discreta X puede tomar valores
enteros positivos entre 0 y + cuando X corresponde al nmero de ocurrencias de un
suceso por unidad de tiempo o espacio, cuya funcin de densidad viene dada por la
expresin:
f ( x ) = e .
x!
f ( x ) = e .
x =0
x!
2 =
29
= p( x )
x!
min X
f ( x ) dx
max x
min X
x f ( x )dx
30
1
2
1 x
1
2
xi -
F(X) = f ( x ) dx donde z =
f (x) =
1
z2
2
F( x ) = f ( x ) dx
-
Es conveniente recordar que las distribuciones discretas a las cuales se hizo mencin
anteriormente, tienen aproximaciones a la distribucin normal. Por ejemplo, la distribucin
31
binomial se podr aproximar a una distribucin normal para valores de p cercanos a 0,5,
teniendo por media = n.p y por varianza 2 = n . p . q
A partir de estos elementos, es posible hacer una transformacin a los valores de Z
mediante la expresin siguiente:
Z=
X - np
npq
As, la probabilidad de que X sea igual a un valor a, cuya distribucin binomial se expresa
n
mediante b(a ) = p a q n a es aproximadamente igual a la distribucin normal definida
a
b
por: f ( x ) =
a
1
2
1
z2
2
32
BIBLIOGRAFA
-
Meyer, Stuart L. Data Analysis for Scientists and Engineers. John Wiley and
Sons.USA.1975.
Si se desea profundizar algunos de los temas tratados en esta gua, se recomienda consultar
las siguientes publicaciones:
33