You are on page 1of 7

Probabilidad y

variables
aleatorias

Metodología de
Análisis de Datos
Cuantitativos

1
Probabilidad conjunta, eventos
mutuamente excluyentes e
independientes
Definamos ahora algunos eventos de interés especial. En primer lugar,
denominamos eventos mutuamente excluyentes a los que no pueden
ocurrir de manera simultánea. Un ejemplo de ello podría ser, para un hogar,
ser pobre y no serlo al mismo tiempo. Entonces, para los eventos
mutuamente excluyentes, tenemos una propiedad importante:
Si A y B son dos eventos mutuamente excluyentes, P(A o B) = P(A) + P(B)
Si por el contrario, dos eventos pueden ocurrir al mismo tiempo, no son
necesariamente mutuamente excluyentes. En ese caso, si C y D tiene
posibilidad de ocurrir al mismo tiempo, P(C o D) = P (C) + P(D) – P (C y D).
Como puede verse, el caso de los eventos mutuamente excluyente es un
caso particular, donde P(C y D)= 0.
Una analogía interesante que permite razonar de manera muy simple con
probabilidades es considerar los eventos como conjuntos. Así, podemos usar
las operaciones, la notación y las gráficas propias de la teoría de conjuntos.

P (A o B) = P (A U B)

Probabilidad conjunta
Si queremos calcular la probabilidad de ocurrencia de dos eventos de
manera conjunta, debemos multiplicar sus probabilidades.

P (A y B) = P (A ∩ B) = P (A) . P(B)

Probabilidad condicional
La probabilidad de que ocurra cierto evento, teniendo en cuenta que ocurre
otro, se denomina probabilidad condicional y su fórmula de cálculo es la
siguiente:

Tabla de contingencia
Muchas veces tenemos descripto un problema a través de la situación
conjunta del grupo de individuos u objetos analizados, en relación con sus
características en dos dimensiones o variables. La forma tradicional de
presentarlos en este caso se denomina Tabla de contingencia, y corresponde

2
a una tabla de doble entrada, que ubica la cantidad de individuos que
corresponden a cada par de categorías (en las respectivas variables).

Figura 1: Hogares con y sin Necesidades Násicas Insatisfechas (NBI)

Fuente: INDEC. Censo Nacional de Población, Hogares y Viviendas 2001.

Por ejemplo, la Figura 1, presenta una Tabla de contingencia presenta la


totalidad de hogares registrados en el Censo de Población y vivienda 2001,
según provincia y posesión o no de Necesidades Básicas Insatisfechas.
Veamos cómo podemos usar la tabla de contingencia para calcular
probabilidades de eventos:

1) Probabilidad de un evento simple: ¿cuál es la probabilidad de que un


hogar en Argentina en 2001, presente al menos un indicador de NBI?
P(A) = (Hogares con NBI) / Total de hogares = 1.442.934 / 10.075.814 =
0,1432
2) Probabilidad de un evento compuesto: ¿cuál es la probabilidad de que
un no tenga NBI y resida en Santiago del Estero?
P(B ∩ C) = 131.517 / 10.075.814 = 0,013

3
3) Probabilidad de un evento compuesto: ¿cuál es la probabilidad de que
un hogar resida en Santa Fe o en Córdoba?
Ya que son dos eventos mutuamente excluyentes, tenemos:

4) Probabilidad de la ocurrencia de eventos no mutuamente excluyentes.


¿cuál esla probabilidad de que un hogar resida en Ciudad de Buenos
Aires o no posea NBI?

5) Probabilidad condicional: ¿cuál es la probabilidad de que un hogar tenga


NBI dado que reside en San Juan?

Variable aleatoria y funciones de probabilidad


Una variable aleatoria es el resultado (numérico) de un experimento
aleatorio. Por ejemplo, si nosotros realizamos el experimento de lanzar una
moneda, y observar el resultado, los dos eventos que se derivan de tal
experimento son:

 Evento A: que salga “Cara”.


 Evento B: que salga “Cruz”.

Si yo genero una asignación (cualquiera sea esta, arbitraria o con un criterio


establecido) que transforme un resultado de un experimento aleatorio en
números, estoy generando una variable aleatoria. Además, una variable
aleatoria tendrá una probabilidad asociada con la ocurrencia de cada valor
de ésta.

4
Tabla 1: Ejemplo de variable aleatoria

Evento X (variable P (X = X0)


aleatoria)
A = que salga “cara” 1 0,5
B = que salga “cruz” 2 0,5

En la Tabla 1 se presenta una asignación arbitraria de los valores de la


variable X a los resultados posibles del experimento. Podría ser (como en la
Tabla 3) una regla de asignación. Por ejemplo, analizamos la cantidad de
llamadas que ingresan en cierta central telefónica de ayuda. Registramos
como valores de la variable aleatoria la cantidad que ingresan en ciertos
períodos de tiempo, por ejemplo de 2 minutos.

Tabla 2: Número de llamadas que ingresan en un período de 2 minutos

Número de X (variable
llamadas que aleatoria)
ingresan
0 0
1 1
2 2
3 3
4 4
5 5
6 6

Los dos casos anteriores son ejemplos de variables aleatorias discretas, ya


que los valores representan un conjunto finito y enumerado de resultados
posibles. El segundo tipo de variables aleatorias corresponde a las
denominadas continuas. Este tipo de variables aleatorias puede presentar
cualquiera de infinitos valores posibles en cierto intervalo de números
reales. Por ejemplo, si tengo una variable aleatoria que registra el tiempo
transcurrido entre dos terremotos en cierta zona sísmica. Claramente esta
variable podría tomar cualquier mayor que 0 (es una variable que mide
tiempo, mientras más exacto se registre el dato, podrá verse que la cantidad
de valores posibles es infinita). En estos casos sólo tiene sentido calcular las

5
probabilidades de que ocurra algún valor de la variable aleatoria en
intervalos de valores, ya que la probabilidad de ocurrencia de un valor
puntual es nula. Veamos un ejemplo:
La altura de las personas tiene una distribución de probabilidades como la
que se ilustra en la Figura 2. Por ejemplo, si en determinada población
masculina, se tiene una media de 175 cm, con una desviación estándar de
10 cm, la probabilidad de que un individuo al azar de esa población mida
entre 165 y 185 cm (μ - 𝜎; μ + 𝜎) es aproximadamente el 0,68. Si
consideramos un intervalo de ±2s, entonces, la probabilidad aumenta al 0,95
aproximadamente, en tanto entre (μ - 3𝜎; μ + 3𝜎), prácticamente la
probabilidad es 1 (se estima en 0,9973). Esta distribución denominada
Normal o Gaussiana es la más utilizada en la resolución de problemas de
inferencia.

Figura 2: Distribución Normal

Fuente: Elaboración propia

La consideración conjunta de los valores posibles de una variable aleatoria y


sus respectivas probabilidades, se conoce como distribución de
probabilidad. En diversos problemas de inferencia se hará uso de este
concepto.

6
Referencias
Aaron y Aaron (2001). Capítulos 1 y 2.

Blalock, H. (1978). Introducción A La Investigación Social. Capítulos II, III, IV, V, VI y


IX.

You might also like