You are on page 1of 37

ESTADÍSTICA BÁSICA PARA SECUNDARIA

Amaury Camargo Benítez

Prólogo
Justificación

Índice

1. ESTADÍSTICA DESCRIPTIVA 1
1.1. Distribuciones de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Tipos de variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2.1. Variable cualitativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2. Variable cuantitativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.3. Variable discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.4. Análisis de distribuciones unidimensionales . . . . . . . . . . . . . . . . 4
1.3. Reglas generales para distribuciones de frecuencia . . . . . . . . . . . . . . . . 5
1.4. Gráficos estadísticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.1. Histogramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.2. Diagrama circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.3. Diagramas de árbol . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4.4. Polígono . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2. MEDIDAS DE TENDENCIA CENTRAL 15


2.1. Media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.1. Media aritmética simple . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2. Media aritmética ponderada . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.1. Mediana para datos no agrupados . . . . . . . . . . . . . . . . . . . . . 19
2.2.2. Mediana para datos agrupados . . . . . . . . . . . . . . . . . . . . . . . 21

i
ÍNDICE ÍNDICE

2.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.1. Moda para datos sin agrupar u originales . . . . . . . . . . . . . . . . . 23
2.3.2. Moda para datos agrupados . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3.3. Otras medidas de tendencia central. . . . . . . . . . . . . . . . . . . . 24
2.3.4. Cuartiles, deciles y percentiles. . . . . . . . . . . . . . . . . . . . . . . . 24
2.4. Medidas de dispersión o de variabilidad . . . . . . . . . . . . . . . . . . . . . . 26
2.4.1. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4.3. Desviación típica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.4.4. Coeficiente de variación de Pearson: (CV ) . . . . . . . . . . . . . . . . 28

3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS 29


3.1. Análisis Combinatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.1.1. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.1.2. Arreglos (variaciones) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.1.3. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.2.1. Experimentos y espacios muestrales . . . . . . . . . . . . . . . . . . . . 33

Referencias 35

profeajcb@gmail.com ii Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

1. ESTADÍSTICA DESCRIPTIVA
Introducción

La estadística a diferencia de la matemática no genera resultados exactos, los resultados siempre


tienen asociado un grado de incertidumbre o error. La estadística trata de lograr una apro-
ximación de la realidad, la cual es siempre mucho más compleja y rica que el modelo que
podemos abstraer. Si bien esta ciencia es ideal para describir procesos cuantitativos, tiene serios
problemas para explicar “el porqué” cualitativo de las cosas.

? Una definición que describe la estadística de manera utilitaria es la que dice que es:
“un conjunto de técnicas para describir grupos de datos y para tomar decisiones en
ausencia de una información completa”.

En este orden de ideas, veremos por ejemplo, que en una colección de datos en los que nos
interesen las características de un grupo de individuos u objetos, es a menudo imposible o poco
práctico observar la totalidad de los individuos, sobre todo si éstos son muchos. En lugar de
examinar al grupo entero llamado población o universo, se examina una pequeña parte del
grupo llamada muestra. Así, podemos tener la colección de datos tales como las alturas y pesos
de los estudiantes de un colegio en un año escolar o el número de cerrojos defectuosos y no
defectuosos producidos por una fábrica en una producción determinada.
Una población puede ser finita o infinita. Por ejemplo, la población, consistente de alturas y
pesos de alumnos de un colegio en un año escolar es finita, mientras que la población formada
por todos los posibles sucesos (caras o sellos) en tiradas sucesivas de una moneda es infinita. Si
una muestra es representativa de una población, se pueden deducir importantes conclusiones
acerca de ésta, a partir del análisis de la misma.
La estadística, está dividida en dos grandes ramas:

? La parte de la estadística que trata de las condiciones bajo las cuales tales inferencias son
válidas se llama estadística inductiva o estadística inferencial.

Al no poder estar absolutamente seguros de la veracidad de tales inferencias, se ha de utilizar


con frecuencia en estas conclusiones el término de probabilidad.

? La parte de la estadística que trata solamente de describir y analizar un grupo dado sin
sacar conclusiones o inferencias de un grupo mayor se llama estadística descriptiva o
estadística deductiva. Esta parte de la estadística es en gran medida el estudio de este
trabajo.

profeajcb@gmail.com 1 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

1.1. Distribuciones de frecuencias


La distribución de frecuencias, es un método para organizar y resumir información. Bajo este
método, los datos recolectados se ordenan y clasifican, indicándonos la frecuencia o sea el
número de veces que se repiten.
Se podrá decir también, que nos permite manejar grandes cantidades de información en espacios
reducidos, en formas de cuadros o tablas, complementadas con gráficas.
Por población o universo, se entiende como un conjunto de medidas para ser aplicadas a
una característica cuantitativa, o como el recuento de todas las unidades que presentan una
característica común, siendo ´esta cualitativa. También se puede definir a la población como
un conjunto de elementos o unidades. Lo que se estudia en una unidad o elemento son sus
características.
Cuando se toman todas la unidades o elementos de la población, se habla de una investigación
exhaustiva o censo. Si sólo se investiga una parte, se le considera como investigación parcial o
muestra.
La muestra, para que sea representativa de la población, requiere que las unidades o elementos
sean seleccionadas al azar, en tal forma que cada una de ellas tenga la misma posibilidad de
ser seleccionada.
Se usan letras mayúsculas o letras del alfabeto griego como símbolos en poblaciones, en cambio,
en la muestra se emplean letras minúsculas.
Los caracteres de los elementos de una población pueden ser cualitativos o cuantitativos, los
datos cualitativos, denominados también atributos, son todos aquellos elementos que pueden ser
descritos cualitativamente, es decir mediante palabras; son ejemplos de atributos: la clasificación
de los alumnos de una institución educativa por lugar de origen; clasificación de un grupo de
personas por ocupación, por cargo, por sexo, etc.
Una variable estadística es cada una de las características o cualidades que poseen los individuos
de una población.
Los caracteres cuantitativos denominados variables, son todas aquellas características o cualida-
des que poseen los individuos de una población, que pueden ser expresadas cuantitativamente,
es decir, mediante números. Ejemplo: peso, estatura, edad, numero de hijos, salarios, etc.

1.2. Tipos de variables


Según el tipo de valores que toman las variables, distinguimos diferentes tipos de variables.

profeajcb@gmail.com 2 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

El tipo de variable es importante: afecta a lo que podemos hacer con ella, al tipo de análisis
que podemos hacer; los métodos estadísticos que usamos dependen del tipo de variable

1.2.1. Variable cualitativa


Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas
con números, es decir:

1. La escala de valores es nominal

2. Los valores son “categorías”

3. Las categorías son valores diferentes por una cualidad, no por una cantidad

4. Ningún “valor” se puede decir que sea mayor o menor que otro

Ejemplos: partido político al que votó; región en que vive; sexo; estado civil; marca de coche
que conduce... 3.
Podemos distinguir dos tipos:

1.2.2. Variable cuantitativa


Una variable cuantitativa es la que se expresa mediante un número (OJO: hay “números” que son
“etiquetas”; por ejemplo: el código postal; el número de teléfono; el código de una asignatura ).

1. Cada valor posible es menor o mayor que otro valor; por tanto se pueden realizar
operaciones aritméticas con ella.

2. El conjunto de valores forman una escala de intervalo

3. “Intervalo”: distancia entre valores

4. En las variables cuantitativas podemos calcular la distancia o intervalo entre cualquier


par de valores de la variable

Podemos distinguir dos tipos: discretas y continuas.


Las variables discretas son aquellas que admiten solamente valores enteros, es decir, no tienen
valores intermedios. Ejemplo: el numero de hijos por familia sera discreta, ya que no se podrá
decir que una familia tiene dos hijos y medio; el numero de empleados por departamento en
una empresa, etc.

profeajcb@gmail.com 3 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Las variables continuas son aquellas que admiten valores fraccionarios, pudiéndose establecer
intervalos. Ejemplo: la estatura de una persona que mide un metro con setenta centímetros; que
pesa sesenta kilos, una libra y cuatro onza, etc.

1.2.3. Variable discreta


Ante todo es conveniente familiarizarnos con ciertos símbolos que utilizaremos tanto para la
variable discreta como para la variable continua.
n = n = Tamaño de la muestra
N = N = Tamaño de la población
Xi = xi = Identificación para cada valor observado
fi = ni = Frecuencias absolutas
fi
n
= hi = Frecuencias relativas
Fi = Ni = Frecuencias absolutas acumuladas
Hi = Hi = Frecuencias relativas acumuladas
Xi = yi = Variable discreta o las marcas de clase
Xi−1 − Xi0
0
= yi−1 − yi0
0
= Identifica a la variable continua con sus intervalos
i = c = Amplitud del universo
m = m = Número de intervalos

1.2.4. Análisis de distribuciones unidimensionales


Una distribución unidimensional está formada por los valores que toma la variable que se
estudia acompañados de sus respectivas frecuencias.

? Frecuencia absoluta (fi ) es el número de veces que se repite un determinado valor.

? Frecuencia relativa (hi ) es el cociente entre la frecuencia absoluta y el número total de


observaciones, por tanto la frecuencia relativa está siempre entre cero y uno.

? Frecuencia absoluta acumulada


i
X
Fi = fj
j=1

es decir, se suman las frecuencias anteriores a un valor dado, por tanto la acumulada al
final coincide con la población N .

profeajcb@gmail.com 4 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

? Distribución por datos no agrupados es cuando se especifican todos y cada uno de los
valores de la variable.

? Distribución por datos agrupados los valores de la variable se miden en intervalos , la


amplitud del intervalo es la diferencia entre el extremo superior Ls y el extremo inferior
Li del intervalo.

? La suma de las amplitudes de todos los intervalos es igual al recorrido ( diferencia entre
el valor mayor y el valor menor de la distribución).

? Marca de clase de un intervalo es la semisuma de los extremos del intervalo y es el valor


que sustituye a todo el intervalo xi = li−12+li siendo li−1 el límite inferior del intervalo i,
y li el límite superior.

Cuando se disponen de un gran número de datos, es útil distribuidos en clases o categorías


y determinar el número de individuos que pertenecen a cada clase, que es la frecuencia de
clase. Una ordenación tabular de los datos en clase, reunidas las clases y con las frecuencias
correspondientes a cada una, se conoce como una distribución de frecuencias o tabla de
frecuencias.

1.3. Reglas generales para distribuciones de frecuencia


Las reglas generales para formar las distribuciones de frecuencia son las siguientes:

? Determinar el mayor y el menor de los datos registrados y así encontrar el rango (dife-
rencia entre el mayor y el menor de los datos).

? Dividir el rango en un número conveniente de intervalos de clase del mismo tamaño. Si


esto no es posible, utilizar intervalos de clase de diferente tamaño o intervalos de clase
abiertos. El número de intervalos de clase se toma generalmente entre 5 y 20 dependiendo
de los datos.
Los intervalos de clase se eligen también de forma que las marcas de clase o puntos
medios coincidan con datos realmente observados. Esto tiende a minorar el llamado
error de agrupamiento, en los análisis posteriores. Sin embargo, los límites reales de
clase no coincidirán con los datos observados.

? Determinar el número de observaciones que caen dentro de cada intervalo de clase, es


decir, encontrar las frecuencias de clase.

profeajcb@gmail.com 5 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

1.4. Gráficos estadísticos.


Los gráficos estadísticos nos permiten presentar la información que dan los datos de manera
resumida y fácil de entender, es decir, las representaciones gráficas tienen que estar hechas
para que el simple impacto visual nos dé información de la distribución; los gráficos pueden
ser univariados, bivariados y multivariados, según el número de variables involucradas.
En distribuciones cuantitativas si los datos no están agrupados, se emplea el diagrama de
barras, si están agrupados el histograma., si la distribución es cualitativa se suele emplear el
diagrama de sectores.

1.4.1. Histogramas
El histograma es una técnica gráfica utilizada para presentar gran cantidad de datos. Se le
atribuye a Karl Pearson en 1895. El histograma puede ser: de frecuencias absolutas, de frecuencias
relativas, de frecuencias absolutas acumuladas y de frecuencias relativas acumuladas.
Para la construcción del histograma se requiere elaborar una tabla de distribución de frecuencias,
el gráfico de la distribución de frecuencias, se llama histograma. El histograma de frecuencias
es una representación visual de los datos en donde se evidencian fundamentalmente tres
características: forma, acumulación o tendencia posicional y dispersión o variabilidad.
El histograma (de frecuencias) en si es una sucesión de rectángulos construidos sobre un sistema
de coordenadas de la siguiente manera:
Las bases de los rectángulos se localizan en el eje horizontal. La longitud de la base es
igual al ancho del intervalo. Las alturas de los rectángulos se registran sobre el eje vertical y
corresponden a las frecuencias de los intervalos. Las áreas de los rectángulos son proporcionales
a las frecuencias de las clases.

1.4.2. Diagrama circular

El diagrama circular (también llamado diagra-Consiste en partir el círculo en porciones pro-


ma de sectores o diagrama de pastel) sirveporcionales a la frecuencia relativa. Entiéndase
para representar variables cualitativas o discre-como porción la parte del círculo que representa
tas. Se utiliza para representar la proporción dea cada valor que toma la variable.
elementos de cada uno de los valores de la va-
riable.

profeajcb@gmail.com 6 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

Cálculo de los sectores: Un círculo completo son 360◦ (o 2π radianes). El ángulo de cada
porción debe ser proporcional a la frecuencia de cada valor. Por ejemplo, si un valor representa
un 50 % del total de elementos, su sector del círculo tendrá un ángulo de 180◦ (o π radianes).
Sea (x1 , x2 , . . . , xn ) un conjunto de elementos. La fórmula para calcular el ángulo de cada
sector es la siguiente:

360◦
α = · ni = 360◦ · fi
N

siendo N el total de elementos, ni el número de sujetos iguales y fi la frecuencia relativa.


El ángulo de cada sector se calcula como 360◦ dividido por el total de sujetos (N ) y multiplicado
por la frecuencia absoluta (ni ), o bien el producto de la frecuencia relativa por 360◦ . También
podemos calcular el ángulo en radianes:


α = · ni = 2π · fi
N

Ejemplo 1.1.

Los continentes suponen el 29, 1 % de superficie de la Tierra, el resto es agua. Supongamos


que se pretende representar mediante un diagrama circular la proporción de superficie de cada
continente respecto a la superficie de todos los continentes.
Para dibujar el diagrama, calcula el ángulo de cada uno de los sectores (que serán Europa,
África, América, Asia, Oceanía, la Antártida). Se obtiene la siguiente tabla:

profeajcb@gmail.com 7 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Continente Superficie (km2 ) Proporción ( %) Ángulo (grados) Ángulo (radianes)


Europa 10,366,825 7% 25◦
0, 43
África 30,283,779 20 % 73◦
1, 27
América 42,028,106 28 % 101◦ 1, 76
Asia 44,555,317 30 % 107 ◦
1, 87
Oceanía 8,543,220 6% 20◦ 0, 36
Antártida 14,107,637 9% 34◦
0, 59
TOTAL MUNDIAL 149,884,884 100 % 360◦ 2π

Una vez calculados los ángulos, puede representarlos gráficamente. El diagrama circular será el
siguiente:

1.4.3. Diagramas de árbol


Para la construcción de un diagrama en árbol se partirá poniendo una rama para cada una de
las posibilidades, acompañada de su probabilidad.
En el final de cada rama parcial se constituye a su vez, un nudo del cual parten nuevas ramas,
según las posibilidades del siguiente paso, salvo si el nudo representa un posible final del
experimento (nudo final).
Hay que tener en cuenta: que la suma de probabilidades de las ramas de cada nudo ha de dar
1.

profeajcb@gmail.com 8 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

1.4.4. Polígono
Otro recurso gráfico para ilustrar el comportamiento de los datos es el polígono de frecuencias.
Este se construye sobre el sistema de coordenadas cartesianas, al colocar sobre cada marca de
clase un punto a una altura igual a la frecuencia asociada a esa clase; luego se unen dichos
puntos por segmentos de recta.
Otra forma de polígono es la Ojiva, la cual es el polígono que se obtiene de unir por segmentos
de recta los puntos situados a una altura igual a la frecuencia acumulada a partir de la marca
de clase como se hace con el polígono de frecuencia.

Ejemplo 1.2.

Las calificaciones de 50 alumnos de grado 8º en Matemáticas han sido las siguientes:


5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3,
5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.

a. Construir la tabla de distribución de frecuencias y dibuja el diagrama de barras.

Solución:

TABLA DE FRECUENCIAS
xi fi Fi ni Ni
0 1 1 0,02 0,02
1 1 2 0,02 0,04
2 2 4 0,04 0,08
3 3 7 0,06 0,14
4 6 13 0,12 0,26
5 11 24 0,22 0,48
6 12 36 0,24 0,72
7 7 43 0,14 0,86
8 4 47 0,08 0,94
9 2 49 0,04 0,98
10 1 50 0,02 1
50 1

Ejemplo 1.3.

profeajcb@gmail.com 9 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Los datos que se muestran a continuación representan el costo de la energía eléctrica


durante el mes de Julio del 2010 para una muestra aleatoria de 50 departamentos con dos
recamaras en una ciudad grande.
Costo de energía eléctrica en pesos.
96 171 202 178 147 102 153 197 127 82
157 185 90 116 172 111 148 213 130 165
141 149 206 175 123 128 144 168 109 167
95 163 206 175 130 143 187 166 139 149
108 119 150 154 114 135 191 137 129 158
a. Realice una tabla de distribución de frecuencias con 7 intervalos.

b. Represente la distribución mediante un diagrama de barras.

Solución:
Intervalos
K fi Xi Fi hi Hi
Ls Li
1 81 100 4 90,5 4 0,08 0,08
2 101 120 8 110,5 12 0,32 0,32
3 121 140 12 130,5 24 0,8 0,8
a.
4 141 160 8 150,5 32 1,44 1,44
5 161 180 10 170,5 42 2,28 2,28
6 181 200 4 190,5 46 3,2 3,2
7 201 220 4 210,5 50 4,2 4,2
P
f = 50

b.

profeajcb@gmail.com 10 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

Ejemplo 1.4.

En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:
2, 8 3, 2 3, 8 2, 5 2, 7 3, 7 1, 9 2, 6 3, 5 2, 3
3, 0 2, 6 1, 8 3, 3 2, 9 2, 1 3, 4 2, 8 3, 1 3, 9
2, 9 3, 5 3, 0 3, 1 2, 2 3, 4 2, 5 1, 9 3, 0 2, 9
2, 4 3, 4 2, 0 2, 6 3, 1 2, 3 3, 5 2, 9 3, 0 2, 7
2, 9 2, 8 2, 7 3, 1 3, 0 3, 1 2, 8 2, 6 2, 9 3, 3

a. ¿Cuál es la variable y de qué tipo es?

b. Construye una tabla con los datos agrupados en 6 intervalos de 1, 65 a 4, 05.

c. Representa gráficamente esta distribución.

Solución:

a.

? Variable: peso de los recién nacidos.

? Tipo: cuantitativa continua.

b. Localizamos los valores extremos: Li = 1, 8 y Ls = 3, 9, recorrido 3, 9 − 1, 8 = 2, 1 = xi .

INTERVALOS MARCA DE CLASE (Xi ) fi


1, 65 − 2, 05 1, 85 4
2, 05 − 2, 45 2, 25 5
2, 45 − 2, 85 2, 65 13
2, 85 − 3, 25 3, 05 17
3, 25 − 3, 65 3, 45 8
3, 65 − 4, 05 3, 85 3
50

c. Representamos los datos en un histograma; al ser los intervalos de la misma amplitud, la


altura de cada barra corresponde a la frecuencia (fi ) de cada intervalo.

profeajcb@gmail.com 11 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

Ejemplo 1.5.

Una entidad bancaria dispone de 50 sucursales en el territorio nacional y ha observado el


número de empleados que hay en cada una de ellas para un estudio posterior. Las observaciones
obtenidas han sido:
12 10 9 11 15 16 9 10 10 11 12 13 14 15 11 11 12
16 17 17 16 16 15 14 12 11 11 11 12 12 12 15 13 14
16 15 18 19 18 10 11 12 12 11 13 13 15 13 11 12

a. Calcular la distribución de frecuencias de la variable obteniendo las frecuencias absolutas,


relativas y sus correspondientes acumuladas.

b. ¿Qué proporción de sucursales tiene más de 15 empleados?

c. Diagrama de barras y diagrama acumulativo de frecuencias correspondientes.

d. Agrupar en intervalos de amplitud 3 los valores de la variable, calcular su distribución de


frecuencias y representar el histograma y su polígono de frecuencias acumuladas.

Solución:

profeajcb@gmail.com 12 Amaury J. Camargo Benítez


ÍNDICE 1. ESTADÍSTICA DESCRIPTIVA

ni Ni
Xi ni Ni fi = N
Fi = N
9 2 2 0, 04 0, 04
10 4 6 0, 08 0, 12
11 10 16 0, 20 0, 32
12 10 26 0, 20 0, 52
13 5 31 0, 10 0, 62
a. 14 3 34 0, 06 0, 68
15 6 40 0, 12 0, 8
16 5 45 0, 1 0, 9
17 2 47 0, 04 0, 94
18 2 49 0, 04 0, 98
19 1 50 0, 02 1
50 1

b. Las sucursales con más de 15 empleados: n8 + n9 + n10 + n11 = 5 + 2 + 2 + 1 = 10

% sucursales con más de 15 empleados = 10


50
 100 = 20 %

c.

profeajcb@gmail.com 13 Amaury J. Camargo Benítez


1. ESTADÍSTICA DESCRIPTIVA ÍNDICE

d. Los datos agrupados en intervalos amplitud 3:

ni Ni ni
[Li − Li+1 ) Xi ni Ni fi = N
Fi = N
ci di = ci
8 − 11 9, 5 6 6 0, 12 0, 12 3 2
11 − 14 12, 5 25 31 0, 50 0, 62 3 8, 33
14 − 17 15, 5 14 45 0, 3 0, 90 3 4, 67
17 − 20 18, 5 5 50 0, 10 1 3 1, 67
50 1 12

profeajcb@gmail.com 14 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

2. MEDIDAS DE TENDENCIA CENTRAL


En el capítulo anterior, se dijo que la estadística cumplía una función descriptiva haciéndolo
mediante cuadros y gráficas, ahora lo complementamos con la aplicación de una serie de
medidas de posición y de dispersión, que nos permiten la descripción de un hecho o de un
conjunto de observaciones.
Las medidas de posición o de tendencia central, denominadas también como promedios,
nos permiten determinar la posición de un valor respecto a un conjunto de datos, el cual lo
consideramos como representativo o típico, para el total de las observaciones.
Estas medidas aplicadas a las características de las unidades en una muestra, se les denominad
estimadores o estadígrafos. En cambio, aplicadas a las características de los elementos de una
población, se les conoce como parámetros o valores estadísticos de la población.
Si con el resultado obtenido, en una encuesta aplicada en una zona o barrio de la ciudad,
afirmamos que el consumo promedio de leche por familia es de dos litros por semana, estamos
representando una gama o variedad de consumos, que van desde familias que no consumen,
hasta un consumo superior a dos litros. Con esta información hacemos referencia al compor-
tamiento del consumo de leche en una zona de la ciudad; también, el resultado puede ser
comparado con los consumos promedios de otros barrios, o el consumo promedio por persona,
o establecer la relación que puede haber entre el consumo y los niveles de ingresos.
Dependiendo de la naturaleza de los datos, la misma necesidad que se tiene y/o las caracte-
rísticas que ellos representan, requieren de la aplicación de un promedio especial dentro de
los diferentes tipos que se expondrán a continuación, pero para ello deberán tenerse en cuenta
algunas reglas que serán básicas en la selección de estas herramientas de descripción.

Características, uso, ventajas y desventajas de las medidas de tendencia central y de


posición Un promedio es un valor en la escala de las X correspondiente a una distribución
de frecuencias, cuyo valor se calcula para representarla en calidad de medida típica del grupo.
Algunas condiciones esenciales para que este valor pueda cumplir su cometido:

? Debe estar representada por una sola cifra.

? Debe ser objetiva y definida por una fórmula algebraica, de tal manera que cualquiera
que sea la persona que trabaje con la distribución, se obtenga siempre el mismo valor.

? Debe ser descriptiva de los datos, de manera que su significado sea fácil de entender.

profeajcb@gmail.com 15 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

? No debe ser una abstracción matemática, que únicamente pueda ser entendida por per-
sonas muy versadas en esta ciencia, ya que una de las condiciones de la estadística, es
simplificar los datos y no hacerlos más complejos.

? Debe ser fácil de calcular, pero esta condición no debe preferirse en prejuicio de otras
ventajas.

? Debe depender de cada uno de los elementos del grupo, de tal manera que si se altera
alguno de éstos, consecuentemente se altera el valor del promedio ya que por definición,
ésta es representante típica de todos los miembros del grupo y no solamente del alguno
de ellos.

? A pesar de que cada uno de los valores de los elementos del grupo debe tener influencia
en el valor de la medida, ésta debe ser de tal calidad que no se deje afectar demasiado
por alguno o algunos pocos valores.

? Debe tener lo que los estadísticos llaman estabilidad en el muestreo.

? Debe ser de uso fácil para cálculos matemáticos posteriores.

2.1. Media aritmética


El promedio es un término muy utilizado por todos, aunque indeterminado. Se dice general-
mente que un valor promedio, intenta representar o resumir las características de un conjunto
de valores. La expresión corriente de promedio, suele en la mayoría a referirse a la media
aritmética X = µ.
Es la medida de posición o promedio más conocida, la más utilizada y entendida por todos,
por su gran estabilidad es la preferida en el muestreo, sus fórmulas admiten tratamiento alge-
braico. Su desventaja principal, es ser muy sensible a cambios en sus valores u observaciones,
también, cuando alguno de sus valores extremos es demasiado grande o pequeño.

Ventajas.

? El promedio aritmético es, en sí, la medida más entendida y la más utilizada. Es un


valor tal. que si se calculara para un grupo en el cual todos los elementos fueran iguales,
cada uno de ellos sería a su promedio aritmético, por lo cual podemos deducir que el
promedio de n elementos, es un nuevo elemento formado, correspondientemente a una
parte igual n1 de cada uno de los elementos originales.

profeajcb@gmail.com 16 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

? Esta medida se define mediante una ecuación matemática muy fácil de entender y al-
gunas veces se puede obtener cuando no es posible calcular otros tipos de medidas de
tendencia central o de posición y, aún en el casos de no conocerse los valores indivi-
duales de la serie, por ejemplo: si 10 familias consumen 20 litros de leche, el promedio
aritmético será de 2 litros por familia.

? El promedio aritmético es extraordinariamente estable en el muestreo.

? Es altamente sensible a cualquier cambio en los datos de la distribución.

? Como ventaja final, se podrá anotar que es excepcionalmente adaptable cuando se trata
de hacer cálculos matemáticos posteriores con él.

Desventajas.

? Es muy sensible a valores muy pequeños o grandes, especialmente cuando estos últimos
se encuentren incluidos en la distribución que se está estudiando, puede resultar en un
promedio que no represente lo típico para el total del grupo.

? Cuando la distribución es marcadamente asimétrica, de tal forma que el promedio arit-


mético, la mediana y el modo difieran en forma apreciable, debe considerarse siempre
la posibilidad de que el promedio aritmético pueda no ser el valor único representativo
de la serie.

? Otro inconveniente o desventaja, es cuando la distribución tiene la forma de U , es decir,


parabólica; éste corresponde a los valores menos comunes en la serie y por tanto, puede
darnos una idea irreal de la distribución.

Esta medida, por lo general, se representa mediante una equis con una raya o trazo colocado
en su parte superior, sin embargo se utilizan otros símbolos como se pueden observar a
continuación: a, ay , ax , M[x] , M[y] , x, y, M[x] , µ.

2.1.1. Media aritmética simple


Suponga que las observaciones en una muestra son x1 , x2 , ..., xn . La media de la muestra, que
se denota con x, y se define como:
n
X xi x1 + x2 + x3 . . . . . . xn
x= =
i=1
n n

profeajcb@gmail.com 17 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

Ejemplo 2.1.

Calcular la media aritmética de los números 10, 12, 36, 25, y 58


Solución.
10+12+36+25+58 121
x= 5
= 5
= 24, 2

Ejemplo 2.2.

Durante los últimos 32 días el valor de las compras en periódicos fue:

5.2 10.2 6.5 6.8 8.5 8.2 5.3 7.0


10.2 8.3 7.1 7.2 5.7 9.0 6.2 7.7
7.0 9.4 6.6 8.4 6.4 7.8 9.1 8.3
7.1 9.2 7.8 9.6 10.1 8.2 8.6 7.5

El promedio aritmético del valor de las compras de periódicos es:

n
X xi 250,2
x= = = 7,82
i=1
n 32

2.1.2. Media aritmética ponderada


Se aplica en datos agrupados, es decir, aquellos que se encuentran organizados en una tabla
de frecuencias, siendo las frecuencias absolutas sus ponderaciones...

Ejemplo 2.3.

Supongamos que dispone de información para 10 observaciones: 8, 2, 8, 6, 2, 2, 8, 2, 4.


La media aritmética será:
8+2+8+......+4 48
x= 10
= 10
= 4, 8
Ahora, si calculamos la media aritmética de las mismas 10 observaciones, pero además organi-
zamos los datos, el resultado obtenido será el mismo.
x= 2+2+2+2+4+6+6+8+8+8
10
= 48
10
= 4, 8 ; resultado que sería exactamente igual a:
2(4)+4(1)+6(2)+8(3) 8+4+12+24
x= 10
= 10
= 4, 8
¿Qué se ha hecho? Simplemente se han organizado los datos en una tabla de frecuencias.

profeajcb@gmail.com 18 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

yi ni y i ni
2 4 8
P
4 1 4 y= yi ni
n
oX= Xi fi
N
6 2 12
y1 n1 +y2 n2 +...... 2(4)+4(1) 48
8 3 24 y= n1 +n2 +......
= 10
= 10
= 4, 8
P
10 48
Xi fi Xi f i

2.2. Mediana
La mediana, es considerada también, al igual que la Media, como una medida de tendencia
central. Su importancia es menor, sus fórmulas son rígidas ya que no admiten tratamiento
algebraico, es por eso que tendremos que aplicar seis procedimientos de cálculo diferente, que
lo hace un poco dispendioso y poco atractivo, como veremos más adelante;
Se define como «aquel valor de la variable que supera a no más de la mitad de las obser-
vaciones, al mismo tiempo, es superado por no más de la mitad de las observaciones»
en otras palabras, se puede definir como el «valor central». Se simboliza por Me , y su fórmula
de aplicación es:

2.2.1. Mediana para datos no agrupados


La mediana de un conjunto finito de valores es aquel valor que divide al conjunto en dos
partes iguales, de forma que el número de valores mayor o igual a la mediana es igual al
número de valores menores o igual a estos. Su aplicación se ve limitada ya que solo considera
el orden jerárquico de los datos y no alguna propiedad propia de los datos, como en el caso de
la media.

Ventajas.

? Esta medida tiene una definición bastante rígida y el concepto de ella es tan claro, que
cualquier persona lo entiende, aún sin ser familiar su término.

? Los datos deben estar ordenados, pero los valores extremos no tienen ninguna incidencia
en su cálculo.

? Tiene menor estabilidad en el muestreo que el promedio aritmético, pero mayor estabi-
lidad que otras medidas.

profeajcb@gmail.com 19 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

? Hay situaciones en que la única medida de tendencia central que puede utilizarse es
la mediana, especialmente cuando los valores extremos de una distribución de variable
continua no están definidos.

Desventajas.

? No es tan conocida como la media aritmética.

? Se hace necesario ordenar los datos para poderla calcular.

? Esta medida no se adapta a cálculos posteriores aritméticos, por cuanto que si obtenemos
las medianas de diferentes grupos, no se podrá calcular una mediana para el conjunto.

? Tampoco es sensible a cambios en los valores de los elementos, manteniéndose el valor


central y los valores ordenados.

t A continuación se muestran los criterios para construir la mediana. Se puede construir los
siguientes criterios:
Cálculo en datos sin agrupar u originales

a. Número impar de observaciones. Cuando esta medida la aplicamos en los datos originales
o sin agrupar, lo primero que se debe hacer, es ordenarlos de menor a mayor o de mayor
a menor.

Ejemplo 2.4.

Supongamos se tienen los siguientes datos: y x1 = 2 x2 = 18 x3 = 4 x4 = 12. Observamos


que la serie es impar, ya que n = 5 por lo tanto ordenamos los datos, por ejemplo, de menor
a mayor: 2 4 6 12 8 La mediana será igual al valor central Me = 6.

b. Número par de observaciones. Ahora calcularemos la mediana, cuando se tenga un número


par de observaciones. En estos casos, encontramos dos valores en el centro de la serie,
por tal razón la mediana deberá ser el promedio de ellos.

Ejemplo 2.5.

Supongamos que en vez de 5 datos se tengan 8 datos así: x1 = 8 x2 = 16 x3 = 4 x4 = 2


x5 = 20 x6 = 3 x7 = 12 x8 = 20.

profeajcb@gmail.com 20 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

x +x
Ordenamos los datos de menor a mayor o viceversa; 2 3 4 8 12 16 20 20 ⇒ Me = j−12 j =
8+12
2
= 10.
En los dos casos anteriores, correspondiente al cálculo de la mediana para datos sin agrupar,
la localización de ella, luego de ser ordenados, se facilita aplicando el siguiente procedimiento:
n+1
2
= 5+12
= 3ª posición, la mediana en el primer caso o ejemplo 1, será Me = xj = 6 y
en el ejemplo 2 será: n+1 2
= 8+1
2
= 4, 5ª posición, es decir, se encuentra entre la 4ª y la 5ª
observación y la mediana será igual a Me = xj = 10, el valor promedio de los dos valores
centrales.

2.2.2. Mediana para datos agrupados


Cuando los datos se encuentran agrupados en una distribución de frecuencia, no conocemos
los datos originales. Por lo tanto es necesario estimar la mediana mediante los siguientes pasos:

1. Calcular el valor n
2

2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se


hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o
mayor que n2 .

3. Aplicando la siguiente fórmula con los valores del intervalo mediano:


!
N
2
− Fi−1
Me = Li + ai
fi

Donde:

? Me = Mediana

? Li = Límite inferior del intervalo que contiene a la mediana

? fi = Frecuencia absoluta del intervalo de la clase mediana

? N = Total de datos o frecuencias

? Fi−1 = Frecuencia acumulada anterior a la clase mediana

? ai = Amplitud del intervalo de la clase mediana

Ejemplo 2.6.

profeajcb@gmail.com 21 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

2.3. Moda
Se define como «el valor de la variable que más se repite» o «aquel valor que presenta
la máxima frecuencia». Puede suceder que una distribución tengas dos Modas, en este caso
se dice que la distribución es Binomial, en el caso que haya más de dos modas, se dice que
es plurimodal o multimodal. Es la única medida de posición que puede ser utilizada en
atributos, es decir, cuando la característica es cualitativa. Modo, Moda o valor Modal, medida
originalmente concebida, como aquel valor de la variable, que presenta el mayor número de
observaciones, es decir, el valor de la variable que más veces se repite. Se empleó formalmente
en 1,984 por Karl Pearson, ya que no era utilizado anteriormente.

Desventajas.

? El hecho que la moda nos indique el punto de mayor concentración, lo hacer tal vez,
la mejor medida de tendencia central. Cuando una distribución es muy asimétrica,
claramente se ve que la moda es el más representativo del grupo, y en algunos casos, si
la moda y el promedio aritmético son significativamente diferentes al valor, es preferible
usar la moda.

? En series plurimodales, la moda permite dividir la distribución con fines de estratifica-


ción.

? Se considera de uso riguroso en variables continuas, aunque puede extenderse a casos


discontinuos.

Ventajas.

? Se le considera con cierto grado de dificultad de cálculo en datos agrupados, siendo su


resultado de poca confianza, especialmente cuando la amplitud no es constante, en este
caso, si se hace necesario se debe seguir un determinado proceso.

? Es muy inestable en el muestreo.

? No puede ser utilizado en procesos algebraicos posteriores.

? No es sensible, especialmente cuando hay cambios en los valores de la variable, salvo que
no afecten a su propio valor.

profeajcb@gmail.com 22 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

2.3.1. Moda para datos sin agrupar u originales


Ejemplo 2.7.

Consideremos los siguientes datos: 5, 10, 8, 5, 10, 18, 5, 12, 5, 12 calculemos la media, la
mediada y la moda. n = 10.
P
M edia → x = nxi = 90 10
=9
M ediana →Ordenamos los datos de mayor a menor o de menor a mayor
5 5 5 5 8 10 10 12 12 18
Me
Posición: 2 = 2 = 5, 5ª La mediana se encuentra entre la 5ª y la 6ª observación
n+1 10+1

x +x
Siendo: Me = 8+102
=9 Me = j−12 j
M oda →Corresponderá a 5, siendo el valor de la variable que más se repite → Md =
xj = 5
Al forjarnos una imagen mental de la distribución de frecuencias de un conjunto de mediciones,
una de las primeras apreciaciones descriptivas de interés es una medida de tendencia central,
es decir, una que localiza el centro de la distribución. Una de las medidas de tendencia central
más común y útil es la media común o “media aritmética”, pero también son de importancia,
según las circunstancias y el tipo de variables la “moda” y la “mediana”.

Ejemplo 2.8.

2.3.2. Moda para datos agrupados


En tablas de frecuencias con datos agrupados, hablaremos de intervalo modal.
La moda se representa por Mo.
 
fi − fi−1
Mo = Li + ai
(fi − fi−1 ) + (fi + fi−1 )

Donde:

? Mo = Moda

? Li = Límite inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).

? fi = Frecuencia absoluta del intervalo modal.

? fi−1 = Frecuencia absoluta del intervalo anterior al modal.

profeajcb@gmail.com 23 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

? fi+1 = Frecuencia absoluta del intervalo posterior al modal.

? ai = Amplitud del intervalo.

Ejemplo 2.9.

2.3.3. Otras medidas de tendencia central.


? La Media Geométrica.

? La Media Cuadrática.

2.3.4. Cuartiles, deciles y percentiles.


Cuartiles: si a un conjunto de datos se ordena de mayor a menor, el valor central es la
mediana, este valor divide el grupo, en dos subgrupos cada uno con el 50 % de los datos. Si
a cada subgrupo ordenado se le marca el valor central, tenemos así tres valores seleccionados
que llamaremos Cuartiles,Q1, Q2 y Q3. Estos valores dividen al conjunto de datos en cuatro
grupos con igual número de términos, cada cuartil contiene el 25 % de los datos. La mediana
es el cuartil dos, Q2. Con los Cuartiles se construye un gráfico especial, “el diagrama de caja”,
este permite visualizar la variabilidad de los datos por Cuartil.
Deciles, si el conjunto de valores, ordenados de de mayor a menor, se dividen en diez partes
iguales, los valores que dividen los datos se llaman deciles y son nueve, D1, D2,...,D9.
Percentiles, si se tiene un conjunto de datos muy numerosos y a este se lo divide en 100 partes
iguales, cada valor que divide los datos se llama percentil, P 1, P 2, P 3. . . P 99.

Ejemplo 2.10.

Consideremos los datos que muestra la siguiente tabla, resultado de gastos diarios en periódicos
de una determinada empresa.

profeajcb@gmail.com 24 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

[Li − Li+1 ) Xi fi hi Fi Hi
5,2 − 6,1 5,65 3 0,094 3 0,094
6,1 − 7,0 6,55 5 0,156 8 0,250
7,0 − 7,9 7,45 9 0,281 17 0,531
7,9 − 8,8 8,35 7 0,219 24 0,750
8,8 − 9,7 9,25 3 0,156 29 0,906
9,7 − 10,6 10,15 2 0,094 32 1,000
T OT AL 32 1,000
....................................................................................
Hallemos el 80º percentil:
Son 99 valores que dividen a un conjunto de datos en 100 partes iguales, los percentiles se
calculan con la fórmula:
kn

c 100 − Fi−1
Pk = Li +
fi

donde;
Li =límite inferior del intervalo que contiene al percentil
Fi−1 =frecuencia acumulada en la clase anterior k-ésima
fi =frecuencia en la clase que contiene al percentiles
c =tamaño del intervalo de clase
k =1º, 2º, 3º,...,99º percentiles
De este modo, el percentil 80º de acuerdo a la tabla, estará en el intervalo 5, es decir,
c( 80n −Fi−1 )
P80º = Li + 100 fi = 8,8 + 0,9(25,6−24)
5
= 9,088
El 80 % de los datos serán menores a 9,088 y el 20 % restante serán mayores.
....................................................................................
Hallemos el 3er cuartil.
El cuartil 3 (percentil 75º) se ubicara en el cuarto intervalo, así:
c( 75n −Fi−1 )
P75º = Li + 100 fi = 7,9 + 0,9(24−17)
7
= 8,8
El 75 % de los datos serán menores a 8,8 y el 25 % restante serán mayores.
....................................................................................
Hallemos ahora el 7º decil.
El decil 7 (percentil 70º) se ubicara en el cuarto intervalo, así:
c( 70n −Fi−1 )
P70º = Li + 100 fi = 7,9 + 0,9(22,4−17)
7
= 8,594
El 70 % de los datos serán menores a 8,594 y el 30 % restante serán mayores a 8,594.

profeajcb@gmail.com 25 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

2.4. Medidas de dispersión o de variabilidad


Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es
importante conocer si los valores en general están cerca o alejados de estos valores centrales,
es por lo que surge la necesidad de estudiar medidas de dispersión.
Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio
de un número si las diferentes puntuaciones de una variable están muy alejadas de la media.
Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será
a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos; dicho de
otro modo, las medidas de dispersión, son herramientas estadísticas para determinar que tan
compactos son una serie de datos, o si se quiere, que tan homogéneos son.
Los tipos de medidas de dispersión más comunes son: “el rango” “la desviación Estándar o
típica” y la “Varianza” y el coeficiente de variación.

2.4.1. Rango
Se define como la diferencia que existe entre el valor mayor y el valor menor de una distribución,
Se indica como R. Se calcula de la siguiente forma: R= Valor Mayor – Valor Menor

2.4.2. Varianza
Es una medida cuya importancia radica especialmente en que da origen a otra medida de
dispersión más significativa, denominada desviación estándar o desviación típica. Es la media
de los cuadrados de las desviaciones, y la denotaremos por Sx2 o también por σ 2 . Las fórmulas
para la varianza poblacional y la varianza muestral son un poco diferente:

? Varianza muestral:

Pn 2
xi − X
Sx2 = i=1
para datos no agrupados
n−1

Pn 2
i=1 fi xi − X
Sx2 = para datos agrupados
n−1

? Varianza poblacional:

profeajcb@gmail.com 26 Amaury J. Camargo Benítez


ÍNDICE 2. MEDIDAS DE TENDENCIA CENTRAL

Pn 2
xi − X
σx2 = i=1
para datos no agrupados
N

Pn 2
f i xi − X
σx2 = i=1
para datos agrupados
N

donde:

? S = designa la desviación estándar o desviación típica.

? xi = para datos no agrupados es el valor de las observaciones en la muestra o de la


población. Para datos agrupados, representa el punto media de una clase o marca de
clase.

? X = media aritmética.

? fi = es la frecuencia absoluta de los intervalos de clase.

? N = es el número de observaciones en la población.

? n = es el número de observaciones en la muestra.

Ejemplo 2.11.

Con los siguientes datos 5, 3, 1, 6, 10 calcule la varianza.


P
x = nxi = 5+3+1+6+10
5
=5
P 22 2 2 2 2 2
s2 = (xin−x) = (5−5) +(5−3) +(5−1) 5
+(5−6) +(5−10)
= 9, 2
Datos agrupados: al trabajar con datos agrupados utilizamos:

(xi − x)2 ni
P
s 2
= para la muestra y,
n
P 2
Xi − X ni
σ2 = para la población.
N

2.4.3. Desviación típica


La desviación típica es la raíz cuadrada de la varianza, considerada siempre positiva.

s = s2 para la muestra y,

σ = σ 2 para la población.

profeajcb@gmail.com 27 Amaury J. Camargo Benítez


2. MEDIDAS DE TENDENCIA CENTRAL ÍNDICE

La desviación típica, es la medida de dispersión más utilizada y de mayor utilidad, dado que
las unidades son expresadas en la misma variable; mientras que, la varianza se expresan en las
mismas unidades pero al cuadrado.

2.4.4. Coeficiente de variación de Pearson: (CV )


Mide la variación de los datos respecto a la media, sin tener en cuenta las unidades en la que
están.

Sx
CV = , x 6= 0
|x|

donde Sx es la desviación típica y x es la media del conjunto de observaciones.


El coeficiente de variación toma valores entre 0 y 1. Si el coeficiente es próximo al 0, significa
que existe poca variabilidad en los datos y es una muestra muy compacta. En cambio, si tienden
a 1 es una muestra muy dispersa.
Para interpretar fácilmente el coeficiente, podemos multiplicarlo por cien para tenerlo en tanto
por cien.

Ejemplo 2.12.

Para la media y la varianza de un conjunto se han hallado, respectivamente los valores 4 y 25


¿qué opinión merece la media aritmética?

s 5
CV = × 100 = × 100 = 125 %
x 4

Esta media aritmética no lo es suficientemente representativa de la distribución, debido a


variabilidad tan alta.

profeajcb@gmail.com 28 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

3.1. Análisis Combinatorio


Cuando estamos en presencia de un conjunto ordenado de una determinada manera, nos
pueden venir las preguntas, ¿porque está ordenado de esa forma?, ¿existen más posibilidades
para ordenar éste conjunto?, ¿cuántas?, etc. . . , el estudio de las permutaciones, de los arreglos
y de las combinaciones nos permitirá responder a éstas y otras preguntas.

3.1.1. Permutaciones
Las permutaciones consisten en cambiar el orden de un conjunto, y poder determinar cuántas
posibilidades de ver de distinta forma ordenado el conjunto existen, por ejemplo; sea M =
m1 , m2 , m3 , m4 , ..., mn un conjunto de n elementos, entonces las posibilidades que tengo
para poner en cada casillero será: en la primera posición puedo colocar cualquiera de los n
elementos, en la segunda puedo colocar cualquiera de los que me quedan, que son (n − 1),
en la tercera posición puedo colocar solo (n − 2) elementos y así voy quedándome con un
elemento menos a medida que avanzo en los casilleros, hasta que me quedo solo con un
elemento en la última posición, es decir:
M = | {z } , | {z }, | {z }, | {z } , ..., | {z } , | {z } , | {z }
n opciones n−1 opciones n−2 opciones n−3 opciones 3 opciones 2 opciones 1 opción

De manera que cuando tengo un conjunto de n elementos la cantidad de permutaciones que


puedo hacer sobre éste será:
Pn elementos = n · (n − 1) · (n − 2) · (n − 3) · ... · 2 · 1

A éste número lo conocemos como factorial de n, lo simbolizamos como n!, por lo tanto las
permutaciones que puedo hacer sobre un conjunto de n elementos será:
Pn elementos = n!

Ejemplo 3.1.

Determinemos la cantidad de ordenamientos distintos del conjunto de las vocales V = a, e, i, o, u:


SOLUCIÓN:
P5 vocales = 5! = 5 · 4 · 3 · 2 · 1 = 120 posibilidades distintas.

profeajcb@gmail.com 29 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

3.1.2. Arreglos (variaciones)


Los arreglos son todas las posibles ordenaciones de n elementos sacados de un grupo más
grande de m elementos (m > n), importando el orden de los conjuntos resultantes, de manera
que α, β, γ 6= γ, β, α. El número de arreglos de a n elementos que puedo hacer en un grupo
de m elementos será:
m!
Amn =
(m−n)!

Ejemplo 3.2.

Determinemos la cantidad de arreglos de 2 vocales que podemos hacer en el conjunto de las


vocales V = a, e, i, o, u:
Solución: m será la cantidad de vocales, y n la cantidad que habrá en los arreglos:

m!
Am
n =
(m−n)!
5!
A52 =
(5 − 2)!
5 · 4 · 3!
A52 =
3!
A52 = 20 Arreglos distintos

Ejemplo 3.3.

¿De cuántas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles?
Respuesta:
Nótese que importa el orden en que se sientan las personas, ya que los cuatro sitios son
diferentes, y que una persona no puede ocupar más de un sitio a la vez. Por lo tanto, hay

m!
Am
n =
(m−n)!
10!
A10
4 =
(10 − 4)!
10!
A10
4 =
6!
10 · 9 · 8 · 7 · 6!
A10
4 = = 10,9,8,7 = 5040 maneras
6!

profeajcb@gmail.com 30 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

Ejemplo 3.4.

En una clase de 10 alumnos van a distribuirse 3 premios. Averiguar de cuántos modos puede
hacerse si:

a. Los premios son diferentes.

b. Los premios son iguales.

Hay dos supuestos posibles: Si una misma persona no puede recibir más de un premio:

? Suponemos que NO puede recibir más de un premio, luego los alumnos NO se pueden
repetir:

Caso 1. Los premios son diferentes (no es lo mismo ganar el primer premio que el segundo)
importa el orden, hay:

m!
Am
n =
(m−n)!
10!
A10
3 =
(10 − 3)!
10!
A10
3 =
7! · 3!
10 · 9 · 8 · 7!
A10
3 = = 10,9,8 = 720 manera de distribuir los premios si estos son diferentes;
7!

3.1.3. Combinaciones
Las combinaciones son muy parecidas a los arreglos, con la diferencia en que en los con-
juntos que se forman no importa el orden de manera que α, β, γ = γ, β, α. El número de
combinaciones de a n elementos que puedo hacer de un total de m elementos será:
m!
Cnm =
n!·(m−n)!

Ejemplo 3.5.

Javier, Gonzalo, Manuel, Pamela y Paola se han postulado a la directiva de su curso, pero solo 3
de ellos pueden quedar, ¿cuántas directivas posibles hay?.
Respuesta :
En éste caso se trata de formar combinaciones entre los postulantes, pues si por ejemplo se elije
a Javier, Gonzalo y Paola es lo mismo que se elija a Paola, Gonzalo y a Javier, lo que corresponde
a una combinación de 3 elementos de un total de 5, por lo tanto:

profeajcb@gmail.com 31 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

m!
Cnm =
n!·(m−n)!
5!
C35 =
3!. (5 − 3)!
5,4,3!
C35 =
3!,2!
20
C35 = = 10 posibles directivas distintas
2

Ejemplo 3.6. (Se refiere a la parte b) del último ejemplo de los arreglos)

son iguales, no importa el orden, son indistinguibles, pueden distribuirse de;

m!
Cnm =
n! · (m−n)!
10!
C310 =
(10 − 3)! · 3!
10!
C310 =
7! · 3!
10 · 9 · 8
C310 = = 120 maneras de distribuir los premios si estos son iguales.
3·2·1

3.2. Probabilidad
Las Probabilidades pertenecen a la rama de la matemática que estudia ciertos experimentos
llamados aleatorios; o sea, regidos por el azar, en que se conocen todos los resultados posibles,
pero no es posible tener certeza de cuál será en particular el resultado del experimento.
Ejemplo, experimentos aleatorios cotidianos son el lanzamiento de una moneda, el lanzamiento
de un dado, extracción de una carta de un mazo de naipes. Más adelante se verá que debemos
distinguir entre los conceptos de probabilidades matemáticas o clásicas de las probabilidades
experimentales o estadísticas.
LA PROBABILIDAD es el estudio de los fenómenos de los que no estamos seguros de su
ocurrencia.
FENÓMENO: un fenómeno es la ocurrencia de un hecho o suceso. Los que nos interesan son
aquellos fenómenos los cuales podemos observar.
Ejemplos de experimentos; Lanzamiento de un dado, lanzamiento de una moneda, un mazo de
cartas, esferas en una urna, etcétera.
EXPERIMENTO: es un fenómeno observable perfectamente definido.

profeajcb@gmail.com 32 Amaury J. Camargo Benítez


ÍNDICE 3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS

3.2.1. Experimentos y espacios muestrales


La teoría de la probabilidad ha sido motivada por diversas situaciones de la vida real en las
que se realiza un experimento y el investigador observa un resultado. Además, el resultado no
puede predecirse con certeza. A estos experimentos se les llama experimentos aleatorios. El
concepto de un experimento aleatorio se considera desde el punto de vista matemático como
una noción primitiva y por ello no se define de otra manera; sin embargo, podemos notar que
los experimentos aleatorios tienen algunas características comunes. Primero, en tanto que no
podemos predecir un resultado con certeza, sí es posible describir el conjunto de resultados
posibles. Segundo, desde un punto de vista conceptual, el experimento es tal que podría
repetirse en condiciones que permanezcan invariables, ocurriendo los resultados de una manera
fortuita; no obstante, a medida que el número de repeticiones aumenta, surgen ciertos patrones
en la frecuencia de ocurrencia de los resultados.
A menudo consideraremos experimentos idealizados. Por ejemplo, cuando se arroja una moneda,
podemos descartar la posibilidad de que caiga de canto. Esto es más por conveniencia que
por necesidad. El conjunto de resultados posibles se llama espacio muestral y estos resultados
definen al experimento idealizado en particular. Los símbolos E y S se utilizan para representar
el experimento aleatorio y el espacio muestral asociado.
De acuerdo con la terminología empleada en el repaso de conjuntos y sus operaciones, clasi-
ficaremos espacios muestrales (y con ello a los experimentos aleatorios). Un espacio muestral
discreto es aquel en el que hay un número finito de resultados o un número finito contable
(numerable) de resultados. Del mismo modo, un espacio muestral continuo tienen resultados
incontables. Éstos podrían ser números reales en un intervalo o pares reales contenidos en
el producto de intervalos, donde las mediciones se realizan respecto a dos variables en un
experimento.
Para ilustrar experimentos aleatorios con un espacio muestral asociado consideremos los ejem-
plos siguientes:

Ejemplo 3.7.

E1 : Lanzar una moneda genuina y observar el lado que cae hacia arriba.
S1 : {C, S}

Ejemplo 3.8.

E2 : Lanzar tres veces una moneda genuina y observar la secuencia «caras» y «sellos».
S2 : {CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}

profeajcb@gmail.com 33 Amaury J. Camargo Benítez


3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS ÍNDICE

Ejemplo 3.9.

E3 : Lanzar tres veces una moneda genuina y observar el número total de «caras».
S3 : {0, 1, 2, 3}

Ejemplo 3.10.

E4 : Lanzar un dado y observar el número que resulta en la cara superior.


S4 : {1, 2, 3, 4, 5, 6}

Ejemplo 3.11.

Lanzar un par de dados y observar los númerosque resultan.


E5 : 


 (1, 1) , (1, 2) , (1, 3) , (1, 4) , (1, 5) , (1, 6) , 


 



 (2, 1) , (2, 2) , (2, 3) , (2, 4) , (2, 5) , (2, 6) , 




 (3, 1) , (3, 2) , (3, 3) , (3, 4) , (3, 5) , (3, 6) , 
S5 :
 (4, 1) , (4, 2) , (4, 3) , (4, 4) , (4, 5) , (4, 6) , 

 

 



 (5, 1) , (5, 2) , (5, 3) , (5, 4) , (5, 5) , (5, 6) , 




 (6, 1) , (6, 2) , (6, 3) , (6, 4) , (6, 5) , (6, 6) . 

profeajcb@gmail.com 34 Amaury J. Camargo Benítez


Referencias Referencias

Referencias

Matemà ticas discretas. Martinez Bencardino Ciro. EstadÃstica y Muestreo. 2012. Leandra.
La yuca y plátanos. 2001. Leandra. el platano. 2003. Myers Walpole, Myers. Probabilidad
y EstadÃstica para IngenierÃa y Ciencias. 9º Ed. 2012.

profeajcb@gmail.com 35 Amaury J. Camargo Benítez

You might also like