Professional Documents
Culture Documents
1. ESTADÍSTICA DESCRIPTIVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Variable estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1. Tipos de variables . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2. Variable cuantitativa . . . . . . . . . . . . . . . . . . . . . . . 4
1.2. Distribución de Frecuencias . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1. Tabla de frecuencias de una variable . . . . . . . . . . . . . . 5
1.3. Reglas generales para distribuciones de frecuencia . . . . . . . . . . . . 6
1.4. Gráficos estadísticos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.4.1. Diagrama de barras . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.2. Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.3. Diagrama circular . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4.4. Tablas de frecuencia para variables Continuas . . . . . . . . 14
2. MEDIDAS DE TENDENCIA CENTRAL . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1. Media aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.1.1. Media aritmética simple . . . . . . . . . . . . . . . . . . . . 23
2.1.2. Media aritmética ponderada . . . . . . . . . . . . . . . . . . 24
2.2. Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.1. Mediana para datos no agrupados . . . . . . . . . . . . . . . 25
2.2.2. Mediana para datos agrupados . . . . . . . . . . . . . . . . . 27
2.3. Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.1. Moda para datos sin agrupar u originales . . . . . . . . . . . 28
2.3.2. Moda para datos agrupados . . . . . . . . . . . . . . . . . . 29
2.3.3. Otras medidas de tendencia central. . . . . . . . . . . . . . 30
2.3.4. Cuartiles, deciles y percentiles. . . . . . . . . . . . . . . . . . 30
2.4. Medidas de dispersión o de variabilidad . . . . . . . . . . . . . . . . . 31
2.4.1. Rango . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
iii
iv ÍNDICE GENERAL
2.4.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4.3. Desviación típica . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.4. Coeficiente de variación de Pearson: (CV ) . . . . . . . . . . 33
3. PROBABILIDAD, DEFINICIONES Y CONCEPTOS BÁSICOS . . . . . . . . . . . . . 35
3.1. Análisis Combinatorio . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.1. Permutaciones . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.2. Arreglos (variaciones) . . . . . . . . . . . . . . . . . . . . . . 36
3.1.3. Combinaciones . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.2. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.1. Experimentos y espacios muestrales . . . . . . . . . . . . . . 39
Bibliografía 41
1. ESTADÍSTICA DESCRIPTIVA
CONCEPTOS PRELIMINARES
¿ESTADÍSTICA?
La estadística es la ciencia que utiliza recursos matemáticos para organizar y resumir una gran
cantidad de datos obtenidos de la realidad, para inferir conclusiones respecto de ellos.
Esta ciencia indica cómo debe emplearse la información y cómo dar una guía de acción en
situaciones prácticas que suponen incertidumbre.
La estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, encon-
trar regularidades y analizar datos; también de hacer inferencias a partir de ellos para ayudar a
la toma de decisiones y formular predicciones.
La estadística permite describir, analizar, resumir y representar un grupo de datos utilizando
métodos numéricos y gráficos para presentar la información recolectada.
? Ayuda a la adquisición de las destrezas necesarias para aprender a aprender, tales como: la
autonomía, la perseverancia, la realización de un trabajo sistematizado y la comunicación
eficaz de los resultados del trabajo personal.
? Utilizar “la información oportuna y necesaria para mejorar y transformar el medio natural,
social y cultural”.5
? Finita, como es el caso del número de personas que llegan al servicio de urgencia de un
hospital en un día; y se conoce el tamaño N de la población.
En algunos casos, también se considera infinita, cuando siendo pequeña no se puede saber con
exactitud el tamaño de la población.
? Individuo. Un individuo o unidad estadística es cada uno de los elementos que componen
la población.
? Valor. Un valor es cada uno de los distintos resultados que se pueden obtener en un
estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara
y sello.
? Dato. Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos que pueden ser:
cara, cara, sello, cara, sello.
? Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas
con números, es decir:
3. Las categorías son valores diferentes por una cualidad, no por una cantidad
4. Ningún “valor” se puede decir que sea mayor o menor que otro
Ejemplos: partido político al que votó; región en que vive; sexo; estado civil; marca de coche
que conduce... 3.
Podemos distinguir dos tipos:
1. Cada valor posible es menor o mayor que otro valor; por tanto se pueden realizar
operaciones aritméticas con ella.
? Las variables discretas son aquellas que admiten solamente valores enteros, es decir, no
tienen valores intermedios. Ejemplo: el numero de hijos por familia sera discreta, ya que
no se podrá decir que una familia tiene dos hijos y medio; el numero de estudiantes por
curso en una I.E, etc.
? Las variables continuas son aquellas que admiten valores fraccionarios, pudiéndose
establecer intervalos. Ejemplo: la estatura de una persona que mide un metro con setenta
centímetros; que pesa sesenta kilos, una libra y cuatro onza, etc.
? La suma de las frecuencias absolutas es igual al número total de datos, que se representa
por N, es decir, f1 + f2 + f3 + . . . fn = N. Para indicar resumidamente estas sumas se
utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
n
f1 + f2 + f3 + . . . fn = ∑ fi =N
i=1
1. n, tamaño de la muestra
2. N, tamaño de la población
3. xi , valor observado
Es un cuadro que se usa para organizar, clasificar y resumir datos relevantes que se ha reco-
lectado, con la finalidad de informarse sobre algún tema. Su uso permite registrar, ordenar y
resumir los resultados cuantitavos recolectados de alguna variable investigada, así como esta-
blecer relaciones entre diversas variables.
Observación 1.2. Con la elaboración de la tabla estadística termina la fase clasificatoria de la
investigación cuantitativa.
Para generar la distribución de frecuencias en una variable discreta se deben seguir los pasos
que se describen a continuación, los cuales permiten organizar la distribución de los datos en
una tabla de cinco columnas básicamente:
Paso 1: Identificar los valores diferentes que toma la variable y escribirlos en la primera columna
de la tabla, en orden ascendente. Se denotará por k el número de valores diferentes que se
encuentran en el conjunto de datos y se denotarán por x1 , x2 x3 , . . . , xk . En esta columna no
deben haber valores repetidos.
Paso 2: La segunda columna consiste en calcular la frecuencia absoluta, fi que es el número de
veces que se repite el valor xi en el conjunto de datos. La suma de los fi es igual al número
total de datos en análisis. Por ejemplo, el valor de f3 es el número de veces que se repite la
observación x3 en el conjunto de datos.
Paso 3: El cálculo de la frecuencia absoluta acumulada, Fi consiste en diligenciar la tercera
columna y es equivalente a sumar los valores menores o iguales de las frecuencias absolutas, fi
de cada valor xi .
Paso 4: La cuarta columna consiste en calcular la frecuencia relativa, ni , la cual es el valor
relativo o porcentual, que representa el valor de cada xi .
Paso 5: La quinta columna se refiere a la frecuencia porcentual, que no es más que la frecuencia
relativa multiplicada por 100 %, se representa con pi .
A continuación se desarrolla un ejercicio para tener mayor claridad al respecto.
Ejemplo 1.1.
Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes
resultados:
negro, azul, amarillo, rojo, azul, azul, rojo, negro, amarillo, rojo, rojo, amarillo, amarillo, azul,
rojo, negro, azul, rojo, negro, amarillo.
Solución:
Ejemplo 1.2.
Un sondeo realizado en una Institución Educativa sobre 30 estudiantes de grado 11, pretende
mostrar que edad es la más representativa del grupo.
Las edades de los estudiantes fueron:
17 17 15 15 16 17 18 17 15 17 16 15 15 16 16 18 18 16 17 15 16 15 18 17 15 19 19 16 17 19
Elabore una tabla de frecuencia que resuma los resultados.
Solución:
En la primera columna, colocamos los valores de nuestra variable xi , en la segunda la frecuencia
absoluta fi , luego la frecuencia acumulada Fi , seguida por la frecuencia relativa ni , y finalmente
la frecuencia relativa acumulada Ni . Ahora vamos a agregar la columna de frecuencia porcentual,
y frecuencia porcentual acumulada.
Tabla de frecuencias
xi fi Fi ni Ni pi Pi
15 8 8 0,26 0,26 26 % 26 %
16 7 15 0,23 0,5 23 % 50 %
17 8 23 0,26 0,76 26 % 76 %
18 4 27 0,13 0,9 13 % 90 %
19 3 30 0,1 1 10 % 100 %
Total 30 1 100 %
Ejemplo 1.3.
Solución:
Ejemplo 1.4.
En una tienda de autos, se registra la cantidad de autos Toyota vendidos en cada día del mes
de Diciembre.
0; 1; 2; 1; 2; 0; 3; 2; 4; 0; 4; 2; 1; 0; 3; 0; 0; 3; 4; 2; 0; 1; 1; 3; 0; 1; 2; 1; 2; 3.
Solución:
Ejercicios 1.1.
En cada de los siguientes ejercicios, realiza una tabla de distribución de frecuencias, con su
respectivo diagrama de barras y el diagrama circular.
2. En un grupo de personas hemos preguntado por el número de días que practican deporte
a la semana. Las respuestas han sido las siguientes: 4, 2, 3, 1, 3, 7, 1, 0, 3, 2, 6, 2, 3, 3, 4,
6, 3, 4, 3, 6.
4. En una clase de 10° hemos preguntado a las alumnas y a los alumnos por las horas de
estudio que dedican a la semana. Estas han sido las respuestas: 16, 11, 10, 12, 10, 15, 10, 10,
14, 15, 10, 10, 13, 10, 12, 15, 12, 16, 16, 16, 16, 10, 13, 13.
5. Al preguntar a 20 familias sobre el número de días a la semana que van al mercado, las
respuestas han sido las siguientes: 1, 2, 2, 4, 6, 1, 6, 1, 2, 3, 5, 2, 6, 3, 1, 4, 1, 6, 1, 2.
6. Las notas de los alumnos de una clase de Matemáticas de grado 6° son las siguientes: 5,
3, 4, 1, 2, 3, 4, 5, 3 3, 5, 4, 1, 2, 2, 1 2, 5, 3, 1, 2, 3, 4, 3, 2, 3, 4, 2, 3, 4.
Es un dibujo utilizado para representar la información recolectada, que tienen entre otras
funciones:
• Evidenciar las relaciones que pueden existir en los datos que representa.
1.4.2. Histograma
Es un tipo especial de gráfica de barras, en la cual una barra va pegada a la otra, es decir
no hay espacio entre las barras. Cada barra representa un subconjunto de los datos.
Un histograma es una gráfica adecuada para representar variables cuantitativas continuas, aun-
que también se puede usar para variables discretas. Es decir, mediante un histograma se puede
mostrar gráficamente la distribución de una variable cuantitativa o numérica.
Para construirlo se representa sobre el eje de abscisas los límites de la clase. Sobre el mismo
eje se construyen unos rectángulos que tienen por base la amplitud de la clase y por altura las
frecuencias absolutas respectivas.
Cálculo de los sectores: Un círculo completo son 360◦ (o 2π radianes). El ángulo de cada
porción debe ser proporcional a la frecuencia de cada valor. Por ejemplo, si un valor representa
un 50 % del total de elementos, su sector del círculo tendrá un ángulo de 180◦ (o π radianes).
Sea (x1 , x2 , . . . , xn ) un conjunto de elementos. La fórmula para calcular el ángulo de cada sector
es la siguiente:
360◦
α = · fi = 360◦ · ni
N
2π
α = · fi = 2π · ni
N
Ejemplo 1.5.
Tabla de frecuencias
Color fi Fi ni Ni
Negro 4 4 0,20 0,20
Azul 5 9 0,25 0,45
Amarillo 5 14 0,25 0,70
Ro jo 6 20 0,3 1
Total 20 1
Ejemplo 1.6.
Con base a la tabla de frecuencias del ejemplo 1.2 realizamos los diagramas de barras y
circular respectivamente
Tabla de frecuencias
xi fi Fi ni Ni pi Pi
15 8 8 0,26 0,26 26 % 26 %
16 7 15 0,23 0,5 23 % 50 %
17 8 23 0,26 0,76 26 % 76 %
18 4 27 0,13 0,9 13 % 90 %
19 3 30 0,1 1 10 % 100 %
Total 30 1 100 %
Ejemplo 1.7.
Los diagramas de barras y circular para el ejemplo 1.3 son como sigue...
Tabla de frecuencias
xi fi Fi ni Ni pi Pi
1 4 4 0,2 0,2 20 % 20 %
2 7 11 0,35 0,55 35 % 55 %
3 5 16 0,25 0,8 25 % 80 %
4 3 19 0,15 0,95 15 % 95 %
5 1 20 0,05 1 5% 100 %
Total 20 1 100 %
? Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos,
se debe determinar la frecuencia absoluta ( fi ) correspondiente a cada intervalo, contando
la cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan
las frecuencias relativas y acumuladas, si es pertinente...
•La suma de los extremos del intervalo entre dos nos da la marca de clase (punto medio del
intervalo).
• Si no se conocen los intervalos, se pueden determinar de la siguiente manera:
? La diferencia entre el valor máximo de la variable y el valor mínimo nos da el rango (R).
• Comenzando por el mínimo valor mínimo de la variable, que será el extremo inferior del
primer intervalo, se suma a este valor la amplitud para obtener el extremo superior y así
sucesivamente. Veamos como se resuelve el siguiente ejercicio.
Ejemplo 1.8.
Los datos que se muestran a continuación representan el costo de la energía eléctrica durante
el mes de Julio del 2018 para una muestra aleatoria de 50 viviendas con tres habitaciones en
montería.
96 171 202 178 147 102 153 197 127 82 157 185 90 116 172 111 148 213 130 165 141 149 206 175 123
128 144 168 109 167 95 163 206 175 130 143 187 166 139 149 108 119 150 154 114 135 191 137 129 158
Solución:
a) Tabla de frecuencias
b) Histograma
Ejemplo 1.9.
En una maternidad se han tomado los pesos (en kilogramos) de 50 recién nacidos:
2,8 3,2 3,8 2,5 2,7 3,7 1,9 2,6 3,5 2,3 3,0 2,6 1,8 3,3 2,9 2,1 3,4 2,8 3,1 3,9 2,9 3,5 3,0 3,1 2,2 3,4 2,5
1,9 3,0 2,9 2,4 3,4 2,0 2,6 3,1 2,3 3,5 2,9 3,0 2,7 2,9 2,8 2,7 3,1 3,0 3,1 2,8 2,6 2,9 3,3
Solución:
b. Tabla de frecuencias:
? Li = 1, 8 y Ls = 3, 9, entonces Rango: 3, 9 − 1, 8 = 2, 1 = xi .
2,1
? Amplitud del intervalo: 6 = 0,35 se aproxima a 0,4, es decir, cada intervalo tendrá una
amplitud de 0,4
c. Histograma
Ejemplo 1.10.
Solución:
a. Tabla de frecuencias
fi Fi
Xi fi Fi ni = N Ni = N
9 2 2 0, 04 0, 04
10 4 6 0, 08 0, 12
11 10 16 0, 20 0, 32
12 10 26 0, 20 0, 52
13 5 31 0, 10 0, 62
14 3 34 0, 06 0, 68
15 6 40 0, 12 0, 8
16 5 45 0, 1 0, 9
17 2 47 0, 04 0, 94
18 2 49 0, 04 0, 98
19 1 50 0, 02 1
50 1
ni Ni ni
[Li − Li+1 ) Xi ni Ni fi = N Fi = N ci di = ci
8 − 11 9, 5 6 6 0, 12 0, 12 3 2
11 − 14 12, 5 25 31 0, 50 0, 62 3 8, 33
14 − 17 15, 5 14 45 0, 3 0, 90 3 4, 67
17 − 20 18, 5 5 50 0, 10 1 3 1, 67
50 1 12
Ejercicios 1.2.
1. Los datos siguientes corresponden a los tiempos de reacción de una muestra de 33 sujetos,
medidos en centésimas de segundo:
55, 51, 60, 56, 64, 56, 63, 63, 61, 57, 63, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74, 65, 58, 61, 62,
59, 64, 57, 63, 52, 67
a) Con los datos anteriores construya una distribución de frecuencia, con amplitud (a = 5).
2. Los siguientes datos representan la presión sanguínea tomada a 30 personas, las cuales se
sometieron a un examen de laboratorio.
108, 113, 136, 122, 130, 114, 115, 132, 123, 110, 126, 109, 125, 122, 119, 118, 119, 106, 115, 124, 118, 111, 124,
113, 124, 109, 121, 121, 108, 119
3. Los datos que se dan a continuación corresponden a los pesos en Kg. de ochenta personas:
60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61; 63; 69; 80; 59; 66; 70; 67;
78; 75; 64; 71; 81; 62; 64; 69; 68; 72; 83; 56; 65; 74; 67; 54; 65; 65; 69; 61; 67; 73; 57; 62; 67; 68;
63; 67; 71; 68; 76;
a) Realiza la tabla de frecuencias con intervalos de amplitud (a = 5), siendo el primer intervalo
[50; 55], y responda la pregunta “b”
b) ¿Cuántas personas tienen peso mayor o igual que 70 Kg? pero menor que 85?
5. Los 40 alumnos de una clase han obtenido las siguientes notas, sobre 50, en un examen X.
33, 35, 30, 37, 27, 31, 41, 20, 16, 26, 45, 37, 9, 41, 28, 21, 31, 35, 10, 26, 11, 34, 36, 12, 22, 17, 33, 43,
19, 48, 38, 25, 36, 32, 38, 28, 30, 36, 39, 40.
6. En una maternidad se han tomado los pesos (en kg) de 50 recién nacidos:
2,8; 3,2; 3,8; 2,5; 2,7; 3,7; 1,9; 2,6; 3,5; 2,3; 3,0; 2,6; 1,8; 3,3; 2,9; 2,1; 3,4; 2,8; 3,1; 3,9; 2,9; 3,5; 3,0; 3,1;
2,2; 3,4; 2,5; 1,9; 3,0; 2,9; 2,4; 3,4; 2,0; 2,6; 3,1; 2,3; 3,5; 2,9; 3,0; 2,7; 2,9; 2,8; 2,7; 3,1; 3,0; 3,1; 2,8;
2,6; 2,9; 3,3
a) Construye una tabla con los datos agrupados en 6 intervalos de amplitud 0,4 kg.
7. Los goles que se han marcado en la última jornada de liga han sido en los siguientes minutos
de juego:
20, 11, 89, 3, 20, 4, 2, 35, 50, 29, 59, 30, 90, 33, 78, 54, 21, 19, 60, 34, 56, 63, 45, 31, 26, 32, 5, 78,
88, 85, 34.
? Debe ser objetiva y definida por una fórmula algebraica, de tal manera que cualquiera
que sea la persona que trabaje con la distribución, se obtenga siempre el mismo valor.
? Debe ser descriptiva de los datos, de manera que su significado sea fácil de entender.
? No debe ser una abstracción matemática, que únicamente pueda ser entendida por per-
sonas muy versadas en esta ciencia, ya que una de las condiciones de la estadística, es
simplificar los datos y no hacerlos más complejos.
? Debe ser fácil de calcular, pero esta condición no debe preferirse en prejuicio de otras
ventajas.
? Debe depender de cada uno de los elementos del grupo, de tal manera que si se altera
alguno de éstos, consecuentemente se altera el valor del promedio ya que por definición,
ésta es representante típica de todos los miembros del grupo y no solamente del alguno
de ellos.
? A pesar de que cada uno de los valores de los elementos del grupo debe tener influencia
en el valor de la medida, ésta debe ser de tal calidad que no se deje afectar demasiado
por alguno o algunos pocos valores.
Ventajas.
? Esta medida se define mediante una ecuación matemática muy fácil de entender y al-
gunas veces se puede obtener cuando no es posible calcular otros tipos de medidas de
tendencia central o de posición y, aún en el casos de no conocerse los valores indivi-
duales de la serie, por ejemplo: si 10 familias consumen 20 litros de leche, el promedio
aritmético será de 2 litros por familia.
? Como ventaja final, se podrá anotar que es excepcionalmente adaptable cuando se trata
de hacer cálculos matemáticos posteriores con él.
Desventajas.
? Es muy sensible a valores muy pequeños o grandes, especialmente cuando estos últimos
se encuentren incluidos en la distribución que se está estudiando, puede resultar en un
promedio que no represente lo típico para el total del grupo.
Esta medida, por lo general, se representa mediante una equis con una raya o trazo colocado
en su parte superior, sin embargo se utilizan otros símbolos como se pueden observar a
continuación: a, ay , ax , M[x] , M[y] , x, y, M[x] , µ.
Ejemplo 2.1.
Ejemplo 2.2.
Ejemplo 2.3.
2.2. Mediana
La mediana, es considerada también, al igual que la Media, como una medida de tendencia
central. Su importancia es menor, sus fórmulas son rígidas ya que no admiten tratamiento
algebraico, es por eso que tendremos que aplicar seis procedimientos de cálculo diferente, que
lo hace un poco dispendioso y poco atractivo, como veremos más adelante;
Se define como «aquel valor de la variable que supera a no más de la mitad de las obser-
vaciones, al mismo tiempo, es superado por no más de la mitad de las observaciones»
en otras palabras, se puede definir como el «valor central». Se simboliza por Me , y su fórmula
de aplicación es:
Ventajas.
? Esta medida tiene una definición bastante rígida y el concepto de ella es tan claro, que
cualquier persona lo entiende, aún sin ser familiar su término.
? Los datos deben estar ordenados, pero los valores extremos no tienen ninguna incidencia
en su cálculo.
? Tiene menor estabilidad en el muestreo que el promedio aritmético, pero mayor estabi-
lidad que otras medidas.
? Hay situaciones en que la única medida de tendencia central que puede utilizarse es
la mediana, especialmente cuando los valores extremos de una distribución de variable
continua no están definidos.
Desventajas.
? Esta medida no se adapta a cálculos posteriores aritméticos, por cuanto que si obtenemos
las medianas de diferentes grupos, no se podrá calcular una mediana para el conjunto.
t A continuación se muestran los criterios para construir la mediana. Se puede construir los
siguientes criterios:
Cálculo en datos sin agrupar u originales
a. Número impar de observaciones. Cuando esta medida la aplicamos en los datos originales
o sin agrupar, lo primero que se debe hacer, es ordenarlos de menor a mayor o de mayor
a menor.
Ejemplo 2.4.
Ejemplo 2.5.
observación y la mediana será igual a Me = x j = 10, el valor promedio de los dos valores
centrales.
1. Calcular el valor n
2
Donde:
? Me = Mediana
Ejemplo 2.6.
2.3. Moda
Se define como «el valor de la variable que más se repite» o «aquel valor que presenta
la máxima frecuencia». Puede suceder que una distribución tengas dos Modas, en este caso
se dice que la distribución es Binomial, en el caso que haya más de dos modas, se dice que
es plurimodal o multimodal. Es la única medida de posición que puede ser utilizada en
atributos, es decir, cuando la característica es cualitativa. Modo, Moda o valor Modal, medida
originalmente concebida, como aquel valor de la variable, que presenta el mayor número de
observaciones, es decir, el valor de la variable que más veces se repite. Se empleó formalmente
en 1,984 por Karl Pearson, ya que no era utilizado anteriormente.
Desventajas.
? El hecho que la moda nos indique el punto de mayor concentración, lo hacer tal vez,
la mejor medida de tendencia central. Cuando una distribución es muy asimétrica,
claramente se ve que la moda es el más representativo del grupo, y en algunos casos, si
la moda y el promedio aritmético son significativamente diferentes al valor, es preferible
usar la moda.
Ventajas.
? No es sensible, especialmente cuando hay cambios en los valores de la variable, salvo que
no afecten a su propio valor.
Ejemplo 2.7.
Consideremos los siguientes datos: 5, 10, 8, 5, 10, 18, 5, 12, 5, 12 calculemos la media, la
mediada y la moda. n = 10.
Media → x = ∑nxi = 9010 = 9
Mediana →Ordenamos los datos de mayor a menor o de menor a mayor
5 5 5 5 8 10 10 12 12 18
Me
Posición: n+1
2 2 = 5, 5ª La mediana se encuentra entre la 5ª y la 6ª observación
= 10+1
x j−1 +x j
Siendo: Me = 8+10
2 =9 Me = 2
Moda →Corresponderá a 5, siendo el valor de la variable que más se repite → Md = x j = 5
Al forjarnos una imagen mental de la distribución de frecuencias de un conjunto de mediciones,
una de las primeras apreciaciones descriptivas de interés es una medida de tendencia central,
es decir, una que localiza el centro de la distribución. Una de las medidas de tendencia central
más común y útil es la media común o “media aritmética”, pero también son de importancia,
según las circunstancias y el tipo de variables la “moda” y la “mediana”.
Ejemplo 2.8.
Donde:
? Mo = Moda
? Li = Límite inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).
Ejemplo 2.9.
? La Media Cuadrática.
Ejemplo 2.10.
Consideremos los datos que muestra la siguiente tabla, resultado de gastos diarios en periódicos
de una determinada empresa.
[Li − Li+1 ) Xi fi hi Fi Hi
5,2 − 6,1 5,65 3 0,094 3 0,094
6,1 − 7,0 6,55 5 0,156 8 0,250
7,0 − 7,9 7,45 9 0,281 17 0,531
7,9 − 8,8 8,35 7 0,219 24 0,750
8,8 − 9,7 9,25 3 0,156 29 0,906
9,7 − 10,6 10,15 2 0,094 32 1,000
T OTAL 32 1,000
....................................................................................
Hallemos el 80º percentil:
Son 99 valores que dividen a un conjunto de datos en 100 partes iguales, los percentiles se
calculan con la fórmula:
kn
c 100 − Fi−1
Pk = Li +
fi
donde;
Li =límite inferior del intervalo que contiene al percentil
Fi−1 =frecuencia acumulada en la clase anterior k-ésima
fi =frecuencia en la clase que contiene al percentiles
c =tamaño del intervalo de clase
k =1º, 2º, 3º,...,99º percentiles
De este modo, el percentil 80º de acuerdo a la tabla, estará en el intervalo 5, es decir,
c( 80n −F )
P80º = Li + 100 fi i−1 = 8,8 + 0,9(25,6−24)
5 = 9,088
El 80 % de los datos serán menores a 9,088 y el 20 % restante serán mayores.
....................................................................................
Hallemos el 3er cuartil.
El cuartil 3 (percentil 75º) se ubicara en el cuarto intervalo, así:
c( 75n −F )
P75º = Li + 100 fi i−1 = 7,9 + 0,9(24−17)
7 = 8,8
El 75 % de los datos serán menores a 8,8 y el 25 % restante serán mayores.
....................................................................................
Hallemos ahora el 7º decil.
El decil 7 (percentil 70º) se ubicara en el cuarto intervalo, así:
c( 70n −F )
P70º = Li + 100 fi i−1 = 7,9 + 0,9(22,4−17)
7 = 8,594
El 70 % de los datos serán menores a 8,594 y el 30 % restante serán mayores a 8,594.
Los tipos de medidas de dispersión más comunes son: “el rango” “la desviación Estándar o
típica” y la “Varianza” y el coeficiente de variación.
2.4.1. Rango
Se define como la diferencia que existe entre el valor mayor y el valor menor de una distribución,
Se indica como R. Se calcula de la siguiente forma: R= Valor Mayor – Valor Menor
2.4.2. Varianza
Es una medida cuya importancia radica especialmente en que da origen a otra medida de
dispersión más significativa, denominada desviación estándar o desviación típica. Es la media
de los cuadrados de las desviaciones, y la denotaremos por Sx2 o también por σ 2 . Las fórmulas
para la varianza poblacional y la varianza muestral son un poco diferente:
? Varianza muestral:
n 2
∑i=1 xi − X
Sx2 = para datos no agrupados
n−1
n 2
∑i=1 fi xi − X
Sx2 = para datos agrupados
n−1
? Varianza poblacional:
n 2
∑i=1 xi − X
σx2 = para datos no agrupados
N
n 2
∑i=1 fi xi − X
σx2 = para datos agrupados
N
donde:
? S = designa la desviación estándar o desviación típica.
? X = media aritmética.
Ejemplo 2.11.
2
∑ (xi − x) ni
s2 = para la muestra y,
n
2
∑ Xi − X ni
σ2 = para la población.
N
La desviación típica, es la medida de dispersión más utilizada y de mayor utilidad, dado que
las unidades son expresadas en la misma variable; mientras que, la varianza se expresan en las
mismas unidades pero al cuadrado.
Sx
CV = , x 6= 0
|x|
Ejemplo 2.12.
s 5
CV = × 100 = × 100 = 125 %
x 4
3.1.1. Permutaciones
Las permutaciones consisten en cambiar el orden de un conjunto, y poder determinar cuántas
posibilidades de ver de distinta forma ordenado el conjunto existen, por ejemplo; sea M =
m1 , m2 , m3 , m4 , ..., mn un conjunto de n elementos, entonces las posibilidades que tengo para
poner en cada casillero será: en la primera posición puedo colocar cualquiera de los n elementos,
en la segunda puedo colocar cualquiera de los que me quedan, que son (n − 1), en la tercera
posición puedo colocar solo (n − 2) elementos y así voy quedándome con un elemento menos
a medida que avanzo en los casilleros, hasta que me quedo solo con un elemento en la última
posición, es decir:
M = | {z } , | {z } , | {z } , | {z } , ..., |{z} , |{z} , |{z}
n opciones n−1 opciones n−2 opciones n−3 opciones 3 opciones 2 opciones 1 opción
A éste número lo conocemos como factorial de n, lo simbolizamos como n!, por lo tanto las
permutaciones que puedo hacer sobre un conjunto de n elementos será:
Pn elementos = n!
Ejemplo 3.1.
Ejemplo 3.2.
m!
Am
n =
(m−n)!
5!
A52 =
(5 − 2)!
5 · 4 · 3!
A52 =
3!
A52 = 20 Arreglos distintos
Ejemplo 3.3.
¿De cuántas maneras pueden sentarse 10 personas en un banco si hay 4 sitios disponibles?
Respuesta:
Nótese que importa el orden en que se sientan las personas, ya que los cuatro sitios son
diferentes, y que una persona no puede ocupar más de un sitio a la vez. Por lo tanto, hay
m!
Am
n =
(m−n)!
10!
A10
4 =
(10 − 4)!
10!
A10
4 =
6!
10 · 9 · 8 · 7 · 6!
A10
4 = = 10,9,8,7 = 5040 maneras
6!
Ejemplo 3.4.
En una clase de 10 alumnos van a distribuirse 3 premios. Averiguar de cuántos modos puede
hacerse si:
Hay dos supuestos posibles: Si una misma persona no puede recibir más de un premio:
? Suponemos que NO puede recibir más de un premio, luego los alumnos NO se pueden
repetir:
Caso 1. Los premios son diferentes (no es lo mismo ganar el primer premio que el segundo)
importa el orden, hay:
m!
Am
n =
(m−n)!
10!
A10
3 =
(10 − 3)!
10!
A10
3 =
7! · 3!
10 · 9 · 8 · 7!
A10
3 = = 10,9,8 = 720 manera de distribuir los premios si estos son diferentes;
7!
3.1.3. Combinaciones
Las combinaciones son muy parecidas a los arreglos, con la diferencia en que en los con-
juntos que se forman no importa el orden de manera que α, β , γ = γ, β , α. El número de
combinaciones de a n elementos que puedo hacer de un total de m elementos será:
m!
Cnm =
n!·(m−n)!
Ejemplo 3.5.
Javier, Gonzalo, Manuel, Pamela y Paola se han postulado a la directiva de su curso, pero solo 3
de ellos pueden quedar, ¿cuántas directivas posibles hay?.
Respuesta :
En éste caso se trata de formar combinaciones entre los postulantes, pues si por ejemplo se elije
a Javier, Gonzalo y Paola es lo mismo que se elija a Paola, Gonzalo y a Javier, lo que corresponde
a una combinación de 3 elementos de un total de 5, por lo tanto:
m!
Cnm =
n!·(m−n)!
5!
C35 =
3!. (5 − 3)!
5,4,3!
C35 =
3!,2!
20
C35 = = 10 posibles directivas distintas
2
Ejemplo 3.6. (Se refiere a la parte b) del último ejemplo de los arreglos)
m!
Cnm =
n! · (m−n)!
10!
C310 =
(10 − 3)! · 3!
10!
C310 =
7! · 3!
10 · 9 · 8
C310 = = 120 maneras de distribuir los premios si estos son iguales.
3·2·1
3.2. Probabilidad
Las Probabilidades pertenecen a la rama de la matemática que estudia ciertos experimentos
llamados aleatorios; o sea, regidos por el azar, en que se conocen todos los resultados posibles,
pero no es posible tener certeza de cuál será en particular el resultado del experimento.
Ejemplo, experimentos aleatorios cotidianos son el lanzamiento de una moneda, el lanzamiento
de un dado, extracción de una carta de un mazo de naipes. Más adelante se verá que debemos
distinguir entre los conceptos de probabilidades matemáticas o clásicas de las probabilidades
experimentales o estadísticas.
LA PROBABILIDAD es el estudio de los fenómenos de los que no estamos seguros de su
ocurrencia.
FENÓMENO: un fenómeno es la ocurrencia de un hecho o suceso. Los que nos interesan son
aquellos fenómenos los cuales podemos observar.
Ejemplos de experimentos; Lanzamiento de un dado, lanzamiento de una moneda, un mazo de
cartas, esferas en una urna, etcétera.
EXPERIMENTO: es un fenómeno observable perfectamente definido.
Ejemplo 3.7.
E1 : Lanzar una moneda genuina y observar el lado que cae hacia arriba.
S1 : {C, S}
Ejemplo 3.8.
E2 : Lanzar tres veces una moneda genuina y observar la secuencia «caras» y «sellos».
S2 : {CCC,CCS,CSC,CSS, SCC, SCS, SSC, SSS}
Ejemplo 3.9.
E3 : Lanzar tres veces una moneda genuina y observar el número total de «caras».
S3 : {0, 1, 2, 3}
Ejemplo 3.10.
Ejemplo 3.11.
[1]
[Wal12] Myers Walpole, Myers. Probabilidad y EstadÃstica para IngenierÃa y Ciencias. 9º Ed.
2012.
41