You are on page 1of 45

Definiciones y recolección de datos.

Mtro. Jorge Manuel Morales


Castro.
Introducción.

 La estadística resulta una herramienta útil en


diferentes ciencias y disciplinas, por ejemplo: en la
economía, en la política, en la educación, etc.
 En general suelen distinguirse dos formas de hacer un
estudio estadístico:
 La variante descriptiva, que se refiere a la recopilación,
sistematización, descripción y presentación de datos.
 La variante inferencial, en la cual se crean conclusiones ,
inferencias y predicciones acerca del fenómeno que se
estudia.
 En nuestro curso solo se hará referencia a la
estadística descriptiva.
 Definam0s algunos términos importantes:
 Variable. Expresa la medición de alguna característica,
para lo cual se basa en un conjunto pre-establecido de
valores, llamado dominio de la variable, un ejemplo que
describe este concepto, es el siguiente si deseáramos
analizar el numero de hombres y mujeres que hay en
nuestro país, la característica (y la variable en este caso)
bajo estudio seria el sexo o genero de la población, y el
dominio de la variable estaría dado por los valores
masculino y femenino .
Clasificación de variables.

 Variables categóricas. Sus valores son expresiones


que se denominan categorías y funcionan de manera
que un individuo solo puede estar en una categoría.
 Variables numéricas. Sus valores son números y
pueden ser discretas ( si los números son enteros) o
continuas (si los números son reales).
Muestra y población.

 Población. La población o universo es el conjunto de


sujetos u objetos sobre los cuales se realiza el estudio
o bien a la colección de todos lo valores de la variable.
 Muestra. Es un subconjunto de la población, para que
esta sea estadística requiere ser representativa, es
decir debe de tener un tamaño adecuado e incluyente
respecto a todos los sujetos que conforman la
población.
Frecuencia.
 La distribución de frecuencias o tabla de frecuencias
es una ordenación en forma de tabla de los datos
estadísticos, asignando a cada dato su frecuencia
correspondiente.
 Frecuencia absoluta. La frecuencia absoluta es el
número de veces que aparece un determinado valor
en un estudio estadístico.
 Se representa por Fa.
 La suma de las frecuencias absolutas es igual al
número total de datos, que se representa por n.
𝑓1 + 𝑓2 + 𝑓3 + ⋯ . . +𝑓𝑛 = 𝑛
• Para indicar resumidamente estas sumas se utiliza la
letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria.
𝑖=𝑛

෍ 𝑓𝑖 = 𝑛
𝑖=1
 Frecuencia relativa. La frecuencia relativa es el
cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos.
 Se puede expresar en tantos por ciento y se
representa por Fr.
𝑓𝑖
𝐹𝑟 =
𝑛
 La suma de las frecuencias relativas es igual a 1.
 Frecuencia acumulada. La frecuencia acumulada es la
suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado, Se
representa por Fi.
 Frecuencia relativa acumulada. La frecuencia relativa
acumulada es el cociente entre la frecuencia
acumulada de un determinado valor y el número
total de datos. Se puede expresar en tantos por
ciento.
Ejemplo.

 En una escuela se midió el peso de 21 alumnos en


kilogramos y se obtuvieron los siguientes resultados:
 58, 42, 51, 54, 40, 39, 49, 56, 58, 57, 59, 63, 58, 63, 70,
72, 71, 69, 70, 68, 64
 Elaborar tabla en pizarrón con: dato, frecuencia
absoluta, frecuencia absoluta acumulada, frecuencia
relativa, frecuencia relativa acumulada, total de
frecuencias absolutas y relativas así como el total de
datos.
 Este tipo de tablas de frecuencias se utiliza con
variables discretas.
Actividad a realizar y entregar
próxima clase.

 Proponer un caso en donde sea posible el realizar una tabla de


frecuencias absolutas y relativas, realizar la tabla en donde se
contemplen las mismas columnas que en el ejemplo establecido.
 Nota: cada caso deberá de ser original, si se detectan copias de
este ejercicio serán anulados todos aquellos que sean iguales.
 El trabajo se entregará a mano en hojas de cuadricula (cuadro
chico o grande), letra legible, trabajo ordenado y limpio, con
nombre completo, procesos y operaciones a lápiz y resultados
finales a tinta.
 Trabajo que no cuente con procedimientos completos no se
tomará en cuenta.
Distribución de frecuencias
agrupadas.

 La distribución de frecuencias agrupadas o tabla con


datos agrupados se emplea si las variables toman un
número grande de valores o la variable es continua.
 Se agrupan los valores en intervalos que tengan la
misma amplitud denominados clases. A cada clase se
le asigna su frecuencia correspondiente.
 Límites de clase. Cada clase está delimitada por el
límite inferior de la clase y el límite superior de la
clase.
 Amplitud de la clase. La amplitud de la clase es la
diferencia entre el límite superior e inferior de la
clase.
 Marca de clase. La marca de clase es el punto medio
de cada intervalo y es el valor que representa a todo
el intervalo para el cálculo de algunos parámetros.
Construcción de una tabla de datos
agrupados.
 Ejemplo. Se tienen los siguiente datos:
5,10,15,20,20,20, 25,25, 30, 35, 5, 10, 15, 20, 20, 20, 25, 25,
30, 35, 5, 10, 15, 20, 20, 20, 25, 25, 30, 40, 10, 15, 15, 20, 20,
25, 25, 25, 30, 40, 10, 15, 20, 20, 20, 25, 25, 25, 30, 45.
Determinar los intervalos de clase (considera que se
desea obtener un total de 8 intervalos), la marca de
clase y la frecuencia absoluta, la frecuencia relativa, la
frecuencia absoluta acumulada y la frecuencia relativa
acumulada.
Pasos a seguir.

 Primer paso. Se ordenan los datos de menor a mayor.

5 10 15 20 20 20 25 25 30 35

5 10 15 20 20 20 25 25 30 35

5 10 15 20 20 20 25 25 30 40

10 15 15 20 20 25 25 25 30 40

10 15 20 20 20 25 25 25 30 45
 Ahora determinaremos la amplitud del intervalo, para
ello calculamos el rango:
𝑅 = 𝐶𝑀 − 𝑐𝑚
Donde:
𝐶𝑀 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑚𝑎𝑦𝑜𝑟
𝑐𝑚 = 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑚𝑒𝑛𝑜𝑟.
Entonces:
𝑅 = 45 − 5 = 40
Ahora el tamaño del intervalo…

 Calculemos el tamaño del intervalo:


𝑅
𝑖=
𝑛𝑖
Donde:
𝑅 = 𝑟𝑎𝑛𝑔𝑜
𝑛𝑖 = 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑠𝑜𝑙𝑖𝑐𝑖𝑡𝑎𝑑𝑜.
Entonces:
40
𝑖= =5
8
 Entonces podemos decir que el primer intervalo queda
determinado como:
[5 − 9]
• De donde podemos decir que el limite superior de este
intervalo es 9 y el inferior es de 5, entonces la marca de
clase la determinamos con:
𝐿1 +𝐿2
𝑥=
2
de donde:
𝐿1 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝐿2 = 𝑙í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟.
Entonces:
5 + 9 14
𝑥= = =7
2 2
Tabla de Frecuencias.
intervalo Marc Fa Fr
a de
clase
5–9 7 3 3/50=
10- 14 12 5 5/50=
15 – 19 17 6 6/50=
20 – 24 22 14 14/50=
25 – 29 27 12 12/50=
30 – 34 32 5 5/50=
35 – 39 37 2 2/50=
40 – 44 42 2 2/50=
45 – 49 47 1 1/50=
Frec.acum - 50 1
1. Se obtuvieron los siguientes datos de las medidas de
la longitud recorrida por varios atletas en diversos
eventos, todos ellos en km.
5, 10, 9, 10, 4, 3, 5, 6, 7, 8, 9,9, 10,
8,8,5,5,3,3,7,6,5,8,9,10,3,6,7,9,5,8,10,6,8,3,5,7,6,8,9,10, 3,
6,4,6,8,9,10,3,4,5,7,6,8,9,10,3,4,6,5.
Se desea obtener un total de 3 intervalos.
Realiza una tabla de frecuencias acumuladas que incluya
el número de intervalos señalados, la marca de clase, la
frecuencia absoluta para cada intervalo, la frecuencia
relativa expresada en decimal y %, la frecuencia absoluta
acumulada y la frecuencia relativa acumulada.
Representación grafica de estudios
estadísticos.
 Histograma. Es una representación grafica de datos
agrupados o no agrupados, la cual es representada
por medio de puntos que se unen por medio de
líneas, para ello colocaremos en el eje de las “x” el o
los datos o bien los intervalos obtenidos de una
variable continua y el eje de las “y” para la frecuencia
absoluta de cada dato o intervalo de datos.
 Tracemos el histograma de la tabla de datos que se
obtuvo en el ejemplo de la tabla de frecuencias para
el ejemplo de variable continua realizado.
intervalo Fa
16
5–9 3
10- 14 5 14

15 – 19 6 12

20 – 24 14 10

25 – 29 12 8
Series1
30 – 34 5 6

35 – 39 2 4

40 – 44 2
2
45 – 49 1
0
Frec.acu 50 5–9 10 – 14 15 – 19 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49

m
Diagrama de sectores o circular
 Para trazar este tipo de diagramas se multiplica el
valor de la frecuencia relativa por 360º, agreguemos
esta columna a la tabla de frecuencias obtenida en el
ejemplo de variable continua, con la tabla de
frecuencias obtenido.
intervalo Fa Fr Grados
5–9 3 3/50= 0.06 0.06x360= 21.6º
10- 14 5 5/50= 0.1 0.1x360=36º
15 – 19 6 6/50= 0.12 0.12x360= 43º
20 – 24 14 14/50= 0.28 0.28x360=100.8º
25 – 29 12 12/50= 0.24 0.24x360=86.4º
30 – 34 5 5/50= 0.1 0.1x360=36º
35 – 39 2 2/50= 0.04 0.04x360= 14.4º
40 – 44 2 2/50= 0.04 0.04x360= 14.4º
45 – 49 1 1/50= 0.02 0.02x360= 7.2º
Frec.acu 50 1 360º
m
La gráfica queda como….

5–9
10 – 14
15 – 19
20 – 24
25 – 29
30 – 34
35 – 39
40 – 44
45 – 49
Diagrama de Barras.

 Al igual que con el histograma emplearemos en el eje


“x” como el eje de datos o datos agrupados y en el
eje de las “y” colocaremos la frecuencia absoluta de
cada dato o de cada dato agrupado, hagámoslo para
la tabla de datos agrupados del segundo ejemplo
trabajado en clase.
intervalo Fa
16
5–9 3
14
10- 14 5
12
15 – 19 6
20 – 24 14 10

25 – 29 12 8
Series1
30 – 34 5
6
35 – 39 2
4
40 – 44 2
45 – 49 1 2

Frec.acu 50 0
5–9 10 – 14 15 – 19 20 – 24 25 – 29 30 – 34 35 – 39 40 – 44 45 – 49
m
Diagramas de Ojivas.
 Se llama ojiva a la gráfica de una distribución de
frecuencia acumulativa.
Gráfica de dispersión.
 En este tipo de grafica se emplean como datos
también la frecuencia absoluta y el dato o el intervalo
de datos, para ejemplificar este tipo de grafico
usemos la tabla de frecuencias obtenida para el caso
de variable continua.
intervalo Fa
5–9 3 Fa
16
10- 14 5
14
15 – 19 6
12
20 – 24 14
10
25 – 29 12
8
Fa
30 – 34 5
6
35 – 39 2
4
40 – 44 2
2
45 – 49 1
0
Frec.acu 50 0 2 4 6 8 10

m
Ejercicio.
 Se tienen los siguientes datos obtenidos de una encuesta:
25, 32, 27, 27, 28, 32, 31, 32, 31, 28, 27, 27, 27, 25, 25, 32, 32,
27, 27, 31, 32,32, 28, 28,27, 25, 31, 32, 33,
32,33,25,33,33,24,25,30,33,33,22,21,34,36,37,34,37.
a) Realiza una tabla de frecuencias en donde expreses la
frecuencia absoluta, frecuencia absoluta acumulada,
frecuencia relativa, frecuencia relativa acumulada y los
grados que requieres para elaborar la grafica de pastel.
b) Realiza las graficas: histograma, barras, pastel, de
dispersión y ojivas, usa colores, regla y compás para
realizarlas y entrega tu trabajo a tu profesor en hojas
cuadriculadas a color, limpias y ordenadas, con
procedimientos a lápiz y resultados finales a tinta.
c) Trabajo que no cuente con estas características no tendrá
valor.
Estadística para datos NO agrupados.
 Medidas de tendencia central. Las medidas de

tendencia central son: la media aritmética (𝑋),
mediana y moda.
 Media aritmética (𝑿
ഥ ) . Es el promedio de todos los
datos y podemos definirla algebraicamente como:
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ … 𝒙𝒏

𝑿=
𝒏
O bien:
𝒇𝟏 𝒙𝟏 + 𝒇𝟐 𝒙𝟐 + 𝒇𝟑 𝒙𝟑 + ⋯ … . 𝒇𝒏 (𝒙𝒏 )
𝑿ഥ=
𝒏
 Mediana. Es el dato que se encuentra en el centro de
un conjunto de datos, en el caso de un numero par de
datos se toman los dos que se encuentren en el
centro y se realiza un promedio de ellos.
 Moda. Es el dato o datos que presentan la mayor
frecuencia absoluta, es decir el dato o datos que mas
se repiten.
Medidas de dispersión para datos no
agrupados.
 Las medidas de dispersión nos informan sobre cuánto
se alejan del centro los valores de la distribución, Las
medidas de dispersión son:
 Rango o recorrido. El rango es la diferencia entre el
mayor y el menor de los datos de una distribución
estadística.
 Desviación media. La desviación respecto a la media es
la diferencia entre cada valor de la variable estadística y
la media aritmética.
𝑫𝑰 = 𝒙 − 𝑿ഥ
Ejemplo.
 Se tienen los siguientes datos obtenidos de un
estudio estadístico: 13, 15, 12, 13, 15, 16, 17, 18, 19, 20,
13, 15, 16 ,17, 14, 18 ,19, 16, 15, 12, 17, 13, 14, 16, 16, 17, 17,
14, 15, 20.
 Realizar:
 Una tabla de frecuencias para los datos (incluir
frecuencia absoluta y relativa, considerando el conjunto
de datos como una variable discreta).
 Calcular su media aritmética, mediana, moda y su
desviación media (coloca esta información en una
columna después de la columna de la frecuencia
relativa).
Finalmente……

 La desviación media para los datos anteriores la podemos


calcular con la fórmula:
│𝑥1 − 𝑋│ത + │𝑥2 − 𝑋│ത + │𝑥3 − 𝑋│ത + ⋯ . +│𝑥𝑛 − 𝑋│ത
𝐷𝑋ത =
𝑛
Estadística para datos agrupados.
Desviación media para datos agrupados. Si los datos vienen
agrupados en una tabla de frecuencias, la expresión de la
desviación media es:

ഥ │𝒇𝟏 + │𝒙𝟐 − 𝑿
│𝒙𝟏 − 𝑿 ഥ │𝒇𝟐 + │𝒙𝟑 − 𝑿
ഥ │𝒇𝟑 + ⋯ . +│𝒙𝒏 − 𝑿
ഥ │𝒇𝒏
𝑫𝑿ഥ =
𝒏
 Ejemplo. Calcular la desviación media de la
distribución:

𝒙𝒊 𝒇𝒊 𝒙𝒊 ∙ 𝒇 𝒊 ഥ │ │𝒙𝒊 − 𝑿
│𝒙𝒊 − 𝑿 ഥ │ ∙ 𝒇𝒊

[10,16] 12.5 3
[15,20] 17.5 5
[20,25] 22.5 7
[25,30] 27.5 4
[30,35] 32.5 2
21

Concluir tabla.
Varianza.

 La varianza es la media aritmética del cuadrado de las


desviaciones respecto a la media de una distribución
estadística.
 La varianza se representa por 𝜎 2

𝑥1 −𝑋ത 2 𝑓1 + 𝑥2 −𝑋ത 2 𝑓2 + 𝑥3 −𝑋ത 2 𝑓3 +⋯…..+ 𝑥𝑛 −𝑋ത 2 𝑓𝑛


𝜎2=
𝑛
Ejemplos.

 Calcular la varianza de la distribución: 9, 3, 8, 8, 9, 8, 9


18
9 + 3 + 8 + 8 + 9 + 8 + 9 + 18
𝑋ത = =9
8
2 9−9 2 (3)+ 3−9 2 (1)+ 8−9 2 (3)+ 18−9 2 (1)
𝜎 = = 15
8
La varianza para datos agrupados
es….

2 2 2
𝑥1 1𝑓 + 𝑥2 2𝑓 + ⋯ … … . +𝑥𝑛 𝑓𝑛
2
𝛿 = = 𝑋ത 2
𝑛
Ahora para datos agrupados…

 Calcular la varianza de la distribución de la siguiente


tabla:
𝒙𝒊 𝒇𝒊 𝒙𝒊 ∙ 𝒇𝒊 𝒙𝟐𝒊 ∙ 𝒇𝒊
[10, 20] 15 1
[20,30] 25 8
[30,40] 35 10
[40,50] 45 9
[50,60] 55 8
[60, 70] 65 4
[70, 80] 75 2
42
La desviación estándar…

 La desviación estándar es la raíz cuadrada de la


varianza, entonces:
𝛿 = 𝛿2
Esto tanto para datos agrupados y no agrupados.
Cuanta más pequeña sea la desviación estándar mayor
será la concentración de datos alrededor de la media.
Ejemplo.
 Calcular la desviación estándar para los datos
obtenidos en la tabla del ejemplo anterior.

You might also like