You are on page 1of 46

Introducción

La presente investigación se refiere al tema de la Estadística, que se puede definir


como la ciencia cuyo objetivo es reunir una información para facilitar al hombre el estudio
de datos masivos de individuos, grupos, series de hechos, etc. y deducir de ello gracias
al análisis de estos datos unos significados precisos o unas previsiones para el futuro.
Objetivos general

 Comprender la importancia del estudio de la de la estadística, para lo cual es necesario


un recorrido por sus conceptos, métodos e importancia y más definiciones, con el fin de
acercarnos un poco más al tema de la Estadística.

Objetivos específicos

 Aplicar apropiadamente los métodos estadísticos en la recolección de información


y procesos matemáticos básicos en cálculos estadísticos.

 Adquirir los conocimientos y habilidades sobre el tema, ser capaz de reconocer los
elementos habituales de la estadística

 Aplicar los fundamentos básicos para realizar un buen trabajo en clase,


también poder elaborar y representar un trabajo en forma grafica.
1. Variables

(CANAVOS, (1988)) La variable en una estadística es el grupo de valores que puede tomar
ciertas cualidades de una población del cual se está haciendo la investigación y entre estos
puede ser la natalidad, desnutrición, la edad, el peso, las notas de una evaluación, etc. y estos
pueden clasificarse en Cualitativas y cuantitativas.

1.1. Cualitativa

Es cuando se toma las cualidades o categorías en una investigación estadística como:


 Sexo (hombre, mujer)
 Salud (buena, regular, mala)

1.2. Cuantitativas
Son las variables que toman los valores numéricos de una investigación estadística
como:
 Número de casas (1, 2,)
 Edad (12,5; 24,3; 35;…)
1.3.Variable cualitativa nominal
Una variable cualitativa nominal presenta como es el objeto de investigación como el
estado civil de una persona, si es casado, soltero, separado, divorciado o viudo.
1.4.Variable cualitativa ordinal
Una variable cualitativa ordinal presenta un orden de a las respuestas de la investigación
como la nota de una evaluación: suspenso, aprobado, notable, sobresaliente.

2. Valores continuos y valores discretos.

Los valores discretos es la agrupación de las mismas especies, categorías o naturaleza


de objetos u personas como el primer, segundo y cuarto lugar de una competencia o el género
como mujeres y hombres.

2.1.Las variables discretas


son aquellas cuyas observaciones se agrupan ‘inherentemente’ o ‘naturalmente’ en
categorías, porque dichas variables por su naturaleza sólo pueden tomar ciertos valores
muy específicos. Otro ejemplo son las calificaciones o educación de los maestros. Podemos
crear las siguientes categorías para describir esta última variable: (a) educación primaria
completa, (b) educación secundaria completa, (c) educación superior incompleta, (d)
educación superior completa y (e) educación de postgrado.

2.2.Las variables continuas

Es la que agrupa cualquier característica de cierto objeto de investigación que no


precisamente establecidos por la ley sino por curiosidad e interés del ser humano como la
cantidad de remesa que ingresa en nuestro país, deportados que entran anualmente o
mensualmente en Guatemala, la edad de los empleados en diferentes instituciones, salario
que ganan los gerentes de empresas los cuales se pueden representar en cualquier valor
numérico intermedio en un rango. Una variable continua puede ser numérica o de
fecha/hora. Por ejemplo, la longitud de una pieza o la fecha y hora en que se recibe un
pago.

3. Instrumentos de medición

(CAMACHO, (2000))Es una operación estadística que se basa en hallar el resultado de


lo que se busca sobre la población total y esto se puede hacer de varias maneras dependiendo
de los objetivos planteados en la investigación, recursos humanos, financieros y tiempo de la
institución.

Para hallar un buen instrumento de medición se debe enfocar si se busca lo cuantitativo o


cualitativo de una investigación para poder elaborar uno y llevarlo a la práctica y entre estos
tenemos el Test.

3.1.El test
Es una forma para encuestar a las personas y tiene como objetivo lograr información sobre
rasgos definidos de la personalidad, la conducta o determinados comportamientos y
características individuales o colectivas de la persona como la (inteligencia, interés, actitudes,
aptitudes, rendimiento, memoria, manipulación, etc.). Esto se logra a base de preguntas,
actividades, manipulaciones los cuales no son observadas y evaluadas por el investigador y

3.2.Características de un Test
 Debe ser elaborados con palabras claras y concisas para que la persona entrevistada
comprenda el mensaje.
 Debe ser confiable, es decir ofrecer consistencia en sus resultados; éstos deben ser los
mismos siempre que se los aplique en idénticas condiciones quien quiera que lo haga.
 Debe ser objetivo, evitando todo riesgo de interpretación subjetiva del investigador. La
Objetividad es requisito indispensable para la confiabilidad.
 Debe ser económico, tanto en tiempo como en dinero y esfuerzo.
 Debe ser de interesante, para motivar el interés de los investigadores.

4. Muestra y población

4.1.Población

Según Chiner población; es “Todo el conjunto de elementos, finito o infinito, que tiene
una o varias características que satisfacen el objeto de estudio de una investigación” (Chiner,
2,011, pág. 30).

Dicho de otra manera: son todas las personas, animales, cosas u objetos que de cierto
rango en los que se le puede obtener un resultado fructífero para la realización de ciertos
problemas y así obtener un resultado para dar una posible solución. Un ejemplo de esto seria
los estudiantes del PEM en Matemática y Física del CUNOC.

María Dicovskiy Riobóo nos dice que

Una población es el conjunto homogéneo de elementos en el que se estudia una


característica dada. El censo es la forma de estudio de todos los elementos de
una población. Frecuentemente no es posible estudiar toda la población ya que
suele ser económicamente inviable o llevar tanto tiempo que es impracticable
(Riobóo, 2,008, pág. 80)

Para realizar una investigación la población tiene que ser parecido, ya que si la población
es diferente la investigación sería indistinta. Par la realización de la investigación a un cierto
tipo de población es necesario utilizar el censo, ya que a través de ello se puede obtener el
resultado, además para la investigación a veces no es posible realizar con toda la población si
no que solo una parte de ello, debido a que, si se lleva mucho tiempo, la investigación no tendría
sentido.

4.2.MUESTRA

Para Chiner, muestra: “Es cualquier subconjunto de una población y, para que sea válida, ha
de ser representativa de la población porque se va a trabajar con ella y las conclusiones se van
a extrapolar a la población”. (Chiner, 2,011, pág. 30)

Es la cantidad de elementos en lo que se quiere obtener una investigación para luego obtener
un resultado estadístico, para qué haiga muestra se requiere tener una población, ya que si la
población no se tendría el objeto de estudio. Un ejemplo de esto sería 200 estudiantes del PEM
en Matemática y Física del CUNOC.

Según Riobóo, refiriéndose a lo que es la muestra; “Como generalmente no se puede estudiar


la población, se selecciona un conjunto representativo de elementos de esta, que llamaremos
muestra” (Riobóo, 2,008, pág. 80)

La muestra es la parte tomada de toda la población o las que se utiliza para la realización de
cierto sondeo, en este caso no se toma todos los que están inmersos en la población si no que
es una parte mínima; porque si se tomara toda la población completa llevaría más tiempo la
investigación.

5. LOS DATOS PROCEDENCIA Y ORDENACIÓN.

Dicho de otra forma, se refiere a lo que es estadística y lo que es estadísticas.

5.1.Estadística

Según Becardino estadística “Se refiere a un conjunto de métodos, normas, reglas y principios
para observar, agrupar, describir, cuantificar y analizar el comportamiento de un grupo”.
(Bencardino, 2,011, pág. 384)

En otras palabras, que para obtener los datos a utilizar es necesario recurrir a diferentes
maneras, para lo cual nos ayudaran para agilizar el tipo de investigación a realizar. Para ello es
importante recurrir a diferentes técnicas, pautas, ordenas, entre otras cosas para obtener el
resultado.
5.2.ESTADÍSTICAS

Según Becardino “Se refiere a un ordenamiento sistemático de datos presentados en


forma de cuadros y gráficas. En otras palabras, la estadística son datos agrupados
metódicamente y consignados en publicaciones elaboradas por entidades, buscando que sean
conocidos por los interesados”. (Bencardino, 2,011, pág. 384)

Entonces con los datos obtenidos, se realizan un ordenamiento de las mismas, para
después obtener el resultado que se espera obtener, para así publicarlos con la intención de que
otras personas interesadas puedan ver y sacar sus propias conclusiones. Para realizar esto es
necesario de un ordenamiento de los diferentes datos en cuadros o a lo que se le llama tablas
estadísticas y representarlos en las diferentes gráficas, aptos para la investigación para su mejor
interpretación.

6. Intervalos, limites reales y marcas de clase

6.1.Intervalos

Para Chiner Intervalo es la “Distancia entre dos valores. Cualquier intervalo viene definido por
dos valores llamados límites de intervalo. Uno es el límite inferior y el otro el superior””.
(Chiner, 2,011, pág. 30)

Diciéndolo de otra manera: es la distancia que puede existir entre dos valores, el espacio que
puede haber entre los intervalos nos sirve para realizar o introducir la cantidad de muestra que
puede existir entre ese intervalo.

6.2.Límites reales

Según Chiner. Son

Aquellos que no presentan discontinuidad entre un intervalo y el siguiente. Se


calcula: El límite real superior: se toma el límite aparente superior más media
unidad de media (+ 0’5). El límite real inferior es igual al límite aparente inferior
menos media unidad de medida (- 0’5).”. (Chiner, 2,011, pág. 30)
En otras palabras, son los que sin interrupción alguna se utilizan para obtener el valor de
números enteros entre los unos intervalos antes y el otro siguiente del intervalo, y para obtener
los límites reales: al intervalo que esta antes se le resta 0.5 y el intervalo que esta después se le
suma 0.5 y así sucesivamente con los intervalos siguientes que pueden existir.

Grafica de límites reales:

Figura 1 Figura 1.
Google. (s.f.).
Recuperado el Jueves de Febrero de 2,019, de rea.ceibal.edu.uy

6.3. Marca de clase

En el año 2,011Chiner dice que “Es el valor que sirve para representar al intervalo. Es
decir, es el punto medio del intervalo y se calcula:

𝑙𝑖𝑚.𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟+𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑥𝑚 = ” ”. (Chiner, 2,011, pág. 30)
2

Desde otro punto de vista, para cada intervalo es necesario un único valor para su
representación, porque ese valor es el que lo va a representar para obtener resultados de otros
parámetros. Para poder obtener el valor representativo se suman los límites de cada intervalo,
obteniendo el resultado de la suma, se divide entre de dos para luego obtener el valor
representativo de ese intervalo. Así también, con los demás intervalos que pueden existir.
Grafica de Marca de clase:

Figura 2

Tabla estadística: intervalos, límites reales y marcas de clase

Figura 3

7. Gráfica de una distribución de frecuencia

Aunque esta tabla sirve para resumir información de variables discretas o continuas,
de manera particular la TDF permite transformar una variable continua, a una variable discreta
definida por el número de intervalos y su frecuencia. Esta transformación permite construir
gráficos de histogramas o polígonos. Con Variables continuas como (peso, altura, producción /
superficie, etc.) el recorrido de la variable se parte en intervalos semiabiertos, las clases.
(Riobóo, 2008)

Lo primero para construir una TDF es definir el “número de clases” o intervalos a crear
y el “intervalo o ancho” de cada intervalo. Para que los gráficos permitan visualizar tendencias
de la variable en estudios, el número de clases se recomienda que no sean menor de 5 ni mayor
de 20. Al ancho de clase se calcula dividiendo el Rango (valor mayor – valor menor), con un
valor que debe variar entre 5 y 20. Hay que utilizar más clases cuando se tiene más datos
disponibles, si el número de clases es muy grande es posible tener muchas clases vacías, si es
demasiado pequeño podrían quedar ocultas características importantes de los datos al
agruparlos. Se tendría que determinar el número de clases a partir de la cantidad de datos
presente y de su uniformidad, en general con menos de treinta datos se usa una TDF con 5
clases. (Riobóo, 2008)

Para tabular una variable continua o discreta (que tome un gran número de datos distintos)
se necesitan los siguientes elementos:

a) Rango: (R): Es el dato mayor – Dato menor


b) Marca de Clase (K): se puede calcular por medio de la siguiente fórmula

𝐾 = 1 + 3.3𝑙𝑜𝑔𝑁 𝐷𝑜𝑛𝑑𝑒 𝑁 𝑒𝑠 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠

c) Intervalo (I): Se puede calcular por medio de la siguiente fórmula:


𝑅𝑎𝑛𝑔𝑜
𝐼=
𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
d) Límites Reales (Lr): Es el margen de error que puede tener un dato. (5%; 1%)

e) Frecuencia (f): Es el número de veces que se repite un dato en el intervalo.


f) Frecuencia Acumulada (F): Es ir sumando la frecuencia en cada intervalo.
g) Frecuencia Relativa: (fr): es la proporción de datos que se encuentra en un intervalo,
se determina dividiendo la frecuencia absoluta del intervalo por el tamaño de la muestra.

𝑓𝑖
𝑓𝑒 =
𝑁
h) Frecuencia Relativa Porcentual (FR%): Son los datos en porcentaje que se requiere,
y se puede calcular por medio de la siguiente fórmula:

𝑓𝑖
𝐹𝑅% = ( ) 𝑥100%
𝑁

i) Marca de Clase (𝝌): Es la sumatoria del intervalo entre dos.


EJEMPLO:

Los siguientes datos corresponden a las notas obtenidas por 100 alumnos en un curso de
estadística:

1. Construya la correspondiente distribución de frecuencia.


2. En qué clase se concentra el mayor número de notas.
3. ¿Cuál es la frecuencia absoluta en el cuarto intervalo?
4. ¿qué porcentaje de los alumnos tienen una nota inferior a 57?
5. ¿Cuántos alumnos tienen una nota superior a 46?
6. Interprete la frecuencia acumulada del sexto intervalo.
7. Interprete la frecuencia relativa acumulada en el quinto intervalo.

Solución:

𝑹 = 100 − 17 = 83

𝐾 = 1 + 3.3 log(100) = 7.6 = 8

83
𝐼= = 10
8

1.

Notas Lr Xi f fr F Fr%
17-26 16.5-26.5 21.5 4 0.04 4 0.04
27-36 26.5-36.5 31.5 7 0.07 11 0.11
37-46 36.5-46.5 41.5 7 0.07 18 0.18
47-56 46.5-56.5 51.5 16 0.16 34 0.34
57-66 56.5-66.5 61.5 22 0.22 56 0.56
67-76 66.5-76.5 71.5 13 0.13 69 0.69
77-86 76.5-86.5 81.5 15 0.15 84 0.84
87-96 86.5-96.5 91.5 9 0.09 93 0.93
97-106 96.5-106.5 101.5 7 0.07 100 1.00
TOTAL 100 1.00

2. El mayor número de notas se concentra en el quinto intervalo, que corresponde al intervalo


entre 57-66.

3. La frecuencia absoluta en el cuarto intervalo es 16. Esto nos indica que son 16 los alumnos
que tienen una nota entre 47-56.

4. El 34% de los alumnos tienen una nota inferior a 57.

5. Existen 69 alumnos con nota inferior a 77.

6. El 56% de los alumnos tienen una nota inferior a 67.

Son las respuestas de las interrogantes de este ejercicio o ejemplo, podemos dar la
interpretación según los datos en la tabla de distribución de frecuencias.

Ahora bien, se pueden representar estos datos en forma gráfica, como por ejemplo una
gráfica de barras, un histograma, un circular, una ojiva y otros. Existe una variedad de gráficas
para la representación de datos de una tabla de distribución de frecuencias.

7.1. Gráfica de barras

Las gráficas de barras se pueden obtener de los intervalos y la frecuencia. Según esta grafica
de barras, se puede ver las informaciones de las notas de los alumnos, como por ejemplo en la
barra más grande, en donde se puede ver que 22 alumnos han obtenido punteos entre 57 y 66.
También se puede notar en la gráfica que 4 alumnos han obtenido punteos entre 17 y 26.
97-106 7

87-96 9

77-86 15

67-76 13

57-66 22

47-56 16

37-46 7

27-36 7

17-26 4

Figura 4
Figura 3

Fuente:
Google. (s.f.). Recuperado el Jueves de Febrero de 2,019, de rea.ceibal.edu.uy

7.2. Histograma

Un histograma se obtiene de los datos de los límites reales y la frecuencia. En esta gráfica
se puede ver que las barras nos muestran la cantidad de alumnos y en la parte horizontal nos
muestra los límites reales de las notas que han obtenido durante la clase de estadística. Como
por ejemplo en la tercera barra nos muestra que 7 de los alumnos están en el intervalo de 36.5
y 46.5, que son los límites reales.

25

20

15

10

Figura 5

DIAGRAMA DE SECTORES: Este diagrama se obtiene de los porcentajes en una tabla


de distribución de frecuencias. Este tipo de diagrama, se representa la información ya en
porcentajes, como por ejemplo la parte de color azul fuerte, que se puede ver que el 23% de los
alumnos, que es la mayor cantidad de alumnos que han obtenido punteos de entre 57 y 66. Y
así se representa los datos de una tabla de distribución de frecuencias para un diagrama de
sectores.

1 2 3
8 1% 3% 5% 4
25% 9%

5
15%

7
23%
6
19%
Figura 6

CURVA DE FRECUENCIAS: Una curva de frecuencia se obtiene de los datos de la marca


que clase (X) y la frecuencia acumulada (F). Con los datos dados para sacar esta grafica de la
curva de frecuencia, se observa el comportamiento de la de la misma para ver. En los datos del
eje vertical se ilustran la cantidad de alumnos, en el eje horizontal se ilustran los datos de la
marca de clase. En donde se puede ver que en el punto (71.5, 69), significa que 69 estudiantes
tienen un punteo menor a 71.5. Viendo el comportamiento de a gráfica, significa que desde la
cantidad de alumnos que son 100, la gráfica va descendiendo en cuanto a sus punteos, y termina
con los puntos más bajos obtenidos por los estudiantes.

120

100 100
93
84
80
69
60
56

40
34

20 18
11
4
0 7
Figura
21.5 31.5 41.5 51.5 61.5 71.5 81.5 91.5 101.5
8. Medidas de tendencia central

La mayor parte de los conjuntos de datos muestran una tendencia a agruparse alrededor de
un punto "central" y por lo general es posible elegir algún valor que describa todo un conjunto
de datos. Un valor típico descriptivo como ese es una medida de tendencia central o "posición".
Las medidas de tendencia central a estudiar son: media aritmética, mediana y moda. (Riobóo,
2008)

Al forjarnos una imagen mental de la distribución de frecuencias de un conjunto de


mediciones, una de las primeras apreciaciones descriptivas de interés es una medida de
tendencia central, es decir, una que localiza el centro de la distribución.
Las medidas de tendencia central corresponden a los valores que generalmente se ubican en
la parte central de un conjunto de datos. Las medidas estadísticas, pretenden resumir la
información de la muestra para poder tener así un mejor conocimiento de la población. Permite
analizar los datos en torno a un valor central (Morales, 2012).

9. Media aritmética

También denomina media, es la medida de tendencia central que se utiliza con mayor
frecuencia. Se calcula sumando toda la observación de un conjunto de datos, dividiendo después
ese total entre el número total de elementos involucrados. (Morales, 2012)
La media aritmética de un conjunto de valores 𝑥1, 𝑥2 , 𝑥3… 𝑥𝑛 se define como el cociente entre
la suma de los valores y el número de ellos. Su símbolo es (X).

a) Para datos agrupados:


𝑥1, 𝑥2 ,𝑥3… 𝑥𝑛 𝑋𝑖
Media aritmética: 𝑋 = = 𝑋 = ∑𝑁
𝑖=1
𝑁 𝑁
Ejemplo: Calcular la media aritmética de los siguientes datos relacionados con las notas de
test en Estadística obtenidas por cierto alumno.

45, 80, 56, 35, 25, 90

45 + 80 + 56 + 35 + 25 + 90
𝑋= = 55.17 ≈ 55
6
El promedio del test es 55 puntos.
Significa que los 55 puntos son bajos, desde ahí se puede tomar decisiones para mejorar ese
punteo obtenido.

b) Para datos agrupados:


𝑚
𝑋𝑖𝐹𝑖
𝑋=∑
𝑁
𝑖=1

Donde:
-Xi es la marca de clase del intervalo.
-fi es la frecuencia en el intervalo.
-N es el número de datos.
-m es el número de intervalos-
Ejemplo: Calcular la media aritmética para el peso de 40 trabajadores, según la tabla siguiente:
Tabla 1

Peso (Kg) Xi Fi XiFi


55-62 58.5 5 192.5
63-70 66.5 15 997.5
71-78 74.5 12 894
79-6 82.5 5 412.5
87-94 90.5 3 271.5
Total 40 2868

5
𝑋𝑖𝐹𝑖 2868
𝑋=∑ = = 71.7 ≈ 72
𝑁 40
𝑖=1

El peso promedio de los 40 trabajadores es de 72 kilos.

10.Mediana

(Banegas, 2000)La mediana es el valor que se encuentra exactamente a la mitad de un


arreglo ordenado, es decir, el conjunto de datos ordenados de menor a mayor. De lo anterior se
deduce que la mitad de las observaciones son menores o iguales a la mediana. Para ello
podemos decir que la mediana es el dato que ocupa la posición central en la muestra ordenada
de menor a mayor.

(Usac, 2011)Es el valor de la observación que ocupa la posición central de un conjunto de


datos ordenados según su magnitud. Es el valor medio o la media aritmética de los valores
medios. La mediana es un valor de la variable que deja por debajo de él un número de casos
igual al que deja por arriba. Geométricamente la mediana es el valor de la variable que
corresponde a la vertical que divide al histograma en dos áreas iguales.

La mediana es el valor que se encuentra exactamente en la mitad de un conjunto de números


(datos), después que los datos han sido ordenados de menor a mayor.

Para determinar el valor de la mediana primero se obtiene el arreglo ordenado de los datos
con los que estemos trabajando y luego se identifica la mediana. Para calcular la mediana
debemos considerar dos casos:

Si el número de datos (n) es impar, la mediana es el valor de en medio.

Si el número de datos (n) es par, la mediana es el promedio de las dos observaciones de en


medio. Al contrario de la media, a la mediana no la afectan valores extremos, ya que sólo
considera la posición del valor central.

Características de la mediana

 Es una medida de tendencia central no afectada por los valores extremos.


 No está definida algebraicamente.
 Cuando la localización del elemento central puede ser determinada y los límites de clase
mediana son conocidos, la mediana para la distribución de frecuencias puede ser
calculada por interpolación, no importando que ésta contenga intervalos abiertos,
cerrados, iguales o diferentes.
 La suma de los valores absolutos, sin considerar el signo, de las desviaciones
individuales respecto a la mediana es mínimo.
 La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de
tendencia central.

CÁLCULO DE LA MEDIANA
 Para datos no agrupados:

1ero. Se ordenan los datos ascendentemente.

2do. La mediana corresponde al dato que está en la posición central.

Ejemplo: n impar

10 14 11 18 12
Ordenamos los datos:

10 11 12 14 18

𝑛+1 5+1
La posición de la mediana es = = 3 (tercer dato), es decir X= 12.
2 2

n par

10 14 12 11 18 23
Ordenamos los datos:

10 11 12 14 18 23

𝑛+1 6+1
Posición de la mediana ⇒ es = = 3.5 (entre el tercer y cuarto dato)
2 2

12+14
Obtenemos la mediana promediando el tercer y cuarto dato: = 13 = 𝑋
2

Notar que (n+1) /2 no es la mediana, sino la localización de la mediana en el conjunto ordenado


de datos.

Si hay datos repetidos deben ser incluidos en el ordenamiento.

 Para datos agrupados

1ero. Se calcula la clase de la mediana, la cual corresponde a la clase cuya frecuencia acumulada
es mayor o igual a n/2.

2do. En la clase de la mediana se aplica la siguiente fórmula:

𝑛⁄ − 𝐹
𝑀𝑒 = 𝐿𝑚𝑒 + [ 2 ]𝐴
𝑓𝑚𝑒
Donde:

𝐿𝑚𝑒 = Límite real inferior de la clase de la mediana.

𝐹 = frecuencia acumulada de la clase anterior a la mediana.

𝑓𝑚𝑒 = frecuencia absoluta de la clase de la mediana.

A = amplitud del intervalo de la clase de la mediana.

Ejemplo:

Tabla 2
DATOS
Punteos de Matemática de Segundo Básico
45 78 89 65 76 89 78 90 53 67
45 67 89 78 78 90 45 67 78 90
67 89 67 90 46 78 67 76 67 57

Tabla 3
No. de Datos 30

Vmax 90

Vmin 45

Rango 45

No. De intervalos 5.87 6

Amplitud de clase 7.5 7

Diferencia 1
Tabla 4
TABLA DE DISTRIBUCION DE FRECUENCIAS
INTERVALOS DE
CLASE
Lim. Lim. Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inferior Superior de Absoluta Acumulada Relativa Relativa %
clase
44 51 47.5 4 4 0.13 0.13 13.33
52 59 55.5 2 6 0.07 0.20 6.67
60 67 63.5 8 14 0.27 0.47 26.67
68 75 71.5 0 14 0.00 0.47 0.00
76 83 79.5 8 22 0.27 0.73 26.67
84 91 87.5 8 30 0.27 1.00 26.67 Clase mediana
30 1.00 100.00

Se calcula la clase de la mediana, la cual corresponde a la clase cuya frecuencia acumulada es


mayor o igual a n/2.

𝑛 30
= = 15
2 2

Se aplica la formula

𝑛⁄ − 𝐹
𝑀𝑒 = 𝐿𝑚𝑒 + [ 2 ]𝐴
𝑓𝑚𝑒

15 − 14
𝑀𝑒 = 76 + [ ] 7 = 76.88
8

𝑴𝒆 = 𝟕𝟔. 𝟖𝟖

11.Moda

(Banegas, 2000) La moda es el valor que más se repite en una lista de datos, es decir, el
que se presenta con mayor frecuencia. Puede darse el caso que haya dos modas en una lista de
datos, lo que recibe el nombre de bimodal. Si hay más de dos modas, se denomina multimodal.
La moda es el valor de un conjunto de datos que ocurre más frecuentemente, se
considera el valor más típico de una serie de datos.

Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia.

La moda puede no existir o no ser única, las distribuciones que presentan dos o más máximos
relativos se designan de modo general como bimodales o multimodales respectivamente.

Características de la Moda:

 Representa más elementos que cualquier otro valor


 No está afectada por los valores extremos, pero para datos continuos es dudoso su
cálculo.
 La moda para una distribución de frecuencias de datos agrupados no puede ser calculada
exactamente, el valor de la moda puede ser afectado por el método de agrupación de los
intervalos de clase.
 La moda no permite conocer la mayor parte de los datos.
 Algunas veces el azar interviene de manera importante y hace que un valor no
representativo se repita frecuentemente.
 Puede usarse para datos cuantitativos como cualitativos.
 La moda como estadístico, varía mucho de una muestra a otra.
 Cuando se tienen dos o más modas es difícil su interpretación
 Tiene la ventaja de que los datos desproporcionados con respecto al resto no la
distorsionan, pero no se presta para un tratamiento matemático.

CÁLCULO DE LA MODA

 Para datos no agrupados:

La moda corresponde al dato o datos que se repiten con más frecuencia.

Ejemplo:

Datos.

25 30 50 30 45 30 55 54 23 24

Mo=30 Es el dato que se repite tres veces.


 Para datos agrupados

1ero. Se localiza la clase modal, la cual corresponde a la clase que tenga la mayor frecuencia.

2do. En la clase modal se aplica la siguiente fórmula:

𝐷1
𝑀𝑜 = 𝐿𝑚𝑜 + [ ]𝐴
𝐷1 + 𝐷2

Donde:

𝐿𝑚𝑜 = Límite real inferior de la clase modal

D1 = diferencia entre la frecuencia de la clase modal y la clase anterior

D2 = diferencia entre la frecuencia de la clase modal y la clase posterior

A = amplitud del intervalo de la clase modal.

Ejemplo:

Tabla 5 TABLA DE DISTRIBUCION DE FRECUENCIAS


INTERVALOS DE
CLASE
Lim. Lim. Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inferior Superior de Absoluta Acumulada Relativa Relativa %
clase
44 51 47.5 4 4 0.13 0.13 13.33
52 59 55.5 2 6 0.07 0.20 6.67
60 67 63.5 8 14 0.27 0.47 26.67 Clase modal

c68 75 71.5 0 14 0.00 0.47 0.00


76 83 79.5 8 22 0.27 0.73 26.67
84 91 87.5 8 30 0.27 1.00 26.67
30 1.00 100.00

Se aplica la formula

𝐷1
𝑀𝑜 = 𝐿𝑚𝑜 + [ ]𝐴
𝐷1 + 𝐷2
8−2
𝑀𝑜 = 60 + [ ]7
8−2+8−0

𝑴𝒐 = 𝟔𝟑

12.Medidas de tendencia no central

Las medidas de posición no centrales permiten conocer otros puntos característicos de la


distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una
serie de valores que dividen la muestra en tramos iguales.

12.1. Cuartiles

Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o


decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los
resultados.

Para datos agrupados:

1ero. Se calcula el índice del cuartil.

𝑄
𝑖 = ( ) ∗ ∑𝑓
4

2do. Se localiza la clase del cuartil, la cual corresponde a la clase cuya frecuencia acumulada
es mayor o igual a 𝑖.

3ro. En la clase del cuartil se aplica la siguiente fórmula:

𝑄
( ) ∗ ∑𝑓 − 𝐹
𝑄𝑖 = 𝐿𝑄𝑖 + [ 4 ]∗𝐴
𝑓𝑄𝑖

Donde:

𝐿𝑄𝑖 = Límite real inferior de la clase del cuartil

F = frecuencia acumulada de la clase anterior al cuartil


𝑓𝑄𝑖 = frecuencia absoluta de la clase del cuartil

A = amplitud del intervalo de la clase del cuartil

Ejemplo:

Calcule el Q2 de la siguiente tabla

Tabla 6 TABLA DE DISTRIBUCION DE FRECUENCIAS


INTERVALOS DE
CLASE
Lim. Lim. Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inferior Superior de Absoluta Acumulada Relativa Relativa %
clase
44 51 47.5 4 4 0.13 0.13 13.33
52 59 55.5 2 6 0.07 0.20 6.67
60 67 63.5 8 14 0.27 0.47 26.67
c68 75 71.5 0 14 0.00 0.47 0.00
76 83 79.5 8 22 0.27 0.73 26.67 Clase Cuartil

84 91 87.5 8 30 0.27 1.00 26.67


∑𝑓 30 1.00 100.00
𝑄 2
𝑖 = ( ) ∗ ∑𝑓 𝑖 = ( ) ∗ 30 𝑖 = 15
4 4

Aplica la formula.

𝑄
( 4 ) ∗ ∑𝑓 − 𝐹 15 − 14
𝑄𝑖 = 𝐿𝑄𝑖 + [ ]∗𝐴 𝑄2 = 76 + [ ]∗7
𝑓𝑄𝑖 8

𝑄2 = 76.88

12.2. Deciles
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los
resultados.

Para datos agrupados:

1ero. Se calcula el índice del Decil.


𝐷
𝑖 = ( ) ∗ ∑𝑓
10

2do. Se localiza la clase del decil, la cual corresponde a la clase cuya frecuencia acumulada es
mayor o igual a 𝑖.

3ro. En la clase del percentil se aplica la siguiente fórmula:

𝐷
(10) ∗ ∑𝑓 − 𝐹
𝐷𝑖 = 𝐿𝐷𝑖 + [ ]∗𝐴
𝑓𝐷𝑖

Donde:

𝐿𝐷𝑖 = Límite real inferior de la clase del decil

F = frecuencia acumulada de la clase anterior al decil

𝑓𝐷𝑖 = frecuencia absoluta de la clase del decil

A = amplitud del intervalo de la clase del decil

Ejemplo:

Calcule el D2 de la siguiente tabla

Tabla 7
TABLA DE DISTRIBUCION DE FRECUENCIAS
INTERVALOS DE
CLASE
Lim. Lim. Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inferior Superior de Absoluta Acumulada Relativa Relativa %
clase
44 51 47.5 4 4 0.13 0.13 13.33
52 59 55.5 2 6 0.07 0.20 6.67
60 67 63.5 8 14 0.27 0.47 26.67
c68 75 71.5 0 14 0.00 0.47 0.00
76 83 79.5 8 22 0.27 0.73 26.67
84 91 87.5 8 30 0.27 1.00 26.67
∑𝑓 30 1.00 100.00
𝐷 2
𝑖=( ) ∗ ∑𝑓 𝑖 = ( ) ∗ 30 𝑖=6
10 10

Aplica la formula.

𝐷
(10) ∗ ∑𝑓 − 𝐹 6−6
𝐷𝑖 = 𝐿𝐷𝑖 + [ ]∗𝐴 𝐷2 = 52 + [ ]∗7
𝑓𝐷𝑖 2

𝑫𝟐 = 𝟓𝟐

12.3. Percentiles

Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o


decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los
resultados.

CÁLCULO DE PERCENTILES

Para datos agrupados:

1ero. Se calcula el índice del percentil.

𝑝
𝑖=( ) ∗ ∑𝑓
100

2do. Se localiza la clase del percentil, la cual corresponde a la clase cuya frecuencia acumulada
es mayor o igual a 𝑖.

3ro. En la clase del percentil se aplica la siguiente fórmula:

𝑝
(100) ∗ ∑𝑓 − 𝐹
𝑃𝑖 = 𝐿𝑝𝑖 + [ ]∗𝐴
𝑓𝑝𝑖

Donde:

𝐿𝑝𝑖 = Límite real inferior de la clase del percentil


F = frecuencia acumulada de la clase anterior al percentil
𝑓𝑝𝑖 = frecuencia absoluta de la clase del percentil
A = amplitud del intervalo de la clase del percentil
Ejemplo:

Calcule el P70 de la siguiente tabla

Tabla 8
TABLA DE DISTRIBUCION DE FRECUENCIAS
INTERVALOS DE
CLASE
Lim. Lim. Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inferior Superior de Absoluta Acumulada Relativa Relativa %
clase
44 51 47.5 4 4 0.13 0.13 13.33
Clase
52 59 55.5 2 6 0.07 0.20 6.67 Percentil
60 67 63.5 8 14 0.27 0.47 26.67
68 75 71.5 0 14 0.00 0.47 0.00
76 83 79.5 8 22 0.27 0.73 26.67
84 91 87.5 8 30 0.27 1.00 26.67
∑𝑓 30 1.00 100.00
𝑃 70
𝑖=( ) ∗ ∑𝑓 𝑖=( ) ∗ 30 𝑖 = 21
100 100

Aplica la formula.

𝑝
(100) ∗ ∑𝑓 − 𝐹 21 − 14
𝑃𝑖 = 𝐿𝑝𝑖 + [ ]∗𝐴 𝑃70 = 76 + [ ]∗7
𝑓𝑝𝑖 8

𝑷𝟕𝟎 = 𝟖𝟐. 𝟏𝟐

13.Desviación media

Cómo calcular la desviación media

Cada dato, se encuentra a una cierta distancia de la media:


Cada distancia de un punto a la media, es la desviación de ese punto con respecto a la media. Se calcula
como el valor absoluto del valor menos la media:

Cada distancia se mide en valor absoluto, ya que, si no es así, los puntos que quedaran a la izquierda de
la media, serían negativas y las distancias siempre deben ser positivas.

Si sumamos todas las distancias de cada dato con respecto a la media, es decir, de todas las desviaciones
y la dividimos entre el número total de datos, estaremos calculando la desviación media.

La desviación media es el promedio de las distancias de cada uno de los datos a la media. Es la media
de lo que se desvía el conjunto de datos con respecto a la media.

La fórmula anterior también podemos ponerla en forma de sumatorio (el signo Σ se utiliza para indicar
la suma de varios sumandos):

14.La desviación típica

La desviación típica (  ) es la raíz cuadrado de la suma de los cuadrados de las observaciones


de las desviaciones respecto a su media dividido por N

(X i  X )2
.   
N
Ejemplo para el cálculo de la desviación media y la desviación típica con datos agrupados

Con los siguientes datos calcular la desviación media, la varianza y la desviación típica:

5.42, 6.22, 8.42, 7.54, 6.44, 6.67, 5.90, 6.18,

7.16. 6.80, 7.32, 8.12, 6.84, 7.12, 8.21, 8.13,

7.25, 7.34, 5.56, 8.32, 7.45, 7.43, 6.87, 7.10

Ordenamos los datos en una tabla, determinando los intervalos necesarios e incluyendo los valores que
pertenecen a cada intervalo, con el fin de obtener la frecuencia absoluta:

Tabla 9
INTERVALOS Frecuencia
Absoluta
(fi)
5 - 5.5 1
5.5 - 6 2
6 - 6.5 3
6.5 - 7 4
7 - 7.5 8
7.5 - 8 1
8 - 8-5 5
Total 24

Añadimos la tercera columna para la marca de clase:

La marca de clase de cada intervalo es el punto medio de cada intervalo:

Linf  Lsup
Xi 
2

Rellenamos la tabla para cada intervalo:


Tabla 10
INTERVALOS Frecuencia Marca de clase
Absoluta (xi)
(fi)
5 - 5.5 1 5.25
5.5 - 6 2 5.75
6 - 6.5 3 6.25
6.5 - 7 4 6.75
7 - 7.5 8 7.25
7.5 - 8 1 7.75
8 - 8-5 5 8.25
Total 24
Añadimos otra columna más donde multiplicamos cada marca de clase por su frecuencia absoluta,
sumando en la última fila todos los resultados:

Tabla 11
INTERVALOS Frecuencia Marca de clase
Absoluta (xi) xi.fi
(fi)
5 - 5.5 1 5.25 5.25
5.5 - 6 2 5.75 11.5
6 - 6.5 3 6.25 18.75
6.5 - 7 4 6.75 27
7 - 7.5 8 7.25 58
7.5 - 8 1 7.75 7.75
8 - 8-5 5 8.25 41.25
Total 24 169.50

Con estos datos, podemos calcular la media:

f i  X 1  f 2  X 2 , , fn  X n
X 
N

La suma de las marcas de clase por su frecuencia la tenemos en la última fila de la cuarta columna, que
es 169.5 y la suma de todos los elementos en la última fila de la segunda columna, que es 24:

169.5
  7.06
24
Añadimos una quinta columna donde iremos escribiendo la distancia de cada intervalo, haciendo la resta
de la marca de clase menos la media:

Tabla 12
INTERVALOS Frecuencia Marca de clase Distancia
Absoluta (xi) (xi.fi) (xi-x)
(fi)
5 - 5.5 1 5.25 5.25 1.81
5.5 - 6 2 5.75 11.5 1.31
6 - 6.5 3 6.25 18.75 0.81
6.5 - 7 4 6.75 27 0.31
7 - 7.5 8 7.25 58 0.19
7.5 - 8 1 7.75 7.75 0.69
8 - 8-5 5 8.25 41.25 1.69
Total 24 169.50 6.31

Tenemos la suma de las distancias de cada intervalo y el número total de datos, los cuales nos sirven
para calcular la desviación media:

(X i  X)
DM 
N

La suma de las distancias es 6.31, que la tenemos en la última fila de la quinta columna y el número
total de datos es 24, que lo tenemos al final de la segunda columna:

6.31
  0.26
24
Por último, le añadimos una quinta columna con el cuadrado de la distancia:
Tabla 13
INTERVALOS Frecuencia Marca de clase Distancia
Absoluta (xi) (xi.fi) (xi-x) (xi-x)2
(fi)
5 - 5.5 1 5.25 5.25 1.81 3.29
5.5 - 6 2 5.75 11.5 1.31 1.72
6 - 6.5 3 6.25 18.75 0.81 0.66
6.5 - 7 4 6.75 27 0.31 0.10
7 - 7.5 8 7.25 58 0.19 0.04
7.5 - 8 1 7.75 7.75 0.69 0.47
8 - 8-5 5 8.25 41.25 1.69 1.41
Total 24 169.50 6.31 7.68

Con la suma de las distancias al cuadrado de cada intervalo y el número total de datos, podemos calcular
la desviación típica:

(X i  X )2
  
N

La suma de las distancias al cuadrado es 7,68 y lo tenemos en la última fila de la sexta columna. El
número total de datos es 24, que lo tenemos al final de la segunda columna:

7.68
  0.56
24
15.Tipos de correlación

La correlación o coeficiente de correlación r2 mide la proporción de variación en la variable


dependiente explicada por la variación en la o las variables independientes, es decir mide el grado de
intensidad lineal de vinculación de las variables, a partir de las variaciones observadas de los valores
proyectados y de los valores reales comparadas con la media aritmética.

Este coeficiente es útil por cuanto permite establecer el grado de intensidad en que una variable
dependiente se encuentra explicada por la o las variables independientes dentro de un modelo.
También facilita el estudio de variables cuantitativas en la medida que podemos explicar un
fenómeno por el grado en que una variable influye en otra, es decir nos permite efectuar afirmaciones
de carácter social, económico y físico.

Esta herramienta estadística se mide por un coeficiente que puede tomar un valor que puede oscilar
entre -1 y 1, si el valor es cercano a1 se dice que existe una relación directa entre las variables estudiadas,
una mayor cantidad en una implica que la otra aumentara también, en la medida que se acerca a 0 se
dice que el nivel de correlación es mínimo o simplemente no existe correlación y por lo tanto la variación
de una variable no explica el comportamiento de otra, finalmente si es cercano a -1 la relación es inversa,
si aumenta la variable independiente, disminuye el valor de la dependiente.

La siguiente gráfica muestra las posibles formas de correlación, vinculando el valor del coeficiente
con su expresión gráfica.

Figura 8

La correlación puede clasificarse en dos tipos dependiendo de la cantidad de variables


analizadas y por el tipo de relación lineal, en el primer caso estamos haciendo referencia a:

 Correlación simple: se estudia la dependencia únicamente entre dos variables


 Correlación múltiple: se estudia la dependencia entre más de 2 variables
 Correlación parcial: cuando se incluye la influencia de variables exógenas no consideradas en
el cálculo de los coeficientes.

Dependiendo del tipo de relación lineal el coeficiente relaciona:

 Relación directa entre las variables: un aumento en la variable independiente implica un


aumento en la variable dependiente. Por ejemplo, la altura de una persona y el tamaño de su pie;
mientras aumenta la altura, el pie también.
 Relación inversa entre las variables: un aumento en la variable independiente implica una
disminución en la variable dependiente. El tiempo de estudio y el tiempo que pasas jugando
videojuegos, tienen una correlación negativa, ya que cuando tu tiempo de estudio aumenta, no
te queda tanto tiempo para jugar videojuegos.
 Sin correlación: no hay una relación aparente entre las variables. Los puntos en tus videojuegos
y tu talla de zapato no parecen tener ninguna correlación; mientras una aumenta, la otra no tiene
ningún efecto.

A partir de ello la ecuación puede mejorar su correlación si se hace pruebas para determinar si se
ajusta más a una recta, una curva exponencial o parabólica.

16.Estadística inferencial

Existen una variedad en las definiciones de la estadística, considerado por algunos como
una ciencia y otros como un método científico con fines para el bien de la ciencia.

Algunos opinan que es una ciencia que estudia los fenómenos colectivos, mediante la
observación numérica, el análisis sistemático e la interpretación lógica investigando
especialmente sus casusas y normas que la rigen. También es muy asemejado con los procesos
científicos, con la obtención de datos, para organizar y dar significa a todos los datos obtenidos.
Esta es una rama de la matemática que se ocupa de reunir, organizar y analizar datos numéricos
con ello poder resolver problemas con el tema ejes de estudio para la toma de decisiones.

División de la estadística

La estadística para una mejor presentación se ha clasificado en dos ramas o áreas las
cuales son: la estadística descriptiva y la estadística inferencial.
La estadística descriptiva:

No se pretende hablar mucho de esta rama de la estadística ya que las unidades


anteriores fueron abordos ampliamente solo se citará una definición breve:

(Ortiz, 2014, pág. 5) “La estadística descriptiva analiza, estudia y describe a la totalidad
de individuos de una población. Su finalidad es obtener información, analizarlas, elaborarlas y
simplificarla lo necesario para que pueda ser interpretada cómoda y rápidamente, y, por lo tanto,
pueda utilizarse eficazmente para el fin que se desee.”

El proceso que sigue para el estudio de una cierta población consta de los siguientes pasos:

 Selección de caracteres
 Elaboración de tablas de frecuencias
 Representación gráfica de los resultados

La estadística deductiva o inferencial

En esta sección se estará trabajando con los conceptos y definición de la estadística


inferencial o deductiva, tomando como base el término inferir partiendo desde las conclusiones
obtenidas con los datos estadísticos el cual es proporcionado por la estadística descriptiva.
Algunas definiciones de diferentes autores son citadas posteriormente:

(Brenes, pág. 6) “La estadística inferencial tiene como objetivo generalizar los
resultados de un subconjunto de datos a todo el conjunto. Seguidamente se presentan los
conceptos básicos de esta rama de la matemática la población y la muestra”.

(Ortiz, 2014, pág. 6 ) La estadística inferencial, sin embrago trabajo con muestras,
subconjuntos formados por algunos individuos de la población. A partir del estudio de la
muestra se pretende inferir aspectos relevantes de toda la población. Como se selecciona, como
realiza inferencia y en grado de confianza se puede tener en ella conocimientos de estadísticas
inferencial, para cuyo estudio se requieran un alto nivel de conocimiento de estadística y de
matemáticas.

Con las definiciones anteriores podemos comparar la diferencia y la estrecha


codependencia de la una con la otra. Cuando obtenemos un conjunto de datos la encargada de
realizar los primeros cálculos es la estadística descriptiva los cuales son indicados con datos
numéricos, la distribución de datos y las gráficas correspondientes. Pero simplemente su
función se delimita a describir los resultados obtenidos o solamente una lectura de la
información resultante en el proceso de investigación, más sin embargo la encargada de inferir,
interpretas y sacar conclusiones atreves de nuevos cálculos definitivos del comportamiento de
la problemática que se estudie con los resultados obtenidos es la estadística inferencial o
deductiva... Por otro lado, la estadística inferencial busca resultados sobre un conjunto de datos
mayor a partir de los datos dados, como por ejemplo determinar el porcentaje de todos los
ciudadanos que apoyan un candidato a partir de los resultados de una encuesta.

Tabla 14
Estadística descriptiva Estadística inferencial
La comprende aquellos métodos gráficos y La estadística inferencial comprende
numéricos usados para recopilar, organizar y aquellos métodos y técnicas usadas para
describir la información que se ha recogido hacer generalizaciones, predicciones y
con el fin de describir sus características estimaciones que se utilizan para la
información en conocimiento.

La estadística inferencial en pocas palabras es la que valora las cualidades y


características de la población partiendo de la interpretación de información extraída en una
muestra. La estadística inferencial, consta de dos factores importantes:

1. La probabilidad: es un instrumento de medida matemática, que permite establecer


tendencias (dirección o inclinación) en situaciones en las que interviene el azar
2. La inferencia: consiste en obtener un resultado o una conclusión, partiendo del análisis
y a la interpretación que se define a partir de la muestra de datos.

Algunos conceptos básicos en el manejo de la estadística inferencial que a su tiempo


también se utilizaremos en ejemplos posteriores de esta estadística deductiva.

1. Población: conjunto de datos que se desea estudiar. Estos datos deben verse como
valores de una misma variable, la cual se utiliza para designar la población. (López,
1999, pág. 14) Afirma: “es un conjunto de medidas o conjunto completo de individuos,
objetos o medidas que posee alguna característica común observable.” De este conjunto
de población es extraen el subconjunto el cual servirá para la elección de la muestra de
investigación.
2. Muestra: Es un conjunto de medidas o el recuento de una parte de los elementos
pertenecientes a la población. Expresada de otra manera es subconjunto de datos que se
seleccionan de la población.
3. Estimación: la estimación y la prueba hipótesis son partes importantes de la estadística
inferencial siendo ella la encargada de evaluar, calcular o dar valor. Un ejemplo de
estimación de un caso de la vida cotidiana seria estimar la masa promedio de la
población, usando masa del departamento de Totonicapán como la mutra.
4. Prueba de hipótesis: Es una posible solución al planteamiento de la problemática,
ejemplar seria sostener que la masa corporal de las personas de la muestra Totonicapán
sería de 100 libras.

16.1. Ejemplificaciones aplicables

La estadística descriptiva: el número de alumnos inscritos para el curso de estadística


educativa de la sección A de la licenciatura de matemática y física de la universidad san Carlos
de Guatemala, en el centro universitario de occidente, registro a los estudiantes por sexo y
obtuvieron los siguientes resultados: el sexo femenino son 27 y del sexo masculino son 35,
siendo un total de 57 pupilos inscritos.

La estadística inferencial: Lugo de visitar 5 escuelas rurales de la república de


Guatemala, referido por una muestra determinada a partir de un proceso aleatorio, se estableció
que 4 de ellas habían sufrido durante el año quebraduras de vidrios de sus ventanas, como
consecuencia de los fenómenos meteorológicos que se manifiestan cíclica y anualmente en
dichos establecimientos (fuertes aguaceros con granizo). Por lo anterior se infiere que el 95%
de las escuelas rurales de la capital de Guatemala se requieren de reparaciones y
mantenimientos periódicos de sus ventanas.

La población y muestra: si se fabrican 50000 unidades de un producto x. la población


la constituye las 50000 unidades, una muestra mínima sería una cantidad de 300 unidades,
tomadas al azar.

Otro caso hipotético seria, durante una auditoria de una corporación, 14 cuentas fueron
seleccionadas aleatoriamente y revisadas en busca de errores. La población es todas las
poblaciones son las 14 cuentas, la muestra también son las 14 cuentas seleccionadas para ser
revisadas, la unidad de observación es una cuenta, la medición en este caso es cualitativa.
Variables matemáticas que se utilizan en la resolución de cálculos matemáticos de
la población y la muestra en la estadística inferencial, el cual la se aprecia en el cuadro
siguiente:

Tabla 15
CRITERIOS POBLACIÓN MUESTRA
Colección de elementos Parte o porción de la
Definición considerados población seleccionada para
su estudio.
características Parámetros Estadísticos
Símbolos Tamaño de la población = N Tamaño de la muestra = n
Media de la población = 𝜇 Media de la muestra = 𝜒
Desviación estándar de la Desviación estándar de la
población = 𝜎 (varianza r2 muestra = s
Proporción poblacional = P Proporción de la muestra = p
𝑝𝑞
Formulario básico 𝜒 ↝ 𝑁 ( 𝜇 , 𝜎⁄ ) 𝑝 ↝ 𝑁 ( 𝑃 , √ 𝑛 ) q = 1-P
√𝑛

17.Organización de datos
Procedimiento

 Organizar los datos en una distribución de frecuencias


 Presentar una distribución de frecuencias en un histograma, un polígono de frecuencias
y una ojiva.
 Elaborar e interpretar una representación de tallo y hoja

Conceptos Fundaméntale En La Organización De Datos

Unidad De Análisis O De Observación: al objeto bajo estudio. El mismo puede ser


una persona, una familia, un país, una región, una institución o en general, cualquier objeto.

Variable: a cualquier característica de la unidad de observación que interese registrar,


la que en el momento de ser registrada puede ser transformada en un número.

Valor: de una variable, OBSERVACIÓN o MEDICIÓN, al número que describe a la


característica de interés en una unidad de observación particular.
Caso O Registro: al conjunto de mediciones realizadas sobre una unidad de
observación.

Tipos De Datos

Datos Categóricos O Cualitativos

Las variables categóricas resultan de registrar la presencia de un atributo. Las categorías


de una variable cualitativa deben ser definidas claramente durante la etapa de diseño de la
investigación y deben ser mutuamente excluyentes y exhaustivas. Esto significa que cada
unidad de observación debe ser clasificada sin ambigüedad en una y solo una de las categorías
posibles y que existe una categoría para clasificar a todo individuo.

En este sentido, es importante contemplar todas las posibilidades cuando se construyen


variables categóricas, incluyendo una categoría tal como No sabe / No contesta, o No registrado
u Otras, que asegura que todos los individuos observados serán clasificados con el criterio que
define la variable. Los datos categóricos se clasifican en dicotómicos, nominales y ordinales

Datos Numéricos
Una variable es numérica cuando el resultado de la observación o medición es un
número. Se clasifican en:
a) Discretos. La variable sólo puede tomar un cierto conjunto de valores posibles. En
general, aparecen por conteo. Ejemplo: número de miembros del hogar, número de
intervenciones quirúrgicas, número de casos notificados de una cierta patología.
b) Continuos. Generalmente son el resultado de una medición que se expresa en
unidades. Las mediciones pueden tomar teóricamente un conjunto infinito de valores posibles
dentro de un rango. En la práctica los valores posibles de la variable están limitados por la
precisión del método de medición o por el modo de registro.
Ejemplos: altura, peso, pH, nivel de colesterol en sangre.

18.Gráficas para la estadística infancia

Se considera que la mayor parte las gráficas son interpretadas a partir de las tablas de
frecuencias las cuales se aprecian en estadística descriptiva.

18.1. Grafica De Distribución maestral Y Poblacional.


Las distribuciones de frecuencia y los histogramas de una variable se aplican tanto a
datos de una muestra como a datos de toda la población. En el primer caso hablamos de
distribución maestral y en el segundo caso de distribución poblacional. En algún sentido la
distribución maestral es una fotografía borrosa de la distribución poblacional.

A medida que el tamaño de muestra aumenta la proporción de casos que cae en cada
intervalo se parece más y más a la proporción poblacional. La fotografía se torna más y más
definida y la distribución maestral luce similar a la distribución poblacional. Si la población
contiene una gran cantidad de unidades de observación y la variable es continua es posible
elegir intervalos tan delgados como deseemos para construir el histograma y además hacer
crecer el tamaño de muestra indefinidamente. En este caso, la forma del histograma se
aproximará a una curva suave denomina distribución de la variable en la población.

Figura 9
La Figura 3.1 muestra dos histogramas, el primero basado en una muestra de tamaño
100 y el segundo basado en una muestra de tamaño 1000, y una curva suave que representa la
distribución poblacional. Aun cuando la variable sea discreta, una curva suave suele ser una
buena aproximación para la distribución poblacional, especialmente cuando el número De
valores posibles de la variable es grande.

18.2. Gráfico De Tortas

En este gráfico, ampliamente utilizado, se representa la frecuencia relativa de cada


categoría como una porción de un círculo, en la que el ángulo se corresponde con la frecuencia
relativa correspondiente. Como en todo gráfico es importante indicar el número total de sujetos.

Esta representación gráfica es muy simple y permite comparar la distribución de una


variable categórica en 2 o más grupos
Figura 10
18.3. Polígono De Frecuencias
El polígono de frecuencias es similar al histograma en muchos aspectos, pero pretende
dar una imagen aproximada de la “curva” definida por la distribución de la variable. Para
construirlo se usan los mismos ejes que en el histograma. Se indica en la escala horizontal el
punto medio de cada intervalo y en la escala vertical la escala densidad para ese intervalo, esto
define pares (x, y) en el gráfico que se unen con tramos de líneas rectas. Se marcan además los
puntos medios del intervalo que precede al primero y del que sigue al último.

Figura 11
19.Conclusiones
Llegado a este punto, se concluye que se ha cumplido con el objetivo general, que consiste en aportar
evidencia teórica del tema a tratar. Se planteó una revisión bibliográfica, que se efectuo por medio de
la técnica de la investigación, además de ejemplificar y facilitar la comprensión de los temas tratados.

Debido a que existen muchos temas a problematizar para su investigación, en lo cual es muy
importante poderlo explorar para darle una posible solución en lo que se requiere. Para esto es
de suma importancia utilizar la estadística, ya que gracias a ello podremos obtener un resultado
que nos pueda ayudar a darnos cuenta sobre los diferentes resultados de cada investigación,
para así ayudar a nosotros mismos como investigadores y a otras personas en lo que se requiere.
Porque gracias a la estadística se puede encontrar un resultado ya sea positivo o negativo al tipo
de población investigada estadísticamente.

En el tema de la elaboración de una tabla de distribución de frecuencia, se comprendió la


importancia en evaluar ciertos datos a partir de una tabla, porque de ahí se pueden tomar
decisiones, ya sea para mejora algún aspecto, para cambiarlo o dependiendo del caso.

En la medida de tendencia central, se también es importante prender, comprenderlo y aplicarlo


a los diferentes problemas en donde se pueda aplicarlo. En este tema, se dio a conocer la media
aritmética, en donde se localiza un valor medio de un conjunto de datos, para luego evaluar ese
valor, y después tomar las decisiones respectivas.

CONCLUSIONES

La desviación media es cuando se encuentra una medida natural de desviación al promediar las
desviaciones de la media aritmética.

La desviación media es la media aritmética de las desviaciones absolutas con respecto a la media
aritmética.

La desviación típica es una medida común de la dispersión con respecto a su media. La desviación es
cero cuando no existe dispersión, y crece según esta aumenta.

Al igual que ocurre con la media, en la desviación fuertes asimetrías o muy pocas observaciones atípicas
pueden hacer que aumente mucho esta. Un ejemplo claro se vería en estadísticas deportivas, si solo se
hicieran en base a una temporada, serían observaciones totalmente diferentes si esta hubiera sido buena
o mala, comparado con hacer las estadísticas en base a todas las temporadas.
Con los diagramas de dispersión podemos ver cómo se relacionan las variables entre sí. Esto es lo que
se conoce como correlación.

Conclusión

La estadística diferencial es muy útil para detectar los avances o retrasos que puedan presentarse
en algún tipo de temática relacionada con la sociedad guatemalteca (dígase economía, índices
de violencia, la pobreza, etc.). Esta estadística más allá de solamente ocuparse en la conclusión,
interpretaciones a análisis de la temática de investigación su rol más importante es permitir
predecir posibles resultados tomando en cuanto los registros pasados.
20.Recomendaciones
Motivar al estudianteado en la investigación constante en el área de estadística, en el ámbito
educativo, el cual es pilar para su labor, para establecer criterios, de retroceso o avance a partir de la
investigación estadística.

una recomendación sería que en el desarrollo del presente curso, considerar en la aplicación correcta
de los conceptos estudiados en el quehacer educativo, dado que en el transcurso de la investigación,
pudimos comprender que es de vital importancia aplicar la estadística, para la toma de decisiones.

21.Bibliografía

Banegas, A. L. (2000). Probalidad y esttadistica. Mexico: Interamerica S.A.

Bencardino, C. M. (2,011). Estadística básica aplicada (Cuarta edición ed.). Bogotá, Colombia:
Eco Ediciones.

CAMACHO, J. (2000) Estadística con SPSS versión 9

CANAVOS, G. (1988) Probabilidad y Estadística. Aplicaciones y Métodos. México: McGraw-


Hill.

Chiner, E. (2,011). Introducción a la estadística descriptiva. España.

google. (s.f.). Recuperado el Jueves de Febrero de 2,019, de tchihuahua.edu.mx

Google. (s.f.). Recuperado el Jueves de Febrero de 2,019, de rea.ceibal.edu.uy

Morales, A. E. (2012). Estadística y Probabilidades. Chile.

Mode, E. B. (1,982). Elementos de probabilidad y estadística. Reverté.

More, D. S. (1995). Estadísitica Aplicada Básica. Freeman anda company.

Riobóo, L. M. (2,008). Estadística Básica. Estelí, Nicaragua.

Usac. (2011). Manual de estadistica Descriptiva. Guatemala: Facultad de Ingenieria.


22.

You might also like