You are on page 1of 25

UNIVERCIDAD DE GUAYAQUIL

DIRECCIÓN DE NIVELACIÓN Y ADMISIÓN


FACULTAD DE CIENCIAS MATEMATICA Y FISICAS
ADMISION Y NIVELACION FCMF

TEMA:
ESTADISTICA

DOCENTE:
ING. LASCANO

ESTUDIANTE:
ÁLVARO ORTIZ CORTEZ

CURSO:
VE 12

CICLO-1
ESTADISTICA
CONCEPTO:
La estadística podría definirse como la ciencia que se encarga de recopilar, organizar,
procesar, analizar e interpretar datos con el fin de deducir las características de una
población objetivo, pero esta sería solo una visión estrecha de lo que comprende esta
rama del saber. A continuación, se hace una muy breve introducción teórica al amplio
concepto de la estadística.

Definiciones
Conjunto de métodos científicos ligados a la toma, organización, recopilación,
presentación y análisis de datos, tanto para la deducción de conclusiones como para
tomar decisiones razonables de acuerdo con tales análisis.
Arte de la decisión en presencia de incertidumbre.
Ciencia que sirve para demostrar que dos personas han comido 1/2 pollo cada una,
cuando en realidad una ha comido uno y la otra ninguno.
¿Por qué la estadística?
¿Usaron la estadística Galileo, Newton y Einstein?
En ciertas ciencias (Biología, Ciencias Humanas, algunos campos de la Física, ...)
aparece el concepto de experimento aleatorio (experimento que repetido en las
"mismas condiciones" no produce el mismo resultado) y asociado al mismo el de
variable aleatoria.
Una variable no aleatoria (asociada al resultado de una experiencia que sí produce el
mismo resultado) está caracterizada por un valor para cada condición.
Una variable aleatoria está caracterizada por la llamada función densidad de
probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles
valores para cada condición.
Se divide en dos áreas:
Estadística descriptiva: Trata de describir las variables aleatorias en las "muestras".
Estadística inductiva o inferencial: Trata de la generalización hacia las poblaciones de
los resultados obtenidos en las muestras y de las condiciones bajo las cuales estas
conclusiones son válidas. Se enfrenta básicamente con dos tipos de problemas:
Estimación, que puede ser puntual o por intervalos.
Contraste de hipótesis.
ESTADISTICA DESCRIPTIVA
La descripción completa de una variable aleatoria está dada por su función densidad
de probabilidad (fdp).
Afortunadamente una gran cantidad de variables de muy diversos campos están
adecuadamente descritas por unas pocas familias de fdps: binomial, Poisson, normal,
gamma, etc.
Dentro de cada familia, cada fdp está caracterizada por unos pocos parámetros,
típicamente dos: media y varianza.
Por tanto, la descripción de una variable indicará la familia a que pertenece la fdp y los
parámetros correspondientes.
Ejemplo: (hipotético) la concentración de glucosa en sangre en individuos no
diabéticos, medida en mg/dl, es normal con media 98 y varianza 90.

MEDIDAS DESCRIPTIVAS
Medidas de posición o tendencia

Media muestral: Si tenemos X1, X2, ... , Xn datos, se llama media muestral de los
mismos a su media aritmética

Moda muestral: El valor que más se repite (puede no existir y si existe puede no ser
única).

Mediana muestral: Ordenando los Xi, el valor que está en el medio

Ejemplo: Sean los datos 3, 5, 7, 7, 8, 9

= 39/6 = 6,5; = 7; moda = 7


Medidas de dispersión

Rango: Si Xi están ordenados Xn - X1

Varianza:

aunque para el cálculo se suele usar otra fórmula más cómoda

Desviación típica o estándar:

¡¡Ojo!! no confundir con error típico o estándar

Coeficiente de variación:

INDIVIDUOS O ELEMENTOS:

personas u objetos que contienen cierta información que se desea estudiar.

PARÁMETRO:

función definida sobre los valores numéricos de características medibles de una


población.

POBLACIÓN Y MUESTRA
Población:
Es el todo o un conjunto formado por todos los valores existentes, ya sean personas,
medidas u objetos que pueden ser expresados mediante una variable y además, tienen
una característica; de que son de interés estadístico para un estudio en específico. Al
análisis completo de la población también se le suele conocer como censo.
Censo:
Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los
caracteres componentes de una población.
Encuesta:
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son
observaciones parciales.
Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere
averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a
un gran número de personas".

• Población finita: Es aquella que expresa que es posible sobrepasarse al


contar o bien, alcanzarse; por lo tanto, es la que tiene o incluye un número limitado ya
sea de objetos, medidas o personas. Por ejemplo: el gasto en comida durante cierto
tiempo, un conjunto de calificaciones o bien, el total de alumnos que estudian en una
universidad.

• Población infinita: Es aquella que incluye a un gran número de conjunto de


observaciones o medidas que no se pueden alcanzar con el conteo. Esto quiere decir
que tiene un número ilimitado de valores, por ejemplo: la producción futura de una
máquina o el lanzamiento de dados o una moneda.

Muestra:
Es aquel subconjunto perteneciente a una población. Esto quiere decir que se
conforma por algunos datos de esta, ya sean ciertos objetos, personas, o medidas de la
población. Al estudio de este concepto se le suele conocer como muestreo.

• Muestra representativa: Es aquel subconjunto representativo de una


población, pero para que se consideren así se deben seguir ciertos procedimientos de
selección o bien, un método de muestreo. Se dice que la muestra adecuada es aquella
que contiene características esenciales de la población para lograr el objetivo de hacer
generalizaciones con respecto al total de los datos sin examinar cada uno de ellos.

Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más muestras de
una población; el muestreo es una técnica que sirve para obtener una o más muestras
de población. Éste se realiza una vez que se ha establecido un marco muestral
representativo de la población, se procede a la selección de los elementos de la
muestra, aunque hay muchos diseños de la muestra. Al tomar varias muestras de una
población, las estadísticas que calculamos para cada muestra no necesariamente
serían iguales, y lo más probable es que variaran de una muestra a otra.
Ejemplo;
Consideremos como una población a los estudiantes de educación del Núcleo San
Carlos de la UNESR, determinando por lo menos dos caracteres ser estudiados en
dicha población;
• Religión de los estudiantes
• Sexo.

ORGANIZACIÓN DE DATOS
TABLA DE FRECUENCIA

La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra


la distribución de los datos mediante sus frecuencias. Se utiliza
para variables cuantitativas o cualitativas ordinales.
La tabla de frecuencias es una herramienta que permite ordenar los datos de
manera que se presentan numéricamente las características de la distribución de un
conjunto de datos o muestra.
La frecuencia es una medida que sirve para comparar la aparición de un elemento
Xi en un conjunto de elementos (X1, X2,…, XN). Mediante tablas de distribuciones de
frecuencia se puede presentar organizadamente el recuento de datos.

Las frecuencias de cada elemento se pueden expresar tanto absolutas (número


total de apariciones) como relativas (proporción de apariciones).
Si los datos provienen de una variable cuantitativa o existen muchas categorías,
los datos se suelen agrupar en clases. Cada clase, que tiene un intervalo o amplitud
constante, está representado por su marca de clase, que es el punto medio de la
misma.
Construcción de la tabla de frecuencias
1. En la primera columna se ordenan de menor a mayor los diferentes valores que
tiene la variable en el conjunto de datos.
2. En las siguientes columnas (segunda y tercera) se ponen las frecuencias
absolutas y las frecuencias absolutas acumuladas.
3. Las columnas cuarta y quinta contienen la las frecuencias relativas y las
frecuencias relativas acumuladas.
4. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y séptima),
representando la frecuencia relativa y la frecuencia relativa acumulada como
tanto por cien. Estos porcentajes se obtienen multiplicando las dos frecuencias
por cien.
La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor está en el
conjunto (X1, X2,…, XN).
La suma de las frecuencias absolutas de todos los elementos diferentes del conjunto
debe ser el número total de sujetos N. Si el conjunto tiene k números (o categorías)
diferentes, entonces:

Fórmula de la suma de las frecuencias absolutas que tiene como resultado el número
total de elementos N.
Ejercicio

Un profesor tiene la lista de las notas en matemáticas de 30 alumnos de su clase.


Las notas son las siguientes:

Se realiza el recuento de la variable que se estudia (notas)


para ver el número de veces que aparece cada nota.
Una vez realizado el recuento, se representan
las frecuencias absolutas de cada una de las notas (ni). Las
frecuencias son: n1(3)=2, n2(4)=4, n3(5)=6, n4(6)=7, n5(7)=5,
n6(8)=3, n7(9)=2 y n8(10)=1.

Frecuencia absoluta acumulada

La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…, XN) es


la suma de las frecuencias absolutas de los valores menores o iguales a Xi, es decir:

Frecuencia relativa
La frecuencia relativa (fi) de un valor Xi es la proporción de valores iguales a Xi en
el conjunto de datos (X1, X2,…, XN). Es decir, la frecuencia relativa es la frecuencia
absoluta dividida por el número total de elementos N:
Las frecuencias relativas son valores entre 0 y 1, 0 ≤ fi ≤ 1. La suma de
las frecuencias relativas de todos los sujetos da 1. Supongamos que en el conjunto
tenemos k números (o categorías) diferentes, entonces:

Si se multiplica la frecuencia relativa por cien se obtiene el porcentaje (tanto por


cien %).

Frecuencia relativa acumulada

Definimos la frecuencia relativa acumulada (Fi) de un valor Xi como


la proporción de valores iguales o menores a Xien el conjunto de datos (X1, X2,…, XN). Es
decir, la frecuencia relativa acumulada es la acumulada dividida por el número total de
sujetos N:

La frecuencia relativa acumulada de cada valor siempre es mayor que la frecuencia


relativa. De hecho, la frecuencia relativa acumulada de un elemento es la suma de
las frecuencias relativas de los elementos menores o iguales a él, es decir:
Frecuencia absoluta acumulada

Se calculan las frecuencias


absolutas acumuladas (Ni) como la
suma de las frecuencias
absolutas de los valores menores o
iguales a Xi:

 N1(3)=n1(3)=2
 N2(4)=n1(3)+n2(4)=2+4=6
 N3(5)=n1(3)+n2(4)+n3(5)=2+4+6=12
 N4(6)=n1(3)+n2(4)+n3(5)+n4(6)=2+4+6+7=19
 N5(7)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)=2+4+6+7+5=24
 N6(8)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)=2+4+6+7+5+3=27
 N7(9)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)=2+4+6+7+5+3+2=2
9
 N8(10)=n1(3)+n2(4)+n3(5)+n4(6)+n5(7)+n6(8)+n7(9)+n8(10)
 =2+4+6+7+5+3+2+1=30

Frecuencia relativa
Se calcula la frecuencia relativa de cada elemento como la división de la frecuencia
absoluta entre el total de elementos N=30.
 f1(3) = n1(3)/N = 2/30 = 0,07
 f2(4) = n2(4)/N = 4/30 = 0,13
 f3(5) = n3(5)/N = 6/30 = 0,20
 f4(6) = n4(6)/N = 7/30 = 0,23
 f5(7) = n5(7)/N = 5/30 = 0,17
 f6(8) = n6(8)/N = 3/30 = 0,10
 f7(9) = n7(9)/N = 2/30 = 0,07
 f8(10) = n8(10)/N = 1/30 = 0,03
Se pueden calcular las frecuencias relativas en porcentaje (%)
multiplicándolas por 100.

Frecuencia relativa acumulada


Para obtener la frecuencia relativa acumulada se divide la frecuencia absoluta
acumulada entre el número total de elementos (N=30). Esto da el tanto por uno de
elementos iguales o menores al elemento que se estudia.
Las frecuencias relativas acumuladas son las siguientes:

 F1(3) =f1(3) =0,07


 F2(4) =f1(3) +f2(4) =0,07+0,13=0,20
 F3(5) =f1(3) +f2(4) +f3(5) =0,07+0,13+0,20=0,40
 F4(6) =f1(3) +f2(4) +f3(5) +f4(6) =0,07+0,13+0,20+0,23=0,63
 F5(7) =f1(3) +f2(4) +f3(5)+f4(6)+f5(7)=0,07+0,13+0,20+0,23+0,17=0,80
 F6(8) =f1(3) +f2(4) +f3(5)+f4(6)+f5(7)+f6(8)
 =0,07+0,13+0,20+0,23+0,17+0,10=0,90
 F7(9) =f1(3) +f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9)
 =0,07+0,13+0,20+0,23+0,17+0,10+0,07=0,97
 F8(10) =f1(3) +f2(4)+f3(5)+f4(6)+f5(7)+f6(8)+f7(9)+f8(10)
 =0,07+0,13+0,20+0,23+0,17+0,10+0,07+0,03=1,00
Se pueden calcular las frecuencias relativas acumuladas en
porcentaje (%) multiplicándolas por 100.

Tabla de frecuencias Una vez se han calculado todas las frecuencias, se


construye la tabla de frecuencias. La tabla es la siguiente:

Adicionalmente, se pueden incluir dos columnas con


los porcentajes de las frecuencias relativas y frecuencias relativas
acumuladas. Se obtiene la siguiente tabla:
DISTRIBUCIÓN DE FRECUENCIAS
En estadística, se le llama distribución de frecuencias a la agrupación de datos en
categorías mutuamente incluye que indican el número de observaciones en cada
categoría.1 Esto proporciona un valor añadido a la agrupación de datos. La distribución
de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el
número existente en cada clase.

Frecuencia completa
La frecuencia completa por su denominación es el número de veces que aparece un
determinado valor en un valor estadístico. Se representa por fila. La suma de la
frecuencia completa es igual al número total de datos, que se representa por N. Para
indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se
lee sumatoria.
Frecuencia relativa
Se dice que la frecuencia relativa es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento
y se representa por hi. La suma de las frecuencias relativas es igual a 1
Frecuencia relativa (hi) es el cociente entre la frecuencia absoluta y el tamaño de la
muestra (N). Es decir:

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una
distribución de frecuencias.
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por
ciento (pi).
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de un
variable aleatoria (X) es menor que o igual a un valor de referencia (Xr).
La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breve (Xr), y se
calcula de

Fc (Hr) = HXr / N

donde MXr es el número de datos X con un valor menor que o igual a Xr, y N es
número total de los datos. En breve se escribe:

Fc = M / N

Cuando Xr=Xmin, donde Xmin es el valor mínimo observado, se ve que Fc=1/N, porque
M=1. Por otro lado, cuando Xr=Xmax, donde Xmax es el valor máximo observado, se ve
que Fc=1, porque M=N.
En porcentaje la ecuación es:

Fc(%) = 100 M / N

Frecuencia relativa acumulada


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el número total de datos. Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 44
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un número grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada clase
se le asigna su frecuencia correspondiente. Límites de la clase. Cada clase está
delimitada por el límite inferior de la clase y el límite superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. La
marca de clase es el punto medio de cada intervalo y es el valor que representa a todo
el intervalo para el cálculo de algunos parámetros. En caso de que el primer intervalo
sea de la forma (-∞,k], o bien [k,+∞) donde k es un número cualquiera, en el caso de (-
∞,k], para calcular la marca de clase se tomará la amplitud del intervalo adyacente a el
(ai+1), y la marca de clase será ((k-ai+1) +k)/2. En el caso del intervalo [k,+∞) también
se tomará la amplitud del intervalo adyacente a el (ai-1) siendo la marca de clase
((k+ai-1)+k)/2.
Construcción de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11,
13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1. Se localizan los valores menor y mayor de la distribución. En este caso son 3 y


48.
2. Se restan y se busca un número entero un poco mayor que la diferencia y que
sea divisible por el número de intervalos que queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece al intervalo, se cuenta en
el siguiente intervalo.

Intervalo ci ni Ni fi Fi

[0, 5) 2.5 1 1 0.025 0.025

[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.275

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850


[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

Total: 40 1

MEDIDAS DE TENDENCIA CENTRAL


Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir
la información con un solo número. Este número que, para tal fin, suele situarse hacia
el centro de la distribución de datos se denomina medida o parámetro de tendencia
central o de centralización. Cuando se hace referencia únicamente a la posición de
estos parámetros dentro de la distribución, independientemente de que esté más o
menos centrada, se habla de estas medidas como medidas de posición.1 En este caso
se incluyen también los cuantiles entre estas medidas. Entre las medidas de tendencia
central tenemos:

 Media aritmética: ponderada, geométrica y armónica


 Mediana
 Moda
Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por
lo que las medidas de posición o medidas de tendencia se usan de acuerdo al tipo de
variable que se está observando, en este caso se observan variables cuantitativas.

La media aritmética
La media aritmética es el valor obtenido por la suma de todos sus valores dividida
entre el número de sumadores. Por ejemplo, las notas de 5 alumnos en una prueba:
niño nota
1 6,0 ·Primero, se suman las notas:
2 5,4 6,0+5,4+3,1+7,0+6,1 = 27,6
3 3,1 ·Luego el total se divide entre la cantidad de alumnos:
4 7,0 27,6/5=5,52
5 6,1
· La media aritmética en este ejemplo es 5,52
La media aritmética es, probablemente, uno de los parámetros estadísticos más
extendidos.2 Se le llama también promedio o, simplemente, media.

Definición formal
Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética
como

Esta definición varía, aunque no sustancialmente, cuando se trata de variables


continuas, esto es, también puede calcularse para variables agrupadas en intervalos.

Propiedades
Las principales propiedades de la media aritmética son:3

 Su cálculo es muy sencillo y en él intervienen todos los datos.


 Su valor es único para una serie de datos dada.
 Se usa con frecuencia para comparar poblaciones, aunque es más apropiado
acompañarla de una medida de dispersión.
 Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de
datos, ya que tiene la propiedad de equilibrar las desviaciones de los datos
respecto de su propio valor:

 Minimiza las desviaciones cuadráticas de los datos respecto de cualquier valor


prefijado, esto es, el valor de

es mínimo cuando k = {x}. Este resultado se conoce


como Teorema de König. Esta propiedad permite interpretar uno de los
parámetros de dispersión más importantes: la varianza.
 Se ve afectada por transformaciones afines (cambios de origen y escala), esto
es, si
 Es poco sensible a fluctuaciones muestrales, por lo que es un parámetro muy
útil en inferencia estadística.

Inconvenientes de su uso
Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en
situaciones muy diversas, tiene también algunos inconvenientes, como son:

 Para datos agrupados en intervalos (variables continuas) su valor oscila en


función de la cantidad y amplitud de los intervalos que se consideren.
 La estatura media como resumen de una población homogénea (abajo) o
heterogénea (arriba).
 Es una medida a cuyo significado afecta sobremanera la dispersión, de modo
que cuanto menos homogéneos sean los datos, menos información
proporciona. Dicho de otro modo, poblaciones muy distintas en su composición
pueden tener la misma media.4 Por ejemplo, un equipo de baloncesto con
cinco jugadores de igual estatura, 1,95 m, evidentemente, tendría una estatura
media de 1,95 m, valor que representa fielmente a esta población homogénea.
Sin embargo, un equipo de jugadores de estaturas más heterogéneas, 2,20 m,
2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendría también, como puede
comprobarse, una estatura media de 1,95 m, valor que no representa a casi
ninguno de sus componentes.
 En el cálculo de la media no todos los valores contribuyen de la misma manera.
Los valores altos tienen más peso que los valores cercanos a cero.
 No se puede determinar si en una distribución de frecuencias hay intervalos de
clase abiertos.

Media aritmética ponderada


A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su
relevancia para determinado estudio. En esos casos se puede utilizar una media
ponderada.
Media muestral
Esencialmente, la media muestral es el mismo parámetro que el anterior, aunque el
adjetivo "muestral" se aplica a aquellas situaciones en las que la media aritmética se
calcula para un subconjunto de la población objeto de estudio.
La media muestral es un parámetro de extrema importancia en la inferencia
estadística, siendo de gran utilidad para la estimación de la media poblacional, entre
otros usos.

Moda
La moda es el dato más repetido de la encuesta, el valor de la variable con mayor
frecuencia absoluta.5 En cierto sentido la definición matemática corresponde con la
locución "estar de moda", esto es, ser lo que más se lleva.
Su cálculo es extremadamente sencillo, pues solo necesita un recuento. En variables
continuas, expresadas en intervalos, existe el denominado intervalo modal o, en su
defecto, si es necesario obtener un valor concreto de la variable, se recurre a la
interpolación.
Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-6-9-
5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima. Cuando
en una distribución de datos se encuentran tres o más modas, entonces es
multimodal. Por último, si todas las variables tienen la misma frecuencia diremos que
no hay moda.
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha
de definir el intervalo modal. El intervalo modal es el de mayor frecuencia absoluta.
La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal
en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen
que:

Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase vienen


dadas por la siguiente tabla (debajo):

calificaciones 1 2 3 4 5 6 7 8 9
Números de 2 2 4 5 8 9 3 4 2
alumnos
Propiedades
Sus principales propiedades son:

 Cálculo sencillo.
 Interpretación muy clara.
 Al depender solo de las frecuencias, puede calcularse para variables
cualitativas. Es por ello el parámetro más utilizado cuando al resumir una
población no es posible realizar otros cálculos, por ejemplo, cuando se
enumeran en medios periodísticos las características más frecuentes de
determinado sector social. Esto se conoce informalmente como "retrato
robot".
Inconvenientes

 Su valor es independiente de la mayor parte de los datos, lo que la hace muy


sensible a variaciones muestrales. Por otra parte, en variables agrupadas en
intervalos, su valor depende excesivamente del número de intervalos y de su
amplitud.
 Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.
 No siempre se sitúa hacia el centro de la distribución.
 Puede haber más de una moda en el caso en que dos o más valores de la
variable presenten la misma frecuencia (distribuciones bimodales o
multimodales).

Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos,
una vez que éstos están ordenados de menor a mayor.7 Por ejemplo, la mediana del
número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2,
3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1,
2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2:

En caso de un número par de datos, la mediana no correspondería a ningún valor de la


variable, por lo que se conviene en tomar como mediana el valor intermedio entre los
dos valores centrales. Por ejemplo, en el caso de doce datos como los siguientes:
Existen métodos de cálculo más rápidos para datos más numerosos (véase el artículo
principal dedicado a este parámetro). Del mismo modo, para valores agrupados en
intervalos, se halla el "intervalo mediano" y, dentro de éste, se obtiene un valor
concreto por interpolación.

Cálculo de la mediana para datos agrupados xi fi Fi

Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla 1 2 2


del margen derecho). 2 2 4
Así, aplicando la fórmula asociada a la mediana para n impar, 3 4 8
obtenemos X (39+1)/2 = X20 y basándonos en la fórmula que hace 4 5 13
5 6 19=19
referencia a las frecuencias absolutas:
6 9 28
Ni-1< n/2 <Ni = N19 < 19.5 < N20 7 4 32
8 4 36
Por tanto, la mediana será el valor de la variable que ocupe el
9 2 38
vigésimo lugar. En nuestro ejemplo, 21 (frecuencia absoluta
acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos (es aconsejable no olvidar las
unidades; en este caso como estamos hablando de calificaciones, serán puntos)
La mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o más.
Ejemplo (N par)
Las calificaciones en la asignatura de Matemáticas de 38 alumnos de una clase vienen
dadas por la siguiente tabla (debajo):

Calificaciones 1 2 3 4 5 6 7 8 9
Números de 2 2 4 5 6 9 4 4 2
alumnos

Cálculo de la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X(38/2)
= X19 y basándonos en la fórmula que hace referencia a las frecuencias absolutas -->
Ni-1< n/2 < Ni = N18 < 19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que
ocupen el decimonoveno y el vigésimo lugar.
En nuestro ejemplo, el lugar decimonoveno lo ocupa el 5 y el vigésimo el 6, (desde el
vigésimo hasta el vigésimo octavo)
con lo que Me = (5+6)/2 = 5,5 puntos.

Propiedades e inconvenientes
Las principales propiedades de la mediana son:8

 Es menos sensible que la media a oscilaciones de los valores de la variable. Un


error de transcripción en la serie del ejemplo anterior en, pongamos por caso,
el último número, deja a la mediana inalterada.
 Como se ha comentado, puede calcularse para datos agrupados en intervalos,
incluso cuando alguno de ellos no está acotado.
 No se ve afectada por la dispersión. De hecho, es más representativa que la
media aritmética cuando la población es bastante heterogénea. Suele darse
esta circunstancia cuando se resume la información sobre los salarios de un
país o una empresa. Hay unos pocos salarios muy altos que elevan la media
aritmética haciendo que pierda representatividad respecto al grueso de la
población. Sin embargo, alguien con el salario "mediano" sabría que hay tanta
gente que gana más dinero que él, como que gana menos.
Sus principales inconvenientes son que, en el caso de datos agrupados en intervalos,
su valor varía en función de la amplitud de estos. Por otra parte, no se presta a cálculos
algebraicos tan bien como la media aritmética.

MEDIDAS DE DISPERSIÓN.
Parámetros estadísticos que indican como se alejan los datos respecto de la media
aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de
dispersión más utilizadas son el rango, la desviación estándar y la varianza.

Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la
diferencia entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x(1)
Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto
a la media.

Donde:
xi:valores de la variable.
n: número total de datos

Desviación estándar
La desviación estándar mide el grado de dispersión de los datos con respecto a la
media, se denota como s para una muestra o como σ para la población. Se define
como la raíz cuadrada de la varianza según la expresión:
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se
divide entre n; también existe la fórmula de desviación típica donde el denominador es
n pero se prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir
existe menor dispersión, el incremento de los valores de la desviación estándar indica
ina mayor variabilidad de los datos.

Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable
respecto a la media. Corresponde a la media aritmética de los cuadrados de las
desviaciones respecto a la media. Su expresión matemática es:

donde Xi es el dato i-ésimo y es la media de los N datos.

Coeficiente de Variación
Permite determinar la razón existente entre la desviación estándar (s) y la media. Se
denota como CV. El coeficiente de variación permite decidir con mayor claridad sobre
la dispersión de los datos. También puede ser expresado en por ciento.
¿QUÉ ES UNA TABLA DE DATOS AGRUPADOS?
Tabla en las bases de datos, se refiere al tipo de modelado de datos, donde se guardan
y almacenan los datos recogidos por un programa. Su estructura general se asemeja a
la vista general de un programa de hoja de cálculo. Registro: es cada una de las filas en
que se divide la tabla. Cada registro contiene datos de los mismos tipos que los demás
registros. Ejemplo: en una tabla de nombres, direcciones, etc., cada fila contendrá un
nombre y una dirección. A los campos se les puede asignar, además, propiedades
especiales que afectan a los registros insertados. El campo puede ser definido como
índice o autoincrementadle, lo cual permite que los datos de ese campo cambien solos
o sean el principal a la hora de ordenar los datos contenidos.

¿COMO CALCULAR LA CANTIDAD CORRECTA DE INTERVALOS?


Por la regla de Sturges: K= 1+3,3.22 LOG (N)
Se utiliza esta fórmula siendo n la cantidad de datos por lo general se usa intervalos
impares para que se desarrolle de la mejor manera.

¿AMPLITUD DE INTERVALO?
Es la diferencia entre el límite superior e inferior de cada intervalo determinado.
Ii = [a;b[, entonces C = b – a
También podemos aplicar:
Donde:
R: Rango
k: número de intervalos de clase.

MARCA DE CLASE
La marca de clase es el punto medio de cada intervalo. La marca de clase es el valor
que representa a todo el intervalo para el cálculo de algunos parámetros como la
media aritmética o la desviación típica.
Se representa por ci o xi
Ejemplo

xi fi xi · fi xi2 · fi
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
BIBLIOGRAFÍA.
https://www.gestiopolis.com/que-es-estadistica-tipos-y-objetivos/
http://www.hrc.es/bioest/estadis_21.html
http://virtual.uptc.edu.co/ova/estadistica/docs/libros/ftp.bioestadistica.uma.es/libro/
node4.htm
https://es.wikipedia.org/wiki/Estad%C3%ADstica#Lenguaje_y_simbolog%C3%ADa
https://www.monografias.com/trabajos15/estadistica/estadistica.shtml
http://www.universoformulas.com/estadistica/descriptiva/tabla-frecuencias/
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_frecuencias
https://es.wikipedia.org/wiki/Medidas_de_tendencia_central
https://www.ecured.cu/Medidas_de_dispersi%C3%B3n

datos:
http://aplicaciones3.ecuadorencifras.gob.ec/BIINEC-
war/index.xhtml
https://www.youtube.com/watch?v=bKK0kXzwpgs
https://www.youtube.com/watch?v=1myBo87lYyU

You might also like