You are on page 1of 35

Para denotar la suma de una gran cantidad de indicadores estadsticos se emplea la letra griega , que es llamada Sigma.

Esta letra indica la suma total. Si la variable x toma los valores (x1 + x2 + x3 + . . . . . + xn) entonces su notacin sumatoria es:

Esta expresin se lee como sumatoria de x, desde i= 1 hasta n . Aqu i=1 debajo de la notacin indica el elemento que va a sumarse (i) y el primer elemento de la suma (1) .La n indica el termino final de la suma. sta se puede representar como la suma de los primeros trminos con la notacin de sumatoria o notacin sigma. El nombre de esta notacin se denomina de la letra griega (sigma mayscula, que corresponde a nuestra S de "suma" )

Aqui unos ejemplos:


Ejemplo 1: Solucin:

Ejemplo 2 :

Solucin:

Los datos no agrupados es un conjunto de informacin sin ningn orden que no nos establece relacin clara con lo que se pretende desarrollar a lo largo de un problema, esto se soluciona mediante una tabulacin que nos conduce a una tabla de frecuencias. Ejemplo: Edades de un grupo de personas: 20, 50, 15, 13, 16, 13, 13, 20, 8, 16 , 40, 13, 20, 35, 28, 32.

Calificaciones de la materia de espaol de un grupo de estudiantes: 10, 5, 6, 8, 6, 9, 7, 5, 8, 7.

Distribucin de frecuencia para datos no Agrupados (n<20): Es aquella distribucin que indica las frecuencias con que aparecen los datos estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificacin al tamao de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad despus que la distribucin de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas frecuencias.

TRATAMIENTO PARA DATOS NO AGRUPADOS. A qu se refiere esto? Cuando la muestra que se ha tomado de la poblacin o proceso que se desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados. Por otro lado se les llama medidas de tendencia central a la media aritmtica, la mediana, la media geomtrica, la moda, etc. debido a que al observar la distribucin de los datos, estas tienden a estar localizadas generalmente en su parte central.

Son indicadores estadsticos que muestran hacia que valor (o valores) se agrupan los datos:
Media

aritmtica Media geomtrica Mediana Moda

fx X
n

nn 2

X g n X1 X 2 X 3 ...X n
X

~ X X n 1
2

x
n

Mo LMo (

d1 )w d1 d 2

Media aritmtica
Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el nmero total de datos. Ejemplo: Cul es la media de 10, 12, 7, 3, 5, 8?

x 10 12 7 3 5 8 45 7.5 X
n 6 6

Media para datos agrupados


Para encontrar x se deben seguir los siguientes pasos:
1. Se calcula el punto medio de cada clase. 2. Se multiplica cada punto medio por la frecuencia de las observaciones de dicha clase. 3. Se suman todos los resultados y se dividen entre el nmero total de observaciones.

fx X
n

MEDIA GEOMETRICA
Cuando los valores dependen en el tiempo y varan de manera no lineal. Por ejemplo, cambios porcentuales, crecimientos anualizados de poblacin o ventas etc.

MEDIANA
Dato que est en el centro de todos los datos ordenados de la muestra. Este valor puede pertenecer o no a la muestra original. Es un solo valor calculado a partir del conjunto de datos que mide la observacin, es la ms central o la que esta mas en medio en el conjunto de nmeros.

Si la muestra tiene un total de par de datos, la mediana ser la media de los dos datos centrales, y este valor no forma parte de la muestra. Ejemplo: Cul es la mediana de 10, 12, 5, 9 y 7? n=5 Los datos ordenados quedan: 5, 7, 9, 10, 12

~ X X n 1 X 51 X 3 9
2 2

MODA
Es el valor que ms se repite en un conjunto de datos.

Moda para datos agrupados


Podemos suponer que la moda esta localizada en la clase que contiene el mayor numero de elementos es decir que tiene mas frecuencias y para determinar un solo valor para la moda a partir de estos datos se utiliza la siguiente formula:

Mo LMo (

d1 )w d1 d 2

Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor. La medidas de posicin son:

Cuartiles
Los cuartiles dividen a los datos en cuatro partes, contiene el 25% de los elementos de la Distribucin. Los smbolos Q1, Q2, Q3 y Q4 denotan los cuatro cuartiles. La forma para calcular los cuartiles va a depender del tipo de datos, eso es si los datos estn agrupados o no

1.-Primero hay que ordenar los datos de menor a mayor. 2.- El nmero de observaciones se divide entre 4 y este resultado indica el nmero del elemento que ocupa el primer cuartil.
3.-El segundo cuartil se calcula multiplicando por dos el nmero anterior y as sucesivamente para el resto de los valores hasta el ltimo elemento.

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.

Deciles
Los deciles son los nueve valores que dividen la serie de datos en 10 partes iguales. En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas.

Percentiles
los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

Clculo de los percentiles En primer lugar buscamos la clase donde se encuentra , en la tabla de las frecuencias acumuladas. La forma de calcular los percentiles v a depender del tipo de datos, es decir si stos estn agrupados o no No hay frmula para datos no agrupados.

Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media

Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).

MEDIDAS DE DISPERCION

Varianza Desviacin Coeficiente de variacin

varianza
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. Se representa por S . VARIANZA La varianza esta basada en las desviaciones con respecto a la media. VARIANZA: Es el promedio de los cuadrados de las desviaciones de cada observacin con respecto de la media. Esta varianza es cero si todas las observaciones son iguales. Existen dos tipos de varianza. Varianza poblacional. Varianza muestral.

Varianza poblacional.

: Varianza de toda la poblacin. Es el valor medio de las


desviaciones con respecto a la media, elevadas al cuadrado El proceso para calcular la varianza poblacional es el siguiente: Calcular la media aritmtica. Comprobar (X-u) = 0, por cada nmero se resta la media poblacional y se realiza la sumatoria. Calcular (X-u) 2 Obtener varianza.

Varianza muestral.
Varianza de una muestra de la poblacin. La varianza
muestral es el valor medio de las desviaciones con respecto a la media, elevadas al cuadrado. El proceso para calcularla es el siguiente: Calcular X 2 Calcular X y X 2

Desviacin

DESVIACIN Es la medida de dispersin mas utilizada, tambin se la conoce como desviacin tpica, y es la raz cuadrada de la varianza. Esta medida pretende conseguir que la medida de dispersin se exprese en las mismas unidades que los datos u observaciones, al igual que la varianza existen dos tipos: Desviacin estndar poblacional Desviacin estndar muestral. DESVIACIN ESTNDAR POBLACIONAL : Para toda la poblacin o datos, es la raz cuadrada de la varianza poblacional. DESVIACIN ESTNDAR MUESTRAL : Es un estimado de la desviacin estndar poblacional. Es la raz cuadrada de varianza muestral, su frmula es:

Coeficiente de variacin

En estadstica, cuando se desea hacer referencia a la relacin entre el tamao de la media y la variabilidad de la variable, se utiliza el coeficiente de variacin. Su frmula expresa la desviacin estndar como porcentaje de la media aritmtica, mostrando una mejor interpretacin porcentual del grado de variabilidad que la desviacin tpica o estndar. Por otro lado presenta problemas ya que a diferencia de la desviacin tpica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media d, por tanto, un valor positivo. A mayor valor del coeficiente de variacin mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglas C.V.

MEDIDAS DE FORMA
Son necesarias para determinar el comportamiento de los datos Adaptan herramientas para el anlisis probabilstico.
Son indicadores estadsticos que permiten identificar si una distribucin de frecuencia presenta uniformidad

MEDIDAS DE FORMA
Las medidas de forma son aquellas que permiten comprobar si una distribucin de frecuencia tiene caractersticas especiales como simetra, asimetra, nivel de concentracin de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribucin

CURTOSIS
Indica que tan apuntada o achatada se encuentra una distribucin respecto a un comportamiento normal (distribucin normal). Si los datos estn muy concentrado hacia la media, la distribucin es leptocrtica (curtosis mayor a 0). Si los datos estn muy dispersos, la distribucin es platicrtica (curtosis menor a 0). El comportamiento normal exige que la curtosis sea igual a 0 (distribucin mesocrtica).

TIOS DE CURTOSIS

Leptocrtica.- Existe una gran concentracin Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.

COEFICIENTE DE ASIMETRIA
Se le denomina Coeficiente de asimetra al que mide el grado de asimetra de la distribucin con respecto a la media. Un valor positivo de este indicador significa que la distribucin se encuentra sesgada hacia la izquierda (orientacin positiva). Un resultado negativo significa que la distribucin se sesga a la derecha.

You might also like