Professional Documents
Culture Documents
Contenidos
1. PRINCIPIOS DE LA INVESTIGACIN ESTADSTICA 2. FORMAS DE PRESENTACIN DE LA INFORMACIN 3. DISTRIBUCIONES DE FRECUENCIAS 4. MEDIDAS DE POSICIN Y DE VARIABILIDAD
Estadstica Descriptiva
Se trata de hacer descripciones de los datos, principalmente mediante nmeros que resumen la informacin, cuadros que la presenten adecuadamente y grficos que sean fciles de interpretar. Es corriente usar trminos como medidas de posicin, medidas de variabilidad, grficos de barras y circulares, etc. Todos estos elementos, aunque sencillos de obtener, son muy importantes para conocer a fondo los datos de que se dispone.
Estadstica Inferencial
Consiste en inferir o generalizar las propiedades de un todo (llamado poblacin) partiendo de lo observado en una parte de esa poblacin, llamada muestra; Sus mtodos estn basados principalmente en la teora de la probabilidad debido a que el proceso de induccin o generalizacin tiene asociada una cierta incertidumbre.
Regresar
Estadstica en el Gobierno
Se recopilan datos sobre poblacin, educacin, comercio exterior, impuestos, etc. Se usa para la planificacin adecuada de las polticas orientadas a la satisfaccin de las necesidades de los ciudadanos. Los datos tambin los pueden utilizar:
Inversionistas nacionales (negocios) Inversionistas extranjeros Instituciones internacionales
Estadstica en la Educacin
Un educador puede dar seguimiento al rendimiento de sus estudiantes mediante los registros de notas a travs del tiempo junto con informacin familiar, social, etc. Si se quiere estudiar los factores que pueden haber influido en las pruebas de sexto grado realizadas por el Ministerio de Educacin, se podra aplicar un cuestionario con preguntas de seleccin nica tratando de discernir cuales elementos pueden ser tomados en cuenta.
Estadstica en la Educacin
Se pueden estudiar relaciones de afinidad entre estudiantes, o la formacin de grupos (de amigos, de estudio, etc.) entre estudiantes; tambin se pueden estudiar las relaciones de afinidad entre estudiantes y profesores y la relacin de esta afinidad con el grado de dificultad de una materia.
Tipos de muestras
Aleatorias No aleatorias
Regresar
Unidad estadstica
Es el objeto o entidad de inters en cualquier estudio estadstico Es para la cual se debe recoger la informacin Puede tratarse de personas, empresas, barrios, pases, plantas vegetales, bombillos elctricos, etc. Tambin se le llama objeto o individuo. Debe definirse en tiempo y en espacio.
Unidad estadstica
La informacin para el anlisis estadstico se basa en observaciones obtenidas al medir caractersticas de la unidad estadstica. Poblacin: totalidad de las unidades estadsticas
Variables estadsticas
Una variable estadstica es la caracterstica que se observa sobre las unidades estadsticas, de acuerdo con los objetivos del anlisis que se deba hacer. Una variable estadstica asigna, a cada unidad estadstica, un valor (por ejemplo, asigna el nmero 1.76 para indicar la estatura de una persona-unidad estadstica) o un atributo (por ejemplo, para indicar el sexo de una personaunidad estadstica, se usa masculino o femenino). Diremos brevemente variable.
Tipos de variables
Cuantitativas: si asignan un nmero
Continuas: si el nmero es real Discretas: si el nmero es entero
Variables cuantitativas
Tipo de variable Cuantitativa Continua Caractersticas Nmeros reales. Hay una escala o unidad de medida Ejemplos Temperatura, peso de una animal, estatura de una persona, tiempo, edad, salario bruto (ingreso), porcentaje de votos Nmero de hijos, edad en aos cumplidos, nmero de personas
Variables cualitativas
Tipo de variable Cualitativa Ordinal Caractersticas Categoras o modalidades ordenadas Categoras o modalidades no ordenadas Ejemplos Grado de aceptacin, nivel de estudios y de salario Sexo de una persona, provincia de nacimiento, equipo de ftbol preferido, estado civil Conoce un producto, realiza una actividad, posee acciones en una compaa.
Nominal
Muestras
Muestra: parte de la poblacin Muestreo: procedimiento para extraer una muestra Censo: estudio sobre toda la poblacin Encuesta por muestreo: si se usa una muestra Muestreo puede ser: aleatorio o no aleatorio
Muestreo aleatorio
Muestreo simple al azar Muestreo sistemtico Muestreo estratificado Muestreo por conglomerados
Muestreo no aleatorio
Muestreo por cuotas Muestreo por criterio Muestreo por conveniencia
Regresar
Regresar
1.6 El cuestionario
TAREA: leer pginas 25-34, para la prxima clase. TAREA:
Traer el lunes 3 recortes de prensa de esta semana donde se presenten datos estadsticos comentados en el texto de la noticia.
Regresar
Regresar
Desventaja:
no es conveniente incluir mucha informacin, es necesario leer todo el texto para interpretar o entender las cifras.
Regresar
Cuadros
La informacin presentada debe ser:
Fidedigna (verdadera y exacta), Legible (cualquier lector, sin ser especialista, debe ser capaz de comprender lo que se est presentando)
Constituyentes de un cuadro
Nmero de cuadro Ttulo Columna matriz Encabezados Cuerpo o contenido Nota introductoria o preliminar Nota al pie Fuente
Formato de un cuadro
Cuadro N TITULO (Nota introductoria) Columna Matriz Encabezados Encabezados
CUERPO
Componentes de un cuadro
1. Nmero de cuadro: Se usa siempre que haya ms de un cuadro dentro del documento donde el mismo se presenta; este nmero es importante para identificarlo o ubicarlo en una publicacin.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados
CUERPO
Nota al pie
FUENTE
Componentes de un cuadro
2. Ttulo: Es una breve explicacin de la naturaleza, clasificacin y referencia en el tiempo de los datos presentados. Qu son los datos, cundo y dnde se recolectaron, cmo y bajo qu criterios se clasificaron.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados
CUERPO
Nota al pie
FUENTE
Componentes de un cuadro
3. Columna matriz: Es la primera columna, a la izquierda, del cuadro y ella contiene la clasificacin principal que se hizo de la informacin.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados
CUERPO
Nota al pie
FUENTE
Componentes de un cuadro
4. Encabezados: Es la parte del cuadro en la que estn situados los ttulos del resto de las columnas, describiendo en forma general la(s) clasificacin(es) de cada columna.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados
CUERPO
Nota al pie
FUENTE
Componentes de un cuadro
5. Cuerpo o contenido: Es la parte del cuadro que contiene las cifras o datos que se quiere presentar.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados
CUERPO
Nota al pie
FUENTE
Componentes de un cuadro
6. Nota introductoria o Cuadro N preliminar: TITULO (Nota introductoria) Es una frase, generalmente Columna Matriz entre parntesis o CUERPO guiones, colocada debajo del ttulo. Explica o Nota al pie provee informacin relacionada con el cuadro; por ejemplo, se puede utilizar para: Indicar las unidades
Encabezados FUENTE
Encabezados
Dar mas claridad al titulo Prevenir sobre limitaciones Establecar base para comparaciones
Componentes de un cuadro
7. Nota al pie: Es una frase que explica o aclara cierta cifra o clasificacin, su funcin es ms especfica que la de la nota introductoria. Para indicar la nota al pie se utilizan llamadas de atencin (nmeros, smbolos como / *).
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados
CUERPO
Nota al pie
FUENTE
Componentes de un cuadro
8. Fuente: Es una cita bibliogrfica exacta del origen de los datos. No se incluye cuando los datos contenidos en el cuadro fueron obtenidos directamente por la persona o institucin que lo confecciona.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados
CUERPO
Nota al pie
FUENTE
Cuadros: recomendaciones
El cuadro debe atraer atencin sobre las cifras y no sobre la configuracin. En cuanto al tamao del cuadro, se recomienda que no sea ni muy largo y angosto, ni muy ancho y corto. En cuanto al rayado, las partes extremas son abiertas ya que no debe dar la impresin de un cuadro enmarcado. No deben trazarse lneas horizontales dentro del cuerpo, pero, puede subrayarse alguna cifra o valor que se quiera destacar.
Cuadros: recomendaciones
El ttulo debe escribirse en letras maysculas e ir centrado. Si consta de ms de una lnea, las siguientes deben centrarse de acuerdo con las anteriores y colocarse en forma de pirmide truncada invertida.
Cuadros: recomendaciones
Norma INEC: cuando se hace referencia a la caracterstica principal en la columna matriz se debe anteponer la palabra segn y para mencionar la informacin de la caracterstica secundaria -en el encabezadose debe usar el vocablo por dentro del segmento de clasificacin.
Cuadros: recomendaciones
Tanto en la columna matriz Provincia y como en el sexo encabezado puede utilizarse dos o ms San Jos clasificaciones Hombres combinadas.
Mujeres Poblacin XXX XXX XXX
Cuadros: recomendaciones
Las clasificaciones en la columna matriz y el encabezado se pueden ordenar de acuerdo con varios criterios: alfabtico, magnitud, cronolgico, geogrfico, usual o progresivo.
Cuadros: recomendaciones
En ocasiones es necesario incluir las cifras correspondientes a totales en el cuadro; si interesa resaltar el total, ste debe colocarse en la esquina superior izquierda del cuadro, sino, se puede colocar en la parte inferior del cuadro, o en la ltima columna a la derecha.
Cuadros: Ejemplo 1
El Producto Interno Bruto (PIB) de Costa Rica, entre 1986 y 1993, fue de: 4 400.8, 4 510.7, 4 604.5, 5 226.0, 5 676.6, 5 636.7, 6 721.9, 7 521.3 (en millones de dlares). En los restantes pases centroamericanos, los respectivos PIB fueron: en Guatemala 6 335.2, 7 084.4, 7 609.2, 8 458.8, 7 609.1, 9 479.4, 10 842.6, 11 360.7; en El Salvador 3 952.6, 4 628.1, 5 473.2, 5 755.4, 5 346.0, 5 959.1, 6 504.3, 7 609.6; en Honduras 3 798.0, 4 064.0, 4 625.5, 3 744.2, 2 842.9, 3 066.5, 3 364.2, 3 343.9; en Nicaragua 323.6, 409.4, 468.4, 1 120.4, 1 717.5, 1 846.0, 1 791.0, faltando la informacin para 1989; en Panam 5 145.1, 5 309.7, 4 551.4, 4 639.3, 5 009.4, 5 496.4, 6 015.4, 6 564.9.
Cuadro 1
Cuadros: Ejemplo 2
Se dispone de los datos sobre generacin bruta y consumo de energa elctrica para 1992 y 1993, en los pases centroamericanos: en Guatemala la generacin bruta fue de 2802 y 3053 Gigavatios hora, para 1992 y 1993, y el consumo fue de 2370 y 2538 gigavatios hora; en El Salvador la generacin fue de 2382 y 2783, y el consumo de 2050 y 2366; en Honduras la generacin fue de 2342 y 2509, y el consumo de 1684 y 1820; en Nicaragua la generacin fue de 1528 y 1635, y el consumo de 1125 y 1124; en Costa Rica la generacin fue de 4144 y 4386, y el consumo de 3652 y 3890; en Panam la generacin fue de 2903 y 3147, y el consumo de 2311 y 2487.
Cuadro 2
Cuadros: Ejemplo 3
Regresar
Presentacin Grfica
Efecto visual: rea y volumen M. Gmez (1980): un grfico es un instrumento que tiene por objeto presentar datos numricos por medio de magnitudes geomtricas, es decir, mediante longitudes, reas, volmenes, etc.
Regresar
Grficos
Ventajas:
presenta -de una manera atractiva- una idea general permite comparar cierto nmero de valores eficientemente
Desventajas:
muestran valores aproximados no se puede incluir tanta informacin como en un cuadro
Componentes de un grfico
1. Nmero: para identificarlo si hay ms de uno 2. Ttulo: debe indicar el qu, dnde, cmo y cundo de la informacin (ver cuadros) 3. Fuente: indica el origen de la informacin utilizada, puede servir para informar al usuario el lugar donde puede obtener mayor informacin al respecto
Componentes de un grfico
4. Leyenda: cuando en un grfico se incluyen varias series de datos, es necesario identificar cada una de ellas mediante smbolos o leyendas 5. Escala: identifica la unidad de medida correspondiente a los valores en ambos ejes, por ejemplo, 1 cm = 1000 nacimientos
Componentes de un grfico
7. Nota introductoria y nota al pie: se utilizan si son necesarias y en tal caso, se sigue las mismas reglas que en los cuadros 8. Ttulo de los ejes: se utiliza para identificar cada uno de los ejes
Componentes de un grfico
Grfico N TITULO (Nota introductoria)
Grfico
Tipos de Grficos
Grfico de barras
Horizontales Verticales Barras 100%, simples, compuestas, comparativas
Grficos de barras
Barras rectangulares de igual anchura y cuya longitud se determina por la frecuencia de la modalidad o categora. Pueden ser horizontales o verticales. Tipos:
simples compuestas comparativas
C AR NES C ER EALES LAC TEOS VER DUR AS GR AS AS AZUC AR F R IJ OLES R AIC ES HUEVOS VAR IOS 0% 5% 10% P OR C ENTAJ E 15% 20%
Errores comunes
GRFICO 2 EST RUCT URA DE COST OS DE LOS GRUPOS DE ALIMENT OS DE LA CANAST A BASICA DE ALIMENT OS ABRIL 1997 CEREALES FRIJOLES VERDURAS
Orden
GRASAS
GRUPO
AZUCAR LACT EOS RAICES CARNES VARIOS HUEVOS 0% 5% 10% PORCENT AJE 15% 20%
Errores comunes
GRFICO 3 EST RUCT URA DE COST OS DE LOS GRUPOS DE ALIMENT OS DE LA CANAST A BASICA DE ALIMENT OS ABRIL 1997 25% 20%
PORCENTAJE
15% 10% 5%
VERDURAS
CEREALES
HUEVOS
GRASAS
0%
VARIOS
RAICES
FRIJOLES
AZUCAR
GRUPO
FUENTE: Costo de la Canasta Bsica de Alimentos. Ao 3, N 4. Instituto Nacional de Estadstica y Censos.
LACTEOS
CARNES
Barras verticales
Datos cronolgicos
GRAFICO 4 COST A RICA: EVOLUCION DE LA POBLACION T OT AL 1920-1995 (En miles de habitantes a mitad de ao) 4000
HABITANTES
3500 3000 2500 2000 1500 1000 500 0 421 456 499 551 619 1025 717 862
1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 AOS
FUENTE: Encuesta de Hogares de Propsitos Mltiples, Julio 1996. Instituto Nacional de Estadstica y Censos.
PAIS
Grfico circular
GRFICO 7 DIST RIBUCION PORCENT UAL DE LOS NACIMIENT OS INSCRIT OS POR PROVINCIA 1995 Guanacaste 7% Heredia 8% Limn 10% San Jos 34%
Puntarenas 11%
Cartago 11%
Alajuela 19%
Grfico circular
GRAFICO 8 DIST RIBUCION DE LOS EMPLEADOS DE LA EMPRESA XYZ SEGUN NIVEL DE INST RUCCION Universitario 21% Primario 42%
1992
AO AO
FUENTE: Encuesta de Hogares de Propsitos Mltiples, Julio 1996. Instituto Nacional de Estadstica y Censos.
3. DISTRIBUCIONES DE FRECUENCIAS
3.1 Distribuciones de frecuencias de variables cualitativas 3.2 Distribuciones de frecuencias de variables discretas 3.3 Distribuciones de frecuencias de variables continuas 3.4 Diagramas tallo-hoja
Distribuciones de frecuencias
Las observaciones hechas para cada variable se agrupan, ordenan o clasifican en clases o categoras y se anota el total de observaciones hechas para cada clase o categora de la variable en cuestin
Clase o categora
Es el grupo dentro del cual se clasifican las observaciones hechas sobre una variable
Frecuencias acumuladas
Es la suma de la frecuencia de la clase o categora en cuestin, ms las frecuencias de todas las categoras o clases anteriores, es decir es lo que se acumula en cada categora desde la primera categora hasta la ltima.
Frecuencia acumulada
Las frecuencias acumuladas se representan con la letra F mayscula, as: F Frecuencia acumulada menos de Fr Frecuencia relativa acumulada menos de F Frecuencia acumulada ms de Fr Frecuencia relativa acumulada ms de
Ejemplo 1
Supngase que, para las elecciones primarias del Partido Democrtico Nacional, se tienen las siguientes intenciones de voto para los precandidatos, en un grupo de 32 delegados a la convencin de octubre de 1997:
Ejemplo 1
Se cuentan las observaciones (votos) para cada candidato, se obtindose las frecuencias absolutas y se disponen en una tabla:
Ejemplo 1
Ejemplo 2
En la empresa XYZ se tienen 56 empleados durante el segundo trimestre de 1996, de los cuales 23 tienen nivel de instruccin primario, 9 nivel secundario, 12 nivel tcnico o secretarial, y los 12 restantes nivel universitario. Estos datos se disponen en una tabla de frecuencias as (hemos marcado con negrita algunos valores que comentamos ms adelante):
Ejemplo 2
Ejemplo 2
En el ejemplo anterior se observa que el 21.4 % de los empleados tiene nivel universitario. El 57.2%, poco ms de la mitad, tiene nivel secundario o menos. De lo que se deduce que el 42.8% tiene nivel tcnico o ms.
Ejemplo 1
Considere los siguientes datos que equivalen al nmero de ausencias de 40 trabajadores de la Empresa El Comercio en el mes de Octubre de 1997:
Ejemplo 1
Ejemplo 1
Con los datos resumidos en la distribucin de frecuencias, se puede apreciar mejor su comportamiento. Por ejemplo, se observa que slo el 10% de los trabajadores tuvieron 6 ausencias durante el mes de octubre de 1997. El 40% de los trabajadores estuvieron ausentes 2 3 veces en ese mismo mes. El 30% de los trabajadores estuvo 5 o ms veces ausente.
Grfico de bastones
Redondeo
Usual: precisin en centmetros
1.632 metros 1.63 mts 1.817 metros 1.82 mts 1.765 metros 1.76 mts 1.775 metros 1.78 mts
1.632 1.63 1.64 1.817 1.81 1.82
Truncamiento:
1.8934 metros 1.89 mts 1.8976 metros 1.89 mts Hacia arriba: 1.764 metros 1.77 mts 1.769 metros 1.77 mts
Lmites de clase
Lmites indicados o lmites dados: li ls lmite inferior de la clase: li lmite superior de la clase: ls Clase o categora: valores x tales que li x ls Clases abiertas: salario de 200,000 colones o ms corresponde a 200000 x.
Lmites reales
Son los nmeros que delimitan las clases realmente, tomando en cuenta el redondeo considerado Si la precisin es en centmetros y se tienen estaturas, entonces la clase 1.80 1.85 tiene los lmites reales:
1.795, el inferior, y 1.855, el superior.
Ejemplo 1
Otros componentes
Marca o punto medio de clase: promedio de los lmites reales de la clase
el punto medio de la clase 69.5 79.5 dada en kilogramos, es (69.5 + 79.5)/2 = 74.5 el punto medio de la clase 1.80 1.85 dada en cms. es (1.80+1.85)/2 = 1.825 1.82
Construccion de clases
(misma amplitud) 1. Se escoge el nmero de clases k 2. Sean M = mximo y m = mnimo 3. Amplitud: c=(M-m)/k 4. Se cuenta cuntos datos hay en cada clase 5. Se presentan los resultados en forma tabular
Observaciones
En ocasiones, se fija la amplitud de las clases y luego el nmero de clases mediante k=(M-m)/c. Hay casos en que las clases tienen diferente amplitud (ejemplo: salarios; primera y ltima clase con el resto de la informacin) A veces se hacen ajustes a los lmites de clase
Ejemplo 2
100 datos (salarios) el valor mximo es 148 000 y el mnimo es 59 000 se quiere construir una distribucin de frecuencias con 8 clases se tiene k = 8, m = 59 000 y M = 148 000 Luego
c = (148 000 59 000)/8 = 89 000/8 = 11 125
Ejemplo 3
Salarios de empleados Mayor: 450 000, menor 55 000 Precision: miles de colones 5 clases Amplitud: c = (450 000 55 000)/5 = 79 000 Ajuste: c = 80 000
Ejemplo 4
Salario por hora (en colones) Muestra de 50 personas Datos: redondeados al dcimo ms prximo
Se quiere 5 clases
Histograma
Ejemplo 4
M = 173.3, m = 120.4 Amplitud c = (173.3 120.4) / 5 = 10.58 Ajuste: c = 10.6 Clases
Histograma
Ejemplo 4
Lmites de clases:
Clasificar los datos en sus respectivas clases (usando los lmites indicados de cada clase) Calcular las frecuencias Calcular los puntos medios clase
Histograma
Ejemplo 4
Histograma
Ejemplo 5
Edades, redondeadas al ao inferior, de un grupo de personas
7 clases, tenemos: M = 75, m = 20 y k = 7 Por lo tanto, c = (75 20) / 7 = 7.86 que se ajusta a 8 porque los datos son nmeros enteros
Ojiva
Ejemplo 5
Ojiva
Ejemplo 6
Para una muestra de clientes de una Agencia Bancaria se anot el saldo disponible en miles de colones en la cuenta de ahorros al ltimo da del mes anterior, redondeando cada observacin al entero siguiente. Construir una distribucin de frecuencias con intervalos de amplitud 6.
Ojiva
Ejemplo 6
Ejemplo 6
Ojiva
Representacin grfica
Histogramas Polgonos de frecuencias Polgonos de frecuencias acumuladas u ojivas
Histogramas
Cada clase est representada por un rectngulo de altura proporcional a la frecuencia de la clase Los rectngulos van continuos y, en algunas ocasiones, tienen ancho proporcional a la amplitud de la clase. En el eje de las abscisas (eje horizontal), se colocan los lmites reales de las clases, donde se coloca el lmite de cada rectngulo. En el eje de las ordenadas (eje vertical) se coloca una escala para las frecuencias de las clases.
Histograma: ejemplo 1
Polgonos de frecuencias
Se trata de dibujar lneas rectas que unen los puntos consecutivos (x,y), donde x es la marca de cada clase (punto medio de una clase) y y la frecuencia de esa clase. La curva empieza a trazarse desde el eje X y termina tambin en el eje X.
Ejemplo 3
Datos Dist.Frec.
Ejemplo 4
Ejemplo 1
Supngase que se tienen las notas obtenidas por un grupo de 20 estudiantes en un examen universitario y que sus valores (ordenados de menor a mayor) son: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92. Tallos: 1, 2, 3, 4, 5, 6, 7, 8, 9.
Ejemplo 1
Ejemplo 2
Sea el diagrama tallo-hoja Entonces los datos completos son: -39,-36,-35,-32,-32,-28, -23,-18,-17,-17,-14,-11, -7,-5,-2,3,7,11,17,19,30.
Ejemplo 3
Salarios en miles de colones de un grupo de 42 profesores de secundaria:
Max = 595, Min = 103 (diferencia = 492) Cinco tallos, hojas con 2 digitos
Ejemplo 3
Captulo 4
4.1 Medidas de Posicin 4.2 Medidas de Variabilidad 4.3 Medidas de Posicin y Variabilidad para Datos Agrupados 4.4 Cuantiles 4.5 Desviacin Cuartil y Cajas de Dispersin
Notacin de sumatoria
X
i =1
= X 1 + X 2 + X 3 L + X n 1 + X n
X
X =3 8
Ejemplos:
= 3+ 4+5+6+7+8
i =1
n i =1
X i f i = X 1 f1 + X
f2 + L + X
fn
(X
Yi ) 2 = ( X 1 Y1 ) 2 + ( X 2 Y2 ) 2 + L + ( X n Yn ) 2
Propiedades de la sumatoria
Orden:
(X
i =1
n
+ Yi ) = X i + Yi
i =1 i =1
Factor comn:
aX
i =1
= a X i
i =1
a = na
i =1
Ejemplo 1
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. La media simple es:
X = 15 + 45 + 47 + 53 + 58 + 58 + 60 + 62 + 67 + 74 + 75 + 78 + 80 + 80 + 81 + 85 + 85 + 85 + 90 + 92 20
1370 = 68 .50 20
X =
+ p
1
p 2 X 2 + L + p + p 2 + L + p n
pX
i
X =
i =1 n
p
i =1
Ejemplo 2
Supngase que un estudiante tiene las siguientes notas en cuatro cursos matriculados un cuatrimestre: 67, 82, 90, 71. El nmero de crditos que vale cada curso es, respectivamente: 3, 2, 2, 4. Entonces la media ponderada de las notas ser:
X = ( 3 67 ) + ( 2 82 ) + ( 2 90 ) + ( 4 71 ) 829 = 3 + 2 + 2 + 4 11 = 75 . 36
i =1
n
Xi
a) =X a
Mediana
La mediana es el valor que est en el centro de todos los valores, si stos se ordenan. Es un valor tal que no ms de la mitad de las observaciones son mayores que l y que no ms de la mitad son menores que l. La mediana se denota Me.
Mediana
Sean X1, X2, X3, , Xn las observaciones ordenadas de una variable cuantitativa
Si n es impar:
Me = X(n+1)/2
Ejemplo 1
Sean los datos -3, -3, -2, 0, 0, 1, 3, 3, 5, 8, 8, 10, 10 Entonces la mediana est en la posicin (n + 1) 2 = (13 + 1) 2 = 7 , es decir, Me = 3.
Ejemplo 2
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. n = 20 n/2 = 10 y n/2 + 1 = 11 Me = (74+75) 2 = 74.5
Moda
Dada una serie de observaciones para una variable cuantitativa, entonces la moda, denotada Mo, es el valor ms frecuente (si existe), o los valores ms frecuentes (si son varios). Unimodal: 1 moda Bimodal: 2 modas No es nica!
Ejemplo 1
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. Entonces la moda es 85, que tiene frecuencia 3.
Ejemplo 2
Supngase que se tienen observadas las siguientes estaturas de 10 personas, en centmetros: 168, 162, 181, 180, 169, 171, 175, 159, 173, 160 Como no hay ningn valor que sea ms frecuente que los dems, entonces la moda no existe.
Ejemplo 3
En una pequea empresa familiar, se tienen los siguientes salarios mensuales de los empleados, en miles de colones: 30, 35, 35, 35, 40, 90, 120, 120, 120, 150 Entonces hay dos modas: 35 y 120.
Distribucin Simtrica
X = Me = Mo
Consideraciones
La media de un conjunto de datos es la medida que conlleva mayores clculos aritmticos y su valor est afectado por los valores individuales de todos los datos, mientras que la mediana y la moda pueden no ser afectadas por todos los valores. Por ejemplo, vase el siguiente conjunto de datos, en el que el ltimo valor es aumentado:
Consideraciones
En grupos pequeos, la moda puede ser muy inestable o puede no existir. La mediana no se afecta por el tamao de los valores por encima o por debajo de ella. La media es influida por el tamao de cada valor en el grupo de datos. Algunos grupos de datos simplemente no manifiestan una posicin en forma significativa, siendo en este caso engaoso calcular una medida de posicin.
Consideraciones
La posicin de grupos de datos con valores extremos se mide probablemente mejor por la mediana, si las observaciones son unimodales. Sin embargo, si lo que se quiere es que la medida utilizada refleje el efecto de los valores extremos, entonces es conveniente utilizar la media. La media aritmtica es muy til para estimar la suma total de las observaciones si se conoce el nmero de observaciones.
-s1 -s2
+s1 +s2
Recorrido o amplitud
El recorrido o amplitud de una serie de datos es la diferencia entre el valor mximo (M) y el valor mnimo (m) de esa serie. Tambin se conoce como rango y se denota como A. A = M m.
Ejemplo 1
Sean los datos de salarios de una pequea empresa familiar: 30, 35, 35, 35, 40, 90, 120, 120, 120, 150. Entonces A = M m = 150 30 = 120. Si hubiera otro empleado con un salario de 200, entonces la amplitud cambia a: A = M m = 200 30 = 170.
Desviacin Estndar
La desviacin estndar es el promedio de desviacin o diferencia de las observaciones con respecto a la media aritmtica.
Datos observados Media
n
( X i X )2 s=
i =1
n 1
Cantidad de observaciones
Simplificaciones
1 n 2 n 2 s= X i n 1 ( X ) n 1 i =1
1 X n X i i =1 i =1 s= n 1
n n 2 i 2
Var(X) = s2
Ejemplo 1
Considrese el conjunto de notas:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92
Sabemos que la media es 68.50 Como X = 15 + 45 + 47 + L + 90 + 92 = 100714 20 Entonces la varianza es: s = 100714 19 (68.50) 19 Luego, la desviacin estndar es:
20 2 i 2 2 2 2 2 i =1
= 361.53.
Propiedades de s
Si se suma o resta una constante:
(X
s=
i =1 n i
X)
(( X
=
i =1
a ) ( X a )) 2 n 1
n 1
aX )
a
=
i =1
(Xi X ) n 1
(X
=| a |
i =1
X )2 = as
n 1
n 1
Coeficiente de Variacin
Mide la variabilidad porcentual o relativa de un conjunto de datos respecto a su media:
CV = s 100 X
til cuando:
Los datos estn en unidades diferentes. Los datos estn en las mismas unidades, pero las medias son muy diferentes.
Ejemplo
Tipo de accin A B
CV ( A) = S A CV ( B ) = S B XA XB
100 = (500 / 15000 ) 100 = 3%, 100 = (300 / 5000 ) 100 = 6%.
Media o promedio
Para datos agrupados en clases, la media es:
X
X =
i =1 k
fi =
X
i =1
fi
donde
fi n k Xi
i =1
fi
es la frecuencia de la clase i, es el nmero total de observaciones es el nmero de clases, es el punto medio o marca de la clase i, si la variable es continua; si es discreta, entonces Xi es el valor que asume la variable.
Ejemplo 1
X =
Ejemplo 2
Mediana
La mediana debe estar en la clase cuya frecuencia acumulada sea aproximadamente n/2, si n es par, o bien la clase cuya frecuencia acumulada sea aproximadamente (n+1)/2, si n es impar. Se hace una interpolacin del valor donde debe estar la mediana.
Mediana
La mediana se aproxima por
n Fa c Me = Li + 2 fi
donde: fi es la frecuencia de la clase que contiene a la mediana, n es el nmero total de observaciones (suma de los fi), Li es el lmite inferior de la clase que contiene a la mediana, Fa es la frecuencia acumulada de la clase anterior a la clase que contiene a la mediana c es la amplitud de la clase que contiene a la mediana
Ejemplo 1
17
Moda
Ejemplo 2
20
Como n/2 = 40/2 = 20, la mediana es el valor de la variable tal que la frecuencia acumulada menos de sea al menos 20, por lo que el valor de la mediana es 4. Moda
Moda
Clase modal: clase que tiene mayor frecuencia Moda: punto medio de la clase modal Ejemplo 1. La clase modal es la clase: 80 a menos de 90, cuyo punto medio es Xi = 85. Por lo tanto, la moda es 85. Ejemplo 2. El nmero de ausencias ms frecuente es 4, por lo que la moda es 4.
(X
2 i =1
X ) fi
2
s =
Nmero de observaciones
k
n 1
( X i f i ) 2
2 i
X
s=
i =1
fi
i =1
n 1
Ejemplo 1
Ejemplo 2
4.4 Cuantiles
Qi son los cuartiles Ki son los quintiles Di son los deciles Pi son los percentiles
Datos simples
Se define el percentil m, denotado como Pm, como un valor tal que un (m/100)% de las observaciones son menores que l y un (1 m/100)% son mayores que Pm. Pm = [m (n + 1)] 100
Nmero de percentil Nmero de observaciones
Datos agrupados
lmite inferior de la clase que contiene al percentil Nmero de observaciones
m n Fa c Pm = Li + 100 fi
Frecuencia de la clase que contiene al percentil
Nmero de percentil
Ejemplo 1
Considrese el conjunto de notas:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92
Los cuartiles son: Q1 = 58, Q2 = Me = 74.5 y Q3 = 83 Entonces la desviacion cuartil es Q = (83 58) 2 = 12.5 Asi, las notas se encuentran entre 74.5 12.5 = 62 y 74.5 + 12.5 = 87.
Ejemplo 2
Q1 (30) Q3 (90)
Ejemplo 2
Q1 = 4500 + 500 [(25/100 120) - 21] 22 = 4500 + (500 9) 22 = 4704.5 Q3 = 5500 + 500 [(75/100 120) - 83] 24 = 5500 + (500 7) 24 = 5645.8 La desviacin cuartil es: Q = (5645.8 4704.2) 2 = 470.65
Cajas de Dispersin
Limite permitido Datos atipicos Ultimo dato normal
50%
25%
25%
a = Q1 2Q b = Q3 + 2Q
25%
50%
25%
Ejemplo 3
Considerar el ejemplo de 20 notas.
Q1 = 58, Q2 = Me = 74.5, Q3 = 83 y Q = 12.5. a = Q1 2Q = 58 25 = 33 b = Q3 + 2Q = 83 + 25 = 108 xa = 45 > 33 ; xb = 92 < 108.
Ejemplo 4
Considerar la tabla de frecuencias del plan complementario de pensiones Q1 = 4704.5, Q3 = 5645.8 y Q = 470.65 a = Q1 2Q = 4704.5 941.3 = 3763.2 b = Q3 + 2Q = 5645.8 + 941.3 = 6587.1 xa =3766 y xb =6586