You are on page 1of 213

Introduccin a la Estadstica Descriptiva

Javier Trejos Zelaya - Ericka Moya Vargas


Universidad Latina de Costa Rica Editorial Sello Latino, San Jose 2004

Contenidos
1. PRINCIPIOS DE LA INVESTIGACIN ESTADSTICA 2. FORMAS DE PRESENTACIN DE LA INFORMACIN 3. DISTRIBUCIONES DE FRECUENCIAS 4. MEDIDAS DE POSICIN Y DE VARIABILIDAD

1. Principios de la Investigacin Estadstica


1.1 La disciplina estadstica 1.2 Aplicaciones y usos de la Estadstica 1.3 Elementos bsicos de la Estadstica 1.4 Fuentes de informacin 1.5 Tcnicas de recoleccin de la informacin 1.6 El cuestionario 1.7 Fases de una investigacin estadstica tpica
Regresar

1.1 La disciplina estadstica


La Estadstica es una ciencia que trata del desarrollo y aplicacin de mtodos eficientes de recoleccin, procesamiento, anlisis e interpretacin de datos numricos. Datos: conjuntos de nmeros que han sido obtenidos en un cierto contexto. Esto significa que los datos provienen de un experimento u observacin con fines determinados.
Regresar

Estadstica Descriptiva
Se trata de hacer descripciones de los datos, principalmente mediante nmeros que resumen la informacin, cuadros que la presenten adecuadamente y grficos que sean fciles de interpretar. Es corriente usar trminos como medidas de posicin, medidas de variabilidad, grficos de barras y circulares, etc. Todos estos elementos, aunque sencillos de obtener, son muy importantes para conocer a fondo los datos de que se dispone.

Estadstica Inferencial
Consiste en inferir o generalizar las propiedades de un todo (llamado poblacin) partiendo de lo observado en una parte de esa poblacin, llamada muestra; Sus mtodos estn basados principalmente en la teora de la probabilidad debido a que el proceso de induccin o generalizacin tiene asociada una cierta incertidumbre.
Regresar

1.2 Aplicaciones y usos de la Estadstica


La Estadstica se aplica en diversos campos del quehacer humano, ya que ayuda a tomar decisiones basadas en grandes cantidades de informacin. A continuacin veremos algunos ejemplos de aplicaciones y usos que tiene la Estadstica en diferentes campos.
Regresar

Estadstica en Administracin y Economa


En una industria, se hace inspeccin de los artculos comprados como materia prima. Se debe entonces contar los artculos defectuosos en el lote comprado. En una industria, se deben llevar registros de la produccin, tanto en volumen como en calidad.

Estadstica en Administracin y Economa


En un estudio de mercado, se toma una muestra de clientes y se pide la opinin de las personas acerca de las calidades de cierto producto. El comerciante detallista debe decidir cada da la cantidad de unidades de artculos perecederos que debe encargar para el da siguiente. Para ello, debe observar las ventas de artculos, los costos en que se incurre por quedar con un remanente almacenado, los costos por no satisfacer completamente la demanda.

Estadstica en el Gobierno
Se recopilan datos sobre poblacin, educacin, comercio exterior, impuestos, etc. Se usa para la planificacin adecuada de las polticas orientadas a la satisfaccin de las necesidades de los ciudadanos. Los datos tambin los pueden utilizar:
Inversionistas nacionales (negocios) Inversionistas extranjeros Instituciones internacionales

Estadstica en las Ciencias Sociales


Encuestas de opinin pblica: temas de actualidad, pulso poltico, intenciones de voto. Generalmente, los resultados que presenta la prensa estn basados en estadsticas simples (clculos de frecuencias, medias, grficos de barras o circulares), como las que veremos en este curso.

Estadstica en las Ciencias Sociales


Estructurar la opinin pblica: muchas veces no importa tanto cunta gente va a votar por el candidato X, sino quines y por qu lo harn, lo cual puede ser de vital importancia para disear estrategias de campaa con el fin de llegarle a los que no van a votar por el candidato. Similarmente, el empresario puede desear saber quines compran (o estn dispuestos a comprar) su producto o servicio y por qu, o bien quines no lo compran.

Estadstica en las Ciencias Sociales


En Sociologa, Psicologa, Antropologa, Arqueologa, Historia, Lingstica, etc. se analizan enormes cantidades de datos: comportamiento de la sociedad, de los individuos, piezas arqueolgicas y fsiles, documentos y archivos histricos, textos, etc. En todas estas ciencias, la Estadstica juega un papel importante para sintetizar o resumir la informacin, as como para verificar ciertas hiptesis que se formulan.

Estadstica en la Educacin
Un educador puede dar seguimiento al rendimiento de sus estudiantes mediante los registros de notas a travs del tiempo junto con informacin familiar, social, etc. Si se quiere estudiar los factores que pueden haber influido en las pruebas de sexto grado realizadas por el Ministerio de Educacin, se podra aplicar un cuestionario con preguntas de seleccin nica tratando de discernir cuales elementos pueden ser tomados en cuenta.

Estadstica en la Educacin
Se pueden estudiar relaciones de afinidad entre estudiantes, o la formacin de grupos (de amigos, de estudio, etc.) entre estudiantes; tambin se pueden estudiar las relaciones de afinidad entre estudiantes y profesores y la relacin de esta afinidad con el grado de dificultad de una materia.

Estadstica en las Ciencias de la Salud


Para el diagnstico de algunas enfermedades, es necesario tener un historial completo de los pacientes y registrar los sntomas que han sufrido; los expedientes mdicos de pacientes de aos anteriores son muy importantes ya que puede ayudar a discernir entre dos enfermedades que se parezcan mucho.

Estadstica en las Ciencias de la Salud


Para tomar una decisin en cuanto a realizar una ciruga o no, son necesarios una serie de exmenes a los pacientes con el fin de determinar si no se corren mayores riesgos; estos exmenes aportan datos que son los que ayudan a tomar la decisin. La medicin de la eficacia de un medicamento se hace muchas veces mediante pruebas estadsticas, primero con animales y luego con algunos seres humanos.

Estadstica en las Ciencias de la Salud


Investigaciones en salud pblica en las que se trata de determinar la existencia de relaciones entre las costumbres y la presencia de enfermedades; En estudios sobre nutricin se determina y analiza la dieta promedio de ciertos grupos de poblacin, para obtener su contenido de elementos nutritivos y as determinar sus deficiencias; Si hay una epidemia en un lugar, mediante una encuesta se puede conocer, cul es la verdadera incidencia de la enfermedad en ese lugar.

Estadstica en las Ciencias Biolgicas


Los bilogos estudian la relacin entre las especies biolgicas y su hbitat; estos estudios abundan en datos que deben ser analizados concienzudamente con el fin de obtener el mximo conocimiento.

Estadstica en las Ciencias Biolgicas


La taxonoma de especies biolgicas pasa, en primera instancia, por la recopilacin de las caractersticas de las especies; por ejemplo, para clasificar las mariposas se deben medir sus dimensiones, registrar sus colores, estudiar su comportamiento alimenticio y reproductivo, etc. Aparte de la taxonoma, los bilogos tambin hacen otros tipos de clasificaciones que necesitan el anlisis de muchos datos.

Estadstica en las Ingenieras


Los anlisis de control de calidad necesitan de la obtencin de informacin acerca de los productos que son fabricados o de los servicios que se brindan; Muchas veces, en el caso de fabricacin de productos, se toman muestras y stas deben pasar una serie de exmenes de resistencia, durabilidad, etc.

Estadstica en las Ingenieras


Simulacin: se crean las condiciones (artificiales) en que los procesos se aplicaran y se trata de ver los resultados que se obtendran; La simulacin requiere del uso de parmetros y normalmente stos provienen de experiencias previas que han arrojado suficientes datos. La simulacin tambin puede emplearse en otros contextos adems de la fabricacin, como por ejemplo en simulaciones de vuelo, de trfico areo, de crecimiento de cultivos, etc.

Estadstica en las Ciencias Agronmicas


Frecuentemente, se hacen estudios de suelos para determinar cuales suelos son los ms apropiados para determinados cultivos. Estos estudios conllevan el examen de diversas muestras para estudiar la composicin qumica del suelo, adems de la pendiente del terreno, horas de sol, precipitacin pluvial, etc.

Estadstica en las Ciencias Agronmicas


Se hacen estudios para determinar los efectos que tienen diversos factores en la productividad de un cultivo: tipos de abonos, tipos de suelos, densidad de siembra, fecha de siembra, cantidad de irrigacin, etc. Para estudiar la productividad en el ganado: tipo de alimento, tipo de pasto, cantidad de ganado por parcela, etc. En todos estos casos, se necesitan amplios estudios estadsticos con grandes cantidades de datos.

Estadstica en las Ciencias Agronmicas


Con el fin de clasificar a las fincas o a los finqueros, se hacen estudios de tipificacin, que toman en cuenta el tamao de las fincas o parcelas, las habilidades y costumbres empresariales del finquero, la forma de comercializar sus productos, etc. Los organismos que brindan ayuda a los agricultores, pueden tener programas de apoyo destinados a un tipo especfico de finquero, y para ello la clasificacin previa es importante.
Regresar

1.3 Elementos bsicos de la Estadstica


Unidad estadstica y poblacin Variables estadsticas
Cuantitativas: continuas, discretas Cualitativas: nominales, ordinales, binarias

Tipos de muestras
Aleatorias No aleatorias
Regresar

Unidad estadstica
Es el objeto o entidad de inters en cualquier estudio estadstico Es para la cual se debe recoger la informacin Puede tratarse de personas, empresas, barrios, pases, plantas vegetales, bombillos elctricos, etc. Tambin se le llama objeto o individuo. Debe definirse en tiempo y en espacio.

Unidad estadstica
La informacin para el anlisis estadstico se basa en observaciones obtenidas al medir caractersticas de la unidad estadstica. Poblacin: totalidad de las unidades estadsticas

Unidad estadstica: Ejemplo 1


Si se desea conocer el monto pagado por cada industria del distrito central de Curridabat por concepto de impuestos locales durante el ao 1996, entonces la unidad estadstica es cada industria situada en el distrito central de Curridabat en el ao 1996. En este caso la poblacin es el conjunto de industrias situadas en el distrito central de Curridabat en 1996; es una poblacin finita.

Unidad estadstica: Ejemplo 2


Si se quiere tener informacin sobre la cantidad de alumnos matriculados en la Universidad de Costa Rica durante el primer semestre de 2004, entonces la unidad estadstica es cada alumno matriculado en la Universidad de Costa Rica en el primer semestre de 2004.

Unidad estadstica: Ejemplo 3


Para hacer un estudio acerca de las caractersticas de las fincas de los pequeos productores de caf situadas en el Valle Central en el ao 1995, entonces la unidad estadstica es cada finca del pequeo productor de caf situada en el Valle Central en 1995.

Unidad estadstica: Ejemplo 4


Para estudiar las horas de sol que reciben las hojas de plantas de banano en el sector de Cariari de Pococ durante el ao de 1997, entonces la unidad estadstica es una hoja de banano de las plantaciones del sector de Cariari de Pococ en 1997. La poblacin es el conjunto de hojas de banano de las plantaciones del sector de Cariari de Pococ en 1997; por razones prcticas, se considera que la poblacin es infinita.

Variables estadsticas
Una variable estadstica es la caracterstica que se observa sobre las unidades estadsticas, de acuerdo con los objetivos del anlisis que se deba hacer. Una variable estadstica asigna, a cada unidad estadstica, un valor (por ejemplo, asigna el nmero 1.76 para indicar la estatura de una persona-unidad estadstica) o un atributo (por ejemplo, para indicar el sexo de una personaunidad estadstica, se usa masculino o femenino). Diremos brevemente variable.

Tipos de variables
Cuantitativas: si asignan un nmero
Continuas: si el nmero es real Discretas: si el nmero es entero

Cualitativas: si asignan un elemento de un conjunto


Ordinales: si el conjunto est ordenado Nominales: si no est ordenado Binaria: presencia-ausencia

Variables cuantitativas
Tipo de variable Cuantitativa Continua Caractersticas Nmeros reales. Hay una escala o unidad de medida Ejemplos Temperatura, peso de una animal, estatura de una persona, tiempo, edad, salario bruto (ingreso), porcentaje de votos Nmero de hijos, edad en aos cumplidos, nmero de personas

Discreta o de Nmeros enteros. No hay escala. conteo

Variables cualitativas
Tipo de variable Cualitativa Ordinal Caractersticas Categoras o modalidades ordenadas Categoras o modalidades no ordenadas Ejemplos Grado de aceptacin, nivel de estudios y de salario Sexo de una persona, provincia de nacimiento, equipo de ftbol preferido, estado civil Conoce un producto, realiza una actividad, posee acciones en una compaa.

Nominal

Binaria o de presenciaausencia (0-1)

Slo dos categoras (se tiene o no se tiene una propiedad)

Muestras
Muestra: parte de la poblacin Muestreo: procedimiento para extraer una muestra Censo: estudio sobre toda la poblacin Encuesta por muestreo: si se usa una muestra Muestreo puede ser: aleatorio o no aleatorio

Cundo usar una muestra?


La poblacin es infinita La poblacin, aunque finita, es muy grande y sera imposible o muy costoso obtener informacin de todos los elementos La unidad estadstica se transforma o destruye al ser estudiada Aunque se pudiera hacer un censo, los resultados que se obtendran al realizar una encuesta por muestreo seran suficientes y precisos

Muestreo aleatorio
Muestreo simple al azar Muestreo sistemtico Muestreo estratificado Muestreo por conglomerados

Muestreo no aleatorio
Muestreo por cuotas Muestreo por criterio Muestreo por conveniencia

Regresar

1.4 Fuentes de informacin


Fuentes primarias: Fuentes que publican o suministran datos recogidos por ellas mismas. Fuentes secundarias: Fuentes que toman y/o publican datos recogidos o publicados anteriormente por otras.
Regresar

1.5 Tcnicas de recoleccin de la informacin


1. Entrevista: Esta tcnica requiere que el entrevistador realice una serie de preguntas preparadas en un cuestionario y registre las respuestas del informante. Puede ser de dos tipos:
Entrevista personal o entrevista cara a cara Entrevista telefnica
Regresar

Tcnicas de recoleccin de la informacin


2. Cuestionario autoadministrado: En esta tcnica, el informante recibe un cuestionario a travs del correo, o de algn otro medio (fax, internet, entrega personal, etc.); anota las respuestas y lo devuelve utilizando alguno de los medios indicados.

Tcnicas de recoleccin de la informacin


3. Observacin y medicin: Se trata de observar directamente lo que interesa y anotar los datos observados. Las observaciones pueden ser el resultado de hacer mediciones o conteos. 4. Registro: Esta tcnica consiste en obtener informacin de fuentes objetivas donde se registran, generalmente en forma obligatoria, ciertos hechos de inters.

Ventajas y desventajas de cada tcnica


Tcnica Ventajas Desventajas Alto costo Desconfianza del entrevistado Influencia del entrevistador puede ser un elemento distorsionador Longitud limitada (en ocasiones) Entrevista Motiva al entrevistado personal Permite aclarar preguntas y/o verificar respuestas Alto porcentaje de respuesta Permite accesar a todos los elementos de la poblacin Permite mayor control sobre la muestra

Ventajas y desventajas de cada tcnica


Tcnica Ventajas Desventajas Longitud limitada No permite accesar a todos los elementos de la poblacin Entrevista Bajo costo telefnica Alto porcentaje de respuesta Permite verificar las respuestas Ms flexible con respecto a la hora de la entrevista

Ventajas y desventajas de cada tcnica


Tcnica Cuestionario autoadministrado Ventajas Bajo costo Longitud casi ilimitada Provee mayor comodidad al informante en cuanto a libertad de respuesta y tiempo para responder Permite tratar temas delicados o embarazosos con confianza por parte del informante Desventajas Porcentaje de respuesta bajo Dificulta la aclaracin de dudas, por lo que pueden presentarse errores de interpretacin por parte del informante Requiere un sistema de correo eficiente, o bien, acceso a otros medios (fax, correo electrnico, etc.) Requiere informantes con nivel educativo alto

Ventajas y desventajas de cada tcnica


Tcnica Ventajas Desventajas Errores en la observacin Instrumento mal calibrado Instrumento mal utilizado Verificacin de datos Alto costo segn los casos Observacin Neutralidad u objetividad y Medicin

Ventajas y desventajas de cada tcnica


Tcnica Registro Ventajas Bajo costo Informacin real y objetiva Desventajas Puede tener informacin desactualizada o incompleta La informacin disponible no siempre coincide con los fines estadsticos

Tcnicas de recoleccin de la informacin: Ejemplo 1


Si se quiere hacer una encuesta tal que la persona deba pensar durante un tiempo la respuesta, o deba consultar alguna documentacin (facturas, recibos, etc.), ser preferible utilizar un cuestionario autoadministrado.

Tcnicas de recoleccin de la informacin: Ejemplo 2


Si se quiere hacer una encuesta sobre personas asalariadas y se dispone de una lista de los lugares de trabajo de inters, es preferible hacer una entrevista en el lugar de trabajo que en el domicilio, ya que ser ms fcil localizar al informante.

Tcnicas de recoleccin de la informacin: Ejemplo 3


Para obtener informacin sobre hbitos de compra, publicidad por medio de afiches o presentacin en vitrinas o estantes, por ejemplo, es preferible la entrevista personal (por ejemplo, en la calle), abordando al entrevistado cuando recin ha tenido contacto con el tema de la encuesta.

Tcnicas de recoleccin de la informacin: Ejemplo 4


Para calcular el porcentaje de hogares que escucharon un mensaje publicitario por radio o televisin, es recomendable utilizar la entrevista telefnica

Regresar

1.6 El cuestionario
TAREA: leer pginas 25-34, para la prxima clase. TAREA:
Traer el lunes 3 recortes de prensa de esta semana donde se presenten datos estadsticos comentados en el texto de la noticia.
Regresar

1.7 Fases de una investigacin estadstica tpica


1. 2. 3. 4. 5. 6. Planteamiento del problema Diseo de la encuesta Obtencin de la informacin Preparacin de la informacin Anlisis e interpretacin Presentacin de resultados
Regresar

2. FORMAS DE PRESENTACIN DE LA INFORMACIN


2.1 Presentacin textual 2.2 Presentacin semitabular 2.3 Presentacin tabular: Cuadros 2.4 Presentacin Grfica 2.5 Tipos de Grficos

2.1 Presentacin textual


Consiste en introducir las cifras o datos dentro del texto. Es muy usada en artculos de peridicos o revistas y en informes.

Regresar

2.1 Presentacin textual


En comparacin con 1994, la economa experiment en 1995 una reduccin en la tasa de crecimiento, pues alcanz apenas el 2.5%, mientras que el promedio anual entre 1985 y 1994 haba sido de 4.9%.
(El Estado de La Nacin en desarrollo humano sostenible, Proyecto Estado de la Nacin, San Jos, Costa Rica. 1995, pg. 41)

2.1 Presentacin textual


Ventajas:
es apropiada para presentar poca informacin en una forma simple, permite explicar mejor algunos aspectos importantes y resaltar ciertos datos.

Desventaja:
no es conveniente incluir mucha informacin, es necesario leer todo el texto para interpretar o entender las cifras.
Regresar

2.2 Presentacin semitabular


En el ltimo mes, la mayora de los bancos ha disminuido los intereses para vivienda, como se puede apreciar a continuacin:
Inters antes del 1 de setiembre Banco Comercial Banco Industrial Crdito Mutual Banco del Caribe 21.0% 21.5% 20.5% 21.0% Inters actual 20.0% 20.5% 10.0% 20.0%

Se espera que esta reduccin de intereses incentive el sector de la construccin. Regresar

2.3 Presentacin tabular


Cuadros o tablas Una lista de datos cuantitativos interrelacionados, distribuidos en columnas y filas con palabras, frases y afirmaciones explicativas y aclaratorias, en nmero suficiente, en forma de ttulos, encabezados y notas que aclaren el significado completo de los datos y su origen. (M. Gmez 1980)
Regresar

Cuadros
La informacin presentada debe ser:
Fidedigna (verdadera y exacta), Legible (cualquier lector, sin ser especialista, debe ser capaz de comprender lo que se est presentando)

Ventaja: comunica claramente la informacin sin necesidad de texto.

Constituyentes de un cuadro
Nmero de cuadro Ttulo Columna matriz Encabezados Cuerpo o contenido Nota introductoria o preliminar Nota al pie Fuente

Formato de un cuadro
Cuadro N TITULO (Nota introductoria) Columna Matriz Encabezados Encabezados

CUERPO

Nota al pie FUENTE

Componentes de un cuadro
1. Nmero de cuadro: Se usa siempre que haya ms de un cuadro dentro del documento donde el mismo se presenta; este nmero es importante para identificarlo o ubicarlo en una publicacin.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados

CUERPO

Nota al pie
FUENTE

Componentes de un cuadro
2. Ttulo: Es una breve explicacin de la naturaleza, clasificacin y referencia en el tiempo de los datos presentados. Qu son los datos, cundo y dnde se recolectaron, cmo y bajo qu criterios se clasificaron.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados

CUERPO

Nota al pie
FUENTE

Componentes de un cuadro
3. Columna matriz: Es la primera columna, a la izquierda, del cuadro y ella contiene la clasificacin principal que se hizo de la informacin.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados

CUERPO

Nota al pie
FUENTE

Componentes de un cuadro
4. Encabezados: Es la parte del cuadro en la que estn situados los ttulos del resto de las columnas, describiendo en forma general la(s) clasificacin(es) de cada columna.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados

CUERPO

Nota al pie
FUENTE

Componentes de un cuadro
5. Cuerpo o contenido: Es la parte del cuadro que contiene las cifras o datos que se quiere presentar.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados

CUERPO

Nota al pie
FUENTE

Componentes de un cuadro
6. Nota introductoria o Cuadro N preliminar: TITULO (Nota introductoria) Es una frase, generalmente Columna Matriz entre parntesis o CUERPO guiones, colocada debajo del ttulo. Explica o Nota al pie provee informacin relacionada con el cuadro; por ejemplo, se puede utilizar para: Indicar las unidades
Encabezados FUENTE

Encabezados

Dar mas claridad al titulo Prevenir sobre limitaciones Establecar base para comparaciones

Componentes de un cuadro
7. Nota al pie: Es una frase que explica o aclara cierta cifra o clasificacin, su funcin es ms especfica que la de la nota introductoria. Para indicar la nota al pie se utilizan llamadas de atencin (nmeros, smbolos como / *).
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados

CUERPO

Nota al pie
FUENTE

Componentes de un cuadro
8. Fuente: Es una cita bibliogrfica exacta del origen de los datos. No se incluye cuando los datos contenidos en el cuadro fueron obtenidos directamente por la persona o institucin que lo confecciona.
Cuadro N TITULO (Nota introductoria) Columna Matriz
Encabezados Encabezados

CUERPO

Nota al pie
FUENTE

Cuadros: recomendaciones
El cuadro debe atraer atencin sobre las cifras y no sobre la configuracin. En cuanto al tamao del cuadro, se recomienda que no sea ni muy largo y angosto, ni muy ancho y corto. En cuanto al rayado, las partes extremas son abiertas ya que no debe dar la impresin de un cuadro enmarcado. No deben trazarse lneas horizontales dentro del cuerpo, pero, puede subrayarse alguna cifra o valor que se quiera destacar.

Cuadros: recomendaciones
El ttulo debe escribirse en letras maysculas e ir centrado. Si consta de ms de una lnea, las siguientes deben centrarse de acuerdo con las anteriores y colocarse en forma de pirmide truncada invertida.

Cuadros: recomendaciones
Norma INEC: cuando se hace referencia a la caracterstica principal en la columna matriz se debe anteponer la palabra segn y para mencionar la informacin de la caracterstica secundaria -en el encabezadose debe usar el vocablo por dentro del segmento de clasificacin.

Cuadros: recomendaciones
Tanto en la columna matriz Provincia y como en el sexo encabezado puede utilizarse dos o ms San Jos clasificaciones Hombres combinadas.
Mujeres Poblacin XXX XXX XXX

Cuadros: recomendaciones
Las clasificaciones en la columna matriz y el encabezado se pueden ordenar de acuerdo con varios criterios: alfabtico, magnitud, cronolgico, geogrfico, usual o progresivo.

Cuadros: recomendaciones
En ocasiones es necesario incluir las cifras correspondientes a totales en el cuadro; si interesa resaltar el total, ste debe colocarse en la esquina superior izquierda del cuadro, sino, se puede colocar en la parte inferior del cuadro, o en la ltima columna a la derecha.

Cuadros: Ejemplo 1
El Producto Interno Bruto (PIB) de Costa Rica, entre 1986 y 1993, fue de: 4 400.8, 4 510.7, 4 604.5, 5 226.0, 5 676.6, 5 636.7, 6 721.9, 7 521.3 (en millones de dlares). En los restantes pases centroamericanos, los respectivos PIB fueron: en Guatemala 6 335.2, 7 084.4, 7 609.2, 8 458.8, 7 609.1, 9 479.4, 10 842.6, 11 360.7; en El Salvador 3 952.6, 4 628.1, 5 473.2, 5 755.4, 5 346.0, 5 959.1, 6 504.3, 7 609.6; en Honduras 3 798.0, 4 064.0, 4 625.5, 3 744.2, 2 842.9, 3 066.5, 3 364.2, 3 343.9; en Nicaragua 323.6, 409.4, 468.4, 1 120.4, 1 717.5, 1 846.0, 1 791.0, faltando la informacin para 1989; en Panam 5 145.1, 5 309.7, 4 551.4, 4 639.3, 5 009.4, 5 496.4, 6 015.4, 6 564.9.

Cuadro 1

Cuadros: Ejemplo 2
Se dispone de los datos sobre generacin bruta y consumo de energa elctrica para 1992 y 1993, en los pases centroamericanos: en Guatemala la generacin bruta fue de 2802 y 3053 Gigavatios hora, para 1992 y 1993, y el consumo fue de 2370 y 2538 gigavatios hora; en El Salvador la generacin fue de 2382 y 2783, y el consumo de 2050 y 2366; en Honduras la generacin fue de 2342 y 2509, y el consumo de 1684 y 1820; en Nicaragua la generacin fue de 1528 y 1635, y el consumo de 1125 y 1124; en Costa Rica la generacin fue de 4144 y 4386, y el consumo de 3652 y 3890; en Panam la generacin fue de 2903 y 3147, y el consumo de 2311 y 2487.

Cuadro 2

Cuadros: Ejemplo 3

Regresar

Presentacin Grfica
Efecto visual: rea y volumen M. Gmez (1980): un grfico es un instrumento que tiene por objeto presentar datos numricos por medio de magnitudes geomtricas, es decir, mediante longitudes, reas, volmenes, etc.

Regresar

Grficos
Ventajas:
presenta -de una manera atractiva- una idea general permite comparar cierto nmero de valores eficientemente

Desventajas:
muestran valores aproximados no se puede incluir tanta informacin como en un cuadro

Componentes de un grfico
1. Nmero: para identificarlo si hay ms de uno 2. Ttulo: debe indicar el qu, dnde, cmo y cundo de la informacin (ver cuadros) 3. Fuente: indica el origen de la informacin utilizada, puede servir para informar al usuario el lugar donde puede obtener mayor informacin al respecto

Componentes de un grfico
4. Leyenda: cuando en un grfico se incluyen varias series de datos, es necesario identificar cada una de ellas mediante smbolos o leyendas 5. Escala: identifica la unidad de medida correspondiente a los valores en ambos ejes, por ejemplo, 1 cm = 1000 nacimientos

Componentes de un grfico
7. Nota introductoria y nota al pie: se utilizan si son necesarias y en tal caso, se sigue las mismas reglas que en los cuadros 8. Ttulo de los ejes: se utiliza para identificar cada uno de los ejes

Componentes de un grfico
Grfico N TITULO (Nota introductoria)

Ttulos de los ejes

Grfico

Ttulos de los ejes Leyenda


Nota al pie Fuente

Tipos de Grficos
Grfico de barras
Horizontales Verticales Barras 100%, simples, compuestas, comparativas

Grfico circular Grfico lineal


Aritmtico Logartmico

Pictograma, superficie dividida,


Regresar

Grficos de barras
Barras rectangulares de igual anchura y cuya longitud se determina por la frecuencia de la modalidad o categora. Pueden ser horizontales o verticales. Tipos:
simples compuestas comparativas

Caractersticas de las barras


Las barras deben ser de igual ancho La longitud de la barra debe ser proporcional a la cantidad que representa El espacio de separacin entre barra y barra debe ser constante Se usan tanto valores absolutos como relativos La base cero debe especificarse, y la escala debe ser continua (sin interrupciones)

Grfico de barras simples


Se presenta slo un componente. Es til para comparar las magnitudes de las categoras. Si la serie es cualitativa o geogrfica las barras se colocan horizontalmente. Las barras, stas se ordenan segn su longitud de mayor a menor, (excepto la categora otros o varios extremo inferior). Si la serie es temporal o cuantitativa discreta, las barras se colocan verticalmente

Grfico de barras simples


GR F IC O 1 ES TR UC TUR A DE C OS TOS DE LOS GR UP OS DE ALIM ENTOS DE LA C ANAS TA B AS IC A DE ALIM ENTOS AB R IL 1997

C AR NES C ER EALES LAC TEOS VER DUR AS GR AS AS AZUC AR F R IJ OLES R AIC ES HUEVOS VAR IOS 0% 5% 10% P OR C ENTAJ E 15% 20%

FUENTE: Costo de la Canasta Bsica de Alimentos. Ao 3, N 4. Instituto Nacional de Estadstica y Censos.

Errores comunes
GRFICO 2 EST RUCT URA DE COST OS DE LOS GRUPOS DE ALIMENT OS DE LA CANAST A BASICA DE ALIMENT OS ABRIL 1997 CEREALES FRIJOLES VERDURAS

Orden

GRASAS

GRUPO

AZUCAR LACT EOS RAICES CARNES VARIOS HUEVOS 0% 5% 10% PORCENT AJE 15% 20%

FUENTE: Costo de la Canasta Bsica de Alimentos. Ao 3, N 4. Instituto Nacional de Estadstica y Censos.

Errores comunes
GRFICO 3 EST RUCT URA DE COST OS DE LOS GRUPOS DE ALIMENT OS DE LA CANAST A BASICA DE ALIMENT OS ABRIL 1997 25% 20%

PORCENTAJE

15% 10% 5%

VERDURAS

CEREALES

Deben ser barras horizontales

HUEVOS

GRASAS

0%

VARIOS

RAICES

FRIJOLES

AZUCAR

GRUPO
FUENTE: Costo de la Canasta Bsica de Alimentos. Ao 3, N 4. Instituto Nacional de Estadstica y Censos.

LACTEOS

CARNES

Barras verticales
Datos cronolgicos
GRAFICO 4 COST A RICA: EVOLUCION DE LA POBLACION T OT AL 1920-1995 (En miles de habitantes a mitad de ao) 4000

3424 3034 2642 2284 1236 1482 1731 1968

HABITANTES

3500 3000 2500 2000 1500 1000 500 0 421 456 499 551 619 1025 717 862

1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 AOS

Grfico de barras compuestas


3500 3000 HABITANTES 2500 2000 1500 1000 500 0 1992 1993 1994 AO INACTIVA ACTIVA 1995 1996 GRAFICO 5 COSTA RICA: POBLACION TOTAL POR AO SEGUN CONDICION DE ACTIVIDAD 1992-1996 (En miles de habitantes)

FUENTE: Encuesta de Hogares de Propsitos Mltiples, Julio 1996. Instituto Nacional de Estadstica y Censos.

Grfico de barras comparativas


GRAFICO 6 CENT ROAMERICA: CONSUMO DE ENERGIA ELECT RICA SEGUN PAIS 1992-1993 (En gigavatios por hora)

Costa Rica Guatemala

PAIS

Panam El Salvador Honduras Nicaragua 0 1000 2000 3000 4000 5000

CONSUMO 1992 1993

FUENTE: Series Estadsticas Seleccionadas de Centroamrica, SIECA (1995)

Grfico circular
GRFICO 7 DIST RIBUCION PORCENT UAL DE LOS NACIMIENT OS INSCRIT OS POR PROVINCIA 1995 Guanacaste 7% Heredia 8% Limn 10% San Jos 34%

Caso cualitativo nominal

Puntarenas 11%

Cartago 11%

Alajuela 19%

FUENTE: Clculo de Poblacin, Enero 1996. Instituto Nacional de Estadstica y Censos.

Grfico circular
GRAFICO 8 DIST RIBUCION DE LOS EMPLEADOS DE LA EMPRESA XYZ SEGUN NIVEL DE INST RUCCION Universitario 21% Primario 42%

Caso cualitativo ordinal

T cnico o Secretarial 21% Secundario 16%

FUENTE: Departamento de Recursos Humanos, Empresa XYZ (1996)

Grfico lineal aritmtico


GRAFICO 9 GRAFICO9 PRODUCTO INTERNO BRUTO DE COSTA RICA POR AO PRODUCTO INTERNO BRUTO DE COSTA RICA POR AO 1986-1993 1986-1993 (En millones de dlares) (En millones de dlares)

8000 8000 7500

7000 7000 PIB PIB


6500 6000 6000 5000 5500 5000 4000 4500 3000 4000 1986 1987 1986 1988 1989 1990 1991 1992

1992

AO AO

FUENTE: Series Estadsticas Seleccionadas de Centroamrica, SIECA (1995)

Grfico lineal aritmtico


EVOLUCION DE LA T ASA DE DESEMPLEO ABIERT O POR SEXO 1992-1996

9 8 7 T 6 A 5 S A 4 3 2 1 1992 1993 1994 AO T OT AL HOMBRES MUJERES 1995 1996

FUENTE: Encuesta de Hogares de Propsitos Mltiples, Julio 1996. Instituto Nacional de Estadstica y Censos.

3. DISTRIBUCIONES DE FRECUENCIAS
3.1 Distribuciones de frecuencias de variables cualitativas 3.2 Distribuciones de frecuencias de variables discretas 3.3 Distribuciones de frecuencias de variables continuas 3.4 Diagramas tallo-hoja

Distribuciones de frecuencias
Las observaciones hechas para cada variable se agrupan, ordenan o clasifican en clases o categoras y se anota el total de observaciones hechas para cada clase o categora de la variable en cuestin

Componentes de una distribucin de frecuencias


Clase o categora Frecuencia absoluta y relativa Frecuencia acumulada absoluta y relativa

Clase o categora
Es el grupo dentro del cual se clasifican las observaciones hechas sobre una variable

Frecuencia absoluta y relativa


Frecuencia simple: Es el nmero de unidades estadsticas que pertenecen a la clase o categora. Puede ser absoluta (fi) o relativa (fr). La frecuencia relativa es la frecuencia absoluta dividida entre el total de observaciones, generalmente se representa en forma de porcentaje (multiplicada por 100).

Frecuencias acumuladas
Es la suma de la frecuencia de la clase o categora en cuestin, ms las frecuencias de todas las categoras o clases anteriores, es decir es lo que se acumula en cada categora desde la primera categora hasta la ltima.

Frecuencia acumulada
Las frecuencias acumuladas se representan con la letra F mayscula, as: F Frecuencia acumulada menos de Fr Frecuencia relativa acumulada menos de F Frecuencia acumulada ms de Fr Frecuencia relativa acumulada ms de

3.1 Distribuciones de frecuencias de variables cualitativas


Una distribucin de frecuencias de una variable cualitativa contiene el total de observaciones hechas para cada categora o modalidad de la variable. Si la variable es nominal las categoras se colocan ordenadas por magnitud de mayor a menor. Si la variable es ordinal, entonces las categoras se colocan segn el orden que tienen. El clculo de frecuencias acumuladas para variables cualitativas se hace nicamente si la variable es ordinal.

Ejemplo 1
Supngase que, para las elecciones primarias del Partido Democrtico Nacional, se tienen las siguientes intenciones de voto para los precandidatos, en un grupo de 32 delegados a la convencin de octubre de 1997:

Ejemplo 1
Se cuentan las observaciones (votos) para cada candidato, se obtindose las frecuencias absolutas y se disponen en una tabla:

Ejemplo 1

Ejemplo 2
En la empresa XYZ se tienen 56 empleados durante el segundo trimestre de 1996, de los cuales 23 tienen nivel de instruccin primario, 9 nivel secundario, 12 nivel tcnico o secretarial, y los 12 restantes nivel universitario. Estos datos se disponen en una tabla de frecuencias as (hemos marcado con negrita algunos valores que comentamos ms adelante):

Ejemplo 2

Ejemplo 2
En el ejemplo anterior se observa que el 21.4 % de los empleados tiene nivel universitario. El 57.2%, poco ms de la mitad, tiene nivel secundario o menos. De lo que se deduce que el 42.8% tiene nivel tcnico o ms.

3.2 Distribuciones de frecuencias de variables discretas


Una distribucin de frecuencias de variables cuantitativas discretas contiene el nmero de observaciones hechas para cada valor que asume la variable.

Ejemplo 1
Considere los siguientes datos que equivalen al nmero de ausencias de 40 trabajadores de la Empresa El Comercio en el mes de Octubre de 1997:

Ejemplo 1

Ejemplo 1
Con los datos resumidos en la distribucin de frecuencias, se puede apreciar mejor su comportamiento. Por ejemplo, se observa que slo el 10% de los trabajadores tuvieron 6 ausencias durante el mes de octubre de 1997. El 40% de los trabajadores estuvieron ausentes 2 3 veces en ese mismo mes. El 30% de los trabajadores estuvo 5 o ms veces ausente.

Grfico de bastones

Grfico de bastones:frecuencias acumuladas menos de

Grfico de bastones: frecuencias acumuladas mas de

3.3 Distribuciones de frecuencias de variables continuas


Una variable cuantitativa continua puede tomar valores arbitrarios en un intervalo de los nmeros reales (decimales). Cuando se determinan los lmites de las clases hay que tomar en cuenta que un lmite de clase puede coincidir con un dato observado. Las representaciones decimales pueden no ser exactas y estar afectadas por un redondeo.

Precisin y redondeo de los datos


Precisin: cuntas cifras decimales sern registradas Redondeo usual: trata de redondear una cifra al nmero superior o inferior ms cercano, dentro de la precisin establecida. Redondeo hacia abajo o truncamiento Redondeo hacia arriba

Redondeo
Usual: precisin en centmetros
1.632 metros 1.63 mts 1.817 metros 1.82 mts 1.765 metros 1.76 mts 1.775 metros 1.78 mts
1.632 1.63 1.64 1.817 1.81 1.82

Truncamiento:

1.775 1.77 1.78

1.8934 metros 1.89 mts 1.8976 metros 1.89 mts Hacia arriba: 1.764 metros 1.77 mts 1.769 metros 1.77 mts

Lmites de clase
Lmites indicados o lmites dados: li ls lmite inferior de la clase: li lmite superior de la clase: ls Clase o categora: valores x tales que li x ls Clases abiertas: salario de 200,000 colones o ms corresponde a 200000 x.

Lmites reales
Son los nmeros que delimitan las clases realmente, tomando en cuenta el redondeo considerado Si la precisin es en centmetros y se tienen estaturas, entonces la clase 1.80 1.85 tiene los lmites reales:
1.795, el inferior, y 1.855, el superior.

Ejemplo 1

Otros componentes
Marca o punto medio de clase: promedio de los lmites reales de la clase
el punto medio de la clase 69.5 79.5 dada en kilogramos, es (69.5 + 79.5)/2 = 74.5 el punto medio de la clase 1.80 1.85 dada en cms. es (1.80+1.85)/2 = 1.825 1.82

Amplitud (rango o intervalo): diferencia entre los lmites reales, y es denotada c

Construccion de clases
(misma amplitud) 1. Se escoge el nmero de clases k 2. Sean M = mximo y m = mnimo 3. Amplitud: c=(M-m)/k 4. Se cuenta cuntos datos hay en cada clase 5. Se presentan los resultados en forma tabular

Observaciones
En ocasiones, se fija la amplitud de las clases y luego el nmero de clases mediante k=(M-m)/c. Hay casos en que las clases tienen diferente amplitud (ejemplo: salarios; primera y ltima clase con el resto de la informacin) A veces se hacen ajustes a los lmites de clase

Ejemplo 2
100 datos (salarios) el valor mximo es 148 000 y el mnimo es 59 000 se quiere construir una distribucin de frecuencias con 8 clases se tiene k = 8, m = 59 000 y M = 148 000 Luego
c = (148 000 59 000)/8 = 89 000/8 = 11 125

Ejemplo 3
Salarios de empleados Mayor: 450 000, menor 55 000 Precision: miles de colones 5 clases Amplitud: c = (450 000 55 000)/5 = 79 000 Ajuste: c = 80 000

Ejemplo 4
Salario por hora (en colones) Muestra de 50 personas Datos: redondeados al dcimo ms prximo

Se quiere 5 clases
Histograma

Ejemplo 4
M = 173.3, m = 120.4 Amplitud c = (173.3 120.4) / 5 = 10.58 Ajuste: c = 10.6 Clases

Histograma

Ejemplo 4
Lmites de clases:

Clasificar los datos en sus respectivas clases (usando los lmites indicados de cada clase) Calcular las frecuencias Calcular los puntos medios clase

Histograma

Ejemplo 4

Histograma

Ejemplo 5
Edades, redondeadas al ao inferior, de un grupo de personas

7 clases, tenemos: M = 75, m = 20 y k = 7 Por lo tanto, c = (75 20) / 7 = 7.86 que se ajusta a 8 porque los datos son nmeros enteros
Ojiva

Ejemplo 5

Ojiva

Ejemplo 6
Para una muestra de clientes de una Agencia Bancaria se anot el saldo disponible en miles de colones en la cuenta de ahorros al ltimo da del mes anterior, redondeando cada observacin al entero siguiente. Construir una distribucin de frecuencias con intervalos de amplitud 6.
Ojiva

Ejemplo 6

M = 71, m = 37 y c = 6 Entonces k = (71 37) / 6 = 5.67 que se ajusta a 6


Ojiva

Ejemplo 6

Ojiva

Representacin grfica
Histogramas Polgonos de frecuencias Polgonos de frecuencias acumuladas u ojivas

Histogramas
Cada clase est representada por un rectngulo de altura proporcional a la frecuencia de la clase Los rectngulos van continuos y, en algunas ocasiones, tienen ancho proporcional a la amplitud de la clase. En el eje de las abscisas (eje horizontal), se colocan los lmites reales de las clases, donde se coloca el lmite de cada rectngulo. En el eje de las ordenadas (eje vertical) se coloca una escala para las frecuencias de las clases.

Histograma: ejemplo 1

Datos Dist. Frec.

Polgonos de frecuencias
Se trata de dibujar lneas rectas que unen los puntos consecutivos (x,y), donde x es la marca de cada clase (punto medio de una clase) y y la frecuencia de esa clase. La curva empieza a trazarse desde el eje X y termina tambin en el eje X.

Polgonos de frecuencias: ejemplo 2

Datos Dist. Frec. Histograma

Polgonos de frecuencias acumuladas (ojivas)


Es un polgono de frecuencias, slo que en lugar de las frecuencias simples, se representan las frecuencias acumuladas ms de o menos de. En el eje X se colocan los lmites reales de las clases y en el eje Y, las frecuencias acumuladas.

Ejemplo 3

Datos Dist.Frec.

Ejemplo 4

Datos Dist. Frec.

3.4 Diagramas tallo-hoja


Similar a distribuciones de frecuencias Las clases tienen el mismo tamao La marca de clase corresponde al concepto de decenas, centenas, miles, etc. Por ejemplo, si los datos van de 1500 a 2500, entonces los tallos sern 150*, 151*, 152*, ..., 250*. El asterisco significa que cada hoja estar dada por un solo dgito. Se pueden reconstruir los datos

Ejemplo 1
Supngase que se tienen las notas obtenidas por un grupo de 20 estudiantes en un examen universitario y que sus valores (ordenados de menor a mayor) son: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92. Tallos: 1, 2, 3, 4, 5, 6, 7, 8, 9.

Ejemplo 1

Ejemplo 2
Sea el diagrama tallo-hoja Entonces los datos completos son: -39,-36,-35,-32,-32,-28, -23,-18,-17,-17,-14,-11, -7,-5,-2,3,7,11,17,19,30.

Ejemplo 3
Salarios en miles de colones de un grupo de 42 profesores de secundaria:

Max = 595, Min = 103 (diferencia = 492) Cinco tallos, hojas con 2 digitos

Ejemplo 3

Captulo 4
4.1 Medidas de Posicin 4.2 Medidas de Variabilidad 4.3 Medidas de Posicin y Variabilidad para Datos Agrupados 4.4 Cuantiles 4.5 Desviacin Cuartil y Cajas de Dispersin

4.1 Medidas de Posicin


Notacin, sumatorias Propiedades de la sumatoria La media aritmtica o promedio La mediana La moda Consideraciones sobre el uso de las medidas de posicin

Notacin de sumatoria

X
i =1

= X 1 + X 2 + X 3 L + X n 1 + X n
X
X =3 8

Ejemplos:

= 3+ 4+5+6+7+8

i =1
n i =1

X i f i = X 1 f1 + X

f2 + L + X

fn

(X

Yi ) 2 = ( X 1 Y1 ) 2 + ( X 2 Y2 ) 2 + L + ( X n Yn ) 2

Propiedades de la sumatoria
Orden:

(X
i =1
n

+ Yi ) = X i + Yi
i =1 i =1

Factor comn:

aX
i =1

= a X i
i =1

Suma de una constante:

a = na
i =1

La media aritmtica o promedio


La media aritmtica de un conjunto de valores se define como la suma de todos esos valores dividida por el nmero de ellos. La media aritmtica puede ser simple o ponderada.

Media aritmtica simple


Sean X1, X2, X3, , Xn los n valores observados para una variable cuantitativa X. La media aritmtica simple es:
X1 + X 2 +L + X n X = n 1 n X = Xi n i =1

Ejemplo 1
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. La media simple es:
X = 15 + 45 + 47 + 53 + 58 + 58 + 60 + 62 + 67 + 74 + 75 + 78 + 80 + 80 + 81 + 85 + 85 + 85 + 90 + 92 20
1370 = 68 .50 20

X =

Media aritmtica ponderada


Sean X1, X2, X3, , Xn los n valores observados para una variable cuantitativa X, donde los datos estn ponderados por los p1, p2, p3, , pn, Entonces la media aritmtica ponderada es:
X = p
1

+ p
1

p 2 X 2 + L + p + p 2 + L + p n

pX
i

X =

i =1 n

p
i =1

Ejemplo 2
Supngase que un estudiante tiene las siguientes notas en cuatro cursos matriculados un cuatrimestre: 67, 82, 90, 71. El nmero de crditos que vale cada curso es, respectivamente: 3, 2, 2, 4. Entonces la media ponderada de las notas ser:
X = ( 3 67 ) + ( 2 82 ) + ( 2 90 ) + ( 4 71 ) 829 = 3 + 2 + 2 + 4 11 = 75 . 36

Propiedades de la media aritmtica


Multiplicar por # obs.: n X =
n

i =1
n

Xi

Centrar ( X X ) = 0 1 Sumar (restar) una constante: n ( X 1 Multiplicar: n aX = aX Dividir: 1 Xa = X n a


i i =1
i =1
n i i =1
n i i =1

a) =X a

Mediana
La mediana es el valor que est en el centro de todos los valores, si stos se ordenan. Es un valor tal que no ms de la mitad de las observaciones son mayores que l y que no ms de la mitad son menores que l. La mediana se denota Me.

Mediana
Sean X1, X2, X3, , Xn las observaciones ordenadas de una variable cuantitativa
Si n es impar:
Me = X(n+1)/2

Si n es par: Me = (Xn/2 + Xn/2 + 1) 2

Ejemplo 1
Sean los datos -3, -3, -2, 0, 0, 1, 3, 3, 5, 8, 8, 10, 10 Entonces la mediana est en la posicin (n + 1) 2 = (13 + 1) 2 = 7 , es decir, Me = 3.

Ejemplo 2
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. n = 20 n/2 = 10 y n/2 + 1 = 11 Me = (74+75) 2 = 74.5

Moda
Dada una serie de observaciones para una variable cuantitativa, entonces la moda, denotada Mo, es el valor ms frecuente (si existe), o los valores ms frecuentes (si son varios). Unimodal: 1 moda Bimodal: 2 modas No es nica!

Ejemplo 1
Sean las 20 notas obtenidas por estudiantes: 15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81 ,85, 85, 85, 90, 92. Entonces la moda es 85, que tiene frecuencia 3.

Ejemplo 2
Supngase que se tienen observadas las siguientes estaturas de 10 personas, en centmetros: 168, 162, 181, 180, 169, 171, 175, 159, 173, 160 Como no hay ningn valor que sea ms frecuente que los dems, entonces la moda no existe.

Ejemplo 3
En una pequea empresa familiar, se tienen los siguientes salarios mensuales de los empleados, en miles de colones: 30, 35, 35, 35, 40, 90, 120, 120, 120, 150 Entonces hay dos modas: 35 y 120.

Distribucin Simtrica
X = Me = Mo

Distribucin Asimtrica Positiva


X > Me > Mo

Distribucin Asimtrica Negativa


X < Me < Mo

Consideraciones
La media de un conjunto de datos es la medida que conlleva mayores clculos aritmticos y su valor est afectado por los valores individuales de todos los datos, mientras que la mediana y la moda pueden no ser afectadas por todos los valores. Por ejemplo, vase el siguiente conjunto de datos, en el que el ltimo valor es aumentado:

Consideraciones
En grupos pequeos, la moda puede ser muy inestable o puede no existir. La mediana no se afecta por el tamao de los valores por encima o por debajo de ella. La media es influida por el tamao de cada valor en el grupo de datos. Algunos grupos de datos simplemente no manifiestan una posicin en forma significativa, siendo en este caso engaoso calcular una medida de posicin.

Consideraciones
La posicin de grupos de datos con valores extremos se mide probablemente mejor por la mediana, si las observaciones son unimodales. Sin embargo, si lo que se quiere es que la medida utilizada refleje el efecto de los valores extremos, entonces es conveniente utilizar la media. La media aritmtica es muy til para estimar la suma total de las observaciones si se conoce el nmero de observaciones.

4.2 Medidas de Variabilidad


Recorrido o Amplitud Desviacin estndar y varianza Coeficiente de variacin

-s1 -s2

+s1 +s2

Recorrido o amplitud
El recorrido o amplitud de una serie de datos es la diferencia entre el valor mximo (M) y el valor mnimo (m) de esa serie. Tambin se conoce como rango y se denota como A. A = M m.

Ejemplo 1
Sean los datos de salarios de una pequea empresa familiar: 30, 35, 35, 35, 40, 90, 120, 120, 120, 150. Entonces A = M m = 150 30 = 120. Si hubiera otro empleado con un salario de 200, entonces la amplitud cambia a: A = M m = 200 30 = 170.

Desviacin Estndar
La desviacin estndar es el promedio de desviacin o diferencia de las observaciones con respecto a la media aritmtica.
Datos observados Media
n

( X i X )2 s=
i =1

n 1
Cantidad de observaciones

Simplificaciones
1 n 2 n 2 s= X i n 1 ( X ) n 1 i =1
1 X n X i i =1 i =1 s= n 1
n n 2 i 2

Var(X) = s2

Ejemplo 1
Considrese el conjunto de notas:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92

Sabemos que la media es 68.50 Como X = 15 + 45 + 47 + L + 90 + 92 = 100714 20 Entonces la varianza es: s = 100714 19 (68.50) 19 Luego, la desviacin estndar es:
20 2 i 2 2 2 2 2 i =1

= 361.53.

s = 361 .53 = 19.01.

Propiedades de s
Si se suma o resta una constante:
(X
s=
i =1 n i

X)

(( X
=
i =1

a ) ( X a )) 2 n 1

n 1

Si se multiplica por una constante positiva:


(aX
i =1 n i

aX )

a
=
i =1

(Xi X ) n 1

(X
=| a |
i =1

X )2 = as

n 1

n 1

Coeficiente de Variacin
Mide la variabilidad porcentual o relativa de un conjunto de datos respecto a su media:
CV = s 100 X

til cuando:
Los datos estn en unidades diferentes. Los datos estn en las mismas unidades, pero las medias son muy diferentes.

Ejemplo
Tipo de accin A B
CV ( A) = S A CV ( B ) = S B XA XB

Precio al cierre 15 000 5 000

Desviacin estndar 500 300

100 = (500 / 15000 ) 100 = 3%, 100 = (300 / 5000 ) 100 = 6%.

4.3 Medidas para datos agrupados


Una variable cuantitativa agrupada en clases en una distribucin de frecuencias Se aproxima el valor de las medidas de posicin y variabilidad Se supone que el punto medio o marca de clase las representa adecuadamente, es decir, se supone que los datos en cualquier clase estn uniformemente distribuidos a lo largo de sta Se calcula: media o promedio, mediana, moda, desviacin estndar y varianza

Media o promedio
Para datos agrupados en clases, la media es:

X
X =
i =1 k

fi =

X
i =1

fi

donde
fi n k Xi

i =1

fi

es la frecuencia de la clase i, es el nmero total de observaciones es el nmero de clases, es el punto medio o marca de la clase i, si la variable es continua; si es discreta, entonces Xi es el valor que asume la variable.

Ejemplo 1

X =

(1 15) + ( 2 25 ) + (1 35 ) + (6 45) + L + (8 85 ) + (3 95) 2135 = = 64 .69 33 33

Ejemplo 2

(6 2) + (10 3) + (12 4) + (8 5) + (4 6) 154 X = = = 3.85 4. 40 40

Mediana
La mediana debe estar en la clase cuya frecuencia acumulada sea aproximadamente n/2, si n es par, o bien la clase cuya frecuencia acumulada sea aproximadamente (n+1)/2, si n es impar. Se hace una interpolacin del valor donde debe estar la mediana.

Mediana
La mediana se aproxima por
n Fa c Me = Li + 2 fi

donde: fi es la frecuencia de la clase que contiene a la mediana, n es el nmero total de observaciones (suma de los fi), Li es el lmite inferior de la clase que contiene a la mediana, Fa es la frecuencia acumulada de la clase anterior a la clase que contiene a la mediana c es la amplitud de la clase que contiene a la mediana

Ejemplo 1

17

Li = 60, f i = 6, c=10, Fa = 12, n = 33 Me = 60 + [(332 12) 6]10 = 60 + [4.56]10 = 60 + 7.5 = 67.5

Moda

Ejemplo 2

20

Como n/2 = 40/2 = 20, la mediana es el valor de la variable tal que la frecuencia acumulada menos de sea al menos 20, por lo que el valor de la mediana es 4. Moda

Moda
Clase modal: clase que tiene mayor frecuencia Moda: punto medio de la clase modal Ejemplo 1. La clase modal es la clase: 80 a menos de 90, cuyo punto medio es Xi = 85. Por lo tanto, la moda es 85. Ejemplo 2. El nmero de ausencias ms frecuente es 4, por lo que la moda es 4.

Desviacin estndar y varianza


Punto medio de clase i Nmero de clases Media Frecuencia de clase i

(X
2 i =1

X ) fi
2

s =

Nmero de observaciones
k

n 1
( X i f i ) 2
2 i

X
s=
i =1

fi

i =1

n 1

Ejemplo 1

(15 64.69) 2 1 + (25 64.69) 2 2 + L + (95 64.69) 2 3 15497 s = = = 484.28. 32 32


2

Ejemplo 2

(2 4)2 6 + (3 4)2 10 + L + (6 4)2 4 = 1.46. s2 = 39

4.4 Cuantiles

Qi son los cuartiles Ki son los quintiles Di son los deciles Pi son los percentiles

Me = P50 Q3 = P75 D4 = P40

Datos simples
Se define el percentil m, denotado como Pm, como un valor tal que un (m/100)% de las observaciones son menores que l y un (1 m/100)% son mayores que Pm. Pm = [m (n + 1)] 100
Nmero de percentil Nmero de observaciones

Datos agrupados
lmite inferior de la clase que contiene al percentil Nmero de observaciones

m n Fa c Pm = Li + 100 fi
Frecuencia de la clase que contiene al percentil

Frecuencia acumulada de la clase anterior a la clase que contiene al percentil Amplitud

Nmero de percentil

4.5 Desviacin cuartil y cajas de dispersin


La desviacin cuartil es la medida de variabilidad asociada a la mediana. Se denota por Q y de define como la diferencia entre el tercer y el primer cuartil entre 2. Es decir, Q = (Q3 - Q1) / 2

Ejemplo 1
Considrese el conjunto de notas:
15, 45, 47, 53, 58, 58, 60, 62, 67, 74, 75, 78, 80, 80, 81, 85, 85, 85, 90, 92

Los cuartiles son: Q1 = 58, Q2 = Me = 74.5 y Q3 = 83 Entonces la desviacion cuartil es Q = (83 58) 2 = 12.5 Asi, las notas se encuentran entre 74.5 12.5 = 62 y 74.5 + 12.5 = 87.

Ejemplo 2

Q1 (30) Q3 (90)

Ejemplo 2
Q1 = 4500 + 500 [(25/100 120) - 21] 22 = 4500 + (500 9) 22 = 4704.5 Q3 = 5500 + 500 [(75/100 120) - 83] 24 = 5500 + (500 7) 24 = 5645.8 La desviacin cuartil es: Q = (5645.8 4704.2) 2 = 470.65

Cajas de Dispersin
Limite permitido Datos atipicos Ultimo dato normal

50%

25%

25%
a = Q1 2Q b = Q3 + 2Q

25%

50%
25%

Primer dato normal Limite permitido

Ejemplo 3
Considerar el ejemplo de 20 notas.
Q1 = 58, Q2 = Me = 74.5, Q3 = 83 y Q = 12.5. a = Q1 2Q = 58 25 = 33 b = Q3 + 2Q = 83 + 25 = 108 xa = 45 > 33 ; xb = 92 < 108.

Ejemplo 4
Considerar la tabla de frecuencias del plan complementario de pensiones Q1 = 4704.5, Q3 = 5645.8 y Q = 470.65 a = Q1 2Q = 4704.5 941.3 = 3763.2 b = Q3 + 2Q = 5645.8 + 941.3 = 6587.1 xa =3766 y xb =6586

You might also like