You are on page 1of 74

COMPILACIN: MG.

JORGE ARMIJOS ORDEZ

CONTENIDO PORTADA 1. PRESENTACIN. 2. OBJETIVOS .. 3. METODOLOGA ... 4. EVALUACIN .. 5. ACREDITACIN... 6. BIBLIOGRAFA .... 7. CONTENIDOS .. 1. PRESENTACIN El Taller de ESTADSTICA DESCRIPTIVA APLICADA A LA INVESTIGACIN est dirigido a los estudiantes del mdulo uno, del rea de la Educacin, el Arte y la Comunicacin, como un instrumento para la investigacin, que permita el manejo e interpretacin de la informacin emprica en los procesos investigativos que ejecuten en cada uno de los mdulos de la formacin profesional y luego en su prctica profesional. Se desarrollar bajo la orientacin conceptual y metodolgica que orienta el Sistema Acadmico Modular por Objetos de Transformacin SAMOT, e impulsa con rigurosidad la aplicabilidad de los fundamentos cientficos, considerando las necesidades de los estudiantes e incorpora la creatividad, valores y desarrollo de la inteligencia como ejes transversales, sin perder la alegra, la creatividad y la interlocucin. 2. OBJETIVOS 2.1. OBJETIVOGENERAL Comprender el papel que cumple la Estadstica en la investigacin, regocijarse con su uso y reconocer el valor de la recopilacin, organizacin, procesamiento, anlisis, interpretacin y presentacin de la informacin con precisin y perseverancia en la bsqueda de soluciones. 2.2. ESPECFICOS Reconocer la importancia de la estadstica en la investigacin. Distinguir la importancia de poblacin y muestra. Explicar la diferencia entre estadstica descriptiva e inferencial. Identificar diversos tipos de variables. Comprender y utilizar el clculo de medidas de tendencia central, asociacin y dispersin en pequeos y grandes grupos de datos. Interpretar informacin a travs de grficos estadsticos. 1 2 2 2 2 3 3 4

3. METODOLOGA El proceso ser participativo, dinmico, integral y productivo, donde la aprehensin de la realidad que modifica los esquemas de los participantes constituye los aprendizajes significativos. El trabajo acadmico, se apoya en procesos y tcnicas grupales que promuevan la comunicacin en el grupo y el logro de conocimientos individuales significativos que modi-

fiquen los esquemas mentales Los asistentes al curso cuentan con un documento gua que facilita y habilita la participacin en su proceso de formacin, as como el uso de la INTERNET y programas de computacin. 4. EVALUACIN El proceso de evaluacin ser permanente y sistemtico que permitir la reorientacin y mejoramiento del interaprendizaje, mediante la observacin directa por parte del docente y la participacin fundamentada los estudiantes. El taller es de aprobacin independiente y se enmarca en el Capitulo II De la Evaluacin, Acreditacin y Calificacin de los Aprendizajes del Reglamento de Rgimen Acadmico de la UNL. 5. ACREDITACIN La acreditacin se cumplir a travs de la verificacin del cumplimiento de: Tareas extra clase Trabajo en clase Pruebas TOTAL 30% 30% 40% 100%

Debiendo alcanzar un promedio mnimo de 7/10 para aprobar el taller. 6. BIBLIOGRAFA 6.1. BUSTAMANTE, Luna, 2001, Estadstica Descriptiva, UTPL, Loja-Ecuador. 6.2. DOWNIE y Eath, 1980, Mtodos Estadsticos aplicados, Editorial Harla, Mxico. 6.3. FREUND, Jhon, Estadstica Elemental Moderna, Editorial Revolucionara 6.4. JACK, Levin, Fundamentos de Estadstica en la Investigacin Social. 6.5. SPIEGEL, Murray, 1991, Estadstica, McGraw-Hill, Segunda Edicin 6.6. VELASCO, Ermel, Estadstica para Educadores y Psiclogos. 6.7. VIZUETE, Alejandro, Elementos de Estadstica aplicados a la Educacin. 6.8. http://www.uaq.mx/matematicas/estadisticas/xu3.html 6.9. http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.htm 6.10.http://www.aulafacil.com/CursoEstadistica/Lecc-1-est.htm

7. CONTENIDOS INTRODUCCIN Los estudiantes de educacin, ha menudo hacen frente al estudio de la estadstica con emociones diversas. Ellos saben, de que no pueden seguir adelante a estudios avanzados en sus campos sin un entendimiento bsico de la estadstica. No es una exageracin al afirmar que es necesario entender la estadstica en el estudio de las ciencias; el desarrollo de las ideas estadsticas ha sido tal en los ltimos aos, que esta presente en casi todas las actividades humanas. La estadstica no es simplemente la compilacin y presentacin de datos en tablas y grficos, constituye en realidad la ciencia de tomar decisiones en presencia de la incertidumbre. Nos enfrentamos con la incertidumbre cuando lanzamos una moneda, cuando experimentamos con un medicamento nuevo, cuando tratamos de decidir cul de dos procesos de produccin es ms eficiente, cuando tratamos de predecir los resultados de una leccin, cuando un nuevo producto al mercado, cuado cavamos buscando oro, cuando tratamos de decidir si hacemos un viaje a las montaas o a la playa. Sera presuntuoso decir que la estadstica en su estado actual de desarrollo, pueda resolver todas las situaciones que implique inseguridad, pero se estn desarrollando mtodos nuevos todo el tiempo y la estadstica moderna con la ayuda de la informtica, proporciona la informacin necesaria para el anlisis en forma lgica y sistemtica. HISTORIA El uso de herramientas cuantitativas para el tratamiento de datos, tiene origen en pocas remotas. Se tiene informacin de hace ms 3000 aos antes de Cristo, donde las antiguas civilizaciones, como la Egipcia, aplicaron continuamente censos que ayudaban a la organizacin del estado y la construccin de las pirmides. El antiguo testamento nos sugiere que Moiss orden un Censo a la poblacin Israelita para identificar los miembros de las familias. En la antigua Grecia y el Imperio Romano, era comn la aplicacin de censos para la planificacin de impuestos y la prestacin del servicio militar. La palabra estadstica deriva del latn moderno statisticum collegium (consejo de estado), del latn antiguo status (posicin, forma de gobierno), de la palabra italiana moderna statista (estadista, poltico) y del italiano antiguo stato (estado). En 1749, el alemn, Gottfried Achenwall (1719-1792) usa el trmino Statistik en su libro titulado Staatswissenschaft der vornehmen Europischen Reiche und Republiken, quien originalmente design la palabra estadstica para el anlisis de los datos de un gobierno, definindola como la Ciencia del Estado. A Gottfried Achenwall se le conoce como el Padre de la Estadstica. La primera persona que introdujo el trmino estadstica en Inglaterra fue Sir John Sinclair (1754-1835) con su trabajo Statistical Account of Scotland (1791-,1799) trabajo compilado en 21 volumenes. El autor explica en su libro, que la palabra estadstica la adopt gracias al estudio de investigaciones realizadas en Alemania, como una palabra novedosa que llamara la atencin de los ingleses; a diferencia, de que en Alemania la estadstica se usa como instrumento para medir la fortaleza de un estado, mientras que Sinclair, la empleara como generadora de informacin interna para encontrar falencias

y proponer mejoras en el pas. A este trabajo le siguieron dos publicaciones: la segunda edicin elaborada entre 1834 y 1845; la tercera edicin comienza despus de la segunda guerra mundial comprendiendo los periodos entre 1951 y 1992.1 A comienzos del siglo XIX, la palabra estadstica adopta un significado ms generalizado hacia la recoleccin y clasificacin de cualquier tipo de datos cuantitativos. William Playfair (1759-1823) expone su idea de que los grficos permiten una comunicacin ms eficiente que las tablas de frecuencia. Es considerado como el inventor de los grficos lineales, de barras y de sectores. Playfair public el libro titulado The Commercial and Political Atlas (1786) el cual contiene 43 grficos de series de tiempo y por primera vez, es usado un grfico de barras. En 1801 utiliza el primer grfico de sectores en su obra Playfairs Statistical Breviary. Sir Francis Galton (1822-1911) cre el concepto estadstico de regresin y correlacin, y fue el primero en aplicar mtodos estadsticos para estudiar las diferencias humanas, basado en el uso de cuestionarios y entrevistas para recolectar los datos. Herman Hollerith (1860-1929) fue un estadstico estadounidense quien desarrollo la primera mquina tabuladora basada en tarjetas perforadas y mecanismos elctricomecnicos para el tratamiento rpido de millones de datos. Su mquina fue usada en el censo de 1890 en estados unidos que redujo la tabulacin de los datos de 7 aos (censo de 1880) a 2.5 aos. Cre la firma Computing Tabulating Recording Corporation (CTR), que bajo la presidencia de Thomas J. Watson fue renombrada a International Business Machines (IBM) en 1924. Major Greenwwod (1880-1949) investiga los problemas de salud asociados al trabajo en fbricas. Desarroll la Epidemiologa y en 1919 cre el Ministerio de la Salud en Inglaterra, responsable de datos estadsticos mdicos. DEFINICIN Todo lo relacionado, con la recopilacin, manipulacin, anlisis, interpretacin y presentacin de datos numricos puede ser clasificado como perteneciente al dominio de la Estadstica. Incluye tareas tan diversas como el clculo del promedio de las calificaciones de un estudiante, la compilacin y presentacin de datos, sobre nacimientos, defunciones, la evaluacin de la precisin, de los proyectiles dirigidos y tambin el estudio de las leyes que gobiernan el comportamiento de las partculas atmicas dentro de lo que llamamos mecnica estadstica. La palabra Estadstica, se utiliza de diversas maneras: En el plural, sealan una compilacin de datos numricos, tales como los que se encuentran en las pginas financieras de los peridicos. El segundo significado, es la totalidad de los mtodos utilizados en la compilacin y anlisis de datos en la ciencia que permite tomar decisiones.

La estadstica a variado su significado a travs del tiempo, pasando de ser una herramienta usada solo para la administracin de los gobiernos, a una ciencia con un sin fin de aplicaciones en diferentes disciplinas.

Estadstica: La enciclopedia Britnica define la estadstica como la ciencia encargada de recolectar, analizar, presentar e interpretar datos. La estadstica pasa a ser una ciencia bsica cuyo objetivo principal es el procesamiento y anlisis de grandes volmenes de datos, resumindolos en tablas, grficos e indicadores (estadsticos), que permiten la fcil compresin de las caractersticas concernientes al fenmeno estudiado. Estadstica: El famoso diccionario Ingles Word Reference define la estadstica como un rea de la matemtica aplicada, orientada a la recoleccin e interpretacin de datos cuantitativos y al uso de la teora de la probabilidad para calcular los parmetros de una poblacin.

Estadstico: Cualquier caracterstica medible calculada sobre una muestra o poblacin. CLASIFICACIN En este sentido la estadstica es una rama de las matemticas aplicadas, que para su mayor comprensin se han dividido: en Estadstica Descriptiva, y Estadstica Inferencial. ESTADSTICA DESCRIPTIVA Debemos entender todos aquellos clculos y tcnicas empleadas para recolectar, manipular, analizar, interpretar y presentar un conjunto de datos. ESTADSTICA INFERENCIAL Es aquella que permite determinar a partir de un conjunto de datos, conclusiones, generalizaciones, predicciones, estimados, y permite tomar decisiones en relacin con la incertidumbre. La Estadstica utiliza dos tipos de medios matemticos, para la descripcin y anlisis de los hechos, se apoya en el clculo numrico elemental; pero cuando se requiere tomar decisiones se fundamenta en las teoras de las probabilidades. La Estadstica es lgica en combinacin con procedimientos aritmticos, la lgica le proporciona el mtodo para la toma de datos y la aritmtica le proporciona el material sobre el que ha de realizar la inferencial. La evaluacin, el anlisis y el control cuidadoso de los riesgos que hay que tomar cuando hacemos generalizaciones o decisiones es una de las principales tareas de la Estadstica Inferencial. POBLACIN El trmino poblacin se refiere a la totalidad de observaciones, datos o medidas que se consideren en una situacin dada.

Ejemplos: En un estudio de la preferencia de los votantes en una eleccin presidencial, la poblacin est constituida por todas las personas empadronadas. En un estudio de mercado una investigacin de las ventas anuales de los supermercados, la poblacin est constituida por todas las ventas de todos los supermercados.

Una poblacin puede ser finita o infinita. Ejemplos: Los alumnos matriculados en el rea de Educacin, Arte y Comunicacin de la Universidad Nacional de Loja, constituyen una poblacin finita. Los alumnos universitarios del Ecuador, constituye una poblacin infinita.

La caracterstica de una poblacin recibe el nombre de parmetros. Ejemplo: La media aritmtica de las estaturas de las alumnas y alumnos del mdulo 5 del rea de Educacin, Arte y Comunicacin de la Universidad Nacional de Loja es un parmetro de la poblacin de los estudiantes del quinto mdulo de todos los alumnos de la Universidad Nacional de Loja.

Es claro que, calcular un parmetro de una poblacin con un gran nmero de elementos es un proceso bastante difcil y en ciertos casos imposibles, por tal motivo es necesario extraer una parte de ella, llamada muestra. MUESTRA Los datos pueden provenir de una poblacin o muestra. Esto datos deben ser cuantitativos, para as poder aplicar sobre ellos, operaciones aritmticas. Muestra: Es un subconjunto de una poblacin. Una muestra es representativa cuando los elementos son seleccionados de tal forma que pongan de manifiesto las caractersticas de una poblacin. Su caracterstica ms importante es la representatividad. La seleccin de los elementos que conforman una muestra pueden ser realizados de forma probabilstica o aleatoria (al azar), o no probabilstica. Es la recoleccin de una parte de la poblacin, de tal manera que se pueda hacer inferencias con respecto a la poblacin. Ejemplos: En un estudio de la preferencia de los votantes en una eleccin presidencial, la muestra est constituida por las personas empadronadas en la ciudad de Loja.

En un estudio de mercado una investigacin de las ventas anuales de los supermercados, la muestra est constituida por las ventas de los supermercados de Guayaquil.

Una caracterstica de la muestra se conoce como estadgrafo. Ejemplo: La estatura promedio de los alumnos del sptimo mdulo paralelo A.

En este contexto podemos definir que la inferencia estadstica es una tcnica, mediante la cual podemos determinar conclusiones, generalizaciones, acercad de los parmetros de la poblacin, basndonos en las informaciones proporcionadas por los estadgrafos de una muestra de esa poblacin. Considerando las definiciones anteriores, podemos determinar que la Estadstica es un conjunto de teoras y mtodos que han sido desarrollados para tratar la recoleccin, el anlisis y la descripcin de datos maestrales, con el fin de extraer conclusiones tiles. Su funcin principal es apoyar al investigador, en la toma de decisiones sobre el parmetro de la poblacin de la cual procede la muestra. MUESTRA REPRESENTATIVA Cuando la poblacin es excesivamente grande, cuando el tiempo requerido para observar los elementos es ms largo de lo que se desea, cuando el costo de la observacin total es superior a los recursos disponibles, o cuando la observacin total implica la destruccin de los elementos de la poblacin, es necesario recoger informacin slo de una parte de la poblacin, es decir, de una muestra. Con la muestra se persigue no estudiar la propia muestra, sino estudiar la poblacin, a travs de ella. Ejemplo: En un laboratorio se recoge una gota de sangre (muestra) para observar la composicin de toda la sangre (poblacin).

Para seleccionar una muestra debe tenerse cuidado de que la misma sea realmente representativa de la poblacin y no una muestra sesgada. Esto quiere decir, que cada elemento de la poblacin debe tener igual oportunidad de ser seleccionado, lo cual se consigue aproximadamente de la siguiente manera. 1. Se numera cada miembro de la poblacin con la finalidad de que pueda ser identificado mediante un cdigo numrico. 2. Se escribe cada cdigo numrico en fichas iguales que se colocan en un recipiente convenientemente revueltas. 3. Se selecciona al azar los datos que conforman la muestra. Para economizar tiempo, se dispone en los libros de Estadstica tablas de nmeros aleatorios.

APLICACIN Los mtodos estadsticos han demostrado ser de gran utilidad en una amplia gama de estudios entre los cuales estn la educacin y la psicologa. Para cumplir con los objetivos utiliza como mtodos: Recoleccin de datos.- que consiste en la obtencin de datos relacionados con el problema motivo de estudio, utilizando instrumentos tales como: - Fichas de observacin - Cuestionarios - Entrevistas - Informes - Memorias, etc. Ejemplos: Entre los estudiantes que pertenecen al rea de la Educacin, el Arte y la Comunicacin, podemos recoger datos correspondientes: colegio donde provienen, nivel de lectura y presentar esta informacin en una tabla de datos que facilite su interpretacin. NMINA COLEGIO FISCAL PRIVADO NIVEL DE LECTURA EFICIENTE DEFICIENTE

Un educador desea saber si hay relacin significante entre las puntuaciones de un test de aptitud escolar y las calificaciones promedio de un grupo de estudiantes. Si existiera una relacin semejante, podra predecir la calificacin promedio de un estudiante, basndose en la puntuacin de su test de aptitud. Es posible comparar dos mtodos de enseanza diferentes para determinar sus eficacias relativas. Se pueden elegir dos grupos de estudiantes y ensearles por los dos mtodos una materia determinada; al final del perodo de instruccin se administra un test tpico a ambos grupos. Basndose en la puntuacin promedio obtenida por cada grupo en el test, se puede llegar a una conclusin sobre si los mtodos son igualmente efectivos, o si uno de los mtodos es significativamente ms efectivo que el otro.

Desde hace varios aos, el nmero de estudios y de encuestas sobre materia educativa han aumentado considerablemente. La necesidad de analizar e interpretar esa gran cantidad de informacin obliga a los estudiantes de educacin a tener por lo menos el conocimiento bsico de los mtodos estadsticos. LA INVESTIGACIN ESTADSTICA El proceso de aplicacin de la estadstica implica una serie de pasos: 1. Seleccin y determinacin de la poblacin o muestra y las caractersticas contenidas que se desean estudiar. En el caso de que se desee tomar una

10

muestra, es necesario determinar el tamao de la misma y el tipo de muestreo a realizar (probabilstico o no probabilstico). 2. Obtencin de los datos. Esta puede ser realizada mediante la observacin directa de los elementos, la aplicacin de encuestas y entrevistas, y la realizacin de experimentos. 3. Clasificacin, tabulacin y organizacin de los datos. La clasificacin incluye el tratamiento de los datos considerados anmalos que pueden en un momento dado, falsear un anlisis de los indicadores estadsticos. La tabulacin implica el resumen de los datos en tablas y grficos estadsticos. 4. Anlisis descriptivo de los datos. El anlisis se complementa con la obtencin de indicadores estadsticos como las medidas: de tendencia central, dispersin, posicin y forma. 5. Anlisis inferencial de los datos. Se aplican tcnicas de tratamiento de datos que involucran elementos probabilsticos que permiten inferir conclusiones de una muestra hacia la poblacin (opcional). 6. Elaboracin de conclusiones. Se construye el informe final.

11

DATOS ESTADSTICOS Resulta evidente que toda investigacin estadstica se ha de referir a un conjunto de personas, animales o cosas. Los elementos que conforman este conjunto pueden ser algo con existencia real como un automvil, una casa, o algo ms abstracto como un voto o un intervalo de tiempo. Los elementos pueden ser tambin artificiales, creados con slo el propsito de la investigacin, por ejemplo, al estudiar un campo sembrado de trigo es usual dividir el campo en cuadrados o rectngulos, pasando stos a constituir los elementos de la poblacin. CARACTERES.- Los elementos de la poblacin estadstica poseen rasgos, propiedades o cualidades que denominaremos caracteres. Ejemplo: El hombre tiene caracteres tales como: estatura, edad, peso, estado civil, religin, etc. VARIABLE.- Es aquella que puede asumir diferentes valores Ejemplo: Cuando una caracterstica tal como la edad,

Las variables pueden dividirse a su vez en dos clases: 1. Las variables cuantitativas son aquellas que producen valores o datos que se pueden describir mediante nmeros, por ejemplo, la edad de un alumno: 15 aos. 2. Las variables cualitativas son aquellas que producen datos cuya descripcin slo puede hacerse mediante palabras, por ejemplo, el estado civil de un alumno: soltero. Los datos de variable cualitativa no son inherentemente numricos como lo son aquellos que pertenecen a variables cuantitativas, por tanto, se deben convertir a valores numricos antes de someterlos a cualquier proceso estadstico. Las variables cualitativas admiten categoras Ejemplo El sexo: masculino y femenino. Cuando se aplican a los elementos de una poblacin, siempre ser posible asignar cada elemento del conjunto a una de dichas categoras y contar luego el nmero que cae en cada una de ellas. Es a dichos nmeros que se debe aplicar los procesos estadsticos pertinentes. Las variables cuantitativas, a su vez, pueden dividirse en variables discretas y variables continuas:

12

Variables discretas.- Son aquellas que pueden asumir slo ciertos valores, por lo regular enteros, y no es posible que lleguen a tomar ningn valor comprendido entre dos consecutivos de aquellos. Ejemplo: El nmero de hermanos de un alumno puede ser: 0, 1, 3, etc., pero no podr ser 1,5. Variables continuas.- Son aquellas que pueden asumir tericamente todos los infinitos valores a lo largo de un cierto intervalo. Ejemplo: La edad de un alumno podra ser cualquier valor entre los 20 y 21 aos, por ejemplo, y podra medirse o darse con cualquier grado de exactitud que se desee: 20,3 aos, es decir, puede darse utilizando incluso nmeros decimales.

CONSTANTE Cuando la medida de un atributo no cambia para los diferentes miembros de una poblacin, no es una variable y se denomina constante. Ejemplo: Todos los alumnos de Mdulo 5 de QQ-BB, tienen como constante ser alumnos del 1er. Curso. LMITES REALES.- la medida de una observacin o dato que pertenece a una variable continua puede darse con cualquier grado de aproximacin que se desee; ms, si la edad de un alumno ha de darse con aproximacin al ao ms cercano Ejemplo: Aquel que tiene 20,3 aos deber considerarse como de 20 aos de edad; igualmente, el alumno que tenga 19,6 aos deber considerarse de 20 aos de edad. En ambos casos las edades son realmente de 20,3 aos y 19,6 aos, respectivamente. Sin embargo, habindose acordado dar las edades redondeando al ao ms cercano, las edades de dichos alumnos se ha dicho que es 20 aos. Supongamos adems que se

13

ha determinado que la edad de un alumno es de 19,5 aos, qu edad reportaramos si seguimos aproximando al ao ms cercano? Las edades de 19 y 20 aos, seran igualmente adecuadas; sin embargo, en este caso, la prctica es redondear al nmero par ms prximo, esto es, 20 aos. De manera que, decir que un alumno tiene 20 aos no significa afirmar que tiene exactamente 20 aos, significa ms bien, que realmente su edad est comprendida entre los lmites de 19,5 y 20,5 aos. 19,5 y 20,5 son los lmites reales de 20. En general, la medida es una variables continua puede darse con cualquier grado de precisin, pero siempre ser preferible considerar que dicha medida es el valor medio entre dos lmites, llamados lmites reales. REDONDEO DE DATOS En la actualidad, con el uso d las computadoras, se pueden obtener miles de cifras decimales o entras; pero en Estadstica no se requiere de la precisin absoluta, sino ms bien de la aproximacin o redondeo de ciertos valores. Para la aproximacin o redondeo se utilizan los siguientes sistemas: SISTEMA CONVENCIONAL.- Segn el cual: - Si el ltimo dgito es menor que 5 se lo suprime

Ejemplos: Cantidad dada 9.53 7.982 19.4 5,630 Cantidad redondeada 9.5 7.98 19 4,600 Redondeado a la dcima Redondeado a la centsima Redondeado a la unidad Redondeado a centenas

Si el ltimo dgito es mayor o igual que 5, se lo suprime y el dgito anterior es redondeado a la cifra inmediata superior Cantidad redondeada 4.5 567.97 20 984,500 Redondeado a la dcima Redondeado a la centsima Redondeado a la unidad Redondeado a centenas

Cantidad dada 4.47 567.968 19.6 98,470

SISTEMA INTERNACIONAL

Ejemplos: Si la fraccin decimal es menor que 5 se la deja en la misma cifra, o no se la toma en cuenta para ser retenida Cantidad redondeada 75,84 Redondeado a dos cifras decimales

Cantidad dada 75,8435

14

Si la fraccin decimal es mayor que 5 se aumenta en una unidad la primera cifra retenida Cantidad redondeada 325 Redondeado a cifras enteras

Cantidad dada 324,754 -

Si la fraccin decimal es exactamente 5 y si le precede al 5 una cifra impar se aumenta una unidad ms Cantidad redondeada 20 Redondeado a cifras enteras

Cantidad dada 19,5 -

Si la fraccin decimal es exactamente 5 y si le precede al 5 una cifra par no varia el nmero Cantidad redondeada 94 Redondeado a cifras enteras

Cantidad dada 94,5

15

NOTACIN SIGMA 1.3. Sigma.- La letra griega se utiliza para denotar abreviadamente una suma de trminos, todos del mismo tipo. Ejemplo, si los valores de la variable X son 2, 4, 5 y 9, entonces:
x=2+4+5+9

Si slo se van a sumar algunos de los valores, se utilizan subndices para indicar dichos valores; de este modo, Xi, indica la suma de los valores de la variable X, empezando con el primero (i = 1) y terminando con el quinto (i = 5):

x = x1 + x 2 + x 3 + x 4 + x 5
Significa que n observaciones (todas) han de ser sumadas, y a menudo esto se abrevia con los smbolos X. La expresin Ejemplos: Suponiendo que la variables X asume sucesivamente los valores 8, 2, 3, 6, 7, 8, 9, 4, 5, 4, 1, calcular: a) n x i =1 i

4 = 8 + 2 + 3 + 6 = 19 xi i =1 n = 9 + 4 + 5 + 4 + 1 = 23 xi i=7 n = 8 + 2 + 3 + 6 + 7 + 8 + 9 + 4 + 5 + 4 + 1 = 57 xi i =1

b)

c)

PROPIEDADES: 1. Cuando cada valor de una variable va a ser multiplicado por una constante o dividido entre ella, dicha constante se puede aplicar despus de que los valores de la variable se hayan sumado: cX = cX Supongamos que c es una constante cuyo valor es 2 y X una variable que puede asumir sucesivamente los valores 12, 4, 7 y 10, calcular: cX = cX = 2 (12 + 4 + 7+ 10) = 2 (33) = 66

16

2. La sumatoria de una constante es igual al producto de la constante y el nmero de veces que se presenta. n ci = nc i =1 Supongamos que una constante es igual a 5, calcular:

5i = 5 + 5 + 5 + 5 + 5 + 5
i =1

= 6 (5) = 30

3. La sumatoria de una suma o diferencia de dos variables es igual a la suma o diferencia, respectivamente, de las sumatorias individuales de las variables. (x + y) = x + y (x - y) = x - y Supongamos que X y Y son dos variables que pueden asumir sucesivamente los valores X: 8, 3, 4, 5; Y: 5, 2, 0, 4, calcular (x + y), y (x - y) Por comodidad se escriben los valores de X y Y en columna e igualmente los valores (X + Y) y (X Y), de la siguiente manera:

X 8 3 4 5 x = 20
(x + y) = x + y = 20 + 11 = 31

Y 5 2 0 4 y = 11

(X+Y) 13 5 4 9 (x + y) = 31

(X-Y) 3 1 4 1 (x - y) = 9

(x - y) = x - y = 20 - 11 =9

4. La sumatoria de una variable ms o menos una constante es igual a la suma de los valores de la variable ms o menos, respectivamente, n veces esa constante. (x + c) = x + n.c (x - c) = x n.c Supongamos que tres valores de una variable son 2, 4 y 6, calcular: (x + c)
(x - c) = x n.c = 2 + 4 + 6 - 3c = 12 - 3c

17

ANLISIS DE PEQUEOS CONJUNTOS DE DATOS Los mtodos estadsticos comprenden el anlisis e interpretacin de nmeros que provienen de la observacin de diversidad de variables, tales como calificaciones de exmenes, porcentajes de respuestas correctas, aos de servicio, resistencia de materiales, etc. Dicho anlisis suele realizarse de diversas maneras, dependiendo de si existe una cantidad pequea de datos (30 menos) o si la cantidad de datos que se debe analizar es muy grande. En el primer caso utilizaremos los mtodos que presentamos en este captulo y, en el segundo caso utilizaremos el agrupamiento de los datos, antes del anlisis. El conjunto de datos, cualquiera que este sea, se puede reducir a unas cuantas medidas numricas sencillas que resumen el conjunto total. Tales medidas ponen de manifiesto dos caractersticas importantes del conjunto: El valor central o tpico del conjunto; y, la dispersin de los elementos del conjunto. TABLAS DE FRECUENCIA 1. El principal objetivo de la estadstica descriptiva es sintetizar conjuntos de datos mediante tablas o grficos resumen, con el fin de poder identificar el comportamiento caracterstico de un fenmeno y facilitar su anlisis exhaustivo. 2. Cualquier investigacin que se emprenda puede conducir a la acumulacin de valores cuantitativos y cuasi-cualitativos correspondientes a las diversas medidas efectuadas. Esta posibilidad, convierte a la estadstica en una herramienta vital para el tratamiento de volmenes de datos mediante tablas resmenes conocidas como "Tablas de Frecuencia". Cuando los datos son agrupados, la interpretacin resulta ser ms sencilla. Tablas de Frecuencia: Tablas estadsticas que agrupan diversos valores de una variable, simplificando los datos. 3. Para entender como funcionan las tablas de frecuencia, analicemos el siguiente ejemplo: 4. Una persona lanza una moneda 10 veces, y registra si el lado superior cae en cara (C) o sello (S). Los resultados del experimento se muestran a continuacin: C, S, S, C, C, S, S, C, S, C 5. La forma de simplificar los datos anteriores equivale a contar cuantas veces se repite cada lado de la moneda. A esta operacin la conoceremos como frecuencia Absoluta. Frecuencia Absoluta (f): Numero de veces que se repite un valor dentro de un conjunto de datos.

18

6. El lado cara se repiti 5 veces y el lado sello 5 veces. Ntese que la suma de las frecuencias equivale al total de lanzamientos. Lado Cara (C) Sello (S) Frecuencia ( f ) 5 5

7. Podemos identificar dos tipos de tablas de frecuencias, las cuales denotaremos como tablas tipo A y B. CONSTRUCCIN Y CARACTERSTICAS DE LAS TABLAS TIPO A Las Tablas Tipo A se caracterizan por manejar un conjunto pequeo de posibles resultados de una variable dentro de la muestra o poblacin. Por lo general, su uso tiende al manejo de datos cualitativos o variables cuantitativas discretas. Ejemplo Una empresa decide medir el grado de aceptacin de 10 clientes sobre un nuevo producto que hace poco sali al mercado. Para tal fin, se les pide que valoren, empleando una escala del 1 al 5, su opinin frente al producto. (1 = Muy Malo, 2 = Malo, 3 = Regular, 4 = Bueno y 5 = Excelente). Las respuestas tabuladas de los 10 clientes son: Cliente 1 2 3 4 5 6 7 8 9 10 Respuesta 2 5 4 5 4 3 4 5 3 5

En presencia de estos puntajes, la persona encargada del proyecto, pide que se simplifiquen y luego se interpreten los datos. SOLUCIN Como podemos observar, el numero de resultados que puede alcanzar la variable grado de aceptacin son relativamente pocos (solo cinco posibilidades), por lo cual identificaremos la tabla de frecuencia resultante como una Tabla Tipo A. Otra forma de catalogar los datos es conociendo la distancia o variacin que hay entre el valor menor (Xmin) y el valor mayor (Xmax), diferencia que de ahora en adelante la conoceremos como Rango.

19

Rango (R): Diferencia existente entre el valor Mximo (Xmax) y el valor Mnimo (Xmin) de un conjunto de datos. La frmula empleada es: R = (Xmax) - (Xmin) En nuestro ejemplo R seria igual a 4. Si el rango manejado es pequeo, bastara representar los datos con una tabla Tipo A. Para crear esta tabla deberemos seguir los siguientes pasos: 1: Contar las veces que se repite cada valor dentro de la muestra. 2: Ubicar estas frecuencias en una tabla ordenada. Grado de Aceptacin 1 2 3 4 5 TOTAL Frecuencia (f) 0 1 2 3 4 10

Ninguno de los clientes valor al producto como muy malo (grado de aceptacin igual a 1), mientras que la mayora de las respuestas se centraron en valorar al producto como Excelente y Bueno (grado de aceptacin iguales a 5 y 4 respectivamente). Observando los datos resumidos, podemos concluir que la mayora de las personas encuestadas tienen una visin favorable del nuevo producto. Queda claro, como la tabla de frecuencia agiliza el anlisis de los datos. Ntese que la sumatoria de las frecuencias es igual al nmero de personas encuestadas (10), por lo cual podemos llegar a la siguiente conclusin: Donde Nc representa el nmero de posibles resultados tabulados en la tabla (que de ahora en adelante se le conocern como clases). La estadstica considera otros tipos de frecuencias auxiliares que complementan el anlisis de las tablas de frecuencia. Frecuencia Absoluta Acumulada (F): Presenta un saldo acumulado de las frecuencias de los intervalos. Esta frecuencia se calcula sumando el acumulado de las frecuencias de los intervalos anteriores ms la frecuencia absoluta del intervalo actual. La Frecuencia Absoluta Acumulada del ltimo intervalo es igual al tamao de la muestra (o poblacin). Siguiendo con el ejemplo, tenemos: Grado de aceptacin 1: Grado de aceptacin 2: Grado de aceptacin 3: Grado de aceptacin 4: Grado de aceptacin 5:

20

Esta frecuencia no proporciona de inmediato el nmero de casos que queda por debajo de cada clase. La F4, por ejemplo, nos dice que seis personas opinaron que el producto se encontraba entre muy malo y bueno. Frecuencia Relativa (h): Equivale a la razn de las frecuencias de cada intervalo sobre la totalidad de los datos (n o N, dependiendo del caso). Matemticamente se expresa: Para el ejemplo, las frecuencias relativas son: Grado de aceptacin 1: Grado de aceptacin 2: 10% Grado de aceptacin 3: 20% Grado de aceptacin 4: 30% Grado de aceptacin 5: 40% La sumatoria de las frecuencias relativas debe ser igual a 1 (si se trabaja estos valores como porcentaje, equivaldra al 100% de los datos). El 40% de las personas encuestadas (h5), opinaron que el producto es excelente. Frecuencia Relativa Acumulada (H): Presenta un saldo acumulado de las frecuencias relativas de cada intervalo de clase. Su clculo resulta de la suma del acumulado de las frecuencias relativas de los intervalos anteriores ms la frecuencia relativa del intervalo actual. La ltima de las Frecuencias Relativas Acumuladas equivale a 1. Las tablas de frecuencias suelen mostrar tanto las frecuencias absolutas, como relativas. Grado de Aceptacin (Clase) 1 2 3 4 5 TOTAL Caractersticas de las tablas Tipo A El nmero de posibles valores que toma la variable debe ser reducido. (Rango pequeo). Suele ser utilizada en la cuantificacin de las variables cuasi-cualitativas. Maneja variables cuantitativas cuyos valores son preferiblemente discretos. Su construccin es sencilla. La interpretacin equivale a especificar la frecuencia de cada resultado. F 0 1 2 3 4 10 Fa 0 1 3 6 10 p 0,0 0,1 0,2 0,3 0,4 1,0 pa 0,0 0,1 0,3 0,6 1,0

21
CONSTRUCCIN DE LAS TABLAS TIPO A EN EXCEL Creemos un archivo nuevo en Microsoft Excel pulsando sobre la opcin Nuevo en el men Archivo o pulsando sobre el botn que se encuentra en la barra de herramientas. Aquellos que posean la versin 2007, debern oprimir el botn ARCHIVO que se encuentra en la esquina superior izquierda de la ventana. Ubiqumonos a partir de la celda B2 y escribamos los siguientes datos (una palabra en cada celda): Azul Rojo Verde Verde Azul Negro Blanco Rojo Blanco Blanco Verde Azul Azul Verde Verde Negro Azul Blanco Azul Rojo Rojo Azul Azul Azul Verde Azul Negro Rojo Verde Azul Blanco Blanco Rojo Rojo Verde Negro Azul Blanco Azul Azul Rojo Verde Verde Negro Blanco Blanco Azul Rojo Rojo Rojo Verde Azul Azul Negro Azul Rojo Blanco Blanco Verde Azul Rojo Rojo Rojo Negro Rojo Azul Azul Verde Negro Blanco

En Excel debera verse as: Construyamos la estructura de nuestra tabla de frecuencia dejando espacio para la frecuencia absoluta, absoluta acumulada, relativa y relativa acumulada a partir de la celda B13: Para determinar la cantidad de colores azul que existen en los datos iniciales emplearemos la siguiente frmula: CONTAR. SI: Permite contar una palabra, nmero o carcter especial dentro de un conjunto de datos. Formato: CONTAR.SI(rango;criterio) Categora: Estadstica Ubicndonos en la celda C14 activaremos la frmula CONTAR. SI pulsando sobre el botn o en la opcin Funcin en el men Insertar. En Microsoft Excel 2007 deber ingresar en la ficha FRMULAS y luego pulsar sobre el botn ASISTENTE PARA FUNCIONES. Esto generar una ventana donde se encuentran todas las funciones disponibles en Excel. Localicemos nuestra funcin y pulsemos en el botn Aceptar. La funcin CONTAR. SI requiere de dos parmetros: El rango, equivalente a los datos iniciales. El criterio, haciendo alusin al valor que se desea contar

Pulsemos en el botn designado para el Rango, el cual reduce la ventana de la funcin. Luego con ayuda del Mouse, seleccionamos los datos iniciales del ejemplo (B2:H11): Pulsemos la tecla Enter o en el botn para regresar a la ventana de la funcin. Luego seguimos los mismos pasos para el parmetro Criterio, teniendo en cuenta que solo seleccionaremos el color que deseamos contar dentro de los datos iniciales (el Azul): Nos valdremos de la celda B13 en nuestra tabla de frecuencia donde se encuentran el listado de los colores:

22
Regresamos a la ventana de la funcin y pulsamos en el botn Aceptar: Debe aparecer el valor 21, indicando que existen 21 aciertos en los datos iniciales. Para calcular la frecuencia del color Rojo debemos seguir los mismos pasos que para el color Azul. Para ahorrarnos este trabajo, Excel tiene la opcin de arrastrar frmulas a otras celdas. En nuestro caso arrastraramos la frmula a las celdas C15, C16, C17 y C18. Para que esto tenga efecto debemos ajustar la frmula inicial: El rango B2:H11 marca los datos iniciales, mientras que la celda B14 indica el color que se va a contar. La celda B14 debe variar para poder asignar los otros colores, mientras que el rango de datos iniciales se debe mantener fijo (los datos iniciales sern siempre los mismos). Ubiquemos el cursor en la Barra de Frmulas al comienzo de la celda B2 y pulsemos la tecla F4; de igual horma hacemos esto para la celda H11. El resultado debera verse como sigue: Lo que hicimos se conoce como Referencia Fija de Celda y permite que a la hora de arrastrar la frmula, las celdas fijadas no varen. Para arrastrar la celda debemos ubicar el Mouse en la esquina inferior derecha de la celda C14 hasta que el puntero cambie a una cruz negra delgada. Justo en ese momento, pulsaremos el botn izquierdo del Mouse y arrastramos hacia la celda C18: El resultado final debera verse como sigue: Recordemos que la sumatoria de las Frecuencias Absolutas equivale al tamao del conjunto de los datos iniciales. Para verificar esto emplearemos una nueva funcin llamada SUMA. SUMA: Suma todos los nmeros en un rango de celdas Formato: SUMA (nmero1; nmero2;) Categora: Matemticas y Trigonomtricas

Ampliemos la tabla de frecuencia para incluir una fila al final cuyo encabezado sea Total: En la celda C19, ubiquemos la funcin SUMA de la forma explicada en la funcin anterior o pulsando sobre el botn . De forma automtica se seleccionar el rango de celdas C14:C18. Pulsemos la tecla ENTER para ver el resultado de la sumatoria: La primera Frecuencia Absoluta Acumulada ser igual a la primera Frecuencia Absoluta (21). En la celda D14 colocaremos el signo igual y luego pulsaremos sobre la celda C14 para trasladar su valor (recuerde pulsar la tecla Enter): La Frecuencia Absoluta Acumulada para el color Rojo (D15) equivale a la Frecuencia Absoluta Acumulada del color Azul (D14) ms la Frecuencia Absoluta del color Rojo (C15). En Excel se vera como sigue: Para calcular el resto de Frecuencias, arrastraremos la frmula que esta en D15 hasta la celda D18. El resultado final se muestra a continuacin: Para calcular las Frecuencias Relativas (h) tomaremos cada Frecuencia Absoluta y la dividiremos sobre el total de datos (C19). Ntese que para poder arrastrar la frmula debemos fijar primero la celda C19 (el total no vara). El calculo de la Frecuencia Relativa Acumulada (H) lo haremos de forma similar que el calculo de la Frecuencia Absoluta Acumulada (F). La tabla final de frecuencia es (se cambiaron los formatos):

23

CONSTRUCCIN Y CARACTERSTICAS DE LAS TABLAS TIPO B Supongamos que 50 estudiantes han sido examinados de Qumica y que sus calificaciones individuales son: 60 71 80 41 94 33 81 41 78 66 85 35 61 55 98 52 50 91 48 66 65 35 55 69 73 77 64 73 85 42 84 74 59 67 65 65 47 53 39 94 57 68 45 76 89 74 54 77 60 88

Al presentar las calificaciones podramos ordenarlas en forma creciente o decreciente, indicando el nmero de alumnos que obtuvo determinada puntuacin. O bien, podramos presentarlas agrupando las calificaciones para decir, por ejemplo, cuntos alumnos alcanzaron calificaciones entre los 30 y 39 puntos, cuntos entre 40 y 49, etc., es decir, indicando el nmero de veces que se repiten las calificaciones dentro de cada grupo o categora de 10 puntos, tal repeticin se conoce como frecuencia de clase. Grupo 1ro. 2do. 3ro. 4to. 5to. 6to. 7mo. Total Calificaciones 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99 Frecuencia 4 6 8 12 9 7 4 n = 50

El procedimiento se conoce como tabulacin y la presentacin como tabla de frecuencias o distribucin de frecuencias. Los grupos o categoras de calificaciones: 30-39, 40-49, etc., se llaman intervalos de clase; en tanto que, Los valores: 30, 40, 50, etc., se llaman lmites inferiores, y, Los valores: 39, 49, 59, etc., son los lmites superiores de los intervalos de clase. La finalidad que se persigue al presentar las calificaciones agrupadas en una distribucin de frecuencias no es nicamente la de simplificar su presentacin, sino, sobre todo, la posibilidad de poder obtener mediante tcnicas estadsticas varias caractersticas de la variable que pueden ser de mucho inters. Al confeccionar una distribucin de frecuencias y a fin de no distorsionar tales caractersticas, conviene tener en cuenta que: Pocos intervalos de clase facilitan la presentacin y reducen los clculos, pero se pierde mucha informacin sobre los datos originales; Demasiados intervalos de clase proporcionan mucha informacin sobre los datos originales, pero se pierde el sentido de simplificacin y de dificultan posclculos posteriores;

24

En general, es conveniente tener de 10 a 15 intervalos, aunque no hay normas fijas.

El nmero de calificaciones diferentes que se pueden escribir entre los lmites de cada intervalo de clase, incluyendo tales lmites, se llama ancho de clase o tambin amplitud, o longitud del intervalo. As, el intervalo 30-39 es un intervalo de 10 unidades: 30, 21, 32, 33, 34, 35, 36, 37, 38, 39. CMO CONSTRUIR UNA DISTRIBUCIN DE FRECUENCIAS? Sigamos considerando el ejemplo de las calificaciones de Qumica. 1. El primer paso consiste en determinar el recorrido de la variable, llamado tambin amplitud total, cuyo valor es la diferencia entre las calificaciones: mxima y mnima, aumentada en 1 Recorrido = (calificacin mxima calificacin mnima) + 1 = (98 33) + 1 = 66 puntos 2. El siguiente paso consiste en determinar el ancho del intervalo de clase (i). En la prctica, es frecuente encontrar intervalos de clase de 3, 5 y 7 unidades, aunque tambin se utiliza el 10 por la facilidad que ofrece al establecer los lmites de cada intervalo. 3. La longitud del intervalo debe ir aparejada con el nmero de intervalos que se desea construir (un criterio, comnmente aceptado, es considerar de 10 a 15 intervalos de clase). Si dividimos el recorrido de la variable para la longitud del intervalo, obtendremos, aproximadamente, el nmero de intervalos de la distribucin. Recorrido Nmero.de.intervalos = i Considerando un ancho de clase de 5 unidades, el nmero aproximado de intervalos ser: 66 = 13, 2 = 14 aprox . 5 El paso siguiente consiste en sealar los lmites del primer intervalo de clase. Un mtodo corriente es empezar el primer intervalo en un nmero que sea mltiplo de la amplitud (i), pero igual o ligeramente menor que la mnima calificacin (33 en nuestro ejemplo). Despus, se escriben los dems intervalos de clase aumentando cada lmite en el nmero de unidades del ancho de clase. El siguiente paso es el conteo de datos; esto es, se consideran las puntuaciones una por una y se van anotando a la derecha del intervalo de clase correspondiente. Esta columna se sustituye, ms tarde, por la columna encabezada por f; luego se suman estos valores y el resultado debe ser el nmero total de datos (n). Observando los pasos anteriores, la distribucin de frecuencias correspondientes a las calificaciones de Qumica, es la siguiente:

25

INTERVALOS 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80-84 85-89 90-94 95-99

N DE ALUMNOS 1 3 3 3 4 4 4 8 5 4 3 4 3 1 n = 50

Los datos consignados en una distribucin de frecuencias se llaman datos agrupados, en tanto que, los datos iniciales se llaman datos no agrupados, datos crudos o puntuaciones brutas. TABLA DE FRECUENCIAS ACUMULADAS A veces, es deseable presentar frecuencias de una manera acumulada, especialmente cuando buscamos localizar la posicin de un caso en relacin con la actuacin total de un grupo. Las frecuencias acumuladas se definen como el nmero total de casos que tengan cualquier puntaje IGUAL o MENOR que un puntaje dado. La frecuencia acumulada correspondiente a un intervalo de clase se obtiene al agregar la frecuencia propia de dicho intervalo a las frecuencias de todos los intervalos que estn antes de l. En la siguiente tabla se presenta una distribucin de frecuencias absolutas acumuladas de las puntuaciones de 376 estudiantes en un test de habilidad: INTERVALOS 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54* 55-59 60-64 f 4 15 23 42 58 64 58 46 32 20* 12 2 n = 376 fa 4 19 42 84 142 206 264 310 342 362 374 376

26

La fa en una distribucin de frecuencias indica, el nmero de casos cuya calificacin es IGUAL o MENOR que el lmite superior del intervalo al que pertenece dicha frecuencia acumulada. As: 20* alumnos del ejemplo anterior alcanzaron una calificacin de 54* puntos o menos. La representacin grfica de la distribucin de frecuencias acumuladas, igual que ciertos clculos que ms adelante mostraremos, permitir decir qu nmero de alumnos obtienen una calificacin igual o menor que cualquier calificacin comprendida dentro de la distribucin. TABLA DE FRECUENCIAS RELATIVAS Cuando el investigador estudia distribuciones de igual tamao total, los datos de frecuencia (f) pueden utilizarse para hacer comparaciones entre los grupos. Sin embargo, generalmente no es posible estudiar distribuciones que tengan exactamente el mismo nmero de casos; en tales circunstancias, necesitamos un mtodo para estandarizar distribuciones de frecuencia por tamao. Dos de los mtodos ms populares y tiles para estandarizar por tamao y comparar distribuciones son la proporcin y el porcentaje. La proporcin compara el nmero de casos en una categora dada por el tamao total de la distribucin. Para convertir cualquier frecuencia f en una proporcin p, dividimos el valor de f por el nmero total de casos de la distribucin (n): f p= n El porcentaje compara la frecuencia de ocurrencia en una categora por cada 100 casos. Para calcular el porcentaje (p) correspondiente a una frecuencia dada f, basta multiplicar la proporcin por 100: f p = (100 ) n . La siguiente es la tabla de frecuencias relativas que corresponde a los datos de la distribucin anterior:

INTERVALOS 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

f 4 15 23 42 58 64 58 46 32 20 12 2 n = 376

p 0.011 0.040 0.061 0.112 0.154 0.170 0.154 0.122 0.085 0.053 0.032 0.005 0.999

P 1.1 4.0 6.1 11.2 15.4 17.0 15.4 12.2 8.5 5.3 3.2 0.5 99.9%

Los clculos de la tabla que antecede se han realizado de la siguiente manera.

27

Ejemplo: la proporcin p que corresponde a la frecuencia 32 del intervalo de clase 4549: f p= n 32 = 376 = 0,085 El porcentaje P que corresponde a la frecuencia del mismo intervalo: f p = (100 ) n = 0,085 (100 ) = 8,5% NOTA.- Cuando el nmero total de casos es pequeo, los tantos por ciento son inestables. Es decir, una variacin en un caso puede producir un cambio relativamente grande en el tanto por ciento. Cuando el nmero de caos es menor a 100, debera evitarse el empleo de los tantos por ciento. TABLA DE FRECUENCIAS RELATIVAS ACUMULADAS Adems de la frecuencia acumulada, tambin podemos construir una distribucin que indique porcentajes acumulados (Pa). Es decir, una columna de la distribucin que indique el porcentaje de casos cuya calificacin es IGUAL o MENOR QUE un puntaje determinado. La siguiente tabla muestra las frecuencias relativas acumuladas correspondientes a la distribucin anterior: INTERVALOS 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 f 4 15 23 42 58 64 58 46 32 20 12 2 n = 376 fa 4 19 42 84 142 206 264 310 342 362 374 376 Pa 1.1 5.0 11.2 22.3 37.7 54.8 70.2 82.4 90.7 96.3 99.5 100.0

En este caso, el clculo del Pa correspondiente al intervalo de clase 45-49, por ejemplo, se obtiene dividiendo la fa 342 entre n = 376 y multiplicando por 100. Es decir, expresando mediante frmula:
Pa = fa (100 ) n

28

En dicho intervalo se puede observar que el 90,7% de los alumnos alcanz una calificacin IGUAL o MENOR que el lmite superior 49. Ejemplo 2 (OTRA FORMA) Un sondeo realizado en la Universidad sobre 30 alumnos del sexto mdulo de Administracin de Empresas, pretende mostrar que edad es la ms representativa. Las edades de los alumnos fueron: 17 21 24 23 21 19 17 18 19 20 22 19 19 27 25 29 21 23 19 21 24 21 20 20 31 22 24 19 20 21

Elabore una tabla de frecuencia que resuma los resultados. SOLUCIN Antes de elaborar la tabla de frecuencia, debemos definir cual de los dos tipos propuestos es el que mejor se adapta (Tipo A y Tipo B). Si resumimos los datos en una tabla tipo A, tendramos una tabla muy extensa, en la cuales algunas frecuencias de las edades serian 0. Esto se debe a que el rango manejado es muy amplio (R = 31 - 17 = 14). Edad 17 18 19 20 21 22 ,,, 31 Total f 2 1 6 4 6 2 1 30

En el caso de que queramos agrupar aun ms estos datos, trabajaramos con el concepto de intervalos de clase (Tabla Tipo B). Paso 1: Determinar el numero de intervalos Se debe siempre aproximar el nmero de intervalos al entero ms prximo, recordando que este valor no ser menor a 5, ni un valor mayor a 15. Nuestra tabla estar constituida por seis intervalos.

29

Paso 2: Determinar el ancho de cada intervalo. Antes de hallar el ancho de los intervalos de clase, debemos calcular el rango (R) como primera medida. Con el Rango y el nmero de intervalos, podremos hallar el ancho: El ancho se debe ajustar para trabajar con el mismo nmero de decimales que en el conjunto de datos tratados. Como los datos son valores enteros (variable discreta), aproximamos al entero superior. El ajuste del Ancho no podr ser menor al valor obtenido inicialmente. Paso 3: Determinar el nuevo Rango (R). En el momento de realizar el ajuste del ancho del intervalo, el rango se incrementa automticamente. Este Nuevo Rango lo denotaremos como R: Nuevo Rango (R): Rango que es convenido por el Ancho de los intervalos a los decimales que son manejados en los datos objeto del estudio. Su clculo se realiza multiplicando el Ancho ajustado por el Nmero de Intervalos: El rango se incremento en cuatro aos. El incremento se le sumar al valor Mximo (Xmax) o restar al valor Mnimo (Xmin). En este caso optaremos por aumentar el valor Mximo y reducir el valor Mnimo en dos. El alumno podr repartir el incremento de la forma que crea ms conveniente. Este procedimiento permite encontrar los valores mximos y mnimos cuya resta sea igual al nuevo Rango (R) Paso 4: Determinar los intervalos de clases iniciales. Con los valores mximos y mnimos, y el ancho, podremos armar cada intervalo de clase. El primer intervalo parte del valor mnimo, al cual le agregamos el ancho. Ni Lm Ls 1 15 18 El segundo intervalo parte del lmite superior del intervalo anterior. Ni 1 2 Lm 15 18 Ls 18 21

Seguimos realizando este proceso hasta alcanzar el valor mximo: Ni 1 2 3 4 5 6 Lm 15 18 21 24 27 30 Ls 18 21 24 27 30 33

30

Esta primera distribucin presenta algunos inconvenientes al momento de repartir las frecuencias a cada intervalo de clase, por ejemplo, existen 6 personas del total de encuestados que tienen una edad de 21 aos, los cuales podran ser clasificados en el intervalo dos o en el tres. Ni 2 3 Lm 18 21 Ls 21 24

Este caso se le conoce como el Problema de la Ambigedad, y el cual debe ser solucionado antes de terminar la tabla de frecuencia tipo B. EL PROBLEMA DE LA AMBIGEDAD EN LAS TABLAS DE FRECUENCIA TIPO B Propondremos dos soluciones diferentes para resolver el problema de la ambigedad. Primera Solucin Se trabajan con intervalos cuyos lmites Superiores e Inferiores tendrn un decimal adicional sobre el nmero de decimales manejados en los datos. Por ejemplo, si el Limite Superior del primer intervalo es 21 y los datos trabajados son valores enteros, el nuevo lmite superior ser 21,1. Si los datos trabajan con un decimal, el nuevo Limite Superior sera 21,01. El primer lmite Inferior (Valor Mnimo) y el ltimo lmite Superior (Valor Mximo) se mantendrn sin modificacin. El problema quedara solucionado de la siguiente manera: Ni 2 3 Lm Ls 18.1 21.1 21.1 24.1

Las seis personas que tienen 21 aos quedaran registradas en el intervalo nmero 2. Segunda Solucin Se convierten los Limites Superior e Inferior en Lmites Abiertos y Cerrados. Se considera como Lmite Abierto aquel que admite un nmero superior, ms no igual, al valor indicado. El Lmite Cerrado puede admitirse as mismo. Los lmites que son abiertos se identifican con el Parntesis y los Lmites Cerrados con el Corchete. La solucin a nuestro problema quedara: Ni 2 3 Lm ( 18 ( 21 Ls 21 ] 24 ]

31

El valor 21 se ubica en el intervalo dos. Otra forma de colocar los intervalos es: Ni 2 3 Lm [ 18 [ 21 Ls 21 ) 24 )

El valor 21 se ubica ahora en el intervalo nmero tres. Continuando con el ejemplo anterior: Paso 5: Determinar los intervalos de clases reales. Ni 1 2 3 4 5 6 Lm 15,0 18,1 21,1 24,1 27,1 30,1 Ls 18,1 21,1 24,1 27,1 30,1 33,0

Paso 6: Determinar las frecuencias absolutas, frecuencias relativas y marcas de clases. Un valor representativo de los intervalos en las tablas de frecuencia son las Marcas de Clase. Marcas de Clase (Mc): Se define como el punto medio de un intervalo de clase. Las marcas de clase son muy utilizadas en algunas grficas estadsticas y en clculos que sern vistos posteriormente. Ni 1 2 3 4 5 6 Lm 15,0 18,1 21,1 24,1 27,1 30,1 Ls 18,1 21,1 24,1 27,1 30,1 33,0 Total F 3 16 7 2 1 1 30 Fa 3 19 26 28 29 30 P 0,10 0,53 0,23 0,07 0,03 0,03 1,00 Pa 0,10 0,63 0,87 0,93 0,97 1,00 Mc 16,6 19,6 22,6 25,6 28,6 31,6

Ejemplo 2: tablas de frecuencia tipo B Crear una tabla tipo B que resuma los siguientes datos: 96,65 546,56 376,43 358,48 718,43 859,76 705,55 73,16 731,09 118,94 949,14 97,94 835,14 869,57 950,77 461,15 673,45 235,69 353,18 717,34 72,06 146,19 251,83 742,90 167,49 137,28 927,49 831,52 189,10 897,99 992,42 473,74 243,41 174,51 490,94 43,07 170,72 226,96 510,13 722,36 253,90 558,50 919,39 87,95 224,61 136,76 888,39 774,02 56,06 852,44 965,75 784,01 763,32 829,01

32

Paso 1: Determinar el nmero de intervalos (Nc). Aplicamos la primera frmula para determinar el nmero de intervalos de clase. Paso 2: Determinar el ancho de cada intervalo. Se determina el rango como primera medida. Con el Rango y el nmero de intervalos, podremos hallar el ancho: El ancho se debe ajustar para trabajar con el mismo nmero de decimales que en el conjunto de datos tratados. Paso 3: Determinar el nuevo Rango (R). Como el ancho fue ajustado, se procede a hallar el nuevo rango (R). El incremento entre el nuevo rango (R) y el rango inicial (R), se reparte entre el valor mnimo y el valor mximo Ni 1 2 3 4 5 6 7 8 Lm 72,04 187,09 302,14 417,19 532,24 647,29 762,34 877,39 Ls 187,09 302,14 417,19 532,24 647,29 762,34 877,39 992,44

Paso 4: Determinar los intervalos de clases iniciales. Paso 5: Determinar los intervalos de clases reales. Ni 1 2 3 4 5 6 7 8 Lm 72,040 187,091 302,141 417,191 532,241 647,291 762,341 877,391 Ls 187,091 302,141 417,191 532,241 647,291 762,341 877,391 992,440

Paso 6: Determinar las frecuencias absolutas, frecuencias relativas y marcas de clases. Ni 1 2 Lm 72,040 187,091 Ls 187,091 302,141 f 14 7 F 14 21 h 0,26 0,13 H 0,26 0,39 MC 129,57 244,62

33

3 4 5 6 7 8

302,141 417,191 532,241 647,291 762,341 877,391

417,191 532,241 647,291 762,341 877,391 992,440 Total

3 4 2 7 9 8 54

24 28 30 37 46 54

0,06 0,07 0,04 0,13 0,17 0,15 1,00

0,44 0,52 0,56 0,69 0,85 1,00

359,67 474,72 589,77 704,82 819,87 934,92

Caractersticas de las tablas tipo B - El nmero de posibles valores que toma la variable es elevado. (Rango grande). - Se utiliza para el tratamiento de variables cuantitativas (discretas y continuas). - Su construccin es ms compleja que en las tablas tipo A. - La interpretacin equivale a especificar la frecuencia de cada intervalo de clase. - Presenta un componente adicional: las marcas de clase.
CONSTRUCCIN DE LAS TABLAS TIPO B EN EXCEL Desarrollemos los seis pasos para la construccin de tablas tipo B en Excel a partir del siguiente conjunto de datos (digtelos a partir de la celda B2): 30 8 47 71 70 76 1 32 69 11 19 4 3 13 17 1 22 27 44 28 29 28 72 67 64 24 78 64 79 24 60 28 62 6 16 20 76 4 56 65 78 37 5 29 39 41 30 79 3

Paso 1: Determinar el nmero de intervalos (Nc). El nmero de intervalos depende del tamao de la muestra o poblacin de datos. Para obtener esta informacin utilizaremos una nueva funcin llamada CONTAR: CONTAR: Cuenta un conjunto de celdas que posean nmeros en su contenido Formato: CONTAR (ref1;ref2;) Categora: Estadsticas Para aplicar la frmula, primero creemos una tabla resumen a partir de la celda B10, que empiece por la cantidad de datos (n) y el nmero de intervalos En la celda C10, ingresamos la funcin CONTAR: En Ref1, seleccionaremos el rango de celdas equivalentes a la totalidad de los datos: Al pulsar Enter y luego el botn Aceptar, tendremos como resultado el conteo de las celdas que tienen nmeros (49 datos en total). Aplicando la frmula: Obtendremos un nmero de intervalos. La raz cuadrada se consigue con la frmula RAIZ: RAIZ: Calcula la raz cuadrada de un nmero. Formato: RAIZ (nmero) Categora: Matemticas y Trigonomtricas

34
Ubiqumonos en la celda C11 y activemos esta funcin. El parmetro nmero corresponde a la celda C10, cuyo valor es 49: Al pulsar en Aceptar tendremos como resultado el valor 7, indicando que nuestra tabla tendr 7 intervalos de clase. Paso 2: Determinar el ancho de cada intervalo. Aumentemos nuestra tabla resumen con cuatro nuevas filas: valor mnimo (Xmin), valor mximo (Xmax), rango (R) y ancho del intervalo de clase (A): Para determinar el valor mnimo y mximo utilizaremos las dos siguientes frmulas: MIN: Localiza y muestra el valor mnimo de un conjunto de nmeros. Formato: MIN (nmero1; nmero2;) Categora: Estadsticas

MAX: Localiza y muestra el valor mximo de un conjunto de nmeros. Formato: MAX (nmero 1; nmero 2;) Categora: Estadsticas En la casilla nmero1 de la funcin MIN, ubicaremos el rango correspondiente a los datos del ejercicio. Procedemos a hacer lo mismos con la funcin MAX. La tabla resumen debe quedar: El rango se calcula con una simple frmula dada por la resta de C13 y C12. El ancho equivale a la divisin del rango (C14) y el nmero de intervalos (C11). Paso 3: Determinar el nuevo Rango (R). Ajustemos primero el ancho del intervalo a 12 (para trabajar con valores enteros) con la siguiente funcin: MULTIPLO SUPERIOR: Redondea un nmero hacia arriba. Formato: MULTIPLO SUPERIOR (nmero; cifra-significativa) Categora: Matemticas y Trigonomtricas Con una nueva fila encabezada por A (indica el ancho ajustado), activaremos esta funcin. En el parmetro nmero seleccionaremos la celda donde se encuentra el ancho sin ajustar (C15), y en cifra significativa (equivale al mltiplo al que se desea redondear), el valor de 1. El nuevo rango resulta de la multiplicacin entre la celda C16 y C11: Sumaremos la diferencia entre R y R al valor mximo (para no afectar el valor mnimo): Paso 4 y paso 5: Determinar los intervalos de clases iniciales y reales. Construyamos la tabla de frecuencia para 7 intervalos de clase: El lmite inferior para el primer intervalo de clase es 1 (Xmin), siendo su lmite superior 13 (Xmin ms el ancho de clase). El lmite inferior de las siguientes clases es igual al lmite superior de su clase anterior: Podremos arrastrar esta frmula hasta el ltimo intervalo de clase (C28): Para calcular los lmites superior bastar con arrastrar la frmula que esta en la celda D22, fijando de antemano, la celda C16 que hace referencia al tamao de la clase: El resultado de los intervalos iniciales es el siguiente:

35
El problema de la ambigedad se corregir agregando al primer lmite superior un valor de 0,1 y restando al ltimo este mismo valor: Paso 6: Determinar las frecuencias absolutas, frecuencias relativas y marcas de clases. Comencemos con la frecuencia absoluta (f). Para trabajar con intervalos emplearemos una nueva funcin: FRECUENCIA: Muestra el nmero de veces que se repite un nmero .dentro de un rango de celdas. Formato: FRECUENCIA (datos; grupos) Categora: Estadsticas A partir de la celda E22, activamos la funcin FRECUENCIA mostrando una ventana que pide dos requisitos: datos, que equivale al rango de celda donde est los datos iniciales y grupos, correspondiente en nuestro caso, a los lmites superiores de la tabla de frecuencia. Al pulsar en Aceptar, Excel mostrar la frecuencia para el primer intervalo de clase: Para el clculo de las frecuencias restantes deberemos seguir los siguientes pasos (dado que es una frmula matricial): Ubicados desde la celda E22, seleccione las celdas consecutivas hasta C28. Pulse la tecla F2. Luego pulse de forma conjunta las teclas Control + Maysculas + Enter.

El resultado final es: Determine el resto de las frecuencias empleando los mismos pasos vistos para las tablas tipo A. El clculo de las marcas de clase se hace tomando la suma de los dos lmites dividido entre dos. La primera marca de clase es el resultado de: La tabla definitiva (con algunos cambios en el formato)

36

EJERCICIOS PROPUESTOS 1. Realice una tabla de frecuencia que resuma los siguientes datos: 1, 6, 8, 4, 5, 3, 4, 1, 1, 5, 3, 8, 7, 4, 6, 2, 8, 9, 3, 4, 10, 2 a. Cul es el dato que mas se repite? b. Cul es el dato que menos se repite? c. Cul es el Rango? d. Qu tipo de tabla sera la ms conveniente para agrupar estos datos? Crear una tabla de frecuencia que permita agrupar los siguientes datos cualitativos Rojo Verde Azul Verde Negro Rojo Blanco Negro 3. Amarillo Verde Negro Rojo Azul Negro Verde Blanco Rojo Azul Rojo Azul

2.

Rojo Verde Verde Negro Un grupo de personas valora la gestin del departamento de servicio al cliente de un supermercado catalogndolo como: Excelente (E), Bueno (B), Regular (R) o Malo (M). Los resultados obtenidos son: E B B R E M R E B B E a) b) c) d) B R M B B E E M E E E B B B R R R E R B R R M B

B R M R E Elabore una tabla de frecuencia que permita resumir los datos Que porcentaje de personas valor la Gestin del Departamento como Buena? Cuantas personas valoraron la gestin como Excelente y Buena? Interprete f3, F3, P3 y Pa3.

3. Agrupe los siguientes datos en una Tabla de Frecuencia 23 29 25 45 9 21 17 11 43 47 43 33 28 23 47 41 35 40 29 31 19 30 22 32 12

37

5.

Agrupe los siguientes datos en una tabla de frecuencia

11,3 31,2 29,4 29,9 27,6 47,3 38,1 6.

14,2 33,7 31,4 15,6 22,5 11 35,3

21 22,5 21 32,2 41,1 15,6 39,8

20,5 27,6 12,1 43 19,1 33,3 30

29,9 20,3 30 17,7 13,6 15,4 15

Los siguientes datos representan el dimetro interno en cm. de 30 tubos para acueducto tomados como muestra dentro de un programa de calidad estatal. 14,1 15 14,5 14,2 14,6 15,2 14,2 14,1 14 14,2 14,1 13,5 13,9 14,5 15,1 14,7 14 14,2 14,7 14,9 14,7 13,9 14,8 14,8 12,9 13,6 13,8 13 14,7 14,5

a) Elabore una tabla de frecuencia que agrupe los datos. Justifique la eleccin del Tipo de Tabla usada. b) Interprete Fa2, Fa4 - Fa2, Fa4 - f3, f3 + f2. c) Interprete P1 + P2, Pa3 - Pa2, Pa3 - h2 7. Elabore una tabla de frecuencia que agrupe los siguientes datos. 200,23 178,15 149,11 176,59 194,58 157,21 121,04 139,45 174,73 230,99 145,81 133,9 211,64 124,45 144,32 174,38 193,2 201,55 147,83 212,71

38

8.

A continuacin se muestran los ingresos registrados en 50 familias seleccionadas al azar de estrato 3 en una importante ciudad: $ 582.400,00 $ 841.210,00 $ 458.882,00 $ 535.211,00 $ 283.427,00 $ 463.710,00 $ 291.932,00 $ 280.678,00 $ 622.441,00 $ 762.212,00 $ 570.688,00 $ 688.648,00 $ 341.204,00 $ 696.637,00 $ 315.031,00 $ 753.701,00 $ 262.217,00 $ 398.000,00 $ 346.031,00 $ 394.019,00 $ 469.799,00 $ 191.021,00 $ 382.482,00 $ 385.656,00 $ 452.318,00 $ 384.916,00 $ 690.247,00 $ 750.317,00 $ 433.792,00 $ 848.607,00 $ 538.597,00 $ 947.218,00 $ 781.633,00 $ 681.517,00 $ 382.734,00 $ 775.123,00 $ 1.147.607,00 $ 926.773,00 $ 584.599,00 $ 500.558,00 $ 1.115.432,00 $ 655.230,00 $ 415.560,00 $ 347.485,00 $ 773.411,00 $ 810.474,00 $ 353.289,00 $ 705.757,00 $ 736.707,00 $ 584.196,00 $ 920.824,00 $ 1.115.851,00 $ 413.914,00 $ 417.028,00 $ 438.579,00 $ 240.334,00 $ 503.314,00 $ 593.656,00 $ 431.972,00 $ 592.240,00 $ 303.165,00 $ 380.497,00 $ 635.302,00 $ 617.137,00 $ 551.668,00 $ 821.100,00 $ 558.260,00 $ 341.103,00 $ 357.441,00 $ 504.725,00 $ 376.616,00 $ 978.298,00 $ 576.128,00 $ 465.540,00 $ 310.504,00 $ 828.898,00 $ 485.925,00 $ 550.409,00 $ 223.878,00 $ 391.814,00 $ 700.010,00 $ 221.135,00 $ 718.487,00 $ 317.555,00 $ 716.003,00 $ 647.222,00 $ 345.931,00 $ 285.715,00 $ 698.338,00 $ 293.312,00 $ 306.300,00 $ 400.496,00 $ 192.019,00 $ 489.025,00 $ 480.314,00 $ 272.328,00 $ 310.504,00 $ 828.898,00 $ 480.314,00 $ 272.328,00

Construya una tabla de frecuencia que agrupe los datos en 10 intervalos de clase. 9. A partir de la siguiente tabla de frecuencias con datos parciales: Nc 1 2 3 4 5 Lm (10 (14 (18 (22 (26 Ls 14] 18] 22] 26] 30] TOTAL f Fa 10 15 31 42 55 P Pa

39

a) Calcule las frecuencias faltantes (f, P y Pa) b) Modifique la tabla de frecuencia para que incluya los siguientes datos: 14, 22, 26, 27 y 28. 10. Debido a un grave accidente, el gerente de una compaa consultora perdi informacin de un estudio de mercado que realiz a una importante compaa a nivel nacional de gaseosas. Solo se conoce algunos datos parciales sobre una entrevista que se elabor a 150 personas. Nc 1 2 3 4 5 6 7 Lm 0,0 2,1 4,1 6,1 8,1 10,1 12,1 Ls 2,1 4,1 6,1 8,1 10,1 12,1 14,0 TOTAL f 24 38 45 16 8 17 2 150 Fa 24 62 107 123 131 148 150 P 0,16 0,25 0,30 0,11 0,05 0,11 0,01 1,00 Pa 0,16 0,41 0,71 0,82 0,87 0,99 1,00

Reconstruya la tabla de frecuencia. Cuantas personas toman menos de 4 gaseosas por semana? Cuantas personas toman al menos 3 gaseosas por semana? CUESTIONARIO DE REPASO Seleccin Mltiple con nica Respuesta: Marque con una X la respuesta correcta. 1. Las Tablas de Frecuencia Tipo A se caracterizan por: A. Trabajan solo con datos cualitativos. B. Agrupan datos cuyo Rango es bajo. C. Agrupan datos cuyo Rango es alto. D. Presentan ms intervalos que en las Tablas Tipo B. 2. Las frecuencias relativas se diferencian de las frecuencias absolutas porque: A. Las frecuencias relativas se establecen de acuerdo a una base. B. Las frecuencias relativas se expresan como porcentaje. C. La suma de las frecuencias relativas es igual a 1. D. La A y B. 3. En una tabla de frecuencia, Fa4 - Fa2 es lo mismo que: A. Fa4 - f3 B. Fa2 + f3 C. Fa3 D. f3 + f4 4. En una tabla de frecuencia, P3 + Pa2 es lo mismo que: A. Fa3 B. Fa4 C. P3 D. P3 - P4

40

5. En el proceso de elaboracin de las Tablas Tipo B, suele determinarse un nuevo Rango (R') para luego hacer los intervalos de clase. Cuando es necesario hallar R'? A. Cuando se desea agregar nuevos intervalos. B. En el momento en que aproximamos el Ancho de los Intervalos. C. Cuando se aumenta el tamao de la muestra. D. Ninguna de las anteriores.

41

REPRESENTACIONES GRFICAS Los grficos estadsticos ms usados que parten de resmenes o tablas de frecuencias. La ventaja de los grficos con respecto a las tablas estudiadas, es que permite una fcil interpretacin y anlisis de los datos, al mostrar las frecuencias mediante smbolos, barras, polgonos y sectores. Grficos Estadsticos: Son representaciones visuales que emplean smbolos, barras, polgonos y sectores, de los datos contenidos en tablas de frecuencias.

Trataremos siete tipos de grficos estadsticos: Grfico de sectores Grficos de columnas Histograma Polgonos de frecuencias Curvas suavizadas o curvas de frecuencias Ojivas Pictogramas GRFICOS DE SECTORES Este tipo de diagramas consideran una figura geomtrica en que la distribucin de frecuencias se reparte dentro de la figura como puede ser una dona, pastel, crculo o anillo, en el que cada porcin dentro de la figura representa la informacin porcentual del total de datos. Ejemplo de grficos de sectores Realizar un diagrama de sectores a partir de la siguiente tabla de frecuencia que resume las preferencias de un grupo de encuestados hacia cinco candidatos a elecciones locales: Clase Candidato 1 Candidato 2 Candidato 3 Candidato 4 Candidato 5 Total Frecuencia 25 30 45 20 20 140

SOLUCIN Para crear un grfico de sectores, hay que tener en cuenta los siguientes pasos:

42

PASO 1: Determinar las frecuencias relativas para cada clase. Clase Candidato 1 Candidato 2 Candidato 3 Candidato 4 Candidato 5 Total Frecuencia 25 30 45 20 20 140 P 0,1786 0,2142 0,3214 0,1429 0,1429 1

PASO 2: Determinar los ngulos que representan las porciones dentro de la figura para cada clase. Un crculo esta formado por un ngulo de 360. La porcin correspondiente al Candidato 1 equivale a un 17,86% de esos 360, es decir, 64,296. Grficamente tendramos (se parte desde el eje vertical superior, y se comienza a graficar cada clase en sentido de las manecillas del reloj): La tabla final con los ngulos repartidos para cada clase quedara: Clase Candidato 1 Candidato 2 Candidato 3 Candidato 4 Candidato 5 Total Frecuencia 25 30 45 20 20 140 P 0,1786 0,2142 0,3214 0,1429 0,1429 1 ngulo 64,296 77,112 115,704 51,444 51,444 360

El grfico definitivo se muestra a continuacin (ntese que cada sector se identifica con un color diferente):
Candidato 5 14% Candidato 4 14% Candidato 1 18%

Candidato 2 21% Candidato 3 33%

Caractersticas de los grficos de sectores No muestran frecuencias acumuladas. Se prefiere para el tratamiento de datos cualitativos o cuasicualitativos. La mayor rea (o porcin de la figura) representa la mayor frecuencia. Son muy fciles de elaborar. Suelen utilizarse para representar tablas tipo A. La figura completa equivale al 100% de los datos (360).

43

Ejemplo 2 Los nmeros de la siguiente tabla representan el nmero de alumnos del ltimo curso de cinco carreras universitarias. CARRERAS Ciencias Derecho Medicina Economa Educacin TOTAL
Educacin 6% Economa 9% Medicina 13% Ciencias 48%

f 440 220 120 80 60 920

p 0.48 0.24 0.13 0.09 0.06

% 48 24 13 9 6 100

Derecho 24%

44
CONSTRUCCIN DE LOS GRFICOS DE SECTORES EN EXCEL Vamos a explicar la creacin de grfico de sectores a partir del ejemplo anterior. Lo primero es trasladar la tabla de datos (a partir de la celda B2) en una hoja vaca: En el caso de Excel, solo es necesario trabajar con una sola frecuencia. Ubiqumoslos en una celda fuera de la tabla que acabamos de crear y pulsemos el botn de Asistentes para Grficos o elija la opcin Grfico en el men Insertar. El asistente cuenta de cuatro pasos sencillos para la creacin de varios tipos de grficos Aparecer una nueva ventana con diferentes tipos de grficos. Seleccionemos el correspondiente al grfico de sectores (Circular en Excel). En el tenemos la opcin de 6 grficos de sectores. Para observar esta misma ventana en Microsoft Excel 2007 deber situarse en la ficha INSERTAR y pulsar sobre el botn GRFICOS, luego pulsar el botn que ampla la ventana. Se selecciona el tipo de grfico CIRCULAR. Al pulsar en el botn SIGUIENTE, pasaremos al pasos dos del asistente, en donde especificaremos los datos de origen para crear el grfico. Pulsemos el botn AGREGAR que se encuentra en la ficha SERIE: Este botn permite introducir distintas series de datos (provenientes de distintas tablas de frecuencias, variables o poblaciones). Excel pide tres campos para construir el grfico: Nombre: Ttulo o encabezado del grfico. Valores: Las frecuencias que estn en la tabla (puede ser relativa o absoluta, ambas no acumuladas). Rtulos del eje de categoras (X): Representa las clases de la tabla de frecuencias.

Este formato se incluye en la versin 2007 en la opcin EDITAR DATOS DE ORIGEN (Edit Data Source). En el ttulo escribamos Grfico de Sectores. En valores sealemos las frecuencias absolutas (f): En la casilla rtulos del eje de categora corresponde al rango de las celdas que muestran las clases: En MS Excel 2007 la ventana para introducir los datos de origen debe quedar como sigue: Pulse nuevamente siguiente para dirigirnos al tercer paso del asistente. En el podremos editar tres fichas: Ttulos, Leyendas y Rtulos de datos. En la ficha Leyenda (intermedia) desactivemos la casilla Mostrar Leyenda para ampliar un poco el grfico (es opcional). En la ficha Rtulos de datos activaremos Nombre de la categora y Porcentajes Microsoft Excel 2007 permite editar las opciones del grfico directamente sobre el grfico a partir de un DISEO RPIDO seleccionado. Por ltimo (paso 4), esta la opcin de visualizacin (este paso se aplica en la versin 2007 al presionar sobre el botn MOVER GRFICO): En una hoja nueva: El grfico aparece en una nueva hoja, abarcando todo el espacio. Como objeto en: Se crea el grfico como un objeto editable en una hoja existente. Optemos por activar en una hoja nueva, modificando el nombre de la hoja por Grfico de Sectores y luego pulse en el botn Finalizar. Podr editar el grfico en cualquier momento, modificando los datos de origen, formatos y tipo:

45

GRFICOS DE COLUMNAS Los grficos de barras representan las frecuencias mediante columnas (o barras), a travs de la altura de las mismas en un plano cartesiano. Ejemplo de grficos de columnas Realizar un grfico de barras a partir de la siguiente tabla de frecuencia: Clase A B C D E F G Total Frecuencia 5 11 11 4 15 18 24 88

SOLUCIN Para crear un grfico de barras, seguiremos 2 sencillos pasos: PASO 1: Representar las escalas en los ejes horizontal y vertical del primer cuadrante de un plano de cartesiano. En el eje vertical colocaremos las frecuencias y en el eje horizontal las clases. Para establecer la escala en eje vertical, nos guiaremos por la frecuencia mxima, siendo ese el punto ms elevado. Puede trabajarse tambin con frecuencias relativas. PASO 2: A cada clase se representa con una columna (o barra) cuya altura concuerda con su frecuencia expuesta en el eje vertical. Para la clase A con frecuencia 5, tenemos: El grfico final se muestra a continuacin:
25 20 15 11 10 5 0 A B C D E F G 5 4 11 15 18 24

Puede observar que las columnas se encuentran separadas una de otras.

46

Tambin podramos realizar el grfico de forma horizontal (conocido como grfico de barras):
G F E D C B A 0 5 5 10 15 20 25 4 11 11 15 18 24

Caractersticas de los grficos de columnas


No muestran frecuencias acumuladas. Se prefiere para el tratamiento de datos cualitativos o cuasicualitativos. La columna (o barra) con mayor altura representa la mayor frecuencia. Son fciles de elaborar. Suelen utilizarse para representar tablas tipo A. La sumatoria de las alturas de las columnas equivalen al 100% de los datos.

CONSTRUCCIN DE LOS GRFICOS DE COLUMNAS EN EXCEL En una hoja nueva copiamos a partir de la celda B2, la tabla de frecuencia del ejemplo anterior y en una celda fuera de la tabla, iniciamos el asistente de grficos de Excel: En el asistente seleccionamos el tipo de grfico columnas y pulsamos el botn Siguiente: En la ficha Serie pulsamos en el botn Agregar (en el caso de que exista una o varias series en esta ventana, pulsemos en el botn Quitar hasta eliminar todas las series). Llenamos los datos Nombre, Valores y Rtulos del eje de categoras, tal cual como se explico en el grfico de sectores. En la ventana siguiente podremos especificar el nombre del eje vertical (eje de valores Y) y horizontal (eje de categoras X) en la ficha Ttulos. Para ampliar el grfico, desactivemos la Leyenda. Podremos tambin, mostrar los valores de las frecuencias para cada clase en la ficha Rtulos de datos pulsando sobre la opcin valor. Para terminar, el ltimo paso permite crear el grfico como objeto en una hoja existente o en una hoja nueva. Esta vez pulsemos sobre Como objeto en y luego en el botn Finalizar. El histograma definitivo (con algunos cambios en el formato y lugar) se muestra a continuacin: Los mismos pasos se emplean para el grfico de barras:

47

HISTOGRAMA Se puede considerar como un grfico de columnas especial. Se realiza sobre el primer cuadrante del plano cartesiano. La diferencia radica en que el histograma se utiliza ms a menudo para representar tablas tipo B, donde el ancho de la columna equivale al ancho del intervalo de clase. Las frecuencias absolutas se colocan en el eje vertical y tambin puede emplearse las frecuencias relativas. Otra diferencia importante es que no existe espacio entre las barras. Es un grfico de barras verticales cuyas bases sobre el eje horizontal tiene un ancho igual a la longitud del intervalo de clase y cuyas alturas son numricamente iguales a las frecuencias de clase. Pasos para dibujar: 1. Se busca el punto medio de cada uno de los intervalos de clase 2. Se trazan lneas verticales en estos valores cuyas alturas son iguales a las frecuencias de cada intervalo, respectivamente: 3. Se toma la mitad de la longitud del intervalo de clase a ambos lados de estas verticales y se dibujan barras, sin dejar espacios entre ellas. Ejemplo 1 Realizar un histograma a partir de la siguiente tabla de frecuencia: INTERVALOS 2.0-6.1 6.1-10.1 10.1-14.1 14.1-18.1 18.1-22.1 22.1-26.1 26.1-28,1 TOTAL SOLUCIN Al igual que en grfico de sectores y el grfico de columnas, seguiremos 2 pasos para la construccin del histograma. PASO 1: Representar las escalas en los ejes horizontal y vertical del primer cuadrante de un plano de cartesiano. En el eje vertical colocaremos las frecuencias y en el eje horizontal las marcas de clases. Para diferenciar este paso del anterior, trabajaremos con un ancho de columna nico, y dejaremos la mitad de ese espacio entre el vertical y la primera columna, y el final del eje horizontal y la ltima columna. F 12 15 21 24 21 12 8 92 Mc 4.1 8.1 12.1 16.1 20.1 24.1 28.1

48

PASO 2: A cada clase se representa con una columna cuya altura concuerda con su frecuencia expuesta en el eje vertical. Podemos decir que la marca de clase 4.1 es representada por una frecuencia 12: Las barras estarn pegadas una junto a la otra, es decir, ocupando el total del ancho de cada intervalo de clase dispuesto en el grfico. El grfico final quedara:
25 20 15 15 10 5 0
2,1 6,1 6,1 10,1 10,1 14,1

24 21 21

12

12 8

118,1 14,1

18,1 22,1

22,1 26,1

26,1 30,1

Ejemplo 2 Trazar el histograma de frecuentas correspondiente al siguiente conjunto de datos: INTERVALO 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80-84 f 1 0 3 6 6 6 7 4 4 1 1 1 n = 40 PUNTO MEDIO 27 32 37 42 47 52 57 62 67 72 77 82

7 6 5 4 3 2 1 0

49

OBSERVACIONES Si se unieran los puntos medios de las bases superiores de cada rectngulo del histograma, se obtendra el polgono de frecuencias trazado por los mismos datos. En un mismo sistema coordenado slo puede situarse un histograma, esto impide que pueda hacerse comparaciones y explicar diferencias como se hizo con el polgono de frecuencias. La altura de cada barra indica la frecuencia de cada intervalo.

CARACTERSTICAS DE LOS HISTOGRAMAS


No muestran frecuencias acumuladas. Se prefiere para el tratamiento de datos cuantitativos. La columna (o barra) con mayor altura representa la mayor frecuencia. Suelen utilizarse para representar tablas tipo B. La sumatoria de las alturas de las columnas equivalen al 100% de los datos.

Ejemplo 3 La siguiente tabla contiene informacin sobre el nmero de accidentes que ocurren diariamente, durante 50 das, en un enorme estacionamiento: 6-9-2-7-0-8-2-5-4-2-6-7-5-4-4-4-4-2-5-6-3-5-6-3-3-8-84-4-4-7-7-6-0-6-4-7-5-3-7-1-3-8-5-1-2-3-6-5-0 Utilizando intervalos obtendramos: Representando grficamente estas dos distribuciones tenemos: En el primer caso se trazan barras separadas (pueden ser verticales u horizontales)
16 16 14 12 10 8 6 4 2 0 0-1 02-mar 04-may 06-jul 08-sep 5 5 13 11

En el segundo caso se traza un histograma

16 14 12 10 8 6 4 2 0

50

Las distribuciones de datos nominales y jerarquizados se representan generalmente mediante diagramas de barras separadas, lo que significa que las categoras no se tocan. Ejemplo 4 Venta de gaseosas en un da
600

600 500 400 300 200


100

200

100 0 Manzana Limn Naranja

50

30

Fresa

Uva

CONSTRUCCIN DE HISTOGRAMAS EN EXCEL Excel no posee un mdulo independiente para la creacin de histogramas grficos. Con unos ajustes podremos adaptar un grfico de columna en algo muy parecido a un histograma, solo que no dejaremos espacios al inicio y fin. En una hoja nueva copiamos a partir de la celda B2, la tabla de frecuencia tipo B del ejemplo anterior y creamos un grfico de columnas como lo vimos en la seccin anterior: El grfico se vera como sigue: Ubicando el puntero del Mouse sobre una de las columnas, pulsamos el botn derecho y en el men flotante que aparece, se selecciona Formato de series de datos: En la ventana generada pulsaremos sobre la ficha opciones: Disminuimos la casilla Ancho de rango a cero para juntar las barras y pulsamos en el botn Aceptar:

51

EL POLGONO DE FRECUENCIAS Este grfico se utiliza para el caso de variables cuantitativas, tanto discretas como continuas, partiendo del diagrama de columnas, barras o histograma, segn el tipo de tabla de frecuencia manejada. Ejemplo El valor usado como la mejor estimacin para las puntuaciones que caen en un intervalo de clase se llama marca de clase o punto medio porque est localizado en la mitad del intervalo. MARCA DE CLASE Mc El punto medio de un intervalo se averigua sumando los lmites y dividiendo para dos. As:
30 + 34 = 32 2

El intervalo que tiene como lmites 30-34, tiene como punto medio Obsrvese que el punto medio ser entero si es que el ancho de clase del intervalo es impar y, ser decimal si es que i es par; de aqu la conveniencia de utilizar preferentemente valores impares como longitudes o anchos de clase (son frecuencias los valores 3, 5, 7 y tambin 10). Al construir el polgono de frecuencias se utiliza un sistema coordenado rectangular en el cual se llevan, sobre el eje de las X, los valores de los puntos medios de todos y cada uno de los intervalos de clase y, sobre el eje de las Y, los valores de las frecuencias correspondientes. Los puntos que resultan se unen mediante segmentos de recta, tenindose de esta manera una lnea poligonal, la misma que, para cerrarla se sienta sobre el eje X, utilizando medio intervalo anterior al primer intervalo de clase y medio intervalo posterior al ltimo. REGLA DE LOS TRES CUARTOS DE ALTURA. Para las representaciones grficas de las distribuciones de frecuencia el eje vertical debe hacerse de tal modo que la altura del punto mximo (resultado que est asociado con la frecuencia ms alta) sea aproximadamente igual a tres cuartos de la longitud de eje horizontal. 3 alto = (ancho ) 4 A continuacin se muestran los resultados obtenidos por un grupo de estudiantes de cuarto grado en una prueba de habilidad de lectura. Representar tales resultados mediante un polgono de frecuencias:

52

INTERVALO 14-16 17-19 20-22 23-25 26-28 29-31 32-34 35-37 38-40 41-43 44-46 47-49 50-52

f 2 4 6 9 11 22 35 24 12 8 5 3 2 n = 143

PUNTO MEDIO 15 18 21 24 27 30 33 36 39 42 45 48 51

Max. frec. 11 35 = 11 = 3 aprox.


Esto es, cada una de las 11 divisiones que deben hacerse sobre el eje Y, valdr 3f aproximadamente.
39 36 33 30 27 EL POLGONO DE FRECUENCIAS RELATIVAS S 24 A I C 21 N E 18 U C E 15 R F 12

9 6 3 0 12 15 18 21 24 27 30 33 36 39 42 45 48 51 54 PUNTOS MEDIOS

Con mucha frecuencia, los datos de las distribuciones que se desean comparar grficamente mediante polgonos de frecuencias difieren considerablemente entre s, a tal punto que se presentan serias dificultades en su representacin sobre un mismo eje coordenado; en tales casos, se suelen convertir las frecuencias absolutas en frecuencias relativas, generalmente expresadas como porcentajes. Trazar el polgono de frecuencias relativas correspondiente a los datos de la tabla.

53

PUNTUACIONES DE 376 ESTUDIANTES EN UN TEST DE HABILIDAD

INTERVALO 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64

f 4 15 23 42 58 64 58 46 32 20 12 2 n = 376

Mc 7 12 17 22 27 32 37 42 47 52 57 62

% 1.1 4.0 6.1 11.2 15.4 17.0 15.4 12.2 8.5 5.3 3.2 0.5 99.9 %

Para trazar el polgono de frecuencias relativas se lleva las puntuaciones en forma usual, esto es, los puntos medios de los intervalos sobre el eje X y, las frecuencias relativas (porcentajes) sobre ele eje Y, como se indica en el siguiente grfico
70 60 50 40 30 20 10 0

Trazar, en un mismo eje coordenado, los polgonos de frecuencias correspondientes a las puntuaciones de un test de inteligencia aplicado a los nios de dos escuelas diferentes:

54
PUNTUACIONES ESCUELA A ESCUELA B P1 P2

60-69 70-79 80-89 90-99 100-109 110-119 120-129 130-139 140-149 150-159

F1 1 4 18 32 69 31 12 8 4 1 n = 180

F2 5 5 10 10 50 180 170 40 20 10 n = 500

0.6 2.2 10.0 17.8 38.3 17.2 6.7 4.4 2.2 0.6 100 %

1 1 2 2 10 36 34 8 4 2 100 %

DISTRIBUCIN DE LAS PUNTUACIONES DE UN TEST DE INTELIGENCIA DE LOS NIOS DE DOS ESCUELAS


200 180 160 140 120 100 80 60 40 20 0

Caractersticas de los polgonos de frecuencias


No muestran frecuencias acumuladas. Se prefiere para el tratamiento de datos cuantitativos. El punto con mayor altura representa la mayor frecuencia. Suelen utilizarse para representar tablas tipo B. El rea bajo la curva representa el 100% de los datos. El polgono de frecuencia esta diseado para mantener la misma rea de las columnas. Analicemos una porcin de nuestro grfico para probar esta afirmacin:

Observe que cada lnea corta una porcin de la columna, pero a su vez, agrega una porcin adicional. Ambas porciones son iguales (triangulo rectngulos iguales), manteniendo el rea global en el grfico.
CONSTRUCCIN DE LOS POLGONOS DE FRECUENCIAS EN EXCEL A partir de la construccin de un histograma en Excel, procedemos a cambiar el tipo de grfico pulsando con el botn derecho del Mouse sobre el grfico y eligiendo la opcin tipo de grfico. Cambiemos el grfico a lneas y pulsemos el botn Aceptar. Cambiemos tambin el titulo de HISTOGRAMA por POLIGONO DE FRECUENCIA.

55

CURVA DE FRECUENCIAS ACUMULADAS Refirindonos a calificaciones de los alumnos, resulta frecuente tener que contestar preguntas tales como:

Cuntos alumnos tienen calificaciones iguales o menores que? Cuntos alumnos tienen calificaciones superiores a?

En tales casos conviene ordenar las calificaciones en una tabla de frecuencias acumuladas, segn se muestra en el siguiente ejemplo: Supongamos que 26 alumnos realizan un examen (sobre 10 puntos), obteniendo las siguientes calificaciones: CALIFICACIONES X 0 1 2 3 4 5 6 7 8 9 10 f 0 2 4 4 3 2 5 8 0 2 0 n = 26 Fa 0 2 6 10 13 15 20 24 24 26 26

La variable X presenta los valores posibles de las calificaciones de (0 a 10 puntos). La columna f indica el nmero de estudiantes que tienen una calificacin determinada (la calificacin correspondiente de la primera columna). La columna de Fa muestra el nmero de estudiantes que tienen una calificacin igual o menor que la calificacin correspondiente de la primera columna. Ejemplo 15 alumnos tienen una calificacin igual o menor que 5 puntos; igualmente podemos afirmar que 11 alumnos (el complemento de 15 a 26) tienen una calificacin superior a 5 puntos. Cuando los datos se han agrupado por intervalos de clase, la tabla de frecuencias acumuladas puede ser representada grficamente tomando como abscisa los lmites reales superiores de los intervalos de clase y como ordenadas longitudes proporcionales a las frecuencias acumuladas. La grfica de frecuencias acumuladas se llama ojiva OJIVA

56

Representar grficamente los siguientes valores: INTERVALOS 90-99 100-109 110-119 120-129 130-139 140-149 f 3 14 16 11 4 2 n = 50 Fa 3 17 33 44 48 50

Distribucin de las calificaciones


60 50 40 30 20 10 0 90-99 100-109 110-119 120-129 130-139 140-149

Esta ojiva indica el nmero de personas que registran una puntuacin igual o menor que un cierto valor. Ejemplo 48 alumnos obtuvieron un puntaje igual o inferior a 139.5 (observe el grfico anterior); igualmente, podemos afirmar que 2 alumnos (el complemento de 48 a 50) alcanzaron un puntaje superior a 139.5. CURVA DE FRECUENCIAS RELATIVAS ACUMULADAS La tabla de frecuencias relativas acumuladas correspondiente al ejercicio anterior es la siguiente: INTERVALOS 90-99 100-109 110-119 120-129 130-139 140-149 f 3 14 16 11 4 2 n = 50 Fa 3 17 33 44 48 50

Grficamente se representa de la siguiente manera los lmites reales superiores de cada intervalo de clase se sitan sobre el eje horizontal (eje x).

57

Los tantos por ciento se ubican siempre sobre el eje vertical (eje Y). Tales valores estarn comprendidos entre 0 y 100: Cada `punto del grfico acumulativo asocia a los intervalos reales superiores de cada intervalo el tanto por ciento acumulado correspondiente La lnea curva trazada por los puntos anteriores se prolonga un intervalo hasta alcanzar el eje X.

Las curvas correspondientes a las distribuciones acumulativas porcentuales tienen la forma de una S, razn por la cual se denominan curvas de la S LECTURA DE LOS CENTILES A PARTIR DE LA CURVA ACUMULATIVA DE FRECUENCIAS RELATIVAS LOS CENTILES, tambin conocidos como percentiles, son puntuaciones de la distribucin que dejan por debajo de si un determinado tanto por ciento de los datos. Ejemplo: El centil 88, es la puntuacin de la distribucin tal que el 88 % de los datos estn por debajo de l. Si la curva acumulativa de frecuencias relativas se ha trazado con cuidado sobre papel milimetrado, se puede leer en ella el valor de cada centil, con gran precisin. Con este fin, se traza una perpendicular al eje Y en el punto que corresponde (%) deseado, hasta cortar la curva. A partir de este punto, se traza la perpendicular al eje X. El pie de esta perpendicular seala el valor correspondiente al centil deseado. Ejemplo: Utilizando el grfico anterior, determinar los puntajes que corresponden a los centiles: 6, 35 y 66 C6 = 99.5 puntos C35 = 109.5 puntos C66 = 119.5 puntos

58

MEDIDAS DE TENDENCIA CENTRAL Las medidas que se utilizan para indicar un valor que tiende a ser el ms representativo del conjunto son: La media aritmtica La mediana; y, La moda. LA MEDIA ARITMTICA Equivale al clculo del promedio simple de un conjunto de datos. Para diferenciar datos mustrales de datos poblacionales, la media aritmtica se representa con un smbolo para cada uno de ellos: Si trabajamos con la poblacin, este indicador ser ; En el caso de que estemos trabajando con una muestra, el smbolo ser Media aritmtica ( o ): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el nmero total de datos. Solo es aplicable para el tratamiento de datos cuantitativos. Hay que entender que existen dos formas distintas de trabajar con los datos tanto poblacionales como mustrales: sin agruparlos o agrupndolos en tablas de frecuencias. Esta apreciacin nos sugiere dos formas de representar la media aritmtica. MEDIA ARITMTICA PARA DATOS NO AGRUPADOS Ejemplo El profesor de la materia de estadstica desea conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 3,2 3,1 2,4 4,0 3,5 3,0 3,5 3,8 4,2 4,0 Cul es el promedio de notas de los alumnos de la clase? SOLUCIN Aplicando la frmula para datos no agrupados tenemos: 2,4 3 3,1 3,2 3,5 3,5 3,8 4 4 4,2
SUMA 34,7

X=

X n 34,7 X= 10 X = 3,47

59

Cabe anotar que en el ejemplo estamos hablando de una poblacin correspondiente a todos los alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47. Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmtica. En este caso la media pasa de 3,47 a 3,15. Esta variacin notoria se debi a que la media aritmtica es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atpica comparada con las dems, que estn ubicadas entre 3,0 y 4,2. La media aritmtica de un conjunto de datos no agrupados se calcula sumando los valores del conjunto y dividiendo esta suma para el nmero de dichos datos. Utilizando la notacin sigma, la media aritmtica se expresa de la siguiente manera: X = media aritmtica = suma de X = los datos del conjunto n = el nmero total de datos del conjunto

X=

X n

Sin embargo, esta frmula sirve para obtener la media aritmtica de un pequeo conjunto de datos. Ejemplo 2 La media aritmtica de las calificaciones de estadstica 9, 8 y 10 es:
X = x n

9 + 8 + 10 3 27 X = 3 X =9 X =

Para un mayor nmero de datos, cuando uno o varios de tales datos se repiten ms de una vez, resulta ms prctico calcular la media aritmtica utilizando la siguiente frmula:
X = fX n

Ejemplo: Calcular la media aritmtica del siguiente conjunto de datos: 8 8 6 6 2 6 5 5 3 7 4 4 4 6 3 5 7 5 3 7 2 5 2 6 5 4 3 4

60

La siguiente tabla ilustra los clculos necesarios: X 2 3 4 5 6 7 8 f f.X 3 6 4 12 5 20 6 30 5 30 3 21 2 16 N = 28 fx = 135

fX n 135 X = 28 X = 4,82

X =

La frmula para calcular la media supone que cada uno de los datos es de igual importancia. En trminos generales, esto suele ser as, no obstante, hay excepciones: Ejemplo: Un profesor indica que recibir dos exmenes mensuales, cada uno equivaldr el 30% de la calificacin total; y, un examen final que corresponder al 40% restante. Si un alumno obtiene 80 en el primer examen, 90 en el segundo y 96 en el final, cul es su promedio? Examen 1er. 2do. 3ro. Calificacin X 80 90 96 Ponderacin W 30 30 40
W = 100

WX 2.400 2.700 3.840


WX = 8940

X =

WX W 8.940 X = 100 X = 89,40 puntos

MEDIA DE VARIAS MEDIAS A veces no se dispone de los datos originales de un conjunto de datos y, ms bien, se conocen las medias aritmticas de dos o ms grupos en los que se ha dividido dicho conjunto y, se desea hallar la media de todo el conjunto, como si se tratara de un solo grupo. Esto se puede calcular suponiendo que las medias de cada grupo son los datos de un nuevo conjunto y el nmero de elementos de cada grupo constituyen los pesos o ponderaciones con los cuales se obtiene una media ponderada, llamada en este caso media de varias medias.

61

Ejemplo: Se desea obtener la media aritmtica de las edades de los 50 alumnos de un curso determinado. Para realizar el trabajo en equipo, se divide el curso en tres grupos diferentes y se encomienda a tres compaeros del mismo curso obtener los datos y calcular la media aritmtica de cada grupo; luego se receptan los resultados y se realiza el clculo final, de la siguiente manera: Gru- Datos media Nmero de alumnos n.X po () (n) A 18,7 12 224,4 B 20,1 22 442,2 C 19,5 16 312,0 n = 50 nX = 978,6
nX n 978,6 x= 50 x = 19,57 aos x=

Esta medida, basada en las medias de cada grupo, recibe el nombre de media de medias y es equivalente a la media aritmtica calculada mediante la frmula, siempre que se conocieran todas y cada una de las edades de los alumnos integrantes del curso en referencia. PROPIEDADES DE LA MEDIA.- La media aritmtica presenta ciertas propiedades que la convierten en la medida de tendencia central que se utiliza con ms frecuencia: 1. La media es sensible a cada valor del conjunto de datos. As, si cambia algn valor del conjunto, le media de tal conjunto tambin cambiar. 2. Si se suma una constante a cada valor del conjunto de datos, la media aritmtica aumentar su valor en dicha constante. De manera que, si sumamos 10 a cada valor del conjunto, la media aumentar en 10. En forma similar, al restar a cada valor del conjunto de datos una constante, o bien, multiplicar o dividir cada valor por una constante, eso har que la media aritmtica disminuye en la misma cantidad o resulte multiplicada o dividida por dicha constante. 3. La suma de las desviaciones de los datos de un conjunto a partir de su media aritmtica, siempre es cero. Se entiende por desviacin (d) de cada uno de los datos de un conjunto desde la media aritmtica, la diferencia entre cada uno de los datos y la media:

d =X X

62

Por considerar que la propiedad anterior es muy importante, comprobar que se cumple para el siguiente conjunto de datos: 10, 12, 14, 15 y 17. X 10 12 14 15 17 68 As pues, la suma de las desviaciones es cero.

- 3.6 - 1.6 (- 5.2) 0.4 1.4 3.4 (5.2) d = 0

X =

x n 68 X = 5 X = 13.6

63

LA MEDIANA Es el punto que deja igual nmero de datos a cada lado de l, siempre que la distribucin est ordenada. Es decir que, cuando los datos estn desordenados, antes de calcular la mediana se debern ordenar de menor a mayor. En el clculo de la mediana se pueden presentar dos casos: 1. Cuando el nmero de datos es impar, la mediana es el valor que se encuentra en el centro de la serie ordenada de datos. La posicin de la mediana dentro de la serie ordenada puede hallarse mediante la frmula: n +1 2

Posicin = Ejemplo:

Los alumnos de 6to grado de una Escuela son 11 y han obtenido los siguientes puntajes en una prueba de Botnica: 14, 12, 10, 8, 18, 17, 8, 19, 19, 8 y 9 hallar la mediana de dichas calificaciones. Ordenando los puntajes: 8, 8, 8, 9, 10, 12, 14, 17, 18, 19, 19 Tomando en cuenta que los puntajes son 11, determinamos la posicin de la mediana:

n +1 2 11 + 1 Posicin = 2 Posicin = 6to. lugar Posicin =


El 6to lugar en la ordenacin lo ocupa el puntaje 12. As pues, la mediana de las calificaciones es 12. 2. Cuando el nmero de datos es par, la mediana es igual a la semisuma de los dos valores centrales de la serie ordenada. Ejemplo: Los alumnos de 5to grado de una escuela son 10 y han obtenido los siguientes puntajes en una prueba de Botnica: 12, 7, 10, 16, 18, 10, 16, 13, 18 y 19. Hallar la mediana de tales puntajes. Ordenando los puntajes: 7, 10, 10, 12, 13, 16, 16, 18, 18, 19 Tomando en cuenta que los puntajes son 10, determinamos la posicin de la mediana:

n +1 2 10 + 1 Posicin = 2 Posicin = 5,5 lugar Posicin =

64

Esto quiere decir que, la mediana es el valor medio entre el 5to y el 6to lugar de la distribucin ordenada. As pues: 13 + 16 Mediana = 2 Mediana = 14,5 LA MODA Es el valor que se repite con mayor frecuencia en una serie de datos. Ejemplo: La moda de las calificaciones de 6to. Grado, del ejercicio anterior es 8 puntos, pues, dicho valor se repite con ms frecuencia que los dems. Ejemplo: La moda de la serie de puntajes del 5to. Grado, del ejercicio anterior es 10 y 18 puntos, pues, dichos valores son los que se repiten con ms frecuencia que los otros. Nota.- As como existen series bimodales, existen otras que no tienen moda. MEDIDAS DE DISPERSIN Para describir en forma adecuada un conjunto de datos, a ms de obtener informacin respecto a la parte media del conjunto ordenado de nmeros, es conveniente tambin tener una medida que nos indique si los valores estn relativamente cercanos el uno del otro o si se encuentran dispersos. Estudiaremos cuatro medidas de dispersin: la amplitud total, La desviacin media, La varianza; y, La desviacin estndar.

Todas estas medidas, excepto la primera, toman a la media aritmtica como punto de referencia. En cada caso, un valor cero indica que no hay dispersin, en tanto que la dispersin es mayor a medida que se hace mayor el valor de cualquiera de las medidas de dispersin que hemos enunciado. LA AMPLITUD TOTAL La amplitud de variacin de un conjunto de nmeros es una medida sencilla de calcular. Se puede expresar en dos formas: a) Dando la diferencia entre los valores mayor y menor del conjunto de datos. b) Identificando los nmeros mayor y menor del conjunto.

65

Ejemplo: Hllese la amplitud de los siguientes conjuntos de nmeros; 1, 5, 7 y 13. 14, 3, 17, 73 y 8 Nmeros 1, 5, 7, 13 14, 3, 17, 73, 8 diferencia 12 70 del ms bajo al ms alto 1 a 13 3 a 73

Este ltimo mtodo tiende a ser ms informativo. As, saber slo que la amplitud de un conjunto de nmeros es 44, no dice nada ms respecto de los dems nmeros, sin embargo, si se informa que la amplitud de dichos nmeros es de 300 a 344, se proporciona mejor informacin acerca de la magnitud de los nmeros del conjunto. La principal limitacin de la amplitud es que considera solamente los valores extremos de un conjunto y no proporciona mayor informacin respecto de los dems valores intermedio del conjunto. LA DESVIACIN MEDIA Esta medida de variabilidad mide la desviacin promedia de los valores de un conjunto de nmeros con respecto a la media aritmtica del conjunto; es decir, se basa en las diferencias de cada uno de los datos del conjunto con relacin a la media . Se obtiene sumando los valores absolutos de las desviaciones y dividiendo para el total de casos:

Dm =
Ejemplo:

XX n

Hllese la desviacin media para el siguiente conjunto de nmeros. 2, 4, 6, 8, 10. Para mayor comodidad de los clculos, los datos se disponen de la siguiente manera:

X 2 4 6 8 10
x = 30
X X n

-4 -2 0 +2 +4

4 2 0 2 4

Dm = Dm =

X =

12 5 Dm = 2,4

X n 30 X = 5 X =6

66

Los pasos necesarios para calcular la Dm. son los siguientes: 1. Calcular la media de los datos. 2. Restar la media de cada valor del conjunto de datos, es decir, calcular las desviaciones. 3. Sumar los valores absolutos de las desviaciones. 4. Dividir esta suma entre el nmero de datos.

Para datos agrupados en una distribucin de frecuencia debe usarse la siguiente frmula:

Dm =
Ejemplo:

f X X n

Hllese la desviacin media del siguiente conjunto de calificaciones: 1, 1, 2, 2, 2, 2, 3, 3, 3, 3 4, 4, 4, 5, 5, 5, 5, 6, 6, 8 Para comodidad de los clculos, los datos se disponen mediante la siguiente distribucin: X 1 2 3 4 5 6 8 f 2 4 4 3 4 2 1 n = 20 f.X 2 8 12 12 20 12 8 f.x = 74

-2.7 -1.7 -0.7 +0.3 +1.3 +2.3 +4.3

5.4 6.8 2.8 0.9 5.2 4.6 4.3

Dm = Dm =

f X X n

30 20 Dm = 1,5
Ejercicio:

fX n 74 X = 20 X = 3,7 X =

Hllese la Dm. del mismo conjunto de calificaciones, sin necesidad de construir previamente la distribucin de frecuencias.

67

LA VARIANZA La varianza (S2) se define como la suma de los cuadrados de las desviaciones de cada uno de los datos con respecto a la media, dividido todo por el nmero total de datos. La varianza o variancia de un pequeo conjunto de datos se calcula casi de la misma forma que la Dm, con la diferencia de que las desviaciones se elevan al cuadrado antes de ser sumadas. Algebraicamente la varianza se expresa y se calcula mediante la siguiente frmula:
X X S = n
2

Ejemplo: Hllese la varianza del conjunto: 2, 4, 6, 8, 10. X 2 4 6 8 10

-4 -2 0 +2 +4

16 4 0 4 16

X=

x n 30 X= 5 X =6

X X S = n 40 S2 = 5 2 S =8
2

Los pasos necesarios para calcular la varianza son los siguientes: 1. Calcular la media de los datos. 2. Restar la media de cada valor del conjunto. 3. Elevar al cuadrado cada una de estas desviaciones. 4. Sumar los cuadrados de las desviaciones; y, 5. Dividir para n. Para datos presentados en una distribucin de frecuencias, la frmula de la varianza es la siguiente:

f X X S2 = n

)2

Obsrvese que la frmula es ms general que la anterior, porque la frecuencia de cada dato, en el caso de que ninguno se repite, es uno, f = 1. Por esta razn debemos considerar la f implcita cuando no se d.

68

Ejemplo: Hllese la varianza del siguiente conjunto de datos: 1, 2, 3, 3, 4, 4, 5, 5, 5, 5, 7, 7, 7, 8, 9 X 1 2 3 4 5 7 8 9 f 1 1 2 2 4 3 1 1 n =15 fX 1 2 6 8 20 21 8 9 fX = 75 -4 -3 -2 -1 0 2 3 4 16 9 4 1 0 4 9 16 16 9 8 2 0 12 9 16

f X X S2 = n 72 S2 = 15 2 S = 4,8
Ejercicio:

)2

X=

fX n 75 X= 15 X=5

Hllese la varianza del conjunto de datos anterior, sin agruparlos en una distribucin de frecuencias. Otra frmula que suele emplearse en el clculo de la varianza es:
S2 = X2 X n n 2

Esta frmula, algunas veces, es ms fcil de utilizar que la anterior, ya que no se requiere calcular cada una de las desviaciones. Ejemplo: Hllese la varianza del siguiente conjunto de nmeros: 2, 4, 6, 8, 10. X 2 4 6 8 10 X = 30 n=5 X2 4 16 36 64 100 X2 = 220

X n 30 X= 5 X=6 X=

69

Cuando los datos se han organizado en una tabla de frecuencias, la frmula para calcular la varianza es: fX 2 2 S2 = X n Ejemplo:

( )

Hllese la varianza del siguiente conjunto de datos: 1, 2, 3, 3, 4, 4, 5, 5, 5, 5, 7, 7, 7, 8. X 1 2 3 4 5 7 8 f 1 1 2 2 4 3 1 n = 14 f.x 1 2 6 8 20 21 8 66 f.x2 1 4 18 32 100 147 64 366

x n 66 X= 14 X = 4,71 X=

f.x 2 ( X) 2 n 366 S2 = (4,71)2 14 2 S = 26,14 22,18 S2 = S2 = 3,96 u 2

La varianza es una medida de dispersin en la que hallamos el promedio de las desviaciones al cuadrado. Esto significa que, por ejemplo, para el caso de las notas de los estudiantes, la unidad de varianza es puntos2. Para superar esta inconveniencia y disponer de una medida de dispersin para los puntajes, que se exprese en puntos, se halla la raz cuadrada de la varianza, llamada desviacin estndar o desviacin tpica. DESVIACIN ESTANDAR As, pues, la desviacin estndar es simplemente la raz cuadrada positiva de la varianza: Desviacin estndar =
S = S2

Ejemplo: Hllese la desviacin estndar del siguiente conjunto de datos: X 5 10 15 20 25 f 1 2 4 2 1 n = 10 f.X 5 20 60 40 25 150 f.X2 25 200 900 800 625 2.550

S2 S2 S2

f.x 2 = ( X) 2 n 2550 = (15)2 10 = 30 u 2

S = S2 S = 30 u 2 S = 5, 48 u

x X= n 150 X= 10 X = 15

70

71

MEDIDAS DE TENDENCIA CENTRAL En el anlisis de grandes conjuntos de datos, las medidas de tendencia central son las mismas que para los pequeos conjuntos de datos. 1. MEDIA ARITMETICA

Cuando los datos se presentan en tablas de frecuencias, los valores de las variables son desconocidos y han sido reemplazados por categoras de datos, los intervalos de clase, de los cuales el punto medio es el valor ms representativo de todos aquellos valores de la variable que caen dentro de dicho intervalo. Utilizando tales puntos medios (X) se halla una buena aproximacin en el clculo de la media de datos agrupados. La frmula para calcular dicha media es la misma que utilizamos para la media de una distribucin de frecuencia simple:
f.x: producto de cada punto medio por su frecuencia; n = nmero total de casos.

Ejemplo: Hllese la media de los datos consignados en la siguiente distribucin: CALIFICACIONES DE QUMICA INTERVALOS 30-39 40-49 50-59 60-69 70-79 80-89 90-99 FRECUENCIAS 4 6 8 12 9 7 4

CALIFICACIONES DE QUMICA
CALIFICACIONES INTERVALO FRECUENCIA f PUNTO MED. x fx fx

30-39 40-49 50-59 60-69 70-79 80-89 90-99 TOTAL

4 6 8 12 9 7 4 n = 50

34.5 44.5 54.5 64.5 74.5 84.5 94.5

138 267 436 774 670.5 591.5 378 fX = 3255

72

METODO BREVE PARA EL CLCULO DE LA MEDIA ARITMTICA


A= d= n= media supuesta (generalmente el punto medio del intervalo de clase de mayor frecuencia Desviacin de cada punto medio desde A n = (x A) nmero total de casos

Utilizamos la siguiente ecuacin:

Ejemplos: Hllese la media de los siguientes datos:


INTERVALO

30-39 40-49 50-59 60-69 70-79 80-89 90-99 TOTAL 2. MEDIANA

f 4 6 8 12 9 7 4 n = 50

x 34.5 44.5 54.5 64.5 74.5 84.5 94.5

d -30 -20 -10 0 10 20 30

f.d -120 -120 - 80 (-320) 0 90 140 120 (+350) fd = 30

Es el punto de distribucin debajo del cul queda el 50 % de los casos. Su valor se obtiene con la siguiente ecuacin.
Lmite real inferior del intervalo de clase en el cual se cumplen la mitad de los datos (n/2) (f)1 = Frecuencia acumulada que se encuentra inmediatamente por debajo de la mediana n = (x A) f= Frecuencia del intervalo de clase mediano i= Longitud del intervalo de clase. l1 =

Ejemplo: Hllese la mediana con los siguientes datos


INTERVALO

30-39 40-49 50-59 60-69 70-79 80-89 90-99 TOTAL

f 4 6 8 12 9 7 4 n = 50

Fa 4 10 18 30 39 46 50

73

Cuando el resultado de n/2 coincide con la Fa de uno de los intervalos de la distribucin, la mediana es igual al lmite real superior de dicho intervalo Ejemplo Hllese la mediana con los siguientes datos: INTERVALO 4-8 9-13 14-18 19-23 24-28 29-33 34-38 39-43 TOTAL Mdna = 23.5 MEDIDAS DE POSICIN 1. LOS CUARTILES Son los puntos que dividen a la distribucin en cuatro partes iguales. El primer cuartil.- (Q1) es el punto de la distribucin debajo del cual queda el 25 % de los datos El segundo cuartil.- (Q2) es la mediana El tercer cuartil.- (Q3) es el punto de la distribucin debajo del cual queda el 75 % de los datos Los cuarteles se calculan de la misma manera que la mediana, pero entonces, la formula de la mediana se modifica, reemplazando n/2 por n/4 y 3n/4, respectivamente
n ( f )1 4 i Q1 = l1 + f
3n ( f )1 4 i Q3 = l1 + f

f 1 2 6 4 8 3 0 2 n = 26

Fa 1 3 9 13 21 24 24 26

74

GUIA DE ESTUDIO 1. Leer detenidamente el documento gua 2. Subrayar las ideas principales 3. Desarrollar la presente gua ESTADSTICA DESCRIPTIVA 1. 2. 3. 4. 5. 6. 7. 8. 9. Defina lo qu es estadstica? De que se ocupa la estadstica descriptiva? De qu se ocupa la estadstica Inferencial? A qu llamamos poblacin? A qu llamamos muestra? Cules son las condiciones necesarias para determinar una muestra? Cite cuatro ejemplos de aplicacin de la estadstica descriptiva en su carrera? A que llamamos datos estadsticos? A qu llamamos caracteres?

10. A que llamamos variables? 11. Cite cuatro ejemplos de variables cuantitativas en educacin? 12. Cite cuatro ejemplos de variables cualitativas en educacin? 13. Para qu utilizamos la notacin sigma? 14. Con un ejemplo calcule la media aritmtica de un grupo pequeo de datos 15. Con un ejemplo calcule la media aritmtica de un grupo grande de datos 16. Con un ejemplo determine la mediana? 17. Con un ejemplo determine la desviacin media? 18. Con un ejemplo determine la varianza? 19. Con un ejemplo construya la distribucin de frecuencias? 20. Con un ejemplo determine la frecuencia acumulada? 21. Con un ejemplo determine la frecuencia relativa? 22. Con un ejemplo elabore un polgono de frecuencias e interprete? 23. Con un ejemplo elabore una curva de frecuencias acumuladas e interprete? 24. Con un ejemplo elabore un histograma e interprete? 25. Con grficos explique la diferencia entre un histograma y un grfico de barras 26. Con un ejemplo elabore un grafico de sectores circulares e interprete?
COMPILADOR: Dr. JORGE ARMIMJOS Mg. Sc COORDINADOR DE LA CARRERA DE FSICO-MATEMTATICAS