You are on page 1of 29

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

APUNTES DE ESTADSTICA DESCRIPTIVA


MC Ral Adalberto Morelos Centro de Estudios Superiores del Estado de Sonora Unidad Acadmica de San Luis Ro Colorado, Sonora Mxico.

Septiembre 2010
1

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

ndice Tema Unidad 1 Conceptos Bsicos Qu es la estadstica? ------------------------Datos estadsticos ----------------------------------------------------------Importancia Actual de la estadstica -----------------------------------Clases de estadstica ------------------------------------------------------Estadstica Descriptiva -----------------------------------------------------Estadstica Inferencial ------------------------------------------------------Definicin del concepto de estadstica ---------------------------------Ejercicio 1.1 -------------------------------------------------------------------Ejercicio 1.2 -------------------------------------------------------------------Unidad 2 Mtodos estadsticos ------------------------------------------------------Recopilacin de datos -----------------------------------------------------Organizacin de datos ----------------------------------------------------Organizacin de datos usando arreglos ------------------------------Organizacin de datos usando una distribucin de frecuencias -------------------------------------------------------------------Nmero de clases o intervalos ------------------------------------------Amplitud de clases ---------------------------------------------------------Tabla de frecuencias -------------------------------------------------------Datos fundamentales de una tabla de frecuencia ------------------Otros mtodos de presentacin de datos ----------------------------Partes principales de una tabla -----------------------------------------Grficas estadsticas -------------- ---------------------------------------- 21 Representacin grfica de una tabla de frecuencia ---------------Ejercicio 2.1 ------------------------------------------------------------------Medidas de tendencia central para datos NO agrupados --------Medidas de tendencia central para datos agrupados -------------Medidas de dispersin para datos No agrupados -----------------Medidas de dispersin para datos agrupados ----------------------Bibliografa --------------------------------------------------------------------Pgina 3 4 4 5 6 6 7 9 9 10 11 12 15 15 16 17 18 18 19 20 22 24 26 27 28 29 29

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

ESTADSTICA GENERAL.
CONCEPTOS BSICOS QUE ES LA ESTADSTICA? Con el fin de estudiar inteligentemente el tema de la estadstica debemos, en primer lugar, comprender lo que l termino significa en la actualidad as como conocer algo de su origen. Como en la mayora de los vocablos, la palabra estadstica tiene diversos significados para diferentes personas. Cuando la mayora de la gente escucha el trmino lo relaciona con cuadros o tablas llenas de cifras sobre nacimientos, muertes, matrimonios, divorcios, accidente de automviles, etc., que ofrecen, por ejemplo, en los almanaques anuales, y que indudablemente usan el trmino con toda correccin. A decir verdad, el trmino en cuestin fue inicialmente usado para tabular las funciones del Estado en lo que respecta a los datos necesarios para una planeacin idnea, reglamentaciones y recaudacin de impuestos. Los cobradores de impuestos y los encargados de hacer este tipo de anlisis eran llamados estadsticos por su dedicacin a compaginar datos e informes requeridos por el Estado. En la actualidad, desde luego, la palabra estadstica se aplica en este primer sentido para casi todo relacionado con los informes basados en hechos y consignados en base a nmeros, lo que comnmente se denomina: Hechos y cifras. Los anunciadores de radio y televisin nos informan que en unos cuantos minutos darn la estadstica del juego ...y los peridicos con frecuencia publican artculos a cerca de concursos de belleza en los cuales brindan las estadsticas de las concursantes. Sin embargo, el trmino tiene otros significados y la gente que no esta familiarizada con la materia los desconoce. La estadstica es una rama del conocimiento el campo de las matemticas aplicadas, que utiliza sus propios smbolos, trminos, contenido, teoremas y tcnicas. Cuando se estudia la estadstica normalmente se pretende dominar algunas de estas tcnicas. Para todos aquellos ya iniciados en los misterios de campo de las estadsticas, el vocablo tiene una segunda aceptacin; las estadsticas son cantidades que han sido calculadas con datos de muestreo: una sola cantidad as calculada se denomina estadstica. Por ejemplo, la media de la muestra es una estadstica, as como tambin lo son la mediana de la muestra y el modo. La varianza de la muestra es una estadstica, como tambin lo es la gama de la muestra. El coeficiente de correlacin de la muestra es asimismo una estadstica. La estadstica est desarrollada para tratar con datos numricos o informacin cuantitativa. La palabra "estadstica", por lo tanto ha sido ampliamente referida ya sea a la informacin cuantitativa misma como a los mtodos que tratan con la informacin. Los estadsticos prefieren llamar a la informacin cuantitativa Datos Estadsticos y a los mtodos que tratan con la informacin los Mtodos Estadsticos. Por ESTADSTICA debemos entender que son los mtodos por medio de los cuales podemos recolectar, organizar, presentar y analizar datos numricos de un conjunto de individuos permitindonos extraer conclusiones vlidas y efectuar decisiones lgicas basadas en dicho anlisis. Los DATOS son agrupaciones de cualquier nmero de observaciones relacionadas. Para que los datos sean tiles, las observaciones deben estar organizadas en tal forma que se puedan identificar tendencias y llegar a conclusiones lgicas.

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

DATOS ESTADSTICOS La informacin cuantitativa apropiada para el anlisis estadstico debe ser un conjunto (o conjuntos) de nmeros que muestren relaciones significativas. En otras palabras, los datos Estadsticos son nmeros que pueden ser comparados, analizados e interpretados. Un nmero aislado que no se compara o que no muestra relacin significativa con otro nmero no es dato estadstico. Por ejemplo: Las edades de 1000 estudiantes son datos estadsticos, puesto que las edades pueden ser comparadas y analizadas, y los resultados de los anlisis pueden ser interpretados. El rea de la cual los datos estadsticos son recopilados, se le conoce como poblacin o universo. Si deseamos tener las edades de 25 estudiantes en la clase de Biometra, podemos simplemente preguntar a cada estudiante su edad: as tenemos un conjunto completo de datos. Sin embargo recopilar tales datos de una poblacin finita pero grande es algunas veces imposible o imprctico. A fin de evitar la tarea imposible o imprctica, usualmente se extrae una muestra de elementos representativos de la poblacin. La muestra entonces, utilizada para el estudio estadstico y los resultados de la muestra son usados como las bases para describir, estimar o predecir las caractersticas de la poblacin. Podemos resumir los significados del trmino Estadstica como sigue: 1. La acepcin publica de cifras y hechos, grficas y mapas. El trmino en este sentido se usa en plural. 2. La materia propiamente dicha, con su terminologa, metodologa y conocimientos particulares. Bajo este concepto el trmino se usa en singular.
3.

Cantidades calculadas sobre datos de muestreo, en cuyo caso el trmino se usa en plural.

IMPORTANCIA ACTUAL DE LA ESTADSTICA La aplicacin de las tcnicas estadsticas se ha extendido tanto, y la influencia de la estadstica en nuestra vida es tan grande, que difcilmente podemos ponderarla lo bastante. Nuestra abundancia agrcola actual se puede explicar parcialmente gracias a la aplicacin de la estadstica a los planos y a los anlisis de los experimentos agrcolas. Este es un campo en el cual la tcnica estadstica se utiliz relativamente al principio. Algunas de las preguntas que los mtodos de la estadstica ayudan a contestar son: Qu clase de maz da los mejores rendimientos? Qu clase de mezcla alimenticia se debe dar a las gallinas para que obtengan el mayor peso? Qu clase de mezcla de semillas de pasto da mayor nmero de toneladas de forraje por hectrea? Todas estas preguntas y cientos mas nos afectan a todos en forma directa a travs del mercado domestico. La metodologa de la estadstica tambin se usa constantemente en la investigacin mdica y farmacutica. La eficacia de nuevos medicamentos se determina por medio de experimentos realizados primero en animales y, posteriormente, en seres humanos. Los adelantos de la investigacin mdicas y las nuevas drogas nos afectan casi a todos. La estadstica tambin es empleada por los gobiernos. La informacin econmica es objeto de estudio y afecta la poltica del gobierno en lo que respecta a los impuestos y a partidas asignables a obras pblicas (tales como caminos, presas, etc.), a fondos para la asistencia pblica, y otros. La estadstica
4

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

del desempleo influye incrementando los esfuerzos para disminuir el porcentaje correspondiente. Los mtodos estadsticos se aprovechan para evaluar el funcionamiento de todo tipo de equipo militar, desde las balas para las pistolas hasta enormes proyectiles dirigidos. La teora de las probabilidades y la estadstica (especialmente un nuevo campo llamado teora estadstica de la toma de decisiones) se usan como ayuda para tomar decisiones sumamente importantes en los altos niveles. En cuanto a la industria privada, el empleo de las estadsticas es casi tan importante en sus efectos como en el sector gubernamental. Se usa las tcnicas estadsticas para el control de calidad de los productos en proceso y para evaluar la aceptacin de los nuevos productos que se van a lanzar al mercado. La estadstica se emplea en el mercado, en las decisiones para la ampliacin de los negocios, en el anlisis de la eficacia de la publicidad, etc. Las compaas de seguros se basan en las estadsticas para fijar sus tarifas a un nivel realista. La lista sera interminable. La estadstica se emplea en la geologa, biologa, psicologa, sociologa; en todo sector en el que las decisiones deben de hacerse a base de los datos o informes incompletos. Se usan tambin en pruebas educacionales, para medidas de seguridad en la ingeniera. La meteorologa, la ciencia de la prediccin del tiempo, tambin esta usando la estadstica actualmente. An hay sectores aparentemente heterogneos que las emplean. Quin habra supuesto que las estadsticas ayudaran a un erudito o a un investigador histrico a determinar quien es el autor de obras en disputa? En este particular, creemos que el ejemplo mas conocido es el del empleo de las estadsticas para establecer la prolongada controversia sobre quien fue el autor de los ensayos literarios en los Federalist Papers. En planos menores, se han hecho estudios estadsticos sobre el efecto que la luna llena tiene la pesca de las truchas; sobre cual sera el tipo ms adecuado del vaso para el agua de los restaurantes; as como la estrategia ptima para juegos de destreza y azar, tales como el bridge, los solitarios, el veintiuno, el bisbol, etc. No cabe la menor duda de la importancia de los efectos de las tcnicas estadsticas en todo y en cada uno de nosotros. Los resultados de los estudios estadsticos se pueden ver, aunque quizs no se comprendan, al recibir nuestros sueldos, en los pagos de pensiones, del seguro social, los premios de las primas de seguros, en nuestra satisfaccin al consumir diversos productos y en nuestra propia salud. CLASES DE ESTADSTICA La estadstica normalmente se divide en dos grandes categoras: La estadstica DESCRIPTIVA y la estadstica INFERENCIAL. Como complemento a las breves consideraciones de los elementos bsicos de la probabilidad, hay dos clases de estadsticas tratadas en este libro. El nombre que naturalmente mas se ajusta a este tipo de estadstica es el de estadstica descriptiva. La clasificacin de datos; el trazo de los histogramas que corresponden a las distribuciones a una poblacin; la representacin de los datos por medio de otras clases de grficas, tales como las lineales, las grficas en barras, los pictogramas; l cmputo de medidas muestrales, medianas y modos; l cmputo de varianzas, las medidas de las desviaciones absolutas y de la gama; todas estas operaciones se refieren a la estadstica descriptiva. La labor estadstica ejecutada en el siglo XIX y principios de este siglo, fue en su mayor parte la estadstica descriptiva.

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

ESTADSTICA DESCRIPTIVA Significado de Estadstica La palabra Estadstica ha sido frecuentemente referida a la informacin cuantitativa o numrica. Tambin ha sido referida ampliamente a los mtodos que se tratan con la informacin. Sin embargo esto debera aclararse y llamar a la informacin, datos estadsticos y a los mtodos, mtodos estadsticos. La estadstica descriptiva es la parte de la estadstica que agrupa las tcnicas apropiadas para la organizacin, representacin y descripcin de un conjunto de datos con el propsito de resaltar sus rasgos ms importantes y extraer la informacin esencial que contiene. En nuestros trminos, diremos que la estadstica descriptiva permite tener una visin a vuelo de pjaro de la variable que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio mas fino de la misma para la toma de alguna decisin. En pocas palabras, la Estadstica Descriptiva permite tener una visin a vuelo de pjaro, de la variable que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio ms fino de la misma, para la toma de alguna decisin. Ejemplo 1.1 : Supngase que un profesor que calcula un promedio para una clase de Historia. Como l est usando estadstica para describir el comportamiento de esa clase y no para hacer una generalizacin acerca de varias clases, se puede decir que l est usando estadstica descriptiva. Los grficos, las tablas y mapas que muestren datos en tal forma que sean ms fciles de entender son ejemplos de estadstica descriptiva. ESTADSTICA INFERENCIAL Y su significado La segunda parte importante de la estadstica se refiere a la Estadstica Inferencial. Antes definimos a la estadstica como la ciencia para tomar decisiones ante alguna incertidumbre; esto es, llegar a la mejor resolucin sobre bases de una informacin incompleta. Con el fin de llegar a una decisin sobre una poblacin, se toma una muestra (generalmente de unos cuantos de los miembros) de esa poblacin. Dicha seleccin se hace, generalmente, al azar, a pesar de que existen varios medios de muestreo. En este libro nos circunscribimos al uso del muestreo al azar. Por lo que dicho trmino implica, se puede apreciar que se trata de un mtodo de muestreo en los que los elementos que lo integran son seleccionados bajo un proceso que no esta bajo el control del investigador. Se conocen varias definiciones de matemticas del muestreo del azar, pero nosotros lo aceptaremos como un muestreo en el que cada elemento escogido de la poblacin tiene la misma oportunidad de ser seleccionado, y en el que la seleccin de cualquier elemento no afecta que se pueda seleccionar cualquier otro. Sobre la base de un muestreo al azar, inferimos ciertos datos acerca de la poblacin. La inferencia que hacemos acerca de la poblacin sobre bases de este tipo de muestreo se conoce como inferencia estadstica. En otras palabras, la inferencia estadstica es el empleo de la tcnica de muestreo para llegar a determinadas conclusiones acerca de la poblacin de la cual se han obtenido las muestras. De manera general, la Estadstica Inferencial es: la Estadstica mediante la cual se obtienen generalizaciones o se toman decisiones en base a una informacin parcial o incompleta obtenida mediante tcnicas descriptivas. Los datos se analizan de una manera ms detallada, se interpretan y se infieren.

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

Si una muestra es representativa de una poblacin, se puede deducir importantes conclusiones acerca de sta, a partir del anlisis e interpretacin de la misma. Ejemplo 1.2: Supngase ahora que el profesor de Historia decide usar las notas promedios en una de la clase de Historia para estimar la nota promedio obtenida en los diez grupos del mismo curso de Historia. El proceso para estimar esta nota ser un problema de inferencia estadstica. Obviamente, cualquier conclusin que realice el profesor acerca de los diez grupos del curso estar basada en una generalizacin que va ms all de los datos originalmente obtenidos en el curso de Historia. La generalizacin del profesor puede no ser completamente vlida y l debe establecer cuanto tiene de cierto. Al efectuar una investigacin o experimento, es necesario definir qu datos se pretenden obtener de la POBLACIN en estudio. Para ello debemos definir los siguientes conceptos: POBLACIN: Es una agrupacin de todos los elementos que se estn estudiando y de los cuales se est tratando de obtener conclusiones. Se debe definir esta poblacin para precisar si un elemento que pertenece a la poblacin. POBLACIN FINITA: Cuando una poblacin consta de un nmero limitado (finito) de elementos. Por ejemplo, si se desea obtener informacin acerca de la capacidad didctica de los 40 profesores de una universidad, se obtendrn datos de una poblacin finita. POBLACIN INFINITA: Cuando una poblacin consta de un nmero ilimitado de elementos. Por ejemplo, la poblacin formada por todos los posibles sucesos (cara, sol) en tiradas sucesivas de una moneda es infinita, puesto que hipotticamente la moneda puede lanzarse un nmero infinito de veces. MUESTRA: Una muestra es una agrupacin de algunos elementos de la poblacin, pero no todos. La mayora de las veces no es posible o prctico observar todos los elementos de la poblacin, en todo caso se toma solo una parte de ella. PARMETRO: Cuando una medida se calcula a partir de los datos de una poblacin. ESTADSTICO: Cuando una medida se calcula a partir de los datos de una muestra. MEDIDA Media aritmtica (Promedio) Desviacin Estndar Nmero de datos o elementos VARIABLE: ESTADSTICO (MUESTRA)
x

PARAMETR0 (POBLACIN )

S n

Es una caracterstica que toma valores diferentes en personas, lugares y cosas diferentes. Son variables cuyos valores son el resultados de factores fortuitos.

VARIABLE ALEATORIA:

VARIABLE ALEATORIA DISCRETA: Se caracteriza por saltos o interrupciones en los valores que esta puede obtener (estos valores se asocian a cualquier valor entero). Ejemplos 1.3: El nmero de automviles vendidos en un mes. El nmero de clientes esperando servicio en la caja de un supermercado. El nmero de tubos electrnicos de T.V. producidos en una hora determinada.
7

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

VARIABLE ALEATORIA CONTINUA: Es aquella que puede tomar cualquier valor de entre todos los contenidos en un intervalo de recta. Ejemplo 1.4:

La cantidad de energa elctrica producida en una planta hidroelctrica en un da. El tiempo necesario para completar el ensamblaje de un artculo en una planta. La cantidad de petrleo bombeado cada hora en un pozo.

La estadstica est desempeando un importante papel ascendente en casi todas las facetas del progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su influencia se extiende a la agricultura, biologa, negocios, qumica, comunicaciones, economa, educacin, electrnica, medicina, fsica, ciencias polticas, psicologa, sociologa, y otros campos de la ciencia. Este desarrollo de la estadstica est ligada a los mtodos cientficos en la toma, organizacin, presentacin y anlisis de los datos, tanto para la deduccin de conclusiones como para tomar decisiones razonables de acuerdo con tales anlisis. No cabe la menor duda de la importancia de los efectos de las tcnicas estadsticas en todos y cada uno de nosotros. Los resultados estadsticos se pueden ver, aunque quizs no se comprendan, al recibir nuestro salario, en los pagos de pensiones, los premios de las primas de seguro, en nuestra satisfaccin al consumir diversos productos y en nuestra propia salud.

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

EJERCICIOS 1.1: ESTADSTICA GENERAL. 1) Identifique las variables aleatorias siguientes como discretas o continuas. a) b) c) d) e) f) g) El nmero de transistores defectuosos en un embarque de 10,000 transistores. El nmero de robos ocurridos en un almacn en un perodo de tiempo. La cantidad de gasolina consumida por un vehculo en una prueba de 100 km. Las ventas brutas de un supermercado en un da determinado. El nmero de plizas vendidas en una determinada semana por un agente de seguros. La demanda diaria de energa elctrica en una determinada ciudad. La duracin de una bombilla elctrica observada en un experimento.

EJERCICIOS 1.2: ESTADSTICA DESCRIPTIVA E INFERENCIAL Identifique, en dnde se est utilizando la estadstica descriptiva y dnde la inferencial. 1.En una prueba de aptitudes, tres trabajadores recibieron calificaciones de 90, 85 y 80. Tres trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes declaraciones realizadas con base en estas calificaciones identifquense aquellas que se derivan de mtodos descriptivos y aquellos que se derivan de inferencia estadstica. La calificacin promedio de los tres trabajadores es 85, y la calificacin promedio de las tres trabajadoras es 89. La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los trabajadores. En las siguientes pruebas de aptitudes, probablemente los trabajadores reciben calificaciones mas bajas que las trabajadoras. Tres bombillas de marca A dejaron de funcionar despus de 1100, 900 y 1000 hrs. de uso continuo. Cuatro bombillas de la marca B dejaron de funcionar despus de 1050, 960, 1070 y 840 hrs. de uso continuo. Se llega a las siguientes conclusiones, Cules de ellas provienen de la estadstica descriptiva y cules de la inferencial? La duracin promedio de las tres bombillas marca A es de 1000 hrs mientras que la duracin promedio de las cuatro bombillas marca B es de 980 hrs. La duracin promedio de todas las bombillas marca A es mayor que todas las bombillas de la marca B. La diferencia entre los dos promedio es de 20. La diferencia entre los dos promedio es demasiado pequea para llegar a la conclusin de que las bombillas marca A son mejores que la marca B. Si se selecciona y prueba otra bombilla de marca A, probablemente durar ms que el promedio de las bombillas marca B. Usted decide comprar bombillas marca A en vez de bombillas marca B.

a) b) c) 2.-

a) b) c) d) e) f)

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

Unidad 2:

DESCRIPCIN DE LOS DATOS.

Cuando los datos estn organizados en una forma compactada y fcil de utilizar, se puede obtener informacin del medio digna de confianza y utilizarla para decisiones inteligentes MTODOS ESTADSTICOS En un estudio estadstico los mtodos estadsticos son divididos en cinco pasos bsicos. a) Recopilacin. d) Anlisis. b) Organizacin. e) Interpretacin. c) Presentacin. Estrictamente hablando, no hay lnea de divisin definitiva que separe los cinco pasos bsicos. Algunos de los mtodos pueden ser usados en ms de un paso. a) RECOPILACIN DE DATOS De acuerdo a la localizacin de la informacin los datos estadsticos pueden se clasificados en datos Internos y datos Externos. DATOS INTERNOS: Es cuando la informacin cuantitativa es obtenida dentro de la organizacin que hace el estudio estadstico; Tal como los sueldos de empleados de una lista de pagos, recibos de caja de la oficina de contabilidad de la organizacin. DATOS EXTERNOS: Es cuando la informacin es obtenida fuera de la organizacin. Los datos externos son usualmente obtenidos de dos maneras: - Datos publicados: (revistas, peridicos, instituciones de investigacin, universidades, publicaciones editadas por gobierno federal, editores privados, etc...)

- Encuestas de datos originales (encuestas, entrevistas, etc..) 1).- Obtencin de datos publicados. Los datos publicados pueden ser obtenidos fcilmente si las fuentes de datos son conocidas por el lector. En relacin con esto, es importante conocer las clases de fuentes de datos y las fuentes de datos publicados. 1.1) FUENTE PRIMARIA Y SECUNDARIA Las fuentes de datos publicados pueden ser clasificadas en dos clases primarias y secundarias. Una fuente de datos se denomina primaria cuando los datos obtenido de la publicacin EDITADA por el recopilador original de los datos. La fuente llamada secundaria cuando los datos son obtenidos de una reimpresin, la cual es publicada por una organizacin distinta del recopilador original. FUENTES DE DATOS PUBLICADOS Los siguientes siete grupos son las fuentes ms importantes de datos publicados con relacin a las actividades de los negocios y econmicos, aunque de ninguna manera puede considerarse como una lista completa de fuentes.
10

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

a).- Agencias gubernamentales b).- Asociaciones empresariales c).- Revistas y publicaciones peridicas de empresas d).- Peridicos y almanaques e).- Organizaciones privadas de servicio de estadstica f).- Organizaciones internacionales g).- Otras organizaciones de negocios y educativas ELABORACIN DE UNA ENCUESTA El trabajo de elaborar una encuesta esta usualmente limitado por los factores del tiempo, dinero y mano de obra disponible para el estudio. En vez de recopilar informacin completa relacionada con el estudio, una muestra consistente de un grupo de elementos representativos es ordinariamente sacada de la fuente de informacin (poblacin) en una encuesta. Los mtodos ms comunes de recopilacin de datos a travs de muestras son: Observacin Directa y Formulacin de Preguntas. OBSERVACIN DIRECTA El mtodo de observacin directa puede dar informacin exacta y es usualmente preferida, ya que puede ser empleado efectiva y econmicamente. Sin embargo, est limitado a unos pocos tipos de estudio y es a menudo demasiado inconveniente en observaciones reales de ciertas operaciones. Ejemplos: a).- Si un investigador desea conocer los precios de menudeo de los alimentos de una ciudad puede ir a un grupo seleccionado de tiendas para observar los precios marcados en los mismos. b).- Si deseamos conocer el ingreso recibido en una semana por un grupo de taxistas sera muy inconveniente observarlos a ellos. Sera ms prctico y fcil obtener los resultados hacindoles ciertas preguntas. FORMULACIN DE PREGUNTAS Hay 3 formas de hacer preguntas a fn, de recopilar datos originales. a).- Entrevistas personales b).- Por telfono c).- Cuestionario por correo Al disear un cuestionario debemos de tener presente los siguientes puntos: 1).- El nmero de preguntas deber ser conservado en un mnimo 2).- Las preguntas debern ser breves y claras 3).- Preguntas ofensivas debern ser evitadas 4).- Preguntas que induzcan a una respuesta no debern ser usadas 5).- Las preguntas debern ser fciles de contestar 6).- Las preguntas debern requerir contestaciones simples.

11

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

Reglas de Redaccin y contenido de las Preguntas: 1.- Facilitar la memoria: No debe preguntarse sobre hechos ocurridos hace mucho tiempo; las preguntas deben limitarse al pasado inmediato (un mes mximo) 2.- No deben usarse ms palabras de las que sean necesarias (mximo 20 por pregunta). 3.- Las palabras empleadas deben ser simples, fciles de pronunciar y de ser posible de uso comn. 4.- Deben evitarse al mximo emplear trminos comerciales o de negocios y palabras cargadas o insinuantes. Ej. Verdad que la Compaa X es la mejor de su ramo? 5.- Asimismo al elaborar la pregunta debe tenerse cuidado en no dar la respuesta. Ej. Asiste usted al cine por lo menos una vez a la semana? 6.- No debe forzarse a la persona a que realice clculos, complicados porque sta, tender a cansar rpidamente al entrevistado. Ej. Cuntos Kgrs. de azcar se consumen en su hogar? 7.- Cuando se tenga que realizar una pregunta que por su naturaleza sea embarazosa o difcil de contestar, es necesario planear cuidadosamente su redaccin, para evitar una gran cantidad de contestaciones falsas. Ej. Cada cuntos das se baa usted? 8.- Al realizar preguntas referidas a tiempos es necesario fijar intervalos adecuados a las posibles contestaciones y la pregunta debe referirse de preferencia a una fecha concreta. Ej. Cundo fue la ltima vez que asisti usted al cine? 9.- Cuando tratan de medirse aspectos relacionados con la calidad de un producto, o bien su sabor, su aroma, su aspecto y otras caractersticas similares, es recomendable el uso de respuestas preformuladas, utilizando escalas de conceptos o de valores o una combinacin de ambas. Ej. Excelente Muy Bueno Bueno Regular Malo Muy Malo Psimo 3 2 1 0 -1 -2 -3

10.- Evitar motivos emocionales o estereotipados, ciertos nombres, expresiones o hechos que son susceptibles de provocar reacciones de tipo Psicolgico positivo o negativos y alterar la respuesta. Ej. El Presidente de la Repblica mencion en su discurso. Usted qu Opina? En este caso el presidente eclipsa el asunto que se discuta.
12

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

11.- Por ltimo es conveniente destacar los siguientes puntos que influyen en forma determinante en la redaccin de un buen cuestionario: No abrumar con palabras altisonantes. Construir las preguntas gramaticalmente breves No usar vulgarismos No someter a negativas dobles. Evitar dobles significados. Evitar preguntas capciosas. Mencionar lo que antecede, siempre que exista la posibilidad de olvido o confusin.

Elementos del Cuestionario. Reporte: Es una breve introduccin al tema, objetivo de la encuesta se usa para crear confianza y cooperacin en el encuestado. Consigna: Es la indicacin de como contesta a determinada pregunta, debe ser muy explcita disearse y haber un nmero mximo e igual de las preguntas. Por ej. Ponga una cruz en la respuesta que crea, enumere del 1 al 4 etc. Pregunta introductoria: Deben ser fciles de contestar, estn antes del tema principal y sirven para introducirlo. Preguntas Bsicas: Es el elemento clave del cuestionario aquel estn traducida las observaciones de la investigacin y deben ser lo suficientemente extensas para que cubra los mismos. Escala de Sinceridad: Son trampas que se le ponen al encuestado para ver si este dice la verdad, como cuando en el cuestionario se repiten las preguntas y, si estas son cortas deben redactarse de diferente manera la misma pregunta. Pregunta de Clasificacin: Tara de la informacin sobre el individuo, edad sexo domicilio, no. de hijos, nacionalidad etc., son preguntas de identificacin al final del cuestionario por que podran influir en la respuesta si fueran al principio. ORGANIZACIN DE DATOS ESTADSTICOS Dentro de una organizacin de datos estadsticos debemos tomar en cuenta: 1).- Crtica y correccin de datos recopilados. Un corrector puede encontrar una o varias de las siguientes cosas que deberan ser corregidas y tratadas. a).- Las respuestas son inconsistentes b).- La escritura no es determinable c).- Las respuestas son incompletas d).- Se necesitan clculos 2).- Clasificacin de datos corregidos. Hay muchas formas de clasificar datos estadsticos en general las clasificaciones pueden ser determinadas de acuerdo a 4 bases: Tiempo, lugar, cantidad y cualidad.
13

al

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

CUALITATIVA.- En esta clasificacin la distincin es mas bien de clases que de cantidad. Por ejemplo, cuando los empleados se clasifican en sindicalizados y no sindicalizados, tenemos una diferencia cualitativa. Los agricultores pueden clasificarse en propietario, parcialmente propietarios, administradores y arrendatarios. En hule puede clasificarse en cultivo o silvestre, de acuerdo con su origen. CUANTITATIVA.- Cuando los valores se modifican con respecto a una caracterstica mensurable, conviene una clasificacin cuantitativa. Por ejemplo, las familias pueden clasificarse de acuerdo con l numero de hijos, las empresas industriales, segn l nmero de obreros empleados y tambin desacuerdo con el valor de los artculos producidos. La mayora de las distribuciones cuantitativas son distribuciones de frecuencia, que son la forma bsica de organizacin de los datos para sus anlisis estadsticos. Los datos clasificados cualitativamente a veces pueden clasificarse de nuevo sobre bases cuantitativas, mediante cambios muy ligeros. CRONOLGICA.- Los datos cronolgicos o las series cronolgicas contienen cifras relativas a un fenmeno determinados en diversos periodos de tiempo especificados. Por ejemplo, se puede mostrar la cotizacin diaria de cierre de ciertas acciones durante un periodo de meses o aos, puede registrarse el coeficiente anual de natalidad de varios aos, puede indicarse la produccin mensual de carbn durante un lapso dado de aos. Las series cronolgicas tiene un cierto modo algn parentesco con las distribuciones cuantitativas, por el hecho de que cada ao o mes sucesivo de una serie esta un ao o un mes alejado del punto de referencia anterior. Sin embargo, los periodos de tiempo o ms bien los acontecimientos, que ocurren dentro de estos periodos difieren cualitativamente entre s. Ocasionalmente una serie cronolgica puede convertirse en una distribucin de frecuencias. GEOGRFICA.- La distribucin geogrfica es esencialmente un tipo de distribucin cualitativa, pero en general se considera como una clasificacin especial. Por ejemplo, cuando se muestra la poblacin de cada unos de los estados, tenemos datos clasificados geogrficamente. Aun cuando existe una diferencia cualitativa entre dos estados cualesquiera, la distincin que se establece no es de clase sino de situacin. A veces es posible esperar una distribucin geogrfica en forma de distribucin de frecuencias. 3).- Tabulacin de datos clasificados. Despus de que se han decidido las clasificaciones adecuadas o deseadas el siguiente paso en la organizacin de los datos es arreglar la masa de hechos cuantitativos en una forma resumida basadas en las clasificaciones. Este proceso se llama tabulacin son: 1).- Tarjetas de escritura manual 2).- Hojas de registro 3).- Tarjetas de perforacin manual 4).- Tarjetas perforadas 5).- Procesamiento electrnico de datos

14

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

ORGANIZACIN DE LOS DATOS USANDO EL ARREGLO. El ARREGLO de datos es una de las formas ms simples de organizar la informacin, se organizan del valor menor al mayor (en orden ascendente), o del mayor al menor (en orden descendente). Los arreglos de datos ofrecen varias ventajas sobre los datos en bruto. - Rpidamente se pueden apreciar los valores menor y mayor en los datos. - Fcilmente se puede dividir los datos en secciones. - Se puede ver si algn valor aparece ms de una vez en el arreglo. - Se puede observar la distancia entre valores sucesivos de datos. A pesar de stas ventajas, algunas veces el arreglo de datos no es de mucha utilidad. Cuando sea necesario mostrar una gran cantidad de ellos, esto se tornar engorroso, porque se debe hacer la lista de todas las observaciones. Para estos casos se necesita condensar la informacin y estar en capacidad de usarla para tomar decisiones e interpretarla. ORGANIZACIN DE LOS DATOS USANDO DISTRIBUCIN DE FRECUENCIAS Una manera de simplificar los datos es usar una tabla de frecuencia o distribucin de frecuencia. Como se ver, la organizacin de los datos en una tabla de frecuencia muestra el comportamiento de la distribucin de manera ms significativa. La organizacin de los datos generalmente implica el arreglo de las observaciones en CLASES o INTERVALOS. Al arreglo de los datos para expresar la frecuencia de ocurrencia de las observaciones en cada una de estas clases se conoce como DISTRIBUCIN DE FRECUENCIA. La construccin de una tabla de frecuencia se realiza de una serie de datos, los cuales primeramente son recopilados y posteriormente organizados. La primera forma de organizarlos es dndoles un orden ascendente o descendente. Los datos constituidos de esta manera estn en un ARREGLO. Este arreglo puede ser construido mediante el uso de marcas, y el nmero de veces que un valor est repetido se le llama FRECUENCIA. Ejemplo 2.1: Calificacin final de Estadstica de 80 Estudiantes de la carrera de LSCA. = RECOPILACION = 68, 84, 75, 82, 68, 90, 62, 88.3, 76, 93, 73, 79, 88, 73, 60, 93, 72, 53, 85, 75 53, 65.5, 75, 87, 74, 62, 95, 78, 62, 72, 66, 78, 82, 75, 94, 77, 69, 74, 68, 60 96, 78, 89, 60, 75, 95, 60, 79, 83, 72.6, 79, 60, 67, 97, 78, 85, 76, 65, 71, 75 65, 80, 73, 53, 88, 78, 63, 76, 53, 74, 86, 67, 73, 81, 72, 63, 76, 75, 85, 77.8 = ORGANIZACION = 53, 53, 53, 53, 60, 60, 60, 60, 60, 62, 62, 62, 63, 63, 65, 65, 65.5, 66, 67, 67 68, 68, 68, 69, 72, 72, 72, 72, 72, 72.6, 73, 73, 73, 74, 74, 74, 75, 75, 75, 75 75, 75, 75, 76, 76, 76, 76, 77, 77.8, 78, 78, 78, 78, 78, 79, 79, 79, 80, 81, 82 82, 83, 84, 85, 85, 85, 86, 87, 88, 88, 88.3, 89, 90, 93, 93, 94, 95, 95, 96, 97

15

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

TABLA DE FRECUENCIAS, ARREGO DE FRECUENCIAS Valor Marca Frecuencia (f) 53 llll 4 60 llll 5 62 lll 3 63 ll 2 ... ... ... En la tabla la segunda columna es slo auxiliar. En la tercera se presenta la Frecuencia de cada dato posible (fi = al nmero de veces que ocurre la i-sima observacin posible). La informacin contenida en la tabla puede ser representada grficamente en varias formas: grfica de barras, de lneas, por sectores, etc. El inconveniente de graficar cada dato contenido en la grfica anterior, es que si el nmero de datos diferentes es muy grande, se diluye la informacin. Imagnese un grfico de 25 o 50 barras. Este inconveniente es superado, al utilizar otras tcnicas apropiadas para el tratamiento de datos provenientes de una variable continua. En el ejempo 2.1 encontramos 80 valores diferentes, distribudos entre el dato menor (Dm) = 53 y el dato mayor (DM) = 97, como puede verse en la ordenacin (organizacin). Para el tratamiento adecuado, procedemos a agrupar los datos por intervalos de clase de igual longitud, para lo cual necesitaremos saber o calcular el nmero de intervalos que tendr nuestra tabla. NUMERO DE CLASES INTERVALOS (k) No hay un criterio establecido para el nmero de agrupacin de datos (intervalo de clase) a utilizar. El primer paso para construir una tabla de frecuencia consiste en decidir cuantas CLASES o INTERVALOS DE CLASE se van a utilizar. El nmero de clases depende del nmero de datos y del rango de los mismos y de la informacin que el investigador desea obtener. Entre mayor sea el nmero de datos, o ms amplio el rango de los datos, mayor nmero de clases se necesitar para dividirlos. Por supuesto, si se tiene slo 10 datos, deja de tener sentido el hacer 10 clases. Como una norma, los estadsticos usan entre 5 y 20 clases. Menos de 5 clases pueden concentrar la informacin y ms de 20 clases pueden dispersar la informacin. Hay muchos libros de texto que recomiendan un snnumero de formas para determinar el nmero adecuado de intervalos. Para nosotros debe ser claro que a mayor nmero de datos resulta adecuado un mayor nmero de intervalos de clase, por lo que utilizaremos un criterio preciso, (aunque personal), basado en la Regla de Sturges, que consiste en elegir k como el entero impar ms cercano a:
k = 1 + 3.3 Log ( N )

k = Nmero de clases. N = Nmero de datos.

Podemos agregar que la experiencia y el uso a que est destinado el agrupamiento, son criterios determinantes en algunos casos. La recomendacin de elegir un nmero impar de intervalos es con el fin de mantener la posible simetra de una distribucin de datos.

16

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

Ejemplo 2.2: Para el problema de los 80 estudiantes de estadstica Ejemplo 2.1. k = 1 + 3.3 Log (80) = 7.28 7 CLASES (Entero impar ms cercano), entonces: k=7 AMPLITUD DE CLASES. Debido a que se necesita tener los intervalos de clase de igual tamao, el nmero de clases determinar la amplitud ( i ) de cada clase. Para encontrar la amplitud de cada intervalo de clase se utilizan las siguientes ecuaciones: Rango (R) = DM - Dm = Dato mayor - Dato menor

i=

R Dato Mayor Dato Menor = k Numero Intervalos

Para el ejemplo 2.1 tendremos: R = 97 - 53 = 44 i = 44/ 7 = 6.2857 ~= 6.3 (para datos continuos) i = 7 (para datos discretos)

Si observamos el ejemplo anterior, podemos tomar a 6.2857 pero, resultara engorroso el trabajar con cuatro dgitos despus del punto decimal, por lo que tomaremos la aproximacin de 6.3 con ancho del intervalo. Aqu debemos tomar en cuenta que tipo de variable estamos utilizando, o sea, si nuestros datos son discretos o continuos. Pues si fueran datos discretos tomaramos i = 7, ya que si tomamos el valor 6, no concordara con el nmero de intervalos que previamente se haban calculado, (esto lo podemos calcular con un pequeo despeje de i = R/k, lo cual tendramos k = R/i ), y tendramos que utilizar un intervalo ms para poder meter los valores ms altos. Al fijar los limites de clase, es necesario tomar en cuenta que el valor mnimo de los datos debe quedar incluido en el primer intervalo de clase y el valor mximo en el ltimo. Para que el valor mnimo de los datos quede incluido en el primer intervalo de clase, el primer lmite inferior de clase deber escogerse en tal forma que sea igual o menor que l. De la misma manera, para que el valor mximo de los datos quede incluido en el ltimo intervalo de clase, el ltimo lmite superior de clase deber ser igual o mayor que l. Los intervalos quedaran as: I1 53.0 a , 59.3 b I2 65.6 I3 71.9 I4 78.3 I5 84.6 I6 90.0 I7 97.2

17

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

para introducir los datos en los intervalos tomaremos el criterio siguiente: ( a, b ) ( a, b ] [ a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores que a; a mayor que y estrictamente menores que b; b menor que. a este intervalo pertenecen todas las observaciones que son estrictamente mayores que a; a mayor que y estrictamente menores o iguales que b; b menor o igual que. a este intervalo pertenecen todas las observaciones que son estrictamente mayores o iguales que a; a mayor o igual que y estrictamente menores o iguales que b; b menor o igual que. a este intervalo pertenecen todas las observaciones que son estrictamente mayores o iguales que a; a mayor o igual que y estrictamente menores que b; b menor que. CONSTRUCCIN DE UNA TABLA DE FRECUENCIAS.
CLASES Li Ls MARCA DE CLASE
FRECUENCIA

[ a, b )

FRECUENCIAS RELATIVAS

FRECUENCIA ACUMULADA

53.0 - 59.3 59.3 - 65.6 65.6 - 71.9 71.9 - 78.2 78.2 - 84.5 84.5 - 90.8 90.8 - 97.1

xi 56.15 62.45 68.75 75.05 81.35 87.65 93.95

f 4 13 7 30 9 10 7

fr 4/80 = 0.05 13/80 = 0.1625 7/80 = 0.0875 30/80 = 0.375 9/80 = 0.1125 10/80 = 0.125 7/80 = 0.0875

C 4 17 24 54 63 73 80

Suma de frecuencias =

f = 80

f r

= 1.0000

DATOS FUNDAMENTALES DE LA TABLA DE FRECUENCIA. LMITES DE CLASE: Son los valores localizados en los extremos de una clase.

LMITE INFERIOR LMITE REAL INFERIOR (Li) = 53.0 LMITE SUPERIOR LMITE REAL SUPERIOR (Ls) = 59.3 TAMAO DE CLASE (i):: Es el recorrido de valores que pueden tomar los elementos de la frecuencia de una clase determinada. Se calcula restando los limites reales. i = TAMAO DE CLASE= Ls - Li = 59.3 -53.0 = 6.3 MARCA DE CLASE (xi) : Es el valor representativo de los elementos de la frecuencia. Se obtiene promediando el lmite inferior y superior de una clase.
Marca Clase = Li + Ls 53 .0 59 .3 = = 56 15 . 2 2
18

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

FRECUENCIA RELATIVA: Es la frecuencia de la clase dividida por la frecuencia total de todas las clases y se expresa generalmente en porcentaje. fr = FRECUENCIA RELATIVA= 13/80 = 0.1625= 16.25% FRECUENCIA ACUMULADA: Es la suma de las frecuencias de clase del intervalo en consideracin y de los intervalos anteriores. Ejercicios 2.1: Resolver las siguientes cuestiones: 1.2.3.4.5.6.7.c) Si la calificacin mnima aprobatoria es de 70, Cuntos alumnos acreditaron? Cuntos alumnos acreditaron con menos de 80 ? Porcentaje de alumnos reprobados. Entre que rango de valores encontramos ms calificaciones. Porcentaje de alumnos que obtuvieron 90 o ms de calificacin. Nmero de alumnos que obtuvieron una calificacin menos de 90. Puede determinarse en la distribucin de frecuencia el nmero de calificaciones con 95.

OTROS MTODOS DE PRESENTACIN DE DATOS: REPRESENTACIN DE DATOS ESTADSTICOS

En general hay 3 formas para presentar datos organizados: a).- Presentacin con palabras b).- Tablas estadsticas c).- Grficas estadsticas PRESENTACION CON PALABRAS . La combinacin de cifras y texto no es un sistema muy eficaz ya que es necesario leer, o por lo menos registrar, todo el parrafo antes de que se pueda comprender el significado de todo el conjunto de cifras. Para la mayora de las personas les resulta difcil aislar las cifras individuales que se presentan. Sin embargo, hay la ventaja de que el autor puede dirigir la atencin hacia determinada cifra, hacindola resaltar, y tambin puede llamar la atencin sobre las comparaciones de importancia. TABLAS ESTADSTICAS . Las tablas estadsticas pueden ser agrupadas en dos tipos de acuerdo con sus propsitos para los cuales nos sirven: TABLAS PARA PROPSITOS GENERALES: Proporcionan informacin para referencia o uso general. No se construyen para una exposicin especfica. En otras palabras, las tablas nos sirven como un depsito de informacin. Por ejemplo se tiene una tabla titulada "Empleo y Poblacin" que muestra el nmero de empleados
19

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

en manufactura, minera, construccin, transporte, comercio al mayoreo y menudeo, gobierno y otras reas del pas. Esta tabla es de propsitos generales, puesto que solamente dice hechos que no son para una discusin particular. Cuando las tablas de propsitos generales son utilizadas por un investigador, son usualmente colocadas en el apndice del informe para fcil referencia. TABLAS PARA PROPSITOS ESPECIALES. Proporcionan informacin para una exposicin particular. Una tabla para propsitos especiales debera ser diseada de tal forma que un lector pueda dirigirse fcilmente a la tabla para comparacin, anlisis o nfasis concerniente a la exposicin particular. La tabla debe ser construida de una manera breve y simple.

PARTES PRINCIPALES DE UNA TABLA


TTULO: Es una descripcin del contenido de la tabla. Debe ser compacto y completo. Un ttulo usualmente indica: Qu son los datos incluidos? Dnde est el rea representada por los datos? Cmo estn los datos clasificados? Cundo ocurrieron los datos? ENCABEZADO: Es el titulo de la parte superior de una columna o columnas. La tabla ms simple tiene solamente dos columnas y dos encabezados: uno para los conceptos y otro para los datos. Sin embargo, muchas tablas tiene mas de dos encabezados y algunas veces tienen encabezados principales y subencabezados. NOTA DE Son usualmente escritas justamente arriba de los encabezados y abajo del titulo. ENCABEZADO: Son usadas para explicar ciertos puntos relacionados con la tabla completa que no han sido incluidos en el titulo o en el encabezado ni en los conceptos. Por ejemplo la unidad de los datos es frecuentemente escrita como una nota de encabezado, tal como "En miles" . CONCEPTOS O Son las descripciones en hileras o filas de las tablas, son colocados al lado COLUMNA izquierdo de la tabla. Usualmente representan las clasificaciones de las cifras MATRIZ: incluidas en el cuerpo de la tabla. La naturaleza de las clasificaciones es indicada por los encabezados de la columna. CUERPO: Es el contenido de los datos estadsticos. Los datos presentados en el cuerpo son arreglados de acuerdo con las clasificaciones de los encabezados y conceptos. Por lo tanto la presentacin efectiva de los datos en la tabla depende de los arreglos columnas y filas. Son usualmente colocadas abajo de los conceptos. Son usadas para clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes. Es el origen de donde se obtuvo la informacin. Es usualmente escrita abajo de las notas de pie. Si los datos fueron recopilados por la misma persona, es costumbre no establecer la fuente de la tabla. Sin embargo, si los datos fueron tomados de otras fuentes, las fuentes de los datos debern ser declaradas en la tabla. La declaracin permitir al lector comprobar o evaluar los datos, u obtener informacin adicional de la fuente original.

NOTA DE PIE: FUENTE:

20

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

GRFICAS ESTADSTICAS Hay una gran variedad de grficas usadas para representar datos estadsticos, los tipos ms comunes de grficas son: 1).- Grfica de lnea 2).- Grfica de barras 3).- Grficas de partes componentes 4).- Grfica de dimensiones 5).- Pictogramas 6).- Mapas estadsticos.

GRFICAS DE LNEAS Las curvas o grfica de lnea se usan a menudo para representar las series cronolgicas, as como las distribuciones de frecuencia. Los datos clasificados cualitativa y geogrficamente raras a veces se presentan por medio de lneas; en su lugar se usan grficas de barras. La Lnea o lneas que representan los datos debern resaltar claramente sobre el fondo de la grfica. La lnea deber, pues, dibujarse con un trazo mas grueso que las coordenadas de lnea. Cuando se trazan varias lneas en el mismo cuadrante, es esencial que cada lnea se destaque con claridad. Para ello se pueden usar tanto lneas continuas, de puntos y de guiones, como lneas gruesas y delgadas. Cuando en una grfica aparecen dos o ms curva, deben distinguirse unas de otras. Esto puede lograrse, de preferencia, rotulando las lneas. De ordinario es conveniente evitar el uso de mas de dos o tres lneas en una grfica. Especialmente si se cruzan, es muy probable que se produzca alguna confusin.

GRFICAS DE BARRAS Cuando se espera que la grfica de simplemente una impresin muy general pueden hacerse grficas de barras simples, sin escalas. Cuando se desea dar una impresin menos vaga, se utilizara la escala y si los intervalos de tiempo son diferentes, los espacios entre barra y barra tambin lo sern de acuerdo a la magnitud de dichos intervalos. Las grficas de barras se usan para hacer representaciones de datos clasificados cronolgicamente, arreglando las barras en forma vertical para datos clasificados en forma cuantitativa. Cuando se realizan comparaciones de datos clasificados cualitativa o geogrficamente, se usan, por lo general, barras horizontales. Aun cuando no hay reglas establecidas para dibujar las grficas de barras, son tiles ciertas consideraciones: 1.- Las barras no deben ser ni excesivamente cortas y anchas, ni demasiadas largas o angostas. 2.- Entre barra y barra deber dejarse un espacio que no sea menos, aproximadamente, que la mitad del ancho de una barra, ni mayor que el ancho de la misma. 3.- La escala es generalmente til. La distancia a la que se colocara no deber exceder de la mitad de una barra a partir de la ms alta, cuando son horizontales, o de la izquierda, cuando son verticales. 4.- Las lneas que sirven como gua ayudan a leer la grfica.

21

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

Para representar grficamente una serie cronolgica pueden usarse una grfica de barras o de lneas. Si la serie abarca muchos aos, por lo general, no es adecuada una grfica de barras, que es difcil de construir. Una grfica lineal facilita el estudio de la variacin general que ha experimentado la serie; mientras que una grfica de barras permite comparar determinados aos con mayor facilidad.

REPRESENTACIN GRFICA DE UNA TABLA DE FRECUENCIA.


Los grficos de distribuciones de frecuencias son tiles porque enfatizan y clasifican las tendencias que no se perciben fcilmente en las tablas. Los grficos tambin ayudan a resolver problemas relacionados con las distribuciones de frecuencia. Permiten estimar algunos valores de un vistazo y proveen un chequeo visual de lo correcto de las soluciones.
HISTOGRAMA:

Es un diagrama formado con rectngulos o barras cada uno de ellos pertenecientes a una clase. Cada rectngulo tiene de ancho el tamao de clase. En el eje "Y" se grafica la frecuencia, y en el eje "X" los lmites reales de clase. En el centro de su base se seala la marca de clase. Las ventajas de los histogramas son: El rectngulo muestra claramente cada clase separada en la distribucin. El rea de cada rectngulo, referida a todos los otros rectngulos, muestra la proporcin del nmero total de observaciones que ocurren en cada clase.
F r e c u e n c i a s 30 25 20 15 10 5 0 Intervalos de clase HISTOGRAMA

POLGONO DE FRECUENCIA:

Es la poligonal que une los puntos cuya abscisa es la marca de clase y cuya ordenada es la frecuencia del intervalo. Es un diagrama de lneas que se forma uniendo los centros (marca de clase) de la parte superior de los rectngulos de un histograma mediante segmentos rectos. La ventaja de los polgonos de frecuencia son: El polgono de frecuencia es mucho ms simple que el histograma. Esboza una idea del comportamiento de los datos ms claramente. El polgono se va aplanando y curveando en la medida en que se aumenta el nmero de clase y el nmero de observaciones.

22

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

F r e c u e n c i a s

POLIGONO DE FRECUENCIAS 35 30 25 20 15 10 5 0 Intervalos de clase

OJIVA:

Es una poligonal que une los puntos cuya abscisa es el extremo superior de cada intervalo y cuya ordenada es la frecuencia acumulada correspondiente al intervalo, con la convencin de que antes del primer intervalo considerado, la frecuencia acumulada es cero y despus del ltimo es el total de datos (N).
F r e c u e n c i a s 90 80 70 60 50 40 30 20 10 0 Intervalos de Clase OJIVA

A c u m u l a d a s

EJEMPLOS 2.2: PRESENTACIN ESCRITA DE DATOS ESTADSTICOS. Se presentan los Costos, Ingresos y utilidades ( en miles de pesos) durante 1991-1995 de la compaa XXX en sus diferentes departamentos: Damas, caballeros y nios. Durante los ltimos 5 aos los costos fueron de 100, 200, 300, 350 y 400 en el departamento de damas; de 120, 180, 310, 380 y 390 en el departamento de caballeros; y de 80, 100, 160, 290, 430 en el departamento de nios. Los ingresos correspondientes obtenidos en este periodo fueron de 260, 390, 425, 560 y 730 en el departamento de damas; de 300, 320, 480, 560 y 700 en el departamento de caballeros; y de 145, 210, 300, 410 y 625 en el departamento de nios.
23

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

Para lo cual sus utilidades respectivas en el departamento de damas fueron de 160, 190, 125, 210 y 310; en el departamento de caballeros fueron de 180, 140, 170, 180 y 310; y en el departamento de nios fueron de 65, 110, 140, 120 y 195. EJEMPLOS: TABLAS ESTADSTICAS. NMERO DE AUTOS MANUFACTURADOS Y VENDIDOS POR G.M., K.W. Y M.S. COMPANY EN 1995
( MILES DE AUTOS )

Ttulo

Manufactu- Vendidos rados Encabezado G.M. 10 9.2 K.W. M.S. Conceptos14 5* 12.8 5

Compaa

Nota de Encabezado

Cuerpo

FUENTE: Revista Journal, Enero de 1996, Pag. 13.


* La manufactura fue muy poca debido a que en los meses de Abril-Juniohubo huelga por parte del sindicato de trabajadores.

EJERCICIOS 21: DISTRIBUCIN DE FRECUENCIA Una mquina vendedora de proporciona 16 oz. de caf si se insertan monedas adecuadas. Para probar si la mquina esta operando adecuadamente se tomaron 30 vasos de caf y se midieron. 15.7 15.9 15.2 16.0 16.2 16.4 15.7 15.9 15.4 16.0 16.3 16.6 15.8 15.9 15.6 16.0 16.3 16.8 15.8 15.9 15.6 16.1 16.3 16.8 15.8 16.0 15.6 16.2 16.4 16.9 a) b) c) d) e) f) Realizar un arreglo de los datos de menor a mayor. Realizar una distribucin de frecuencia. Cuando la mquina tiene un margen de 0.2 oz se dice que trabaja correctamente, no importando las onzas que proporcione despus de 16 oz. En qu porcentaje la mquina funciona adecuadamente? En qu porcentaje la mquina no trabaja adecuadamente? En qu porcentaje la mquina proporciona ms de 16 oz de caf? Cul es la probabilidad de una persona al usar la mquina le proporcione ms de 16 oz de caf?

GRFICAS CIRCULARES Se emplean para demostrar la relacin existente entre los componentes de una clase. Cada uno de los sectores del crculo representa una parte de un agregado de un total. Para dividir la circunferencia en sectores se emplean proporciones, en las que se hace el total igual a los 360 grados, o bien, cuando se trata de porcentajes, a 100%.
24

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

Para evitar los clculos resulta muy conveniente emplear un transportador de porcentajes que tiene graduados los grados y los porcentajes, A falta de ese transportados de porcentajes, podemos simplificar el procedimiento si partimos del siguiente razonamiento: si 1% equivale a 3.6 grados, basta multiplicar el porcentaje por este factor y el producto as obtenido equivale a los grados que le corresponde en la circunferencia. Si se trata de valores absolutos, y no de porcentajes o valores relativos, ese factor se obtendr dividiendo 360 entre el total, ya que la circunferencia se ha hecho igual a l. PICTOGRAMAS Las grficas de volumen al presentar dibujos que se relacionan directamente con la naturaleza de los datos que representan son ms atractivas; sin embargo; como ya se sealo presentan mayores dificultades, tanto para su elaboracin como para su adecuada interpretacin. Este valor pictrico, puede conservarse usando varios dibujos pequeos que representen una cantidad fija de los datos, del mismo tamao, y arreglndolos de manera que se forme una grfica de barras. A la grfica resultante se le llama pictograma. Aunque este diagrama es esencialmente una grfica de barras es ms atractivo y, por lo tanto, hay mayor probabilidad de que lo examine el lector. En los pictogramas las barras, aun cuando representen series cronolgicas, se arreglan en forma horizontal, porque aparece ms adecuado poner los dibujos (cosas o personas) uno al lado del otro y no uno encima del otro. Las reglas fundamentales para la construccin de pictogramas estadsticos son: 1.- Los smbolos deben explicarse por s mismo 2.- Las cantidades mayores se indican por un nmero mayor de smbolos y no por smbolos ms grandes 3.- Estos diagramas compran cantidades aproximadas y no detalles minuciosos 4.- Los pictogramas slo deben utilizarse para hacer comparaciones y no afirmaciones aisladas MAPAS ESTADSTICOS Los mapas estadsticos son artificios grficos que muestran la informacin cuantitativa sobre una base geogrfica. Los tipos ms comunes son los mapas sombreados o rayados, los mapas punteados y los mapas de alfileres.

25

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS (Descriptivas) Una vez que los datos han sido obtenidos y organizados, el investigador esta listo para realizar un anlisis descriptivo. En el tratamiento de los datos, es til resumir sus caractersticas principales. Para ello, se plantean las siguientes cuestiones: Cul es el dato de mayor frecuencia? Cul es el valor central de la distribucin? Qu tan separados se encuentran los datos? Las respuestas a estas interrogantes es por medio de las medidas descriptivas conocidas como de Tendencia Central, de dispersin, de sesgo y kurtosis. La medida de tendencia central son los promedios o valores tpicos representativos de un conjunto de datos que tienden a situarse en el centro de dichos datos. Las tres medidas de tendencia central ms comunes son la media (X), mediana (Md) y moda (Mo). MEDIA ARITMTICA ( X ) Es la suma de las observaciones o datos entre el nmero de observaciones totales. Es una de las medidas digna de confianza porque se determina con mayor certeza que otras medidas.

x=
VENTAJAS:

x
I= 1

DESVENTAJAS:

Es familiar a la mayora de la gente y muy sencilla de calcular. En ellas se reflejan todos los valores del conjunto de datos. Un conjunto de datos solo tiene una sola media.

Puede afectarse por los valores extremos que no son representativos del resto de los valores. MEDIANA ( Md ) La mediana es el valor nico de un conjunto de datos que mide al elemento central de los datos. Para encontrar la mediana de un conjunto de datos, primero se ordenan los datos de menor a mayor. Si el conjunto de datos tiene un nmero impar de elementos, el elemento de la mitad del arreglo es la mediana { (N+1)/2 }. Si hay un nmero par de elementos, la mediana es el promedio de los dos elementos de la mitad { N/2 }. VENTAJAS: Los valores extremos no afectan la mediana tan fuertemente como lo hacen con la media. Se puede encontrar la mediana an cuando los datos sean descripciones cualitativas como el color o la claridad.

26

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

DESVENTAJAS: Debido a que la media es un promedio de posicin, se deben de organizar los datos antes de realizar cualquier tipo de clculo. Esto consume tiempo para un conjunto de datos muy grande. MODA ( Mo ) La moda es aquel valor que se repite ms en un conjunto de datos. VENTAJAS:
Se puede usar como una medida de localizacin central tanto para datos

cualitativos como cuantitativos. La moda no esta afectada por los valores extremos. DESVENTAJAS:
Muy a menudo no hay un valor modal porque el conjunto de datos no contiene

valores que se repiten ms de una vez. Otras veces, cada valor es la moda porque cada valor aparece el mismo nmero de veces. Cuando el conjunto de datos tiene dos, tres o ms modas, stas son difciles de interpretar y comparar.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS


MEDIA ARITMETICA PARA DATOS AGRUPADOS
N

x=

fi xi
i =1

x i = Marca de clase f = N =Total de datos f = Frecuencia

Mtodo corto para el clculo de la Media Aritmtica:

x= A+

i =1

f i di N

A = Media supuesta (marca de clase del intervalo central) di = Desviacin en unidades de intervalo i = Amplitud del intervalo

27

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

MEDIANA PARA DATOS AGRUPADOS Linf = Lmite inferior N = Total de datos M d = L inf+ i = Amplitud del intervalo fMd = Frec. de la clase mediana Se divide N/2 para encontrar la clase mediana C = Frecuencia acumulada hasta antes de la clase mediana. para datos pares, (N+1)/2 para datos impares.
N +1 2

C ant i fMd

MODA PARA DATOS AGRUPADOS:

d1 Mo = L inf + i d1 + d2

d1 = Frec. de la clase modal menos la frecuencia de la clase anterior. d2 = Frec. de la clase modal menos la frecuencia de la clase posterior.

MEDIDAS DE DISPERSIN: Indican el grado de esparcimiento de los datos con respecto al valor central. Las medidas de dispersin se usan para poder verificar si el promedio es representativo o no de la muestra y como base de control de la variacin misma. Una dispersin pequea indica un alto grado de uniformidad. Las medidas de dispersin son: desviacin estndar, varianza y rango. VARIANZA: La varianza es la suma de la distancia al cuadrado de la media y cada elemento de la poblacin entre el nmero total de elementos de la poblacin.

La frmula para datos no agrupados es:

S =
2

( xi x)
i =1

S2 =Varianza. xi = Dato individual o marca de clase. x = Media Aritmtica. N = Total de datos.

Para la varianza, sin embargo, las unidades son el cuadrado de las unidades de los datos, por ejemplo, "dlares al cuadrado" o "dlares cuadrados", no son expresiones intuitivas claras de interpretar. Por esta razn, debe efectuarse un cambio significativo en la varianza para calcular una medida de desviacin til, una que no presente problemas con las unidades de medidas y sea menos confusa. Este parmetro es llamado la DESVIACIN ESTNDAR y es la raz cuadrada de la varianza. DESVIACIN ESTNDAR PARA DATOS AGRUPADOS La desviacin estndar permite determinar, con cierto grado de certeza dnde estn localizados los valores de una distribucin de frecuencia con relacin a la media.
28

Estadstica Descriptiva Adalberto_Morelos

_____________ _____________

__________MC

Ral

Desviacin estndar para datos agrupados:

S=

f (x X )
i =1 i i

S = Desviacin Estndar. xi = Dato individual o marca de clase. X = Media Aritmtica. N = Total de datos. f = frecuencia del intervalo.

Mtodo corto para el clculo de la desviacin estndar:

s =i

f
i =1

d i2

n f i d i i =1 N

S = Desviacin Estndar. xi = Dato individual. di = Desviacin en unidades de intervalo. N = Total de datos. f = frecuencia del intervalo. i = Amplitud de la clase.

Bibliografa. Anderson, D. (2007) Estadstica para Administracin y Economa. Mxico: Pearson Berenson, M., Levine, D. (1996) Estadstica Bsica en Administracin, Conceptos y Aplicaciones. (6aEd.). Mxico :Prentice Hall Hispanoamericana Hildebrand, D. (1998). Estadstica Aplicada a la Administracin. Mxico: Pearson Levin, R. I., (2004). Estadstica para Administracin y Economa. Mxico: Pearson Levine, D., Krehbiel, T., Berenson, M. (2006). Estadstica para Administracin. (4ta. Ed.). Mxico.:Printece Hall Webster, A. (2005). Estadstica Aplicada a los Negocios y la Economa. (3ra Ed. ). Mxico: Prentice Hall. Stephen, P. Shao (1970) Estadstica para economistas y administradores de empresas. (6aEd.). Mxico: Trillas

29

You might also like