You are on page 1of 41

Estadstica Descriptiva

Conceptos Generales
http://bibliotecadeinvestigaciones.wordpress.com/matematicas/estadistica-descriptiva-conceptos-generales/

Origen, Avance y Desarrollo Histrico


Surgimiento de la Estadstica en la Antigedad La estadstica surgi en pocas muy remotas; como todas las ciencias, no se cre de improviso, sino mediante un proceso largo de desarrollo y evolucin, desde hechos de simple recoleccin de datos hasta la diversidad y rigurosa interpretacin de los datos que se dan hoy en da. Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o cosas. Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de todas las dems ciencias.

El nacimiento de la Estadstica se puede situar en el ao 3050 A.C., en el Antiguo Egipto. Los mercados, la medicina, la ingeniera, los gobiernos, etc. se nombran entre los ms destacados clientes de esta ciencia. Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 a. C., prolijos datos relativos a la poblacin y la riqueza del pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.

Hacia el ao 3000 a.C. los babilonios usaban pequeas tablillas de arcilla para recopilar datos sobre la produccin agrcola y sobre los gneros vendidos o cambiados mediante trueque. En el antiguo Israel la Biblia da referencia del uso estadstico, principalmente en los libros de Nmeros y Crnicas que incluyen, en algunas partes, trabajos de esta ndole. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China se efectuaron censos de poblacin, pues varios registros numricos con anterioridad al ao 2000 a.C. dan fe de ello. Los griegos efectuaron censos peridicamente hacia 594 a. C., con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.

El Imperio Romano, fue el primer gobierno en emplear los recursos estadsticos para calcular su poblacin, su superficie territorial y renta de sus territorios. El Imperio romano, maestro de la organizacin poltica, fue el primer gobierno que supo emplear los recursos de la estadstica, mediante la recopilacin de una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control: cada cinco aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del imperio. Durante los mil aos siguientes a la cada del imperio Romano realizaron operaciones sobre las relaciones de tierras pertenecientes a la Iglesia; en la edad media slo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Desarrollo y avances en la Estadstica Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, despus de la conquista normanda en 1066, Guillermo el Conquistador encarg la realizacin de un censo. La informacin obtenida fue recopilada en el

Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de Inglaterra.

Guillermo el Conquistador orden en 1066 un censo, recopilado en el Libro del Gran Castro, considerado el primer compendio estadstico de Inglaterra. Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes , hicieron grandes operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos econmicos. Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los recursos nacionales, comprensiva de datos sobre organizacin poltica, instrucciones sociales, comercio y podero militar. Durante el siglo XVII aport indicaciones ms concretas de mtodos de observacin y anlisis cuantitativo y ampli los campos de la inferencia y la teora Estadstica. Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica. En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los aos terminados en siete mora ms gente que en los restantes, y para lograrlo hurg

pacientemente en los archivos parroquiales de la ciudad. Despus de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms personas que en los dems. Los procedimientos de Neumann fueron conocidos por el astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compaas de seguros. Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante durante cierto tiempo, la teora de las probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes problemas cientficos.

En 1760, Godofredo Achenwall, acu la palabra Estadstica. Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el trmino latino status, que significa estado o situacin; Esta etimologa aumenta el valor intrnseco de la palabra, por cuanto la estadstica revela el sentido cuantitativo de las ms variadas situaciones. Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la ciencia. Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos fundamentales para la teora Estadstica; la teora de los errores de observacin, aportada por Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace, Gauss y Legendre.

A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por Correlacin, que tena por objeto medir la influencia relativa de los factores sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la ciencia biomtrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones. Nacimiento de la Estadstica Moderna

Ronald Arnold Fisher, figura ms influyente de la Estadstica. Una vez sentadas las bases de la teora de probabilidades, podemos situar el nacimiento de la estadstica moderna y su empleo en el anlisis de experimentos en los trabajos de Francis Galton y Kurt Pearson. Este ltimo public en 1892 el libro The Grammar of Science (La gramtica de la ciencia), un clsico en la filosofa de la ciencia, y fue l quien ide el conocido test de Chi -cuadrado. El hijo de Pearson, Egon, y el matemtico nacido en Polonia Jerzy Neyman pueden considerarse los fundadores de las pruebas modernas de contraste de hiptesis. Pero es sin lugar a dudas Ronald Arnold Fisher la figura ms influyente de la estadstica, pues la situ como una poderosa herramienta para la planeacin y anlisis de experimentos. Contemporneo de Pearson, desarroll el anlisis de varianza y fue pionero en el desarrollo de numerosas tcnicas de anlisis multivariante y en la introduccin del mtodo de mxima verosimilitud para la estimacin de parmetros. Su libro Statistical Methods for Research Workers (Mtodos estadsticos para los investigadores), publicado en 1925, ha sido probablemente el libro de estadstica ms utilizado a lo largo de muchos aos. Mientras tanto, en Rusia, una activa y fructfera escuela de matemticas y estadstica aport asimismo como no poda ser de otro modo su considerable influencia. Desde finales del siglo XVIII y comienzos del XIX cabe destacar las figuras de Pafnuty Chebichev y Andrei Harkov, y posteriormente las de Alexander Khinchin y Andrey Kolmogorov. Sucesos de inters en el desarrollo de la estadstica

A continuacin se presenta una relacin cronolgica de diferentes sucesos que nos permiten tener una idea general de la evolucin de la estadstica En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores vieron la necesidad de reducir la informacin a valores numricos para evitar la ambigedad de las descripciones verbales. Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior desarrollo del clculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la Fsica como resultado de las investigaciones atmicas y que este principio se juzga aplicable tanto a las ciencias sociales como a las fsicas. [1], [2], [3], [4], [5], [6] y [7]

Influencia y Aplicaciones de la Estadstica en la Sociedad Actual


En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve como herramienta para relacionar y analizar dichos datos.

El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin.

La Estadstica es ampliamente utilizada para la exactitud de datos econmicos, polticos... La estadstica que conocemos hoy da debe gran parte de sus logros a los trabajos matemticos de aquellos hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri la estadstica a las ciencias formales. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. De esta manera, la estadstica ocupa un lugar de gran importancia en la investigacin y en la prctica mdica. En los estudios de medicina de cualquier pas se incluyen varias asignaturas dedicadas a la estadstica; es difcil, por no decir imposible, que un trabajo de investigacin sea aceptado por una revista mdica sin que sus autores hayan utilizado tcnicas y conceptos estadsticos en su planteamiento y en el anlisis de los datos. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos.

La Estadstica es de suma importancia en la Investigacin y la prctica mdica. Es una herramienta indispensable para la toma de decisiones; se ha convertido en un mtodo efectivo para describir con exactitud los valores de los datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en interpretar esa informacin.

Tambin es ampliamente empleada para mostrar los aspectos cuantitativos de una situacin. La estadstica est relacionada con el estudio de proceso cuyo resultado es ms o menos imprescindible y con la finalidad de obtener conclusiones para tomar decisiones razonables de acuerdo con tales observaciones. El resultado de estudio de dichos procesos, denominados procesos aleatorios, puede ser de naturaleza cualitativa o cuantitativa y, en este ltimo caso, discreto o contina. Son muchas las predicciones de tipo socilogo, o econmico, que pueden hacerse a partir de la aplicacin exclusiva de razonamientos probabilsticos a conjuntos de datos objetivos como son, por ejemplo, los de naturaleza demogrfica. La estadstica es un potente auxiliar de muchas ciencias y actividades humanas: sociologa, psicologa, geografa humana, economa, etc. Las predicciones estadsticas, difcilmente hacen referencia a sucesos concretos, pero describen con considerable precisin en el comportamiento global de grandes conjuntos de sucesos particulares. De manera ms especfica, sirve para saber quien, de entre los miembros de una poblacin importante, va a encontrar trabajo o a quedarse sin l; o en cuales miembros va a verse aumentada o disminuida una familia concreta en los prximos meses. Sin embargo, puede proporcionar estimaciones fiables del prximo aumento o disminucin de la tasa de desempleo referido al conjunto de la poblacin; o de la posible variacin de os ndices de natalidad o mortalidad. La aplicacin de la Estadstica en la Contabilidad En el caso especfico de la contabilidad, la estadstica es muy importante, pues se aplica para seleccionar muestras, cuando se pretende hacer una auditoria; tambin funciona para medir la variacin de costos de produccin.

En la Contabilidad, es una herramienta rpida y eficiente para la solucin de problemas de costos y auditoras

La estadstica matemtica y en particular los mtodos de muestreo, juegan un papel de gran importancia y utilidad en el desarrollo de una auditora, esto gracias a su carcter de rapidez y economa. Cmo seleccionar la muestra, cmo realizar la inferencia (extrapolacin de las conclusiones obtenidas sobre la muestra, al resto de la poblacin), y qu grado de confianza se tiene en ello, son los principales problemas a los cules de una solucin efectiva. El muestreo, es un procedimiento por el que se infieren los valores verdaderos de una poblacin, a travs de la experiencia obtenida con una muestra de esta. El uso de muestras para estimar valores de una poblacin ofrece diversas ventajas. En trminos generales se puede afirmar que el muestreo permite una reduccin considerable de los costos materiales del estudio, una mayor rapidez en la obtencin de la informacin y el logro de resultados con mxima calidad. Hoy las tcnicas de muestreo asistidas por computadoras, son herramientas bsicas, pues la rpida toma de decisiones que hay que ejecutar en la dinmica de los procesos econmicos, demanda el uso de nuevas tecnologas que le impriman una rapidez, confiabilidad, disponibilidad y capacidad, entre otras facilidades, que se han ido buscando a travs de los recursos informticos. Con el avance de la Informtica y la vinculacin de esta a la Estadstica, se maneja de manera rpida, fiable y relativamente sencilla grandes volmenes de informacin, y obtener conclusiones que despus el profesional interpreta, mediante el uso de paquetes de programas, tales como el estatistics, el SPSS, el statgraphics, que facilitan el empleo de procedimientos estadsticos usados por algunos auditores, contadores e investigadores en general. [6], [7], [8], [9], [10] y [11]

Definiciones de la Estadstica
Qu es la Estadstica?

Sir John Sinclair, introdujo la recoleccin y clasificacin de datos a la Estadstica.

Despus de haber conocido el origen y desarrollo de la Estadstica como ciencia as como su influencia y aplicaciones en la sociedad actual, toca turno de definir y comprender qu es la Estadstica. Si bien, existen diversas definiciones acerca de esta ciencia, considero preciso el comenzar por aclarar el origen etimolgico, a pesar de que como ya vimos, fue Godofredo Achenwall quien en 1760, acu la palabra Estadstica. As pues, Estadstica proviene del trmino alemn Statistik que se traduce como La ciencia del Estado, por lo que designaba originalmente el anlisis de datos del Estado. En el siglo XIX cuando el militar britnico Sir John Sinclair (1754-1835) introdujo al trmino estadstica el significado de recolectar y clasificar datos. Tambin se sabe proviene del latn statisticum collegium (consejo de Estado) y su derivado italiano statista (hombre de Estado o poltico). Ahora bien, despus de haber dado a conocer el significado etimolgico, es preciso el saber cul es la definicin conceptual del trmino en cuestin. Para ello, he decidido tomar la definicin que el autor Ignacio M. Lizrraga Gaudry hace respecto a esta ciencia, pues la considero una respuesta completa y concreta para definirla de manera generalizada. Entonces, el seor Lizrraga considera la Estadstica como: La rama de las matemticas que recopila, organiza, analiza e interpreta los datos obtenidos de un problema estadstico, para obtener conocimiento de los hechos pasados, para prever situaciones futuras y tomar decisiones en base a las experiencias. Ahora, a pesar de ser la anterior una respuesta entendible y completa, es necesario el exponer otras interesantes definiciones acerca del tema, tales como las siguientes: 1. Es una rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. [6] 2. Es el recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. [12] 3. Es un conjunto de mtodos cientficos ligados a la toma, organizacin, recopilacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones como para tomar decisiones razonables de acuerdo con tales anlisis. [13] 4. Es la ciencia cuyo objetivo es reunir una informacin cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al anlisis de estos datos unos significados precisos o unas previsiones para el futuro. [14] 5. En general, es la ciencia que trata de la recopilacin, organizacin presentacin, anlisis e interpretacin de datos numricos con el fin de realizar una toma de decisin ms efectiva. [14] 6. Es la ciencia que tiene por objeto el estudio cuantitativo de los colectivos. Enrique Chacn [14] 7. La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su prediccin prxima.

scar Vzquez Mnguez [14] Ahora bien, en cuanto a la Estadstica Descriptiva, especficamente hablando, podemos definirla como la ciencia que analiza, estudia y describe a la totalidad de individuos de una poblacin. Su finalidad es obtener informacin, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cmoda y rpidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. [6]

Divisin de la Estadstica y su Objeto de Estudio

La Estadstica se puede clasificar en funcin de su etapa o funcin, del tiempo considerado o del nmero de variables estudiadas. La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Tiene como propsito la descripcin del conjunto de datos colectados, as como la generalizacin y/o toma de decisiones acerca de las caractersticas de todas las observaciones potenciales bajo consideracin. En consecuencia nos permite organizar y resumir datos para poder realizar inferencias (conclusiones) relativas a los mismos. Para su mejor estudio se han creado varias formas de clasificar los estudios estadsticos. Algunas de las ms comunes son las siguientes: Clasificacin de la Estadstica segn la etapa o funcin Generalmente se considera que la estadstica tiene dos funciones (divisiones). Hay una estadstica descriptiva y una estadstica inferencial. La primera etapa se ocupa de describir la muestra, y la segunda etapa infiere conclusiones a partir de los datos que describen la muestra (por ejemplo con respecto a la poblacin). A continuacin, se dar paso a describir brevemente, cada etapa.
Estadstica Descriptiva o Deductiva

Se refiere a la recoleccin, presentacin, descripcin, anlisis e interpretacin de una coleccin de datos, esencialmente consiste en resumir stos con uno o dos

elementos de informacin (medidas descriptivas) que caracterizan la totalidad de los mismos.

La Estadstica Descriptiva recolecta, describe, analiza, interpreta y presenta los datos de una poblacin en forma de tablas y grficas Consiste sobre todo en la presentacin de datos en forma de tablas y grficas; as que se emplea simplemente para resumir de forma numrica o grfica un conjunto de datos. Esta comprende cualquier actividad relacionada con los datos y est diseada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como tales. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre s mismos y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de una muestra. As pues, si aplicamos las herramientas ofrecidas por la estadstica descriptiva a una muestra, solo nos limitaremos a describir los datos encontrados en dicha muestra, por lo que no se podr generalizar la informacin hacia la poblacin.
Estadstica Inferencial o Inductiva

La Estadstica Inferencial trabaja a base de muestras para inferir aspectos de la poblacin. La estadstica descriptiva trabaja con todos los individuos de la poblacin. La estadstica inferencial, sin embargo, trabaja con muestras, subconjuntos formados por algunos individuos de la poblacin. A partir del estudio de la muestra se pretende inferir aspectos relevantes de toda la poblacin. Cmo se selecciona la muestra, cmo se realiza la inferencia, y qu grado de confianza se puede tener en ella son aspectos fundamentales de la estadstica inferencial, para cuyo estudio se requiere un alto nivel de conocimientos de estadstica, probabilidad y matemticas. Para que stas generalizaciones sean vlidas la muestra deben ser representativa de la poblacin y la calidad de la informacin debe ser controlada, adems puesto que las conclusiones as extradas estn sujetas a errores, se tendr que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La Estadstica Inferencial investiga o analiza una poblacin partiendo de una muestra tomada. Es as que permite realizar conclusiones o inferencias, basndose en los datos simplificados y analizados de una muestra hacia la poblacin o universo. Por ejemplo, a partir de una muestra representativa tomada a los habitantes de una ciudad, se podr inferir la votacin de todos los ciudadanos que cumplan los requisitos con un error de aproximacin. En sus particularidades la Inferencia distingue la Estimacin (cuando se usan las caractersticas de la muestra para hacer inferencias sobre las caractersticas de la poblacin) y la Contrastacin de Hiptesis (cuando se usa la informacin de la muestra para responder a interrogantes sobre la poblacin). Clasificacin de la Estadstica segn el tiempo considerado

Si se clasifica la Estadstica en base al tiempo considerado, tenemos la Estadstica Esttica (datos de la actualidad) y la Estadstica Evolutiva (datos del pasado).

Dentro de la estadstica descriptiva se distinguen los datos en funcin al tiempo en que se encuentra analizada la poblacin; de esta manera, tenemos 2 clasificaciones:
Estadstica Esttica o Estructural

La estadstica esttica o estructural, que describe la poblacin en un momento dado empleando datos de la actualidad (por ejemplo la tasa de nacimientos en determinado censo)
Estadstica Dinmica o Evolutiva

La estadstica dinmica o evolutiva, que describe como va cambiando la poblacin en el tiempo empleando datos del pasado (por ejemplo el aumento anual en la tasa de nacimientos). Clasificacin de la Estadstica segn la cantidad de variables estudiada Tambin, se puede clasificar a la Estadstica en funcin de la cantidad de variables que estn siendo estudiadas en determinado problema estadstico. Desde este punto de vista hay una estadstica univariada (estudia una sola variable, como por ejemplo la inteligencia, en una muestra), una estadstica bivariada (estudia cmo estn relacionadas dos variables, como por ejemplo inteligencia y alimentacin), y una estadstica multivariada (que estudia tres o ms variables, como por ejemplo como estn relacionados el sexo, la edad y la alimentacin con la inteligencia).
Estadstica Univariada

Un ejemplo perfecto del anlisis estadstico univariado, es la utilizacin del promedio o media aritmtica, pues slo se mide una variable. Cuando el anlisis presenta caracterstica por caracterstica, aisladamente, estaremos en presencia de un anlisis estadstico univariado. Esto quiere decir, que se est estudiando una sola variable. El anlisis univariado es el anlisis bsico, primario. Las caractersticas o propiedades de las personas o cosas han de medirse una a una, de modo univariado y si se presentan de esa manera decimos que es anlisis univariado.

Los estadsticos bsicos que conocemos, como la media, la mediana, la moda, la varianza, los porcentajes, entre otros, miden una variable. Es decir, fueron hechos univariados. Ahora bien este tipo de anlisis ha sido muy criticado ya que la realidad se presenta interconectada, relacionada. Por ejemplo existe una relacin entre el peso y la talla de las personas o entre la el inters y el rendimiento escolar, etc. Como la realidad se presenta relacionada necesitamos mtodos ms rigurosos para evaluarla. Esto lo podemos hacer de dos modos; El primero es medir las variables de modo univariado (analizarlas) y relacionarlas luego en la interpretacin.
Estadstica Bivariada

La Estadstica bivariada, busca la relacin entre 2 variables, mediante la elaboracin de ndices y resultados estadsticos La estadstica univariada se aplica, por lo general, en explotaciones estadsticas bsicas de la fuente de datos (frecuencias, porcentajes, promedios, tasas). La estadstica bivariada trata de ir ms all elaborando ndices y resultados estadsticos en trminos de relaciones entre dos variables de inters, as como de establecer inferencias sobre una poblacin a partir de datos que provienen de una muestra (como, por ejemplo, en los estudios mediante encuesta). El conjunto de tcnicas estadsticas bivariadas difiere en funcin del tipo de datos de los que se dispone (niveles de medida: nominal, ordinal, intervalo, razn), adaptndose en todo momento al contexto de anlisis aplicado en el que nos encontremos.
Estadstica Multivariada

La Estadstica multivariada tiene diversas aplicaciones en una enorme cantidad de reas, como los son: la agricultura, el deporte, la psicologa, la economa, etc. Los mtodos estadsticos multivariantes y el anlisis multivariante son herramientas estadsticas que estudian el comportamiento de tres o ms variables al mismo tiempo. Se usan principalmente para buscar las variables menos representativas para poder eliminarlas, simplificando as modelos estadsticos en los que el nmero de variables sea un problema y para comprender la relacin entre varios grupos de variables. Algunos de los mtodos ms conocidos y utilizados son la Regresin lineal y el Anlisis discriminante. Se pueden sintetizar dos objetivos claros: 1. Proporcionar mtodos cuya finalidad es el estudio conjunto de datos multivariantes que el anlisis estadstico uni y bidimensional es incapaz de conseguir. 2. Ayudar al analista o investigador a tomar decisiones ptimas en el contexto en el que se encuentre teniendo en cuenta la informacin disponible por el conjunto de datos analizado. Los datos multivariados surgen cuando a un mismo individuo se le mide ms de una caracterstica de inters. Un individuo puede ser un objeto o concepto que se puede medir. Ms generalmente, los individuos son llamados unidades experimentales. Ejemplos de objetos: personas, animales, terrenos, compaas, pases, etc. Ejemplos de conceptos: amor, amistad, noviazgo, etc. Una variable es una caracterstica o atributo que se le mide a un individuo. Las aplicaciones de la estadstica multivariada estn presentes en distintas reas o ramas de la ciencias, como por ejemplo en: Investigacin de mercados (para identificar caractersticas de los individuos con el propsito de determinar qu tipo de personas compran determinado producto); en el sistema de educacin de cualquier tipo de especialidad (para conocer los estudiantes que tendrn xito y concluirn satisfactoriamente sus estudios); en la agricultura (al estudiar la resistencia de determinado tipo de cosechas a daos por plagas y sequas); en el deporte (para conocer a partir de medidas antropomtricas las posibilidades de obtener buenos resultados en un deporte especfico); en la psicologa (al estudiar la relacin entre el comportamiento de adolescentes y actitudes de los padres); en la economa (para conocer el nivel de

desarrollo de un territorio en relacin con otros y realizar inferencias a partir de variables econmicas fundamentales, entre otros).
[6], [15], [16], [17], [18], [19], [20] y [21]

Elementos bsicos de la Estadstica


Concepto de Poblacin

En estadstica, poblacin es el conjunto de datos de un problema estadstico determinado. Poblacin estadstica, tambin llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. Algunas de las definiciones ms aceptadas son: Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones. Levin & Rubin (1996). Una poblacin es un conjunto de elementos que presentan una caracterstica comn. Cadenas (1974). Es entonces que cuando tenemos un conjunto muy grande de datos numricos para analizar decimos que tenemos un Universo o Poblacin de observaciones; tiene como objetivo final descubrir las caractersticas y propiedades de aquello que gener los datos. En estadstica es representado con N. Existen distintos tipos de poblaciones que son:

Poblacin base: es el grupo de personas designadas por las siguientes caractersticas: personales, geogrficas o temporales, que son elegibles para participar en el estudio.

Poblacin muestreada: es la poblacin base con criterios de viabilidad o posibilidad de realizarse el muestreo. Muestra estudiada: es el grupo de sujetos en el que se recogen los datos y se realizan las observaciones, siendo realmente un subgrupo de la poblacin muestreada y accesible. El nmero de muestras que se puede obtener de una poblacin es una o mayor de una. Poblacin diana: es el grupo de personas a la que va proyectado dicho estudio, la clasificacin caracterstica de los mismos, lo cual lo hace modelo de estudio para el proyecto establecido. Concepto de Muestra

Una muestra de poblacin, en estadstica, es un conjunto de datos representativos del total de una poblacin o universo. Muestra de poblacin, seleccin de un conjunto de individuos representativos de la totalidad del universo objeto de estudio, reunidos como una representacin vlida y de inters para la investigacin de su comportamiento. Los criterios que se utilizan para la seleccin de muestras pretenden garantizar que el conjunto seleccionado represente con la mxima fidelidad a la totalidad de la que se ha extrado, as como hacer posible la medicin de su grado de probabilidad. Otras definiciones altamente aceptadas, son: Se llama muestra a una parte de la poblacin a estudiar qu sirve para representarla. Murria R. Spiegel (1991). Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos. Levin & Rubin (1996).

Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia Cadenas (1974). La muestra tiene que estar protegida contra el riesgo de resultar sesgada, manipulada u orientada durante el proceso de seleccin, con la finalidad de proporcionar una base vlida a la que se pueda aplicar la teora de la distribucin estadstica. A la muestra de una poblacin se le representa en estadstica con la letra n. Es as muestreo probabilstico, consiste en elegir una muestra de una poblacin al azar. Podemos distinguir varios tipos de muestreo.
Muestreo aleatorio simple:

El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamao de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que estamos manejando es muy grande.
Muestreo aleatorio sistemtico:

Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin, pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,, i+(n-1) k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al azar entre 1 y k. El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la poblacin.
Muestreo aleatorio estratificado:

Consiste en considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad respecto a alguna caracterstica. Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de inters estarn representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarn parte de la muestra. La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser de diferentes tipos:

Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales. Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la poblacin en cada estrato. Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que se considera la proporcin y la desviacin tpica.

Muestreo aleatorio por conglomerados:

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en investigar despus todos los elementos pertenecientes a los conglomerados elegidos. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas geogrficas suele hablarse de muestreo por reas. Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sealar: 1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo. 2. Como consecuencia del punto anterior ahorraremos costes. 3. Estudiar la totalidad de los pacientes o personas con una caracterstica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar. 4. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y plurales que si las tuvisemos que realizar a una poblacin. 5. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una poblacin al indicar los criterios de inclusin y/o exclusin. Tipos y clasificacin de Datos Estadsticos

Los Datos Estadsticos, son aquellos que se estudian en cada elemento de la muestra y son variables que tomaran valores dependiendo del problema. Los datos estadsticos son lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensin arterial sistlica, etctera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las variables incluidas en el estudio. Deberemos adems concretar la escala de medida que aplicaremos a cada variable. La naturaleza de las observaciones ser de gran importancia a la hora de elegir el mtodo estadstico ms apropiado para abordar su anlisis. Con este fin, clasificaremos a estos datos estadsticos, a grandes rasgos, en dos tipos: datos cuantitativos o datos cualitativos.
Datos cuantitativos

Las Datos Cuantitativos son aquellos que se pueden expresar mediante valores numricos, y se dividen en continuos (enteros y decimales) y discretos (slo enteros): Son las variables que pueden medirse, cuantificarse o expresarse numricamente y pueden ser manipulados estadsticamente. Incluyen tabulaciones de frecuencia, porcentajes, medias y promedios. Si entre cada dos datos puede haber una infinidad de ellos, se llaman continuos, y si entre un dato y otro siempre hay un hueco o salto, se llaman discretos.

Datos cuantitativos continuos: si admiten tomar cualquier valor dentro de un rango numrico determinado, es decir, que pueden expresarse con nmeros decimales o fraccionarios. (Densidad de un lquido, la fuerza de un muelle, edad, peso, talla). Datos cuantitativos discretos: si no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (Nota de un examen, nmero de hijos, nmero de partos, nmero de hermanos, etc.).
Datos cualitativos.

Son datos que no se pueden expresar numricamente, debido a que suponen cualidades, opiniones, sentimientos entre otros, y se dividen en nominales (categoras que no mantiene relacin de orden) y los jerarquizados (escalas utilizadas bajo un orden). Datos que expresan cualidades, como opiniones, sentimientos, observaciones y cambios en el comportamiento que clasifica a cada caso en una de varias categoras (Domroese & Sterling 1999). La situacin ms sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificacin no es suficiente y se requiere de un mayor nmero de categoras (color de los ojos, grupo sanguneo, profesin, etctera). En el proceso de medicin de estas variables, se pueden utilizar dos escalas:

Escalas nominales: sta es una forma de observar o medir en la que los datos se ajustan por categoras que no mantienen una relacin de orden entre s (color de los ojos, sexo, profesin, presencia o ausencia de un factor de riesgo o enfermedad, etctera). Escalas ordinales o jerarquizados: en las escalas utilizadas, existe un cierto orden o jerarqua entre las categoras (grados de disnea, estadiaje de un tumor, etctera). Tipos y clasificacin de Variables Estadsticas

Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de la poblacin que estamos interesados en estudiar. Se pueden clasificar en funcin a la Medicin o a la influencia.

VARIABLES EN FUNCIN DE SU MEDICIN

Existen dos tipos: las variables cualitativas y las variables cuantitativas.


Variable cualitativa

Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos:

Variable cualitativa nominal: presenta modalidades no numricas que no admiten un criterio de orden.

Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

Variable cualitativa ordinal o variable cuasicuantitativa: modalidades no numricas, en las que existe un orden.

presenta

Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1, 2, 3, Medallas de una prueba deportiva: oro, plata, bronce. La variable que tiene resultados o valores que tienden a variar de observacin en observacin debido a los factores relacionados con el azar recibe el nombre de variable aleatoria. Las variables aleatorias pueden ser discretas y continuas.
Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos: Variable discreta: Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Es decir, slo puede ser expresado con nmeros enteros. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable continua: Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros por lo cual tiene un nmero infinito de valores posibles. Es decir, puede ser expresada con nmeros decimales o fraccionarios. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales.
VARIABLES EN FUNCIN DE SU INFLUENCIA
Variables independientes

Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando intrnsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los resultados por medio de un sesgo. Es aquella caracterstica o propiedad que se supone ser la causa del fenmeno estudiado. En investigacin experimental se llama as a la variable que el investigador manipula.
Variables dependientes

Son las variables de respuesta que se observan en el estudio y que podran estar influenciadas por los valores de las variables independientes. Hayman la define como propiedad o caracterstica que se trata de cambiar mediante la manipulacin de la variable independiente. La variable dependiente es el factor que es observado y medido para determinar el efecto de la variable independiente.
Fuentes del subtema 1.5 [22], [23], [24], [25], [25], [27], [28], [29] y [30],

Cuadros Estadsticos
Qu es un cuadro o tabla estadstica? Un cuadro estadstico es una representacin grafica de las diversas situaciones que se nos presentan diariamente; sirve para presentar de forma ordenada las distribuciones de frecuencias. Es la forma esquemtica de comprender las tendencias de nuestra forma de ser y de vivir. En un cuadro estadstico puedes identificar tantas variables como quieras; se realiza como un resumen del conjunto de datos que se poseen, distribuidos segn las variables que se estudian. Su forma general es la siguiente: Modalidad Frec. Abs. Frec. Rel. Frec. Abs. Acumu. Frec. Rel. Acumu. ni fi Ni Fi C n1 N1 = n1 c1 nj cj nk Nk = n Fk = 1 ck n 1 Es un instrumento que permite sintetizar y/o presentar la informacin de un hecho investigado, y consta de cinco elementos principales: Cabeza: parte inicial donde se registra el ttulo. Columna principal: Aqu anotamos las categoras ordenadas obtenidas.

Encabezado de columnas: Smbolos que explican el objeto en estudio, o las caractersticas fundamentales que dan lugar al ingreso de la informacin (vaciado de datos). Cuerpo: Conjunto de datos estadsticos realmente observados y distribuidos de acuerdo a las caractersticas predeterminadas. Fuente: Referencia donde se adquiere la informacin. Cmo construir tablas o cuadros estadsticos? Si tenemos datos estadsticos que los podemos manejar tambin los podemos ordenar. Si luego de la recopilacin, obtenemos un conjunto de datos estadsticos demasiado numeroso, poco o nada se puede hacer con ellos. Pero si los organizamos y los clasificamos se nos va a facilitar la informacin incluso la interpretacin. La forma ms correcta es en una tabla de distribucin de frecuencias, y su elaboracin no requiere ningn artificio especial, basta con anotar los datos en fila o en columna. Cuando elaboramos estas tablas se debe tener presente lo siguiente:

Si se trabaja con variables discretas las clases pueden ser sin agrupamiento, siempre y cuando su recorrido sea menor a 20. Cuando estamos encontrando estadsticas de variables continuas y por lo general numerosa, debemos agrupar, o por lo general cuando su rango sea mayor a 20.

Por consiguiente podemos obtener 3 tipos de series: 1. Serie simple o tipo I, tambin llamada ordinaria (cuando las estadsticas representan un rango menor a 10. 2. Serie de frecuencia, o tipo II (cuando las estadsticas observadas se repiten y su rango est entre mayor a 10 y menor que 20). 3. Serie de intervalos de clase o tipo III, o de datos agrupados (cuando los datos observados son numerosos o su rango es mayor que 20). Tipos de Tablas o Cuadros Estadsticos Las tablas o cuadros estadsticos no tienen modelo nico, estn sujetos a las exigencias de la informacin y del investigador (revise, estudie y analice los cuadros de la gua didctica y texto bsico. Las tablas estadsticas segn el nmero de observaciones y segn el recorrido de la variable estadstica, as tenemos los siguientes tipos de tablas estadsticas: 1. Tablas Tipo I 2. Tablas Tipo II 3. Tablas Tipo III

Tablas tipo I: Cuadro Simple

Cuando el tamao de la muestra y el recorrido de la variable son pequeos, por ejemplo si tenemos una muestra de las edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas. Edad de los 5 miembros de una familia: 5
Tablas tipo II: Cuadro de Frecuencias

11 22 40 65 80

Cuando el tamao de la muestra es grande y el recorrido de la variable es pequeo, por lo que hay valores de la variable que se repiten. Por ejemplo, si preguntamos el nmero de personas activas que hay en 50 familias obtenemos la siguiente tabla: Personas Activas en 50 familias 2122124211 2321113422 2212111322 3231242141 1343222133 Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla: Personas Activas 1 2 3 4 Total
Tablas tipo III: Cuadro de Intervalos

Nmero de Familias 16 20 9 5 50

Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo que ser necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos encontramos con los siguientes datos: 450 5 605 185 1152 180 785 125 250 200 1595 315 300 675 2300 425 175 500 5000 560 80 25 2680 375 1500 205 1200 100 985 1100

Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 pesetas, por lo que s queremos hacer una tabla con estos datos tendremos que tomar intervalos. Para

decidir la amplitud de los intervalos, necesitaremos decidir cuntos intervalos queremos? Normalmente se suele trabajar con no ms de 10 o 12 intervalos. Amplitud =4998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500 Debemos tener en cuenta las siguientes consideraciones:

Tomar pocos intervalos implica que la prdida de informacin sea mayor. Los intervalos sern siempre Cerrados por la izquierda y Abiertos por la Derecha [ Li-1 , Li ) Procuraremos que en la decisin de intervalos los valores observados no coincidan con los valores de los extremos del intervalo y si esto ocurre que no sea en ms de un 5% del total de observaciones.

Con estas recomendaciones tendremos la siguiente tabla: [ Li-1 , Li ) [ 0,500) [ 500, 1000) [ 1000,1500) [ 1500, 2000) [ 2000, 2500) [ 2500, 3000) [ 3000, 3500) [ 3500, 4000) [ 4000, 4500) [ 4500, 5000) [ 5000,5500)
Fuentes del subtema 1.8 [31], [32], y [33]

Frecuencia 16 6 3 2 1 1 0 0 0 0 1

Representacin Grfica de los Datos de una Tabla de Distribucin de Frecuencias


Qu son las Grficas Estadsticas?

La Representacin Grfica de un conjunto de datos recopilados, es una manera rpida y eficiente de presentar estadsticamente la informacin. Cuando se hace un estudio estadstico se obtiene una gran cantidad de datos numricos. Para tener una informacin clara y rpida de lo obtenido en el estudio se han creado las grficas estadsticas. Gran parte de la utilidad que tiene la Estadstica Descriptiva es la de proporcionar un medio para informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de informacin depender de la presentacin de los datos, siendo la forma grfica uno de los ms rpidos y eficientes, aunque tambin uno de los que ms pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones bsicas al realizar las grficas. Existen tambin varios tipos de grficas, o representaciones grficas, utilizndose cada uno de ellos de acuerdo al tipo de informacin que se est usando y los objetivos que se persiguen al presentar la informacin. Entonces, algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier grfica a fin de que la informacin sea transmitida de la manera ms eficaz posible y sin distorsiones son: 1. El eje que represente a las frecuencias de las observaciones (comnmente el vertical o de las ordenadas) debe comenzar en cero (0), de otra manera podra dar impresiones errneas al comparar la altura, longitud o posicin de las columnas, barras o lneas que representan las frecuencias. 2. La longitud de los espacios que representan a cada dato o intervalo (clase) en la grfica deben ser iguales. 3. El tipo de grfico debe coincidir por sus caractersticas con el tipo de informacin o el objetivo que se persigue al representarla, de otra manera la representacin grfica se convierte en un instrumento ineficaz, que produce ms confusin que otra cosa, innecesario o productor de malinterpretaciones.

Existen decenas de tipos de grficas, a continuacin te presento los ms usuales e importantes. Por ejemplo, si se desea representar la proporcin de poblacin masculina en un pas conviene ms usar una grfica de pastel o circular que una grfica de barras al compararla contra la poblacin femenina; por un lado se puede apreciar dicha proporcin, por el otro se aprecia cul de las dos poblaciones es mayor. Hay un punto que conviene remarcar: existe software que permite la construccin rpida y eficiente de grficas a partir de bases de datos o hojas de clculos, pero no importa cun bonita, bien delineada, bien coloreada o bien presentada est una grfica, si no se han tomado en cuenta consideraciones de este tipo que tienen que ver ms sobre el objetivo de estas herramientas y la Estadstica: la transmisin eficiente de la informacin. Hay muchos tipos de grficas estadsticas. Cada una de ellas es adecuada para un estudio determinado, ya que no siempre se puede utilizar la misma para todos los casos. Tienen una estructura distinta, lo cual les permite ser utilizados para diferentes objetivos, y es que la mayora de las veces utilizan datos o variables distintos. A continuacin, se presentarn las grficas estadsticas ms utilizadas:
Histograma

Histograma de Frecuencias Un histograma es una representacin grfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. Un ejemplo es el que se presenta abajo y que representa el nmero de visitas que ha tenido este hipertexto de acuerdo a la hora de la visita. Es importante observar que resulta difcil utilizar este tipo de representacin cuando existen intervalos abiertos o cuando los intervalos no son iguales entre s. Otra observacin es la amplitud de los intervalos, que se puede establecer utilizando la regla de Sturges, pues al cambiarla la presentacin visual de un histograma puede variar. Un applet que muestra cmo el nmero de clases y su ancho pueden hacer variar fue desarrollado por Webster West de la Universidad del Sur de Carolina. Algunos de los usos ms comunes del uso de un histograma son: aumentar la calidad de alguno de nuestros procesos, pues todos sabemos que es necesario reducir al mnimo la variacin que se presente en el mismo. Es por eso, que el histograma nos permite identificar cuantas veces se repite un mismo valor, as como la frecuencia con la que se presenta. Siendo base para la toma de decisiones.
Diagrama de Barras

Diagrama o grfica de barras Un tipo de grfico muy parecido al histograma es la grfica de columnas. En este tipo de grfica, sobre los valores de las variables se levantan barras estrechas de longitudes proporcionales a las frecuencias correspondientes. Se utilizan para representar variables cualitativas y cuantitativas discretas.

Para este tipo de grfica, elaboradas con rectngulos tambin, se pide que sus bases sean del mismo ancho y sus alturas equivalentes con las frecuencias. A diferencia del histograma, no es necesario tener una escala horizontal continua, por lo que los rectngulos (o barras) no tienen que aparecer juntas entre s. Otra observacin pertinente es que se pueden representar en la misma grfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una grfica con varias series, correspondiendo cada una de ellas a cada observacin de la muestra (o poblacin), y tenindose una grfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustrados o iluminados de igual manera entre s, pero distinta de las dems. En el eje horizontal, o eje de abscisas, se representan los datos o modalidades; en el eje vertical o de ordenadas, se representan las frecuencias de cada dato o modalidad. Las frecuencias pueden ser absolutas, acumuladas relativas y relativas acumuladas. El ejemplo de la ilustracin de arriba pertenece al comportamiento de las calificaciones parciales de tres alumnos de preparatoria. Las series (cada una de las calificaciones parciales) estn coloreadas con diferente color para mostrar el comportamiento tanto individual, como comparativo.
TIPOS DE GRFICOS DE BARRAS

Grfica de barras compuestas Barra simple: se emplean para graficar hechos nicos.

Barras mltiples: es muy recomendable para comparar una serie estadstica con otra, para ello emplea barras simples de distinto color o tramado en un mismo plano cartesiano, una al lado de la otra. Barras compuestas: en este mtodo de graficacin las barras de la segunda serie se colocan encima de las barras de la primera serie en forma respectiva.

El diagrama de barras proporciona informacin comparativa principalmente y este es su uso fundamental.


Grficas de Barras Horizontales

Tambin es posible realizar grficas de barras horizontales, los cuales se parecen mucho a las grficas de columnas, con la salvedad importante de que la funcin de los

ejes se intercambia y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases. Es muy comn que este tipo de grficos se utilicen para ilustrar el tamao de una poblacin dividida en estratos como, por ejemplo, son sus edades. El ejemplo que se presenta es la poblacin de un pas ficticio llamado Timbuctulandia: A este tipo de grficos en particular se le llama pirmide de edades por su forma. Incluso, cuando se compara la poblacin masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la poblacin de un sexo y el lado derecho para el otro, el resultado es una pirmide casi simtrica (depender de la poblacin en particular).
Pirmides de poblacin.

La pirmide de poblacin es la representacin grfica de la distribucin por edad y sexo de la poblacin. Grficamente se trata de un doble histograma de frecuencias. La pirmide de edades es un histograma doble en el que se representa en la derecha la poblacin masculina y en la izquierda la poblacin femenina. En el eje de abscisas se representa los efectivos de poblacin, normalmente en porcentajes, y en el eje de ordenadas las edades. Toma el nombre de la forma que debe adoptar en las sociedades con una poblacin equilibrada, con una amplia base debido al gran nmero de nacimientos que se estrecha paulatinamente por la mortalidad creciente a medida que aumenta el intervalo de edades considerado. La pirmide de poblacin, dependiendo de su forma, puede dar una visin general de la juventud, madurez o vejez de una poblacin, y por lo tanto obtener consecuencias sociales de ello. Segn su perfil podemos distinguir tres tipos bsicos de pirmides: De poblacin expansiva: con una base ancha y una rpida reduccin a medida que ascendemos. Es propia de los pases del Tercer Mundo en plena transicin demogrfica con altas tasas de natalidad y mortalidad, y con un crecimiento natural alto. De poblacin regresiva: con una base ms estrecha que el cuerpo central y un porcentaje de ancianos relativamente grande. Se trata de una poblacin envejecida con bajas tasas de natalidad y de mortalidad, y con un crecimiento natural reducido. De poblacin estacionaria: con una notable igualdad entre las generaciones jvenes y adultas, y una reduccin importante en las ancianas. El crecimiento natural es bajo. Este tipo de pirmide es propia de las poblaciones que no presentan cohortes de la transicin demogrfica.
Grficas de Lneas

Cuando los datos se relacionan entre s, es decir, cuando podemos decir que existe cierta continuidad entre las observaciones se pueden utilizar las grficas de lneas, que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, unindose consecutivamente con lneas. Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de cinco observaciones anuales. Al igual que en el caso de las grficas de columnas (y de otras ms) es posible presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos de un individuo).
Polgono de Frecuencias

Otra forma de representacin de un uso menos comn, y muy parecida a las grficas de lneas, es el polgono de frecuencias. ste, es un grfico que se realiza a travs de la unin de los puntos ms altos de las columnas en un histograma de frecuencia (que utiliza columnas verticales para mostrar las frecuencias). La diferencia fundamental entre ambas es que en el polgono de frecuencias se aaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra despus de la ltima. El resultado es que se sujeta la lnea por ambos extremos al eje horizontal y lo que podra ser una lnea separada del eje se convierte, junto con ste, en un polgono. Los polgonos de frecuencia para datos agrupados, por su parte, se construyen a partir de la marca de clase que coincide con el punto medio de cada columna del histograma. Cuando se representan las frecuencias acumuladas de una tabla de datos agrupados, se obtiene un histograma de frecuencias acumuladas, que permite diagramar su correspondiente polgono. Se suelen utilizar cuando se desea mostrar ms de una distribucin o la clasificacin cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta en un mismo grfico. El punto con mayor altura de un polgono de frecuencia representa la mayor frecuencia, mientras que el rea bajo la curva incluye la totalidad de los datos existentes. El ejemplo de arriba corresponde al porcentaje del PIB gastado en docencia e investigacin durante el ao de 1990 en cinco pases (fuente: Revista Ciencia y Desarrollo, 1994, XIX (114):12)) Cabe recordar que la frecuencia es la repeticin menor o mayor de un suceso, o la cantidad de veces que un proceso peridico se repite por unidad de tiempo.
Pictograma

Son grficos con dibujos alusivos al carcter que se est estudiando y cuyo tamao es proporcional a las frecuencias que representan.La mayor frecuencia se identifica por la mayor acumulacin de smbolos. Los pictogramas se emplean sobre todo, para hacer

ms amigables y entendibles los informes estadsticos. Se utilizan en estadstica, en muchas ocasiones como parte de una tabla. Por ejemplo, si se quiere representar la produccin de troncos de un aserradero, se utilizan el dibujo de un tronco ancho para sealar mil troncos y un tronco pequeo para representar 500 troncos.
Diagrama de Sectores

Tambin conocido como grfica de pastel o grfico circular. Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Si el estudio estadstico tiene pocos valores distintos, suele ocurrir con los caracteres cualitativos, se puede usar un diagrama en forma de crculo dividido en tantos sectores como datos distintos haya, de modo que la frecuencia de cada valor viene dada por un trozo de rea del crculo. As, el crculo queda dividido en sectores cuya amplitud es proporcional a las frecuencias de los valores. Para obtener esta caracterstica fundamental del diagrama de sectores, en que el ngulo de cada sector es proporcional a la frecuencia absoluta correspondiente, tenemos que el ngulo se calcula de la siguiente forma: El diagrama circular se construye con la ayuda de un transportador de ngulos. Tambin puede usarse para datos cuantitativos agrupados en clases, y en tales casos, cada sector corresponde a una clase. Dada la ndole de esta representacin, slo se utiliza para distribuciones de frecuencias relativas usualmente expresadas en porcentajes.
Para qu sirve?

Expresa de manera grfica la distribucin proporcional de los eventos o datos en estudio; sin embargo, stos no deben ser ms de 7 porque el anlisis se vuelve excesivamente complejo. Cuando lo que se desea es resaltar las proporciones que representan algunos subconjuntos con respecto al total, es decir, cuando se est usando una escala categrica, conviene utilizarla. Los datos presentados comienzan a las 12 horas en el crculo y corren en el sentido de las manecillas del reloj; colocando el porcentaje mayor (la rebanada ms amplia del pastel) junto con la siguiente ms importante; y as sucesivamente, hasta la ms pequea. Apguese a esta convencin a menos que quiera ilustrar contrastes dramticos en los porcentajes, colocando los porcentajes mayores junto con los ms pequeos. Los textos necesarios pueden situarse dentro del pastel o fuera de ste (preferiblemente fuera cuando las secciones representen valores pequeos) y el color debe usarse para dar nfasis y esttica. Su principal inconveniente consiste en que requieren de mucho espacio en cada pgina. Ejemplo

Deporte Alumnos (fi) ngulo () En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 4 12 144 Baloncesto juegan al ftbol y el resto no practica 3 36 Natacin ningn deporte. 9 108 Ftbol 6 72 Sin deporte Diagrama de Dispersin Total 30 (N) 360 En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi). Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin. Un grfico de dispersin tiene dos ejes de valores y muestra un conjunto de datos numricos en el eje horizontal (eje X) y otro en el eje vertical (eje Y). Combina estos valores en puntos de datos nicos y los muestra en intervalos irregulares o agrupaciones. Los grficos de dispersin se utilizan por lo general para mostrar y comparar valores numricos, por ejemplo datos cientficos, estadsticos y de ingeniera. Se usa cuando:

Desea convertir dicho eje en una escala logartmica. Los espacios entre los valores del eje horizontal no son uniformes. Hay muchos puntos de datos en el eje horizontal. Desea mostrar similitudes entre grandes conjuntos de datos. Desea comparar muchos puntos de datos sin tener en cuenta el tiempo.
CLASIFICACIN SEGN TIPO DE CORRELACIN

1. Correlacin directa: La recta correspondiente a la nube de puntos de la distribucin es una recta creciente. 2. Correlacin inversa: La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente. 3. Correlacin nula: En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.
CLASIFICACIN SEGN GRADO DE CORRELACIN

El grado de correlacin indica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos: 1. Correlacin fuerte: La correlacin ser fuerte cuanto ms cerca estn los puntos de la recta. 2. Correlacin dbil: La correlacin ser dbil cuanto ms separados estn los puntos de la recta. 3. Correlacin nula: No existe el ms mnimo grado de correlacin entre los puntos.
Grficas de rea

Los grficos de rea destacan la magnitud del cambio en el tiempo y se pueden utilizar para llamar la atencin hacia el valor total en una tendencia. Por ejemplo, se

pueden trazar los datos que representan el beneficio en el tiempo en un grfico de rea para destacar el beneficio total. Al mostrar la suma de los valores trazados, un grfico de rea tambin muestra la relacin de las partes con un todo. Los grficos de rea tienen los siguientes subtipos de grfico:

reas en 2D y 3D Tanto si se presentan en 2D como en 3D, los grficos de reas muestran la tendencia de los valores en el tiempo u otros datos de categora. Como norma, considere la posibilidad de utilizar un grfico de lneas en lugar de un grfico de reas no apilado, ya que los datos de una serie pueden quedar ocultos por los de otra. reas apiladas y reas 100% apiladas: Los grficos de reas apiladas muestran la tendencia de la contribucin de cada valor a lo largo del tiempo u otros datos de categora. Las grficas se pueden proyectar en perspectiva 3D.

Otros grficos

Existen muchos otros grficos, que en este trabajo no abordaremos de manera profunda debido a que son poco comunes; principalmente, se trata de grficas estadsticas utilizadas en ciencias o actividades muy especficas y muchas veces se requiere de un conocimiento avanzado para su realizacin. Como ejemplo, vale la pena mencionar:
Grficos de superficie

Un grfico de superficie es til cuando busca combinaciones ptimas entre dos conjuntos de datos. Como en un mapa topogrfico, los colores y las tramas indican reas que estn en el mismo rango de valores. Puede utilizar un grfico de superficie cuando ambas categoras y series de datos sean valores numricos.
Grficos de anillos

En un grfico de anillos se pueden representar datos organizados nicamente en columnas o en filas de una tabla de datos estadsticos. Un grfico de anillos muestra la relacin de las partes con un todo pero puede contener ms de una serie de datos; no son fciles de leer. Es conveniente utilizar un grfico de columnas apiladas o un grfico de barras apiladas en su lugar.
Grficas Radiales

Los datos organizados en columnas o filas en una hoja de clculo se pueden representar en un grfico radial. Los grficos radiales comparan los valores agregados de varias series de datos y muestran cambios en valores relativos a un punto central.
Fuentes del subtema 1.9 [34 - 50]

Glosario

Al Azar o Aleatorio: Son todos aquellos eventos fortuitos o productos de la suerte. Aleatoriamente: Actividades o mtodos producidos o llevados a cabo simulando un comportamiento al azar. Clase: Subdivisin de escala de datos. Correlacin: Cuando dos fenmenos sociales, fsicos o biolgicos crecen o decrecen de forma simultnea y proporcional debido a factores externos, se dice que los fenmenos estn positivamente correlacionados. Si uno crece en la misma proporcin que el otro decrece, los dos fenmenos estn negativamente correlacionados. El grado de correlacin se calcula aplicando un coeficiente de correlacin a los datos de ambos fenmenos. Datos: Son los valores cualitativos o cuantitativos mediante los cuales se miden las caractersticas de los objetos, o fenmenos a estudiar. Dispersin: La extensin o variabilidad de un conjunto de datos. Estadstica: Rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones. Evento: Uno o ms de los resultados posibles de hacer algo, o uno de los resultados posibles de realizar un experimento Frecuencia: Nmero de veces en que se repite un dato. Frecuencia Acumulada: Es el nmero de estudiantes con calificaciones iguales o menores que el rango de cada intervalo sucesivo. Frecuencia absoluta: Es el nmero de veces que ocurre un cierto suceso, en la proporcin de veces que ocurre dicho suceso con relacin al nmero de veces que podra haber ocurrido. Frecuencia Relativa: Es la proporcin entre la frecuencia de un intervalo y el nmero total de datos. Intervalo de Clase: Pequea seccin de la escala segn la cual se agrupan las puntuaciones de una distribucin de frecuencia. Tamao o rango de la Clase. Lmites del Intervalo: Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase. Muestra estadstica: es un subconjunto de casos o individuos de una poblacin estadstica.

Muestreo aleatorio simple: Mtodos de seleccin de muestras que permiten a cada muestra posible una probabilidad igual de ser elegida y a cada elemento de la poblacin una oportunidad igual de ser incluidos en la muestra. Muestreo aleatorio: Las tcnicas de muestreo aleatorio aseguran que cada elemento en la poblacin de inters tenga una probabilidad (no nula) de ser incluido en la muestra. Porcentaje: Es la proporcin de una cantidad de datos especficos, con respecto al total de esos datos. Poblacin estadstica: tambin llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan las observaciones. Rango: Situacin de un dato respecto de una distribucin. Regresin: Proceso general que consiste en predecir una variable a partir de otra mediante medios estadsticos, utilizando datos anteriores. Tablas de Frecuencias: Tabla que muestra el nmero de veces que en un conjunto de datos aparece cada una de las clases de inters especificadas en el recorrido de los datos Tamao de la Muestra: Es la cantidad de datos que sern extrados de la poblacin para formar parte de la muestra. Variable: Propiedad o rasgo de un hecho u objeto (no constante) por la que puede ser caracterizado o clasificado. Representacin de una caracterstica, de un tributo, que posee alguna realidad. Variable dependiente: La variable que tratamos de predecir en el anlisis de regresin. Variables independientes: Variables (s) conocida(s) en el anlisis de regresin. Varianza: Desviacin cuadrada media de todos los valores de la media.
Fuentes del Glosario [51] y [52]

Fuentes de Informacin [1] http://www.gestiopolis.com/recursos/experto/catsexp/pagans/eco/21/estadistica.htm [2] http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm [3] http://www.eumed.net/cursecon/libreria/drm/1a.htm [4] http://es.wikipedia.org/wiki/Estadstica#Origen [5] http://www.galeon.com/estadisticautil/quees.htm [6] Estadstica. Microsoft Encarta 2009 [DVD]. Microsoft Corporation, 2008.

[7] http://www.uv.mx/cienciahombre/revistae/vol18num2/articulos/historia/index.htm [8] http://www.monografias.com/trabajos10/esta/esta.shtml#apli [9] http://web.cortland.edu/flteach/stats/stat-sp.html [10] http://html.rincondelvago.com/estadistica_38.html [11] http://www.monografias.com/trabajos27/muestreo-estadistico/muestreoestadistico.shtml [12] http://www.vitutor.com/estadistica/descriptiva/a_1.html [13] http://www.hrc.es/bioest/estadis_1.html [14] http://www.eumed.net/cursecon/libreria/drm/0.htm [15] http://www.monografias.com/trabajos19/la-estadistica/la-estadistica.shtml [16] http://estadisticadescriptiva1.blogspot.com/2009/09/division-de-la-estadistica.html [17] http://sitios.ingenieriausac.edu.gt/estadistica/estadistica2/estadisticadescriptiva.html [18] http://www.estadisticaparatodos.com/index_archivos/page0003.htm [19] http://www.noparametricas.com/archivos/servicios/analisise.html [20] http://es.wikipedia.org/wiki/Estadstica_multivariante [21] http://www.gestiopolis.com/canales7/fin/matematicas-aplicacion-de-estadisticasmultivariables-e-indicadores-financieros.htm [22] http://www.mitecnologico.com/Main/PoblacionEnEstadistica [23] http://es.wikipedia.org/wiki/Poblacin_estadstica [24] http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html [25] Muestra de poblacin. Microsoft Encarta 2009 [DVD]. Microsoft Corporation, 2008. [26] http://html.rincondelvago.com/conceptos-y-muestreo.html [27] http://www.fisterra.com/mbe/investiga/10descriptiva/10descriptiva.asp [28] http://www.vitutor.com/estadistica/descriptiva/a_2.html

[29] http://recursostic.educacion.es/descartes/web/materiales_didacticos/iniciacion_estadistis tica_fjgarcia/01VariablesEstadisticas.htm [30] http://es.wikipedia.org/wiki/Variable_estadstica [31] http://www.monografias.com/trabajos73/estadistica-descriptiva/estadisticadescriptiva2.shtml [32] http://www.bioestadistica.uma.es/libro/node7.htm [33] http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-upunt12.html#seccion2 [34] http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/grficas_estads ticas.html [35] http://www.uaq.mx/matematicas/estadisticas/xu3.html [36] http://www.vitutor.net/2/11/graficas_estadistica.html [37] http://www.vitutor.com/estadistica/descriptiva/a_6.html [38] Grficas estadsticas. Microsoft Encarta 2009 [DVD]. Microsoft Corporation, 2008. [39] http://mx.kalipedia.com/glosario/diagrama-barras.html?x=1487 [40] http://www.monografias.com/trabajos11/estadi/estadi.shtml [41] http://definicion.de/poligono-de-frecuencia/ [42] http://www.vitutor.com/estadistica/descriptiva/a_5.html [43] http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica/diagrama_de_ sectores.html [44] http://www.ematematicas.net/estadistica/graficas/index.php?tipo=sectores [45] http://dieumsnh.qfb.umich.mx/estadistica/graficas.htm [46] http://www.ematematicas.net/estadistica/graficas/index.php?tipo=picto [47] http://www.conevyt.org.mx/cursos/enciclope/prob_inf_graf.html#pictograma [48] http://www.dgplades.salud.gob.mx/descargas/dhg/GRAFICA_PASTEL.pdf

[49] http://office.microsoft.com/es-es/excel-help/tipos-de-graficos-disponiblesHA001233737.aspx#BMareacharts [50] http://enciclopedia.us.es/index.php/Pir%C3%A1mide_de_poblaci%C3%B3n [51] http://web.cortland.edu/flteach/stats/glos-sp.html [52] http://es.scribd.com/doc/8050872/GLOSARIO-ESTADISTICO

You might also like