You are on page 1of 22

Notas sobre Estadstica Descriptiva

Introduccin
Existen diferentes razones por las cuales los profesionales de las ciencias de la
salud deben conocer los fundamentos de la epidemiologa y la estadstica como
instrumentos del trabajo cotidiano. Entre dichas razones sealamos las siguientes:
los trminos estadsticos y epidemiolgicos invaden la literatura mdica, la
medicina es cada vez ms cuantitativa, su conocimiento nos permitir leer la
bibliografa mdica con ms capacidad crtica para detectar errores potenciales y
falacias. Nos ser tambin til para llegar a conclusiones correctas acerca de
procedimientos para el diagnstico y del resultado de las pruebas. Su
conocimiento nos permitir a su vez valorar protocolos de estudio e informes
remitidos para su publicacin y participar, en definitiva, en la investigacin mdica.
Resulta imprescindible, por lo tanto, conocer los conceptos bsicos de estadstica
que nos faciliten la realizacin de estudios y conocer las posibilidades a desarrollar
con ayuda de profesionales estadsticos para mejorar dicho anlisis.

Poblacin y muestra
Cuando se realiza un estudio de investigacin, se pretende generalmente inferir o
generalizar resultados de una muestra a una poblacin. Se estudia en particular a
un reducido nmero de individuos a los que tenemos acceso con la idea de poder
generalizar los hallazgos a la poblacin de la cual esa muestra procede. Este
proceso de inferencia se efecta por medio de mtodos estadsticos basados en la
probabilidad.
La poblacin representa el conjunto grande de individuos que deseamos estudiar y
generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogneo que
rene unas caractersticas determinadas.
La muestra es el conjunto menor de individuos (subconjunto de la poblacin
accesible y limitado sobre el que realizamos las mediciones o el experimento con
la idea de obtener conclusiones generalizables a la poblacin). El individuo es
cada uno de los componentes de la poblacin y la muestra. La muestra debe ser
representativa de la poblacin y con ello queremos decir que cualquier individuo
de la poblacin en estudio debe haber tenido la misma probabilidad de ser elegido.

Las razones para estudiar muestras en lugar de poblaciones son diversas y entre
ellas podemos sealar
a. Ahorrar tiempo. Estudiar a menos individuos es evidente que
lleva menos tiempo.
b. Como consecuencia del punto anterior ahorraremos costes.
c. Estudiar la totalidad de los pacientes o personas con una
caracterstica determinada en muchas ocasiones puede ser
una tarea inaccesible o imposible de realizar.
d. Aumentar la calidad del estudio. Al disponer de ms tiempo y
recursos, las observaciones y mediciones realizadas a un
reducido nmero de individuos pueden ser ms exactas y
plurales que si las tuvisemos que realizar a una poblacin.
e. La seleccin de muestras especficas nos permitir reducir la
heterogeneidad de una poblacin al indicar los criterios de
inclusin y/o exclusin.

Tipos de datos
Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo,
peso, talla, tensin arterial sistlica, etctera). Los datos son los valores que toma
la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar
valores a las variables incluidas en el estudio. Deberemos adems concretar la
escala de medida que aplicaremos a cada variable.
La naturaleza de las observaciones ser de gran importancia a la hora de elegir el
mtodo estadstico ms apropiado para abordar su anlisis. Con este fin,
clasificaremos las variables, a grandes rasgos, en dos tipos: variables cuantitativas
o variables cualitativas.
a. Variables cuantitativas. Son las variables que pueden medirse,
cuantificarse o expresarse numricamente. Las variables cuantitativas
pueden ser de dos tipos:
Variables cuantitativas continuas, si admiten tomar
cualquier valor dentro de un rango numrico
determinado (edad, peso, talla).
Variables cuantitativas discretas, si no admiten todos
los valores intermedios en un rango. Suelen tomar

solamente valores enteros (nmero de hijos, nmero de


partos, nmero de hermanos, etc).

b. Variables cualitativas. Este tipo de variables representan una


cualidad o atributo que clasifica a cada caso en una de varias
categoras. La situacin ms sencilla es aquella en la que se clasifica
cada caso en uno de dos grupos (hombre/mujer, enfermo/sano,
fumador/no fumador). Son datos dicotmicos o binarios. Como resulta
obvio, en muchas ocasiones este tipo de clasificacin no es suficiente y
se requiere de un mayor nmero de categoras (color de los ojos, grupo
sanguneo, profesin, etctera).
En el proceso de medicin de estas variables, se pueden utilizar dos
escalas:

Escalas nominales: sta es una forma de observar o


medir en la que los datos se ajustan por categoras que
no mantienen una relacin de orden entre s (color de
los ojos, sexo, profesin, presencia o ausencia de un
factor de riesgo o enfermedad, etctera).
Escalas ordinales: en las escalas utilizadas, existe un
cierto orden o jerarqua entre las categoras (grados de
disnea, estadiaje de un tumor, etctera).

Descripcin de los datos en funcin de un valor


Una vez que se han recogido los valores que toman las variables de nuestro
estudio (datos), procederemos al anlisis descriptivo de los mismos. Para
variables categricas, como el gnero se quiere conocer el nmero de casos en
cada una de las categoras, reflejando habitualmente el porcentaje que
representan del total, y expresndolo en una tabla de frecuencias.
Para variables numricas, en las que puede haber un gran nmero de valores
observados distintos, se ha de optar por un mtodo de anlisis distinto,
respondiendo a las siguientes preguntas:
a. Alrededor de qu valor se agrupan los datos?
b. Supuesto que se agrupan alrededor de un nmero, cmo lo
hacen? muy concentrados? muy dispersos?

a. Medidas de tendencia central


Las medidas de centralizacin vienen a responder a la primera pregunta. La
medida ms evidente que podemos calcular para describir un conjunto de
observaciones numricas es su valor medio. La media no es ms que la suma de
todos los valores de una variable dividida entre el nmero total de datos de los que
se dispone.
Como ejemplo, consideremos 10 pacientes de edades 21 aos, 32, 15, 59, 60, 61,
64, 60, 71, y 80. La media de edad de estos sujetos ser de:

Ms formalmente, si denotamos por (X1, X2,...,Xn) los n datos que tenemos


recogidos de la variable en cuestin, el valor medio vendr dado por:

Otra medida de tendencia central que se utiliza habitualmente es la mediana. Es


la observacin equidistante de los extremos.
La mediana del ejemplo anterior sera el valor que deja a la mitad de los datos por
encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de
mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones es par (10
individuos), los dos valores que se encuentran en el medio son 60 y 60. Si
realizamos el clculo de la media de estos dos valores nos dar a su vez 60, que
es el valor de la mediana.
Si la media y la mediana son iguales, la distribucin de la variable es simtrica. La
media es muy sensible a la variacin de las puntuaciones. Sin embargo, la
mediana es menos sensible a dichos cambios.
Por ltimo, otra medida de tendencia central, no tan usual como las anteriores, es
la moda, siendo ste el valor de la variable que presenta una mayor frecuencia.
En el ejemplo anterior el valor que ms se repite es 60, que es la moda.

b. Medidas de dispersin
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos
continuos es la dispersin de los mismos. Existen distintas formas de cuantificar
esa variabilidad. De todas ellas, la varianza (S2) de los datos es la ms utilizada.
Es la media de los cuadrados de las diferencias entre cada valor de la variable y la
media aritmtica de la distribucin.

Esta varianza muestral se obtiene como la suma de las de las diferencias de


cuadrados y por tanto tiene como unidades de medida el cuadrado de las
unidades de medida en que se mide la variable estudiada.

En el ejemplo anterior la varianza sera:


Sx2=

La desviacin tpica (S) es la raz cuadrada de la varianza. Expresa la dispersin


de la distribucin y se expresa en las mismas unidades de medida de la variable.
La desviacin tpica es la medida de dispersin ms utilizada en estadstica.

Aunque esta frmula de la desviacin tpica muestral es correcta, en la prctica, la


estadstica nos interesa para realizar inferencias poblacionales, por lo que en el
denominador se utiliza, en lugar de n, el valor n-1.
Por tanto, la medida que se utiliza es la desviacin tpica muestral, dada por:

Aunque en muchos contextos se utiliza el trmino de desviacin tpica para


referirse a ambas expresiones.
En los clculos del ejercicio previo, la desviacin tpica muestral, que tiene como
denominador n, el valor sera 20.678. A efectos de clculo lo haremos como n-1 y
el resultado seria 21,79.
El haber cambiado el denominador de n por n-1 est en relacin al hecho de que
esta segunda frmula es una estimacin ms precisa de la desviacin estndar
verdadera de la poblacin y posee las propiedades que necesitamos para realizar
inferencias a la poblacin.

Cuando se quieren sealar valores extremos en una distribucin de datos, se


suele utilizar la amplitud como medida de dispersin. La amplitud es la diferencia
entre el valor mayor y el menor de la distribucin.
Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65.
Como medidas de variabilidad ms importantes, conviene destacar algunas
caractersticas de la varianza y desviacin tpica:

Son ndices que describen la variabilidad o dispersin y por


tanto cuando los datos estn muy alejados de la media, el
numerador de sus frmulas ser grande y la varianza y la
desviacin tpica lo sern.
Al aumentar el tamao de la muestra, disminuye la varianza y
la desviacin tpica. Para reducir a la mitad la desviacin tpica,
la muestra se tiene que multiplicar por 4.
Cuando todos los datos de la distribucin son iguales, la
varianza y la desviacin tpica son iguales a 0.
Para su clculo se utilizan todos los datos de la distribucin;
por tanto, cualquier cambio de valor ser detectado.

Otra medida que se suele utilizar es el coeficiente de variacin (CV). Es una


medida de dispersin relativa de los datos y se calcula dividiendo la desviacin
tpica muestral por la media y multiplicando el cociente por 100. Su utilidad estriba
en que nos permite comparar la dispersin o variabilidad de dos o ms grupos. As,
por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya
media es de 69,6 kg. y su desviacin tpica (s) = 10,44 y la TAS de los mismos
(150, 170, 135, 180 y 195 mmHg) cuya media es de 166 mmHg y su desviacin
tpica de 21,3. La pregunta sera: qu distribucin es ms dispersa, el peso o la
tensin arterial? Si comparamos las desviaciones tpicas observamos que la
desviacin tpica de la tensin arterial es mucho mayor; sin embargo, no podemos
comparar dos variables que tienen escalas de medidas diferentes, por lo que
calculamos los coeficientes de variacin:

CV de la variable peso =

CV de la variable TAS =

A la vista de los resultados, observamos que la variable peso tiene mayor


dispersin.
Cuando los datos se distribuyen de forma simtrica (y ya hemos dicho que esto
ocurre cuando los valores de su media y mediana estn prximos), se usan para
describir esa variable su media y desviacin tpica. En el caso de distribuciones
asimtricas, la mediana y la amplitud son medidas ms adecuadas. En este caso,
se suelen utilizar adems los cuartiles y percentiles.
Los cuartiles y percentiles no son medidas de tendencia central sino medidas de
posicin. El percentil es el valor de la variable que indica el porcentaje de una
distribucin que es igual o menor a esa cifra.
As, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por
debajo de s al 80% del total de las puntuaciones. Los cuartiles son los valores de
la variable que dejan por debajo de s el 25%, 50% y el 75% del total de las
puntuaciones y as tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el
tercer cuartil (Q3).

Representacin grfica
Gran parte de la utilidad que tiene la Estadstica Descriptiva es la de proporcionar
un medio para informar basado en los datos recopilados. La eficacia con que se
pueda realizar tal proceso de informacin depender de la presentacin de los
datos, siendo la forma grfica uno de los ms rpidos y eficientes, aunque tambin
uno de los que ms pueden ser manipulados o ser malinterpretados si no se
tienen algunas precauciones bsicas al realizar las grficas. Existen tambin
varios tipos de grficas, o representaciones grficas, utilizndose cada uno de
ellos de acuerdo al tipo de informacin que se est usando y los objetivos que se
persiguen al presentar la informacin.
Entonces, mencionaremos algunas consideraciones que conviene tomar en
cuenta al momento de realizar cualquier grfica a fin de que la informacin sea
transmitida de la manera ms eficaz posible y sin distorsiones:
1. El eje que represente a las frecuencias de las observaciones (comnmente
el vertical o de las ordenadas) debe comenzar en cero (0), de otra manera
podra dar impresiones errneas al comparar la altura, longitud o posicin
de las columnas, barras o lneas que representan las frecuencias.
2. La longitud de los espacios que representan a cada dato o intervalo (clase)
en la grfica deben ser iguales.
3. El tipo de grfico debe coincidir por sus caractersticas con el tipo de
informacin o el objetivo que se persigue al representarla, de otra manera la
representacin grfica se convierte en un instrumento ineficaz, que produce
ms confusin que otra cosa, innecesario o productor de
malinterpretaciones. Por ejemplo, si se desea representar la proporcin de
poblacin masculina en un pas conviene ms usar una grfica de pastel o
circular que una grfica de barras al compararla contra la poblacin
femenina; por un lado se puede apreciar dicha proporcin, por el otro se
aprecia cul de las dos poblaciones es mayor.
Hay un punto que conviene remarcar: existe software que permite la construccin
rpida y eficiente de grficas a partir de bases de datos o hojas de clculos, pero
no importa cun bonita, bien delineada, bien coloreada o bien presentada est una
grfica, si no se han tomado en cuenta consideraciones de este tipo que tienen
que ver ms sobre el objetivo de estas herramientas y la Estadstica: la
transmisin eficiente de la informacin.

Tipos de grficos
Para las distribuciones de frecuencias la representacin grfica ms comn es el
histograma. Un ejemplo es el que se presenta a continuacin y que representa el
nmero de "visitas" que ha tenido este hipertexto de acuerdo a la hora de la visita.

En el eje horizontal (o de las abscisas) se representan los intervalos de los datos,


marcndose de manera continua las fronteras entre cada uno de los stos. De
esta manera, el histograma est compuesto rectngulos, cuyo nmero coincide
con la cantidad de intervalos considerados, el ancho de la base de cada uno de
esos rectngulos es la misma siempre y coincide con las fronteras de los
intervalos, y la altura corresponde a la frecuencia de cada intervalo.
Es importante observar que resulta difcil utilizar este tipo de representacin
cuando existen intervalos abiertos o cuando los intervalos no son iguales entre s.
Otra observacin es la amplitud de los intervalos, que se puede establecer
utilizando la regla de Sturges, pues al cambiarla la presentacin visual de un
histograma puede variar.

El programa Excel no permite crear de manera automtica histogramas, pues


proporciona el ancho de las columnas de tal manera que quedan separadas. Para
ello disponemos de software estadstico.

Un tipo de grfico muy parecido al histograma es la grfica de columnas. Para


este tipo de grfica, elaboradas con rectngulos tambin, se pide que sus bases
sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este
tipo, a diferencia del histograma, no es necesario tener una escala horizontal
continua, por lo que los rectngulos (o barras) no tienen que aparecer juntas entre
s.
Otra observacin pertinente es que se pueden representar en la misma grfica,
utilizando las mismas escalas horizontales y verticales, varios datos
correspondientes a las mismas variables producto de varias observaciones. Esto
produce una grfica con varias series, correspondiendo cada una de ellas a cada
observacin de la muestra (o poblacin), y tenindose una grfica compuesta. Es
conveniente que cada serie de datos (u observaciones) sean ilustradas o
iluminadas de igual manera entre s, pero distinta de las dems.
El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales
de tres alumnos de preparatoria. Las series (cada una de las calificaciones
parciales) estn coloreadas con diferente color para mostrar el comportamiento
tanto individual, como de cada uno de los alumnos con respecto a los dems. Es
interesante observar que la escala horizontal no es continua (es nominal).

Existe la posibilidad, y si los recursos lo permiten, de representar grficos


compuestos de una manera "tridimensional", es decir, con grficos que posean no
slo dos ejes, sino tres; y en los que los rectngulos son sustituidos por prismas
de base rectangular (ocasionalmente el software en el mercado permite utilizar
prismas cuya base son polgonos regulares de ms de cuatro lados, pirmides o
cilindros). Un ejemplo es el siguiente:

donde se representa el porcentaje del PIB gastado en docencia e investigacin por


cinco pases en el lapso de 1988 a 1999 (fuente: Revista "Ciencia y Desarrollo",
1994, XIX(114):12). Es importante considerar que este tipo de grficos puede
complicarse mucho, haciendo que la informacin sea menos legible.

Tambin es posible realizar grficas de barras horizontales, los cuales se


parecen mucho a las grficas de columnas, con la salvedad importante de que la
funcin de los ejes se intercambia y el eje horizontal queda destinado a las
frecuencias y el eje vertical a las clases.

Es muy comn que este tipo de grficos se utilicen para ilustrar el tamao de una
poblacin dividida en estratos como, por ejemplo, son sus edades. El ejemplo que
se presenta es la poblacin de un pas ficticio llamado "Timbuctulandia":

A este tipo de grficos en particular se le llama pirmide de edades por su forma.


Incluso, cuando se compara la poblacin masculina y femenina por estratos de
edades, se estila utiliza el lado izquierdo para la poblacin de un sexo y el lado
derecho para el otro, el resultado es una "pirmide" casi simtrica (depender de
la poblacin en particular).

Cuando los datos se relacionan entre s, es decir, cuando podemos decir que
existe cierta continuidad entre las observaciones (como por ejemplo el crecimiento
poblacional, la evolucin del peso o estatura de una persona a travs del tiempo,
el desempeo acadmico de un estudiante a lo largo de su instruccin escolar, las
variaciones presentadas en la medicin realizada en algn experimento cada
segundo o minuto) se pueden utilizar las grficas de lneas, que consisten en una
serie de puntos trazados en las intersecciones de las marcas de clase y las
frecuencias de cada una, unindose consecutivamente con lneas:

Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos
individuos a lo largo de cinco observaciones anuales. Al igual que en el caso de
las grficas de columnas (y de otras ms) es posible presentar varias series de
observaciones (en este caso cada serie de observaciones son los pesos de un
individuo).

Otra forma de representacin de un uso menos comn, y muy parecida a las


grficas de lneas, es el polgono de frecuencias. La diferencia fundamental
entre ambas es que en el polgono de frecuencias se aaden dos clases con
frecuencias cero: una antes de la primera clase con datos y otra despus de la
ltima. El resultado es que se "sujeta" la lnea por ambos extremos al eje
horizontal y lo que podra ser una lnea separada del eje se convierte, junto con
ste, en un polgono.
El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e
investigacin durante el ao de 1990 en cinco pases (fuente: Revista "Ciencia y
Desarrollo", 1994, XIX(114):12):

Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de


aplicar parcialmente la misma tcnica a una distribucin acumulativa y de igual
manera que stas, existen las ojivas mayor que y las ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polgonos de
frecuencias (y por esto la aplicacin de la tcnica es parcial):
1. Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor
que sucede con el extremo izquierdo; para la ojiva menor que, con el
derecho.
2. En el eje horizontal en lugar de colocar las marcas de clase se colocan las
fronteras de clase. Para el caso de la ojiva mayor que es la frontera menor;
para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la
menor que, utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el


punto que est sobre la frontera de clase "4:00" se ven las visitas que se
realizaron en una hora mayor que las 4:00 horas (en cuestiones temporales se
dira: despus de las 4:00 horas). De forma anloga, en la ojiva menor que la
frecuencia que se representa en cada frontera de clase son el nmero de
observaciones menores que la frontera sealada (en caso de tiempos sera el
nmero de observaciones antes de la hora que seala la frontera).
Si se utiliza una distribucin porcentual acumulativa entonces se obtiene una ojiva
(mayor que o menor que segn sea el caso) cuyo eje vertical tiene una escala que
va del 0% al 100%. El siguiente ejemplo es la misma ojiva menor que que se
acaba de usar, pero con una distribucin porcentual:

En ocasiones, al comparar dos series de observaciones (o de datos) se utiliza una


llamada grfica de reas, la cual consiste en rellenas el rea que se encuentre
debajo de las lneas que resultan de una grfica de lneas.
El ejemplo que se presenta es la comparacin del total de las especies de las
familias del orden Carnivora y las que estn amenazadas, en Mxico, (fuente:
Revista "Ciencia y Desarrollo", 1994, XIX(114):58):

Cuando lo que se desea es resaltar las proporciones que representan algunos


subconjuntos con respecto al total, es decir, cuando se est usando una escala
categrica, conviene utilizar una grfica llamada de pastel o circular.
Por ejemplo, para ilustrar la matrcula en licenciatura (en Mxico) por reas de
conocimiento en el ao de 1992 se puede usar algo as como sigue (Fuente:
ANUIES,1995):

De hecho, si se desea resaltar una de las categoras que se presentan, es vlido


tomar esa "rebanada" de la grfica y separarla de las dems:

Hay que tomar algunas precauciones al utilizar este tipo de grficos. Por un lado,
comparar dos grficos circulares (por ejemplo, si se quisieran comparar las
proporciones de matrculas en licenciatura por reas de conocimiento en
licenciatura para dos aos distintos) resulta muy difcil y, por tanto, no es muy
aconsejable.
Por otro lado, en ocasiones existen categoras con pocas frecuencias (por ejemplo,
dos o tres con frecuencias relativas menores al 1% cada una), haciendo que la
grfica resulte "pesada" y las etiquetas se encimen. Una posible solucin es
juntarlas en una sola categora (por ejemplo, la tpica "otras" o "varias"), pero
entonces habra que ponderar si se hace una grfica extra con dichas
observaciones nicamente, haciendo la anotacin pertinente, o simplemente se
ignoran por no resultar significativas.

Actualmente, y mucho en los medios masivos de comunicacin, se utilizan


grficos para ilustrar los datos o los resultados de alguna investigacin.
Regularmente se utilizan dibujos para representar dicha informacin, y el tamao o
el nmero de estos dibujos dentro de una grfica queda determinado por la
frecuencia correspondiente. A este tipo de grfica se le llama pictograma y stos
son dos ejemplos:

El de la izquierda representa la poblacin de los Estados Unidos (cada hombrecillo


representa a dos millones de habitantes), el de la derecha representa la masa de
tres planetas de nuestro sistema solar tomando como unidad a la masa de la
Tierra (cada representa la masa de nuestro planeta: Venus tiene masa menor y
Neptuno tiene ms 17 veces ms masa que la Tierra).
Las versiones del Excel 7.0 y anteriores no tienen opciones para realizar este tipo
de grficas, las posteriores s. Otros programas contemporneos (como el Corel
Draw o el StatGraphics) s son capaces.

Cuando se pretende ilustrar la dispersin de las observaciones realizadas, y as


trabajar algunas cosas como correlaciones se puede utilizar una grfica de
dispersin. Por ejemplo, el ejemplo de la izquierda es la dispersin que se
presenta al comparar el nmero de tesis doctorales en ciencias exactas contra el
nmero de total de tesis doctorales (todo en Mxico) en observaciones anuales
entre 1984 y 1990 (fuente: Revista "Ciencia y Desarrollo", 1994, XIX(114):12):

La grfica de la derecha es resultado de comparar el dimetro (en miles de


kilmetros) de los planetas interiores del nuestro sistema solar contra sus
densidades (en gramos por centmetro cbico). Es interesante observar que los
puntos parecen "seguir" una lnea imaginaria que se asemeja a una recta, con
excepcin de un caso atpico: Mercurio.

Uno de los usos de este tipo de grficas es precisamente encontrar si las


observaciones siguen algn patrn lineal (una lnea de tendencia) o si existen
valores atpicos.
Un tipo de grfico similar a las grficas de dispersin son las grficas de
burbujas, en las cuales se presenta la dispersin de las observaciones de la
misma forma que aqullas, pero se le aade la posibilidad de visualizar otra
variable representada en el tamao del punto, pues stos se convierten en
crculos (burbujas) con radios proporcionales a las magnitudes que representan.

Este ejemplo compara la distancia


que existe en cada uno de los
planetas interiores de nuestro
sistema solar al Sol contra el tiempo
que necesitan para recorrer sus
rbitas, y el tamao de las burbujas
indica la masa de cada planeta.
Adems existen otros tipos de
grficos,
cada
uno
con
caractersticas particulares que les
proporcionan cierta intencionalidad
para su uso, como son las grficas
de radar y las grficas polares.

Bibliografa
1. Canavos, G.(1992): PROBABILIDAD Y ESTADSTICA, Editorial McGraw-Hill.
2. Pea, D. (1988): Estadstica, Modelos y Mtodos, 1. Fundamentos.
Editorial Alianza Universidad Textos.
3. Novales, A. (1996): ESTADSTICA Y ECONOMETRA. Editorial McGraw-Hill.
4. Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud.
Madrid: Interamericana McGraw Hill; 2001.
5. Casas Snchez, J.M., y otros (1998): PROBLEMAS DE ESTADSTICA.
DESCRIPTIVA, PROBABILIDAD E INFERENCIA. Editorial Pirmide.

You might also like