Professional Documents
Culture Documents
Qu es la Estadstica?
Despus de haber conocido el origen y desarrollo de la Estadstica como ciencia as como su influencia y
aplicaciones en la sociedad actual, toca turno de definir y comprender qu es la Estadstica.
Si bien, existen diversas definiciones acerca de esta ciencia, considero preciso el comenzar por aclarar
elorigen etimolgico, a pesar de que como ya vimos, fue Godofredo Achenwall quien en 1760,
acu la palabra Estadstica.
As pues, Estadstica proviene del trmino alemn Statistik que se traduce como La ciencia
del Estado, por lo que designaba originalmente el anlisis de datos del Estado. En el siglo
XIX cuando el militar britnico Sir John Sinclair (1754-1835) introdujo al trmino estadstica el
significado de recolectar y clasificar datos. Tambin se sabe proviene del latn statisticum
collegium (consejo de Estado) y su derivado italiano statista (hombre de Estado o
poltico).
Ahora bien, despus de haber dado a conocer el significado etimolgico, es preciso el saber cul es la
definicin conceptual del trmino en cuestin. Para ello, he decidido tomar la definicin que el autor Ignacio
M. Lizrraga Gaudry hace respecto a esta ciencia, pues la considero una respuesta completa y concreta
para definirla de manera generalizada. Entonces, el seor Lizrraga considera la Estadstica como:
La rama de
las matemticas que recopila, organiza, analiza e interpreta losdatos obtenidos
un problema
estadstico,
para
obtener conocimiento de
loshechos
de
pasados,
1.
Es una rama de las matemticas que se ocupa de reunir, organizar y analizar datos
numricos y que ayuda a resolver problemas como el diseo de experimentos y la toma
de decisiones.
2.
[6]
3.
[12]
4.
[13]
5.
[14]
6.
Es la ciencia que tiene por objeto el estudio cuantitativo de los colectivos. Enrique
Chacn [14]
7. La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para
medir su intensidad, deducir las leyes que los rigen y hacer su prediccin prxima.
scar Vzquez Mnguez [14]
Ahora bien, en cuanto a la Estadstica Descriptiva, especficamente hablando, podemos definirla como
la
ciencia
la totalidad de
individuos
de
una poblacin.
La Estadstica se puede clasificar en funcin de su etapa o funcin, del tiempo considerado o del
nmero de variables estudiadas.
La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran
cantidad
de datos obtenidos
de
comopropsito la descripcin
la
realidad,
del
inferir
conjunto
conclusiones
de
datos
respecto
de
colectados,
ellos.
Tiene
as
como
la generalizacin y/o toma de decisiones acerca de las caractersticas de todas las observaciones
potenciales bajo consideracin. En consecuencia nos permite organizar y resumir datos para poder
realizar inferencias (conclusiones) relativas a los mismos. Para su mejor estudio se han creado varias formas
de clasificar los estudios estadsticos. Algunas de las ms comunes son las siguientes:
inferencial. La primera
la
muestra, y la segunda etapa infiere conclusiones a partir de los datos que describen la muestra
(por ejemplo con respecto a la poblacin). A continuacin, se dar paso a describir brevemente, cada etapa.
refiere
una
coleccin de datos, esencialmente consiste en resumir stos con uno o dos elementos de informacin
(medidas descriptivas) que caracterizan la totalidad de los mismos.
La Estadstica Descriptiva recolecta, describe, analiza, interpreta y presenta los datos de una poblacin
en forma de tablas y grficas
Consiste sobre todo en lapresentacin de datos en forma detablas y grficas; as que se emplea
simplemente para resumir de forma numrica o grfica un conjunto de datos. Esta comprende cualquier
actividad relacionada con los datos y est diseada para resumir o describir los mismos sin factores
pertinentes adicionales; esto es, sin intentar inferir nada que vaya ms all de los datos, como tales.
La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre s
mismos
y no
sobrepasan
el
conocimiento
proporcionado por
stos.
Puede
utilizarse
para resumir o describir cualquier conjunto ya sea que se trate de una poblacin o de
una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de una
muestra.
As pues, si aplicamos las herramientas ofrecidas por la estadstica descriptiva a una muestra, solo nos
limitaremos a describir los datos encontrados en dicha muestra, por lo que no se podr generalizar
la informacin hacia la poblacin.
La estadstica descriptiva trabaja con todos los individuos de la poblacin. La estadstica inferencial, sin
embargo, trabaja con muestras, subconjuntos formados por algunos individuos de la poblacin. A partir
del estudio de la muestra se pretende inferir aspectos relevantes de toda la poblacin. Cmo se
selecciona la muestra, cmo se realiza la inferencia, y qu grado de confianza se puede tener en ella son
aspectos fundamentales de la estadstica inferencial, para cuyo estudio se requiere un alto nivel de
conocimientos de estadstica, probabilidad y matemticas.
Para que stas generalizaciones sean vlidas la muestra deben ser representativa
de
la
poblacin y la calidad de la informacin debe ser controlada, adems puesto que las conclusiones as
extradas estn sujetas a errores, se tendr que especificar elriesgo o probabilidad que con que se
pueden cometer esos errores.
La Estadstica Inferencial investiga o analiza una poblacin partiendo de unamuestra tomada.
Es
as
que
permite
realizar conclusiones
inferencias, basndoseen
los datos
Dentro de la estadstica descriptiva se distinguen los datos en funcin al tiempo en que se encuentra
analizada la poblacin; de esta manera, tenemos 2 clasificaciones:
Estadstica Univariada
Un ejemplo perfecto del anlisis estadstico univariado, es la utilizacin del promedio o media
aritmtica, pues slo se mide una variable.
Los estadsticos bsicos que conocemos, como la media, la mediana, la moda, lavarianza,
los porcentajes, entre otros, miden una variable. Es decir, fueron hechos univariados.
Ahora bien este tipo de anlisis ha sido muy criticado ya que la realidad se presenta interconectada,
relacionada. Por ejemplo existe una relacin entre el peso y la talla de las personas o entre la el inters y el
rendimiento escolar, etc.
Como la realidad se presenta relacionada necesitamos mtodos ms rigurosos para evaluarla. Esto lo
podemos hacer de dos modos; El primero es medir las variables de modo univariado (analizarlas) y
relacionarlas luego en la interpretacin.
Estadstica Bivariada
Estadstica Multivariada
La Estadstica multivariada tiene diversas aplicaciones en una enorme cantidad de reas, como los
son: la agricultura, el deporte, la psicologa, la economa, etc.
Los mtodos estadsticos multivariantes y el anlisis multivariante son herramientas estadsticas que estudian
el comportamiento de tres o ms variables al mismo tiempo. Se usan principalmente
para buscar las variables menos representativas para poder eliminarlas, simplificando as
modelos
estadsticos
en
los
que
el
nmero
de
variables
sea
un
problema
para comprender la relacin entre varios grupos de variables. Algunos de los mtodos ms
conocidos y utilizados son la Regresin lineal y el Anlisis discriminante.
Se pueden sintetizar dos objetivos claros:
Concepto de Poblacin
tenemos
un Universo
Poblacin
de
observaciones; tiene
como
objetivo final descubrir las caractersticas y propiedades de aquello quegener los datos. En
estadstica es representado con N.
Existen distintos tipos de poblaciones que son:
accesible. El nmero de muestras que se puede obtener de una poblacin es una o mayor
de una.
o
Concepto de Muestra
Una muestra de poblacin, en estadstica, es un conjunto de datos representativos del total de una
poblacin o universo.
Muestra
de
de
individuos
representativos de
la totalidad del universo objeto de estudio, reunidos como una representacin vlida y de inters para la
investigacin de su comportamiento.
Los criterios que se utilizan para la seleccin de muestras pretenden garantizar que el conjunto
seleccionado represente con la mxima fidelidad a la totalidad de la que se ha extrado, as como
hacer posible la medicin de su grado de probabilidad.
Otras definiciones altamente aceptadas, son:
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la poblacin que
estamos manejando es muy grande.
El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la poblacin ya que al
elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad
que no se da en la poblacin.
Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o
el estratificado para elegir los elementos concretos que formarn parte de la muestra. La distribucin de la
muestra en funcin de los diferentes estratos se denomina afijacin, y puede ser de diferentes tipos:
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la poblacin que forman
una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios,
una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas
geogrficas suele hablarse de muestreo por reas.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sealar:
1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
2. Como consecuencia del punto anterior ahorraremos costes.
3. Estudiar la totalidad de los pacientes o personas con una caracterstica determinada en
muchas ocasiones puede ser una tarea inaccesible o imposible de realizar.
4. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones
y mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y
plurales que si las tuvisemos que realizar a una poblacin.
5. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una
poblacin al indicar los criterios de inclusin y/o exclusin.
Los Datos Estadsticos, son aquellos que se estudian en cada elemento de la muestra y son variables
que tomaran valores dependiendo del problema.
Los datos estadsticos son lo que estudiamos en cada individuo de la muestra son lasvariables (edad,
sexo, peso, talla, tensin arterial sistlica, etctera). Los datos son losvalores que toma la variable en
cada caso. Lo que vamos a realizar es medir, es decir,asignar valores a las variables incluidas en el
estudio. Deberemos adems concretar la escala de medida que aplicaremos a cada variable.
La naturaleza de las observaciones ser de gran importancia a la hora de elegir el mtodo estadstico ms
apropiado para abordar su anlisis. Con este fin, clasificaremos a estos datos estadsticos, a grandes
rasgos, en dos tipos: datos cuantitativos o datos cualitativos.
Datos cuantitativos
Las Datos Cuantitativos son aquellos que se pueden expresar mediante valores numricos, y se
dividen en continuos (enteros y decimales) y discretos (slo enteros):
estadsticamente.
Incluyentabulaciones
de
frecuencia,porcentajes, medias y promedios. Si entre cada dos datos puede haber una infinidad de ellos,
se llamancontinuos, y si entre un dato y otro siempre hay un hueco o salto, se llaman discretos.
Datos cuantitativos continuos: si admiten tomar cualquier valor dentro de un rango numrico
determinado, es decir, que pueden expresarse con nmeros decimales o fraccionarios. (Densidad de
un lquido, la fuerza de un muelle, edad, peso, talla).
Datos cuantitativos discretos: si no admiten todos los valores intermedios en un rango. Suelen
tomar solamente valores enteros (Nota de un examen, nmero de hijos, nmero de partos, nmero de
hermanos, etc.).
Datos cualitativos.
Son datos que no se pueden expresar numricamente, debido a que suponen cualidades, opiniones,
sentimientos entre otros, y se dividen en nominales (categoras que no mantiene relacin de orden) y
los jerarquizados (escalas utilizadas bajo un orden).
Datos
que
expresancualidades,
elcomportamiento que clasifica a cada caso en una de varias categoras (Domroese & Sterling 1999). La
situacin ms sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer,
enfermo/sano, fumador/no fumador).
Son datos dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificacin
no es suficiente y se requiere de un mayor nmero de categoras (color de los ojos, grupo sanguneo,
profesin, etctera).
En el proceso de medicin de estas variables, se pueden utilizar dos escalas:
Escalas nominales: sta es una forma de observar o medir en la que los datos se
ajustan por categoras que no mantienen una relacin de orden entre s (color de los ojos,
sexo, profesin, presencia o ausencia de un factor de riesgo o enfermedad, etctera).
VARIABLE CUALITATIVA
Las variables
cualitativas se
refieren
a caractersticas
Por ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
o
de
observacin
en
observacin debido a los factores relacionados con el azar recibe el nombre devariable aleatoria.
Las variables aleatorias pueden ser discretas y continuas.
VARIABLE CUANTITATIVA
Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden
realizar operaciones aritmticas con ella. Podemos distinguir dos tipos:
Variable
discreta es
aquella
que
toma valores
aislados,
es
decir no admite valores intermedios entre dos valores especficos. Es decir, slo puede ser expresado
con nmeros enteros.
Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable
continua es
aquella
que
puede
tomar valores
comprendidos entre dos nmeros por lo cual tiene un nmero infinito de valores posibles. Es decir,
puede ser expresada con nmeros decimales o fraccionarios.
Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales.
VARIABLES INDEPENDIENTES
Son las que el investigador escoge para establecer agrupaciones en el estudio, clasificando
intrnsecamente a los casos del mismo. Un tipo especial son las variables de control, que modifican al
resto de las variables independientes y que de no tenerse en cuenta adecuadamente pueden alterar los
resultados por medio de un sesgo.
Es aquella caracterstica o propiedad que se supone ser la causa del fenmeno estudiado. En
investigacin experimental se llama as a la variable que el investigador manipula.
VARIABLES DEPENDIENTES
Son las variables de respuesta que se observan en el estudio y que podran estarinfluenciadas por
los
valores
de
las variables
independientes.
Hayman
la
define
como propiedad
Cuadros Estadsticos
Qu es un cuadro o tabla estadstica?
Un cuadro estadstico es una representacin grafica de las diversas situaciones que se nos presentan
diariamente; sirve para presentar de forma ordenada lasdistribuciones de frecuencias. Es la
forma esquemtica de comprender las tendencias de nuestra forma de ser y de vivir. En un cuadro estadstico
puedes identificar tantas variables como quieras; se realiza como un resumen del conjunto de datos que se
poseen, distribuidos segn las variables que se estudian.
Su forma general es la siguiente:
Modalid
ad
Frec.
Abs.
Frec.
Rel.
ni
fi
c1
n1
cj
nj
ck
nk
n
Frec. Abs.
Acumu.
Ni
Frec. Rel.
Acumu.
Fi
N 1 = n1
Nk = n
Fk = 1
Es un instrumento que permite sintetizar y/o presentar la informacin de un hecho investigado, y consta de
cinco elementos principales:
Si se trabaja con variables discretas las clases pueden ser sin agrupamiento, siempre y
cuando su recorrido sea menor a 20.
o
Por consiguiente podemos obtener 3 tipos de series:
1. Serie simple o tipo I, tambin llamada ordinaria (cuando las estadsticas representan un rango menor
a 10.
2. Serie de frecuencia, o tipo II (cuando las estadsticas observadas se repiten y su rango est entre
mayor a 10 y menor que 20).
3. Serie de intervalos de clase o tipo III, o de datos agrupados (cuando los datos observados son
numerosos o su rango es mayor que 20).
Las tablas estadsticas segn el nmero de observaciones y segn el recorrido de la variable estadstica, as
tenemos los siguientes tipos de tablas estadsticas:
1. Tablas Tipo I
2. Tablas Tipo II
3. Tablas Tipo III
1
1
2
2
4
0
6
5
8
0
Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla
en la que resumamos estos datos quedando la siguiente tabla:
Personas Activas
Nmero de Familias
16
20
Total
50
450
1152
250
300
175
80
25
2680
180
200
675
500
375
1500
205
605
785
1595
2300
5000
1200
100
985
185
125
315
425
560
1100
Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 pesetas, por lo que s queremos
hacer una tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos,
necesitaremos decidir cuntos intervalos queremos?
Los intervalos sern siempre Cerrados por la izquierda y Abiertos por la Derecha [ L i-1 , Li )
[ Li-1 , Li )
Frecuencia
[ 0,500)
16
[ 500, 1000)
[ 1000,1500)
[ 1500, 2000)
[ 2000, 2500)
[ 2500, 3000)
[ 3000, 3500)
[ 3500, 4000)
[ 4000, 4500)
[ 4500, 5000)
[ 5000,5500)
Cuando se hace un estudio estadstico se obtiene una gran cantidad de datos numricos. Para tener una
informacin clara y rpida de lo obtenido en el estudio se han creado las grficas estadsticas.
Gran parte de la utilidad que tiene laEstadstica
Descriptiva es la deproporcionar
un
medio para informarbasado en los datos recopilados. La eficacia con que se pueda realizar tal
proceso de informacin depender de lapresentacin de los datos, siendo la formagrfica uno de
los ms rpidos y eficientes, aunque tambin uno de los que ms pueden ser manipulados o ser
malinterpretados si no se tienen algunas precauciones bsicas al realizar las grficas.
Existen tambin varios tipos de grficas, o representaciones grficas, utilizndose cada uno de
ellos de acuerdo al tipo de informacin que se est usando y los objetivos que se persiguen al presentar la
informacin.
Entonces, algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier
grfica a fin de que la informacin sea transmitida de la manera ms eficaz posible y sin distorsiones son:
1. El eje que represente a las frecuencias de las observaciones (comnmente el vertical o
de las ordenadas) debe comenzar en cero (0), de otra manera podra dar impresiones
errneas al comparar la altura, longitud o posicin de las columnas, barras o lneas que
representan las frecuencias.
2. La longitud de los espacios que representan a cada dato o intervalo (clase) en la
grfica deben ser iguales.
3. El tipo de grfico debe coincidir por sus caractersticas con el tipo de informacin o el
objetivo que se persigue al representarla, de otra manera la representacin grfica se
convierte en un instrumento ineficaz, que produce ms confusin que otra cosa,
innecesario o productor de malinterpretaciones.
Por ejemplo, si se desea representar la proporcin de poblacin masculina en un pas conviene ms usar
una grfica de pastel o circular que una grfica de barras al compararla contra la poblacin femenina; por un
lado se puede apreciar dicha proporcin, por el otro se aprecia cul de las dos poblaciones es mayor.
Hay un punto que conviene remarcar: existe software que permite la construccin rpida y eficiente de
grficas a partir de bases de datos o hojas de clculos, pero no importa cun bonita, bien delineada, bien
coloreada o bien presentada est una grfica, si no se han tomado en cuenta consideraciones de este tipo que
tienen que ver ms sobre el objetivo de estas herramientas y la Estadstica: la transmisin eficiente de
la informacin.
Hay muchos tipos de grficas estadsticas. Cada una de ellas es adecuada para un estudio determinado,
ya que no siempre se puede utilizar la misma para todos los casos. Tienen una estructura distinta, lo cual les
permite ser utilizados para diferentes objetivos, y es que la mayora de las veces utilizan datos o variables
distintos.
A continuacin, se presentarn las grficas estadsticas ms utilizadas:
Histograma
Histograma de Frecuencias
por altura,
la frecuencia
absoluta de
cada intervalo.
La superficie de
Otra observacin es la amplitud de los intervalos, que se puede establecer utilizando la regla de Sturges, pues
al cambiarla la presentacin visual de un histograma puede variar. Un applet que muestra cmo el nmero de
clases y su ancho pueden hacer variar fue desarrollado por Webster West de la Universidad del Sur de
Carolina.
Algunos de los usos ms comunes del uso de un histograma son: aumentar la calidad de alguno de nuestros
procesos, pues todos sabemos que es necesario reducir al mnimo la variacin que se presente en el mismo.
Es por eso, que el histograma nos permite identificar cuantas veces se repite un mismo valor, as
como la frecuencia con la que se presenta. Siendo base para la toma de decisiones.
Diagrama de Barras
este
tipo
de
grfica,
estrechas delongitudes
sobre
los valores
de
las
variables se
levantanbarras
mismas
escalas
variables producto
horizontales
de
varias
verticales, varios
observaciones.
Esto
datos correspondientes
produce
una
grfica
las mismas
convarias series,
correspondiendo cada una de ellas a cada observacin de la muestra(o poblacin), y tenindose una
grfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustrados o
iluminados de igual manera entre s, pero distinta de las dems.
En el eje horizontal, o eje de abscisas, se representan los datos o modalidades; en el eje
vertical o de ordenadas, se representan las frecuencias de cada dato omodalidad. Las
frecuencias pueden ser absolutas, acumuladas relativas y relativas acumuladas.
El ejemplo de la ilustracin de arriba pertenece al comportamiento de las calificaciones parciales de tres
alumnos de preparatoria. Las series (cada una de las calificaciones parciales) estn coloreadas con diferente
color para mostrar el comportamiento tanto individual, como comparativo.
o
Grfica de barras compuestas
Barras mltiples:es muy recomendable para comparar una serie estadstica con otra,
para ello emplea barras simples de distinto color o tramado en un mismo plano
cartesiano, una al lado de la otra.
A este tipo de grficos en particular se le llama pirmide de edades por su forma. Incluso, cuando se
compara la poblacin masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la
poblacin de un sexo y el lado derecho para el otro, el resultado es una pirmide casi simtrica (depender
de la poblacin en particular).
Pirmides de poblacin.
La pirmide de poblacin es la representacin grfica de la distribucin por edad ysexo de
la poblacin. Grficamente se trata de un doble histograma de frecuencias.
La pirmide de edades es un histograma doble en el que se representa en la derecha la poblacin
masculina y en la izquierda la poblacin femenina. En el eje de abscisas se representa los efectivos de
poblacin, normalmente en porcentajes, y en el eje de ordenadas las edades. Toma el nombre de la
forma que debe adoptar en las sociedades con una poblacin equilibrada, con una amplia base debido al gran
nmero de nacimientos que se estrecha paulatinamente por la mortalidad creciente a medida que aumenta el
intervalo de edades considerado.
La pirmide de poblacin, dependiendo de su forma, puede dar una visin general de la juventud, madurez o
vejez de una poblacin, y por lo tanto obtener consecuencias sociales de ello.
De poblacin expansiva: con una base ancha y una rpida reduccin a medida que ascendemos. Es
propia de los pases del Tercer Mundo en plena transicin demogrfica con altas tasas de natalidad y
mortalidad, y con un crecimiento natural alto.
De poblacin regresiva: con una base ms estrecha que el cuerpo central y un porcentaje de
ancianos relativamente grande. Se trata de una poblacin envejecida con bajas tasas de natalidad y de
mortalidad, y con un crecimiento natural reducido.
De poblacin estacionaria: con una notable igualdad entre las generaciones jvenes y adultas, y una
reduccin importante en las ancianas. El crecimiento natural es bajo. Este tipo de pirmide es propia de las
poblaciones que no presentan cohortes de la transicin demogrfica.
Grficas de Lneas
Cuando los datos se relacionan entre s, es decir, cuando podemos decir que existe cierta continuidad entre
las observaciones se pueden utilizar las grficas de lneas, que consisten en una serie de puntos
trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, unindose
consecutivamente con lneas.
Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de
cinco observaciones anuales. Al igual que en el caso de las grficas de columnas (y de otras ms) es posible
presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos de un
individuo).
Polgono de Frecuencias
Otra forma de representacin de un uso menos comn, y muy parecida a las grficas de lneas, es
el polgono de frecuencias.
ste, es un grfico que se realiza a travs de la unin de los puntos ms altos de las columnas en
un histograma de frecuencia (que utiliza columnas verticales para mostrar las frecuencias). La
diferencia fundamental entre ambas es que en el polgono de frecuencias se aaden dos clases con
frecuencias cero: una antes dela primera clase con datos y otra despus de la ltima.
El resultado es que se sujeta la lnea por ambos extremos al eje horizontal y lo que podra ser
una lnea separada del eje se convierte, junto con ste, en un polgono. Los polgonos de frecuencia
para datos agrupados, por su parte, se construyen a partir de la marca de clase que coincide con
el punto medio de cada columna del histograma.
Cuando se representan las frecuencias acumuladas de una tabla de datos agrupados, se obtiene un
histograma de frecuencias acumuladas, que permite diagramar su correspondiente polgono.
una variable
cuantitativa
continua con
una cualitativa
cuantitativa
El ejemplo de arriba corresponde al porcentaje del PIB gastado en docencia e investigacin durante el ao
de 1990 en cinco pases (fuente: Revista Ciencia y Desarrollo, 1994, XIX (114):12))
Pictograma
Son grficos con dibujos alusivos
al
carcter
que
se
est
estudiando
cuyo tamaoes proporcional a las frecuencias que representan.La mayor frecuencia se identifica
por la mayor acumulacin de smbolos. Los pictogramas se emplean sobre todo, para hacer ms
amigables y entendibles los informes
Diagrama de Sectores
Tambin conocido como grfica de pastel o grfico circular. Un diagrama de sectores se puede
utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas.
Si el estudio estadstico tiene pocos valores distintos, suele ocurrir con los caracteres cualitativos, se
puede usar un diagrama en forma de crculo dividido en tantos sectores como datos distintos haya, de modo
que la frecuencia de cada valor viene dada por un trozo de rea del crculo. As, el crculo queda dividido en
sectores cuya amplitud es proporcional a las frecuencias de los valores.
Para obtener esta caracterstica fundamental del diagrama de sectores, en que elngulo de
cada sector es proporcional a la frecuencia absoluta correspondiente, tenemos que el ngulo se
calcula de la siguiente forma:
El diagrama circular se construye con la ayuda de un transportador de ngulos.
Tambin puede usarse para datos cuantitativos agrupados en clases, y en tales casos, cada sector
corresponde a una clase. Dada la ndole de esta representacin, slo se utiliza para distribuciones de
frecuencias relativas usualmente expresadas en porcentajes.
PARA QU SIRVE?
Expresa de manera grfica la distribucin proporcional de los eventos o datos en estudio; sin embargo,
stos no deben ser ms de 7 porque el anlisis se vuelve excesivamente complejo. Cuando lo que
se desea es resaltar las proporciones que representan algunos subconjuntos con respecto al total, es
decir, cuando se est usando una escala categrica, conviene utilizarla.
Los datos presentados comienzan a las 12 horas en el crculo y corren en elsentido de las
manecillas del reloj; colocando el porcentaje mayor (la rebanada ms amplia del pastel) junto con
la siguiente ms importante;
y as sucesivamente, hasta la
convencin a menos que quiera ilustrar contrastes dramticos en los porcentajes, colocando los porcentajes
mayores junto con los ms pequeos.
Los textos necesarios pueden situarse dentro del pastel o fuera de ste (preferiblemente fuera
cuando las secciones representen valores pequeos) y el colordebe usarse para dar nfasis y esttica.
Su principal inconveniente consiste en que requieren de mucho espacio en cada pgina.
Ejemplo
En una clase de 30
Deporte
Alumnos (fi)
ngulo ()
alumnos, 12 juegan a
baloncesto,
Baloncesto
12
144
practican la natacin,
4 juegan al ftbol y el
resto
no
practica
ningn deporte.
Natacin
36
Diagrama de
Dispersin
Ftbol
108
En
las distribuciones
bidimensionales
a cada individuo le
Sin deporte
72
corresponden
los valores
de
30 (N)
360
par (xi,
yi).
Si
representamos cada
par de valores como
las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de
dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible,
llamada recta de regresin.
Un grfico de dispersin tiene dos ejes de valores y muestra un conjunto de datos numricos en el eje
horizontal (eje X) y otro en el eje vertical (eje Y). Combina estos valores en puntos de datos nicos y
los muestra en intervalos irregulares o agrupaciones. Los grficos de dispersin se utilizan por lo
general para mostrar y comparar valores numricos, por ejemplo datos cientficos, estadsticos y de
ingeniera. Se usa cuando:
o
Los espacios entre los valores del eje horizontal no son uniformes.
Grficas de rea
Los grficos de rea destacan la magnitud del cambio en el tiempo y se pueden utilizar para
llamar la atencin hacia el valor total en una tendencia. Por ejemplo, se pueden trazar los datos que
representan el beneficio en el tiempo en un grfico de rea para destacar el beneficio total. Al mostrar la suma
de los valores trazados, un grfico de rea tambin muestra la relacin de las partes con un todo.
Los grficos de rea tienen los siguientes subtipos de grfico:
reas en 2D y 3D
Otros grficos
Existen muchos otros grficos, que en este trabajo no abordaremos de manera profunda debido a que son
poco comunes; principalmente, se trata de grficas estadsticas utilizadas en ciencias o actividades muy
especficas y muchas veces se requiere de un conocimiento avanzado para su realizacin. Como ejemplo,
vale la pena mencionar:
GRFICOS DE SUPERFICIE
Un grfico de superficie es til cuando busca combinaciones ptimas entre dos conjuntos de datos. Como en
un mapa topogrfico, los colores y las tramas indican reas que estn en el mismo rango de valores.
Puede utilizar un grfico de superficie cuando ambas categoras y series de datos sean valores numricos.
GRFICOS DE ANILLOS
En un grfico de anillos se pueden representar datos organizados nicamente en columnas o en filas de una
tabla de datos estadsticos. Un grfico de anillos muestra la relacin de las partes con un todo pero puede
contener ms de una serie de datos; no son fciles de leer. Es conveniente utilizar un grfico de columnas
apiladas o un grfico de barras apiladas en su lugar.
GRFICAS RADIALES
Los datos organizados en columnas o filas en una hoja de clculo se pueden representar en un grfico radial.
Los grficos radiales comparan los valores agregados de varias series de datos y muestran cambios en
valores relativos a un punto central.
Glosario
Al Azar o Aleatorio: Son todos aquellos eventos fortuitos o productos de la suerte.
Aleatoriamente: Actividades o mtodos producidos o llevados a cabo simulando un comportamiento
al azar.
Clase: Subdivisin de escala de datos.
Correlacin: Cuando dos fenmenos sociales, fsicos o biolgicos crecen o decrecen de forma simultnea y
proporcional debido a factores externos, se dice que los fenmenos estn positivamente correlacionados. Si
uno crece en la misma proporcin que el otro decrece, los dos fenmenos estn negativamente
correlacionados. El grado de correlacin se calcula aplicando un coeficiente de correlacin a los datos de
ambos fenmenos.
Datos: Son los valores cualitativos o cuantitativos mediante los cuales se miden las caractersticas de los
objetos, o fenmenos a estudiar.
Dispersin: La extensin o variabilidad de un conjunto de datos.
Estadstica: Rama de las matemticas que se ocupa de reunir, organizar y analizar datos numricos y que
ayuda a resolver problemas como el diseo de experimentos y la toma de decisiones.
Evento: Uno o ms de los resultados posibles de hacer algo, o uno de los resultados posibles de realizar un
experimento
Frecuencia: Nmero de veces en que se repite un dato.
Frecuencia Acumulada: Es el nmero de estudiantes con calificaciones iguales o menores que
el rango de cada intervalo sucesivo.
Frecuencia absoluta: Es el nmero de veces que ocurre un cierto suceso, en la proporcin de veces que
ocurre dicho suceso con relacin al nmero de veces que podra haber ocurrido.
Frecuencia Relativa: Es la proporcin entre la frecuencia de un intervalo y el nmero total de datos.
Intervalo de Clase: Pequea seccin de la escala segn la cual se agrupan las puntuaciones de una
distribucin de frecuencia. Tamao o rango de la Clase.
Lmites del Intervalo: Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre
los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
Muestra estadstica: es un subconjunto de casos o individuos de una poblacin estadstica.
Muestreo aleatorio simple: Mtodos de seleccin de muestras que permiten a cada muestra posible
una probabilidad igual de ser elegida y a cada elemento de la poblacin una oportunidad igual de ser incluidos
en la muestra.
Muestreo aleatorio: Las tcnicas de muestreo aleatorio aseguran que cada elemento en la poblacin de
inters tenga una probabilidad (no nula) de ser incluido en la muestra.
Porcentaje: Es la proporcin de una cantidad de datos especficos, con respecto al total de esos datos.
Poblacin estadstica: tambin llamada universo o colectivo, es el conjunto de elementos de
referencia sobre el que se realizan las observaciones.
Rango: Situacin de un dato respecto de una distribucin.
Regresin: Proceso general que consiste en predecir una variable a partir de otra mediante medios
estadsticos, utilizando datos anteriores.
Tablas de Frecuencias: Tabla que muestra el nmero de veces que en un conjunto de datos aparece
cada una de las clases de inters especificadas en el recorrido de los datos
Tamao de la Muestra: Es la cantidad de datos que sern extrados de la poblacin para formar parte de
la muestra.
Variable: Propiedad o rasgo de un hecho u objeto (no constante) por la que puede ser caracterizado o
clasificado. Representacin de una caracterstica, de un tributo, que posee alguna realidad.
Variable dependiente: La variable que tratamos de predecir en el anlisis de regresin.