You are on page 1of 23

Grupo 1: Clases de iguales intervalos

Intervalo para n clases:

Ic

Mximo Mnimog
b

Clase 1: Mnimo -> Mnimo+Ic


Clase 2: Mnimo+Ic -> Mnimo+(2*Ic)
Clase i:
Clase n: Mnimo+((n-1)*Ic) -> Mnimo+(n*Ic) o Mximo

Desventaja:
muy sensible a los valores extremos
Con una distribucin asimtrica o que presenta discontinuidades, algunas clases
pueden ser vacas y provocar una concentracin en pocas clases.
Ventaja:
Facilidad de clculo y de interpretacin.
Muy til cuando la variable se extiende de 0 a 100 o segn valores extremos
conocidos.

Grupo 1: Progresin aritmtica


Para n clases, se calcula la razn de la progresin de manera que:

Mximo Mnimo A 2 A 3 A...nA


Mximo Mnimo
A
1 2 3...n
Clase 1: Mnimo -> Mnimo+A
Clase 2: Mnimo+A -> Mnimo+(2*A)
Clase i:
Clase n: Mnimo+((n-1)*A) -> Mnimo+(n*A)

Mismas desventajas
Ventajas: permite tener ms clases en los pequeos valores, cuando la
distribucin es asimtrica.

Grupo 1: Progresin geomtrica


Para n clases, se calcula la razn de la progresin de manera que:

Mximo Mnimo G n
Gn

Mximo
Mnimo

Log10G
Clase1: Mnimo -> Mnimo*G
Clase 2: Mnimo*G -> Mnimo*G2
Clase i:
Clase n: Mnimo*G(n-1) -> Mnimo*Gn

log10 Mximo log10 Mnimo


n

Este mtodo propone clases an ms finas en los pequeos valores. Corresponde


a la discretizacin con iguales intervalos aplicada a una serie de valores
transformados con la funcin logartmica.
Esto supone que el mnimo no sea 0.

EJ1.CAT

Densidad total 1992: mapa con los tres tipos de


discretizacin Ctrl E, Ctrl A, Ctrl G
Densidad total 2001. idem
Idem con densidad rural
Conclusin ?
Mirar el histograma

Grupo 1: Utilizacin de estos mtodos


1.

Verificar que la distribucin no presenta una fuerte asimetra, valores de


mnimo y mximo demasiados particulares o discontinuidades en la
distribucin.

2.

Si la distribucin es aproximadamente normal o uniforme, utilizar los


iguales intervalos. En el segundo caso, se aproximar una discretizacin
por cuantiles.

3.

Si la distribucin presenta una fuerte asimetra en los pequeos valores,


o discontinuidades en los grandes valores, utilizar la progresin
aritmtica.

4.

Si, adems de la asimetra, la distribucin se acerca de un modelo lognormal, utilizar la progresin geomtrica.

5.

Progresin aritmtica y geomtrica pueden ser utilizadas tambin


cuando se trata de mostrar fenmenos particulares que se distribuyen
naturalmente de manera muy desigual, por ejemplo la densidad de la
poblacin.

Grupo 2: Clases segn cuantiles


Este mtodo calcula los limites de clase de manera que
cada clase tenga el mismo nmero de observacin.
Nmero de observacin en cada clase:

(Nt: Nmero total de observacin, n: nmero de


clases)
La serie de datos est ordenada en orden creciente. Se
establece los limites de clase contando m observacin y
tomando el valor de la m observacin.
Si n=4, los los limites son los cuartiles. Si n=10 son
percentiles, etc.

Desventaja:
Se puede que cada clase no tenga exactamente el mismo nmero de individuos,
porque pueden existir varias observaciones con el mismo valor.
Puede ser difcil establecer los limites de clase en el caso de series muy
discontinuadas.
Tambin si existen valores muy particulares a los extremos, los lmites de clases
estarn difcil de interpretar. En este caso, suele tomar como clases extremas los
percentiles 5 y 95.

Ventaja:
Este mtodo funciona con cualquier tipo de distribucin, que sea normal o no.
Es completamente independiente de los valores; y no depende de los valores
extremos.
La discretizacin permite una comparacin entre diferentes series, con comparacin
del orden de las observaciones de la distribucin..
Considerando que cada clase tiene el mismo nmero de individuos, la entropa es
mxima. Es decir que es la discretizacin que trae el mximo de informacin, y que
permite la mejor lectura grfica del mapa.
Los lmites de clase son valores reales.

Grupo 2: Clases segn media y desviacin


estndar.
Este mtodo calcula los limites de clases segn una fraccin de la
desviacin estndar. Se supone que la distribucin sigue un modelo normal,
o que se ha hecho una transformacin de los datos de manera que la
distribucin se acerque a un modelo normal.
Se calcula la media (m) y la desviacin estndar (s).
Se calcula los limites de clases de manera a tener la misma extensin de una
desviacin estndar.
Nmero par de clases
Clase 1: <m-1.5 s
Clase 2: (m-1.5s) -> (m-0.5s)
Clase 3: (m-0.5s) -> (m+0.5s)
Clase 4: (m+0.5s) -> (m+1.5s)
Clase 5 > m+1.5s

Nmero impar
Clase 1: <m-2 s
Clase 2: (m-2s) -> (m-1s)
Clase 3: (m-1s) -> m
Clase 4: m -> (m+1s)
Clase 5: (m+1s) -> (m+2s)
Clase 6 > m+2s

Ventaja:
Permite la comparacin entre variables muy disimilares porque la comparacin se hace a partir de
variables de origen comn (media) y de unidad de medida similar (desviacin estndar), a
condicin de tener una distribucin normal.
A veces es necesario subdividir ms las clases cerca de la media e incluir en una sola clase los
valores extremos que salen del intervalo de confianza.

Grupo 2: - Medias encajadas


La media aritmtica
separa una
distribucin en dos
grupos y constituye
un punto de
equilibrio en la
distribucin.
Tambin, por cada
grupo se puede
calcular la media
que sera el punto de
equilibrio de estos
grupos.
Con este mtodo se
puede tener
solamente 4 o 8
clases.

Ventajas:

Construye las clases segn la diferencia que existe


entre las medias aritmticas.
Si la distribucin no presenta demasiados valores
extremos, se acerca de la discretizacin de los cuantiles.
Si la distribucin es muy asimtrica, se acerca de la
discretizacin de la progresin geomtrica.
Desventajas:

Si hay clases con poco nmero de observacin, la


media no tiene sentido, sobretodo si eso ocurre cerca de
los valores extremos.
El nmero de clases no se puede cambiar, siempre ser
4 o 8.

Grupo 2: - Mtodo de Jenks o de

anlisis de la varianza.
Este mtodo propone, sobre base de un anlisis de la varianza,
minimizar la varianza dentro de cada clase, y maximizar la varianza
entre las clases.
Los datos se ordenan por valor creciente.
Se buscan todos los grupos que se pueden constituir con k clases.
Por cada configuracin, se calcula la varianza dentro de los grupos, y la
varianza entre los grupos.
Se hace una comparacin entre estos valores y se toma la configuracin que
minimiza la varianza dentro de los grupos, y maximiza la varianza entre los
grupos.
Ventajas:
Este mtodo es el mejor del punto de vista estadstica porque constituye grupos con
mxima homogeneidad y busca una mxima heterogeneidad entre los grupos.
Los lmites de clase son valores reales de la distribucin.
Desventaja:
Cada configuracin da clases muy diferentes

Grupo 2: - Equiprobabilidades.
Este mtodo se basa en la distribucin terica de las probabilidades
de las frecuencias asociadas a una distribucin normal.
La distribucin de frecuencia adoptada es una equireparticin con el
mismo nmero de observacin en cada clase.
El nmero de observacin es calculado como:
E=Nmero total de observacin / Nmero de clases.
Se utiliza la tabla de las probabilidades de una ley normal para buscar la
probabilidad de tener E observacin en cada clase. Estos valores tericos
corresponden a valores centradas y reducidas.
Se usa la media y la desviacin estndar de la distribucin para calcular los
limites de clase.
Ventajas:
Si la distribucin es normal, se cumula las ventajas del mtodo de los cuantiles y de la
desviacin estndar. Frecuencias y probabilidades son similares.
Si la distribucin no es normal, el nmero de observacin en cada clase no es constante y la
diferencia indica la distancia entre las dos distribuciones.

EJ1.CAT

% Poblacin rural: ver el histograma e intentar realizar


un mapa
Conclusin ?

EJ2.CAT

Variable %Joven 2001: hacer los cinco mapas: Ctrl Q, Ctrl P,


Ctrl J, Ctrl S, Ctrl M
Por cada mapa mirar el men Estadsticas /
Estadsticas descriptivas

Tomar notas y hacer un recapitulativo


Conclusin ?

Comparacin de los criterios estadsticos


Normalidad

Redundencia

Intra/Inter

Quantiles

0.128

0.000

0.079

Probabilidades

0.134

0.008

0.081

Jenks

0.166

0.069

0.052

0.259

0.083

0.191

0.009

0.124

Estndar
Medias

Conclusin
Ratio entre la varianza entre las clases y la varianza dentro de
las clases (Anlisis de varianza): Cuanto ms este ndice es
pequeo, ms la clasificacin es significativa, es decir, gran
homogeneidad de las clases y gran diferencia entre clases.
En nuestro caso ?

Examinando los mapas: Similaridad y analysis de los


histogramas. ,
La ventaja de estos mtodos, particularmente de la
equiprobabilidad, de las medias encajadas y del estndar,
reside en la posibilidad de hacer una representacin grfica
por media de una gama de colores en oposicin, de ambos
lado de la media o de la mediana. En el caso del mtodo del
estndar, la eleccin de un nmero impar de clases permite
tener una clase promedio que representa los valores alrededor
de la media.

Grupo 3: Curva Clinogrfica


Este mtodo permite escoger los limites de clase de una variable a partir de la
distribucin de otra variable. Un caso tpico es la distribucin de la
poblacin con respecto a la superficie de cada unidad espacial. Otro caso
puede ser la distribucin de un carcter de una poblacin con respecto a la
distribucin de esta poblacin.
Para realizar esta curva, es necesario:
Ordenar la variable principal X por valor creciente
Calcular el valor cumulado de la variable Y
Calcular el % cumulado de la variable Y
Se construye la curva poniendo en abscisa la variable X (en el ejemplo el
analfabetismo de los productores agrcolas) y en ordenado la variable Y
cumulada (por ejemplo la poblacin de los productores)..
Se toma los limites de clase leyendo en la curva el porcentaje (100/k)
correspondiendo a k clases.

Ventajas:
Permite incluir en la discretizacin la cantidad de una variable de
ponderacin. En general se utiliza la superficie o la poblacin.
En el caso de la superficie, cada clase, es decir cada color del mapa,
representa la misma superficie.
Se puede estudiar tambin la relacin que existe en dos variables
relacionadas. En el ejemplo, existe una parte de la curva que muestra una
proporcionalidad entre la tasa de analfabetismo y el nmero cumulado de
productores. Es decir tambin que la clase con menos tasa representa el
mismo peso que la clase con ms analfabetismo. El estudio de la forma de
la curva da algunas caractersticas de la distribucin geogrfica de la
variable.

Mapa clinogrfica del % de joven y % de viejos:


EJ2.CAT

Comparacin de los mapas y de los histogramas

Grupo 3: Usuario o histograma


EJ2.CAT

A partir del mapa de los viejos: Ctrl U y


precisar los valores.

Mostrar el histograma en tipo bigote y con


el men modif, modificar las clases

Pruebas de significacin de una


discretizacin
La discretizacin optima no existe. Cada discretizacin dar un mapa
diferente ms o menos conforme a la distribucin de los datos. Eso por dos
razones:
La agrupacin de datos en clases, es decir la reduccin de la informacin
til, introduce un error o una distorsin en la percepcin de esta
distribucin.
El modelo de distribucin de los datos interviene en la eleccin de un
mtodo de discretizacin. Esto introduce hiptesis que necesitan pruebas.
Tres parmetros permiten escoger una discretizacin.
Si se trata de un solo mapa o de un grupo de mapas que se necesita
comparar;
Si se trata de probar una hiptesis de distribucin
Si la distribucin se conforma a un modelo particular.
Cada vez, es necesario probar la significacin de las clases escogidas, ya
sea por medio de un anlisis de varianza, o por medio de la comparacin
de las medias de cada grupo.

Simtrica
Pequea escala

Error mnimo

Homogeneidad
de las clases
Mapas
independientes

Entropa mxima

Uniforme

No uniforme

Medias
encajadas
Histograma
Medias
Jenks
encajadas Tranformacin de
Jenks
los datos
Quantiles
Clinogrfico

Distancia
cumulada
Quantiles
Clinogrfico

Iguales intervalos
Transformacin de
los datos
Jenks

Error mnimo y
homogeneidad de
las clases

Estndar
Jenks

Estndar
Transformacin de
los datos Jenks

Entropa mxima

EquiProbabilidades

EquiProbabilidades

Preservacin de
la estructura
espacial

Distancia
cumulada
Medias
encajadas

Distancia
cumulada
Medias encajadas

Preservacin de
la estructura
espacial

Serie de mapas

Iguales
intervalos
Estndar
Iguales
intervalos
Estndar
Jenks
EquiProbabilidades
Quantiles

Distribucin de la frecuencia
Simtrica
Asimtrica
Asimtrica
Grande
Grande
Pequea escala
escala
escala

Medias
encajadas
Quantiles
Clinogrfico
EquiHistograma
Clinogrfico

Quantiles
EquiProbabilidades

Histograma

FAMILIA

MTODO

Intuitivo

..

Intuicin y experiencia
del autor

Exgeno

..

Segn una referencia


Exclusivam ente para hacer com paracin con base a un
externa a la distribucin valor de referencia

Matem tica

NOTA
Requiere un buen conocim iento de la variable estudiada.
No perm ite la com paracin

Iguales intervalos

Las clases tienen la


m ism a m agnitud

Eficaz con una distribucin uniform a. No perm ite


com paracin. Incorrecto en caso de una distribucin
asim trica

Progresin
aritm tica

Los intervalos de las


clases aum entan del
m nim o al m xim o
segn una progresin
aritm tica (Aditivo)

Eficaz con una distribucin asim trica en los pequeos


valores, donde da clases m s detalladas.

Progresin
geom trica

Los intervalos de las


clases aum entan del
m nim o al m xim o
segn una progresin
geom trica
(Multiplicacin)

Eficaz con una distribucin asim trica en los pequeos


valores, donde da clases m s detalladas.

FAMILIA

Estadstica y
Probabilidade
s

MTODO

NOTA

Quantiles

Cada clase tiene el


m ism o m m ero de
individuos. La
distribucin no tiene
que ser norm al

Estandr

El intervalo de la clase
es proporcional a una
fraccin de la desviacin Necesita una distribucin norm al. Eficaz para hacer
estandr.
com paracin entre varias distribuciones.

Medias encajadas

Clculo de la m edia
aritm tica. Clculo de la
m edia del grupo bajo la
m edia y del grupo
encim a de la m edia....

Eficaz para hacer com paracin. No necesita una


distribucin norm al

Jenks

Minim izacin de la
variancia de un grupo y
m axim izacin de la
variancia entre los
grupos (basado en la
anlisis de variancia)

No depende del tipo de distribucin. Da la m ejor


clasificacin pues todas las clases son significativas

Clasificacin ordinal (Rango). Se utiliza con cualquier tipo


de distribucin. No tom a en cuenta los valores
particulares

Los intervalos son


calculados con base a
una distribucin terica
norm al de param etro la
m edia y la desviacin de Necesita una distribucin norm al. Es una com binacin
Iguales probabilidad la distribucin real.
del m todo de los quantiles y del m todo estandr.

FAMILIA

Grfica

MTODO

NOTA

Histogram a

Busca de los intervalos


sobre un histogram a o
una curva de las
frecuencias cum uladas

Basado en rupturas del histogram a. Mtodo intuitivo. No


perm ite la com paracin

Curva clinogrfica

Basado en una curva de


distancia o variable
cum ulada

Quantile espacial. Perm ite corregir el efecto del tam ao


de las unidades espaciales.

You might also like