You are on page 1of 54

Estadstica

Carpeta de trabajo
Estadstica
Mara Eugenia ngel
Mario Enrique Borgna
Graciela Fernandez
Diseo original de maqueta: Hernn Morfese
Procesamiento didctico: Marina Gergich / Bruno De Angelis
Primera edicin: septiembre de 2009
Universidad Nacional de Quilmes, 2009
Roque Senz Pea 352, (B1876BXD) Bernal, Buenos Aires
Telfono: (5411) 4365 7100 | http://www.virtual.unq.edu.ar
La Universidad Nacional de Quilmes se reserva la facultad de dis-
poner de esta obra, publicarla, traducirla, adaptarla o autorizar su
traduccin y reproduccin en cualquier forma, total o parcialmente,
por medios electrnicos o mecnicos, incluyendo fotocopias, graba-
cin magnetofnica y cualquier sistema de almacenamiento de infor-
macin. Por consiguiente, nadie tiene facultad de ejercitar los dere-
chos precitados sin permiso escrito del editor.
Queda hecho el depsito que establece la ley 11.723
Impreso en Argentina
Lectura obligatoria
Es la bibliografa imprescindible que acompaa el desarrollo de los conteni-
dos. Se trata tanto de textos completos como de captulos de libros, artcu-
los y "papers" que los estudiantes deben leer, en lo posible, en el momento
en que se indica en la Carpeta.
Actividades
Se trata de una amplia gama de propuestas de produccin de diferentes ti-
pos. Incluye ejercicios, estudios de caso, investigaciones, encuestas, elabo-
racin de cuadros, grficos, resolucin de guas de estudio, etctera.
Leer con atencin
Son afirmaciones, conceptos o definiciones destacadas y sustanciales que
aportan claves para la comprensin del tema que se desarrolla.
Para reflexionar
Es una herramienta que propone al estudiante un dilogo con el material, a tra-
vs de preguntas, planteamiento de problemas, confrontaciones del tema con la
realidad, ejemplos o cuestionamientos que alienten la autorreflexin, etctera.
Lectura recomendada
Es la bibliografa que no se considera obligatoria, pero a la cual el estudian-
te puede recurrir para ampliar o profundizar algn tema o contenido.
Pastilla
Se utiliza como reemplazo de la nota al pie, para incorporar informaciones
breves, complementarias o aclaratorias de algn trmino o frase del texto
principal. El subrayado indica los trminos a propsito de los cuales se inclu-
ye esa informacin asociada en el margen.
conos
nd
Introduccin...........................................................................................9
Mapa conceptual ..................................................................................10
Problemtica del campo ........................................................................10
Objetivos del curso ...............................................................................11
1. Estadstica descriptiva.....................................................................13
1.1. Los datos y su organizacin ...........................................................13
1.1.1. Variables estadsticas y su clasificacin................................13
1.1.2. Ordenamiento y tabulacin de los datos................................15
1.1.3. Representaciones grficas ...................................................23
1.2. Medidas estadsticas.....................................................................28
1.2.1. Medidas de posicin............................................................28
1.2.2. Medidas de dispersin.........................................................39
1.2.3. Medidas de intensidad.........................................................43
1.3. Matrices ejemplos .........................................................................51
2. Probabilidad.....................................................................................55
2.1. Elementos de la teora de probabilidad ...........................................55
2.1.1. Experimento aleatorio .................................................................55
2.1.2. Definiciones de probabilidad........................................................62
2.1.3. Axiomatizacin de la probabilidad ................................................63
2.1.4. Tipos de probabilidad..................................................................64
2.2. Variable aleatoria...........................................................................69
2.2.1. Variable aleatoria discreta...........................................................69
2.2.2. Modelos especiales de variables aleatorias discretas ...................71
2.2.3. Variable aleatoria continua ..........................................................76
2.2.4. Modelos especiales de variables aleatorias continuas ..................77
3. Inferencia estadstica.......................................................................87
3.1. Distribucin de estadsticos muestrales..........................................87
3.1.1. Distribucin del estadstico media muestral .................................88
3.1.2. Distribucin del estadstico proporcin muestral ...........................90
3.1.3. Teorema central del lmite ...........................................................91
3.2. Problemas fundamentales de la inferencia estadstica .....................94
3.2.1. Estimacin por intervalo de confianza ..........................................94
3.2.2. Pruebas de hiptesis ................................................................105
4. Elementos bsicos de econometra.................................................113
4.1. Introduccin ................................................................................113
4.2. Anlisis de regresin y de correlacin ...........................................114
4.3. Series de tiempo .........................................................................120
Referencia bibliogrfica......................................................................125
7
ndice
Anexo................................................................................................127
Tabla 1: Percentiles de la distribucin normal estndar .........................127
Tabla 2: Percentiles de la distribucin t de Student ...............................129
8
Universidad Virtual de Quilmes
9
El material de esta carpeta contiene, en su inicio Unidad 1, diversas formas
de organizacin de los conjuntos de datos (apartado 1.1.). En algunos casos
datos de campo y en otros compilados, como preparacin del material de base
para elaborar las medidas estadsticas (apartado 1.2.) tambin denominadas
indicadores estadsticos, y producir informacin til.
La importancia de la organizacin de los datos, en vistas del tratamiento
posterior, reside en que permite establecer distintas lneas de trabajo en pos
de la calidad de la informacin que se busca. Una informacin estadstica de
calidad es primordial para la comprensin de las cualidades o caractersticas
del mundo real con perspectiva de su modelizacin.
A comienzos del siglo XIX el astrnomo Adolfo Quetelet considerado el fun-
dador de la estadstica moderna aplic a las ciencias sociales los mtodos
estadsticos hasta entonces utilizados en las ciencias naturales, contribu-
yendo a la ampliacin del campo de la estadstica. Sin embargo, fue a partir
de mediados de la dcada de 1960 con el Anlisis Exploratorio de Datos (EDA)
desarrollado por J. Tukey y otros que surgi un enfoque ms amplio en el
tratamiento de datos, cimentado en el uso de la informtica, donde el sopor-
te tecnolgico permiti sostener una gran masa de datos y procesarlos en
tiempo real, contribuyendo as al mejoramiento de la calidad de la informacin
resultante.
Luego del tratamiento descriptivo de los datos desarrollado en la Unidad
1, se incorporan nociones sobre la teora de la probabilidad Unidad 2.
A partir del siglo XVII comenz a evolucionar el Clculo de probabilidad
como disciplina cientfica introducindose el uso sistemtico de los concep-
tos de azar, indeterminismo y aleatoriedad. La Estadstica, que a la sazn ya
tena un desarrollo de varios milenios donde el campo de trabajo era exclusi-
vamente las poblaciones o universos, es decir la totalidad de los individuos o
elementos involucrados en el estudio de un problema, se vio enriquecida por
el desarrollo de la teora de la probabilidad la cual le permiti extender su
alcance hacia el interior de dichas poblaciones y ampliar su metodologa al
tratamiento de los subconjuntos de ellas, las muestras.
Los trabajos de Bernoulli, Laplace, Gauss y Galton entre otros, proveyeron
al clculo de probabilidades de recursos matemticos que permitieron dise-
ar modelos probabilsticos aplicables a diversos campos de la ciencia. Los
modelos probabilsticos, cuyo ncleo son las distribuciones de probabilidad
de las variables involucradas en los problemas de estudio (apartado 2.2.),
son la base de la inferencia estadstica.
La inferencia estadstica Unidad 3 es el procedimiento por el cual se
extrapolan o extienden a la poblacin en estudio los resultados de una mues-
tra representativa. A partir de los indicadores o estadsticos muestrales se
estiman (apartado 3.2.) o se someten a prueba (apartado 3.3.) los indicado-
res poblacionales tambin denominados parmetros.
In tro duc cin
Por ltimo, se tratan algunos elementos de econometra Unidad 4, nocio-
nes sobre la relacin entre variables como el anlisis de regresin lineal, el
anlisis de correlacin y un breve estudio sobre las series de tiempo.
El orden y sentido en que se desarrollan los distintos conceptos en el trans-
curso del presente material se sintetiza en el diagrama siguiente.
Mapa conceptual
Problemtica del campo
La estadstica se compone de dos grandes reas, la descriptiva y la inferencial.
Por medio de la estadstica descriptiva se analizan propiedades de un con-
junto de datos referidas al contexto en el que ellos se encuentran inmersos y
no como entidades aisladas. Por ese motivo es muy importante antes del an-
lisis descriptivo, conocer y clarificar el entorno del que provienen los datos.
Cuando hablamos del entorno estamos haciendo referencia a la poblacin en
estudio (o a una parte de ella) y a sus unidades de anlisis, a los atributos
que interesa estudiar y a la calidad del dato que se puede extraer.
Por otro lado, en los estudios de campo se da con frecuencia y por distin-
tas causas la imposibilidad de acceder a toda la poblacin y es en esos casos
donde los datos tienen que extraerse de un subconjunto de ella al que deno-
minamos muestra. Si el objetivo del anlisis de la muestra es realizar infe-
rencias respecto a la poblacin, necesariamente debe ser una muestra repre-
sentativa que comportndose como una imagen reducida de esa poblacin
de estudio refleje sus caractersticas. Estas muestras son obtenidas por
mtodos de muestreo aleatorio.
La estadstica inferencial tiene como objetivo realizar inferencias sobre la
poblacin en un ambiente de incertidumbre producto del azar y la aleatoriedad.
En sntesis, hay dos grandes problemas con los que se encuentra este
campo del saber el conocimiento del contexto de estudio y el tratamiento de
la incertidumbre.
10
Universidad Virtual de Quilmes
Aprehender tcnicas y mtodos estadsticos tanto de la Estadstica des-
criptiva como de la Estadstica inferencial.
Emplear esas tcnicas y mtodos en la formalizacin de modelos esta-
dsticos en el mbito de las ciencias econmicas.
Aplicar el conocimiento estadstico adquirido a la vida cotidiana como parte
de una cultura general.
11
Objetivos del curso
13
Estadstica descriptiva
Ob je ti vos
Determinar y analizar distintos indicadores socioeconmicos.
Construir e interpretar grficos estadsticos diversos.
1.1. Los datos y su organizacin
En este apartado se tratarn algunas de las formas de organizar los datos
recolectados o recopilados y se preparar el material de base para que en los
apartados siguientes puedan elaborarse medidas estadsticas, comnmente
denominadas indicadores estadsticos.
Los datos son tomados de una cierta poblacin o universo objeto de estu-
dio: la poblacin objetivo.
Por ejemplo, todos los empleados de una determinada pyme constituyen
una poblacin objetivo. Y en ese caso, cada individuo de ese universo cada
empleado es lo que se denomina una unidad de observacin.
En el estudio de la poblacin nos pueden interesar determinados atribu-
tos comunes a los individuos como la edad, el salario, la antigedad, etc. Los
archivos de la empresa combinados con entrevistas personales pueden haber
sido los instrumentos con que se relev la informacin.
El paso inicial para organizar toda la informacin primaria obtenida del
grupo de empleados de la pyme y que la presente en su totalidad, es elabo-
rar una tabla denominada matriz de datos. Una matriz de datos es un arreglo
de filas y columnas donde cada fila representa un individuo o unidad de obser-
vacin y cada columna un atributo variable (en el apartado 1.3. figuran cuatro
matrices de datos llamadas a partir de ahora matrices ejemplo ME cada
vez que se haga referencia a ellas).
Cada uno de los atributos variables que se observan en la matriz son pasi-
bles de convertirse en lo que llamamos variables estadsticas.
1.1.1. Variables estadsticas y su clasificacin
Las variables estadsticas se obtienen a partir de los atributos. Por ejemplo,
si el atributo primario hubiese sido la fecha de nacimiento de cada empleado,
para su tratamiento estadstico se disea la variable edad en aos. Por otro
lado, contando con la fecha de nacimiento y la fecha de ingreso podra dise-
1
En el apartado 1.6. figu-
ran varios ejemplos de
poblacin objetivo y de unidad de
observacin.
Otros instrumentos de
recoleccin de datos son:
documentos, encuestas o simple
observacin.
Puede haber atributos
que no varen de un indi-
viduo a otro, como la pertenen-
cia a la empresa, ya que todos
son empleados.
arse la variable edad que tena cuando ingres a la empresa (en este caso
la variable surge de una combinacin de atributos).
Para un primer tratamiento se convertir cada atributo de las matrices ejem-
plo ME en una variable estadstica.
Si se observan detenidamente cada una de las variables se puede notar
que algunas asumen valores numricos y otras valores no numricos.
A las que asumen valores numricos las denominaremos variables cuan-
titativas y a las que asumen valores no numricos, es decir cualidades, varia-
bles cualitativas.
Son ejemplos de variables cuantitativas la antigedad, el salario quince-
nal, la cantidad de personal, la longitud de las piezas de plstico, etc. Son
ejemplos de variables cualitativas el sexo, el tipo de posesin de la vivienda,
el rubro de las pymes, el tipo de materia prima, etctera.
1.
Clasificar como cuantitativas o cualitativas cada una de las variables de
las ME del apartado 1.3.
Si se observan ms detenidamente las variables de las matrices ejemplo se
puede notar que hay variables cuantitativas que asumen valores dentro del
conjunto de los nmeros reales y hay otras cuyos valores son nmeros ente-
ros. A las que asumen valores reales las denominamos cuantitativas conti-
nuas y a las otras cuantitativas discretas. Por ejemplo: la edad civil es por
naturaleza una variable discreta pero eventualmente si se tratara la edad bio-
lgica sta sera por naturaleza una variable cuantitativa continua.
Con respecto a las variables cualitativas se puede notar que en algunas de
ellas sus valores pueden ordenarse y en otras no. Esto justifica tambin sub-
clasificarla en cualitativas ordenables y cualitativas no ordenables. Un ejem-
plo de variable cualitativa ordenable es el nivel de detalle de terminacin de
las piezas plsticas y un ejemplo de no ordenable es el rubro de las pymes.
2.
Completar la actividad 1 con la clasificacin de las variables.
Por qu motivo cree que es necesaria la clasificacin realizada para las
variables y cul ser su utilidad?
14
Universidad Virtual de Quilmes
7
FIN DE LEER ATENTO
COMIENZO DE ACTIVIDAD

Completar la actividad 1 con la clasiIicacion de las variables.


FIN DE ACTIVIDAD
COMIENZO DE PARA REFLEXIONAR
Por que motivo cree que es necesaria la clasiIicacion realizada
para las variables y cual sera su utilidad?
FIN DE PARA REFLEXIONAR
1.1.2. Ordenamiento y tabuIacin de Ios datos
A partir de aqui se seguira la organizacion de los datos centrando la
atencion en cada una de las variables y teniendo en cuenta su
complejidad.
Variable cualitativa no ordenable
Elegimos para esta categoria la variable 'Rubro de la pyme de la
matriz de ejemplo ME 3.
Los rubros relevados en la muestra son: servicios (S), industrial (I),
agricola (A) y comercial (C). Podria interesarnos cuantas empresas hay
de cada rubro, entonces armamos la siguiente tabla denominada tabla de
distribucion de Irecuencias.
Rubo Cantidad de e
6
C 5
9
4
Total 24
varlables
Cuantltatlvas
Cualltatlvas
Dlsoretas
Ccntlnuas
0rdenables
Nc crdenables
1.1.2. Ordenamiento y tabulacin de los datos
A partir de aqu se seguir la organizacin de los datos centrando la atencin
en cada una de las variables y teniendo en cuenta su complejidad.
Variable cualitativa no ordenable
Elegimos para esta categora la variable Rubro de la pyme de la matriz de
ejemplo ME 3.
Los rubros relevados en la muestra son: servicios (S), industrial (I), agr-
cola (A) y comercial (C). Podra interesarnos cuntas empresas hay de cada
rubro, entonces armamos la siguiente tabla denominada tabla de distribucin
de frecuencias.
El conteo realizado para la segunda columna de la tabla constituye lo que lla-
maremos de aqu en ms frecuencia absoluta.
Se denomina frecuencia absoluta a la cantidad de veces que aparece cada
valor de la variable en el grupo de datos estudiado.
Es importante tener en cuenta que la suma de todas las frecuencias abso-
lutas es igual a la cantidad total de datos.
Ampliando el concepto de frecuencia de tal manera de involucrar no slo las
cantidades con que aparece cada rubro sino tambin su incidencia respecto
del total, surgen las denominadas frecuencias porcentuales y relativas.
La frecuencia relativa se calcula dividiendo cada frecuencia absoluta por
el total de datos.
La frecuencia porcentual se calcula multiplicando por 100 la respectiva
frecuencia relativa.
La tabla que sigue, que llamaremos de aqu en adelante tabla de distribucin
de frecuencias o distribucin de frecuencias a secas, incluye a los tres tipos
de frecuencias definidas anteriormente.
15
Estadistica
FIN DE LEER ATENTO
COMIENZO DE ACTIVIDAD
2.
Completar la actividad 1 con la clasicacin de las variables.
FIN DE ACTIVIDAD
COMIENZO DE PARA REFLEXIONAR
Por qu motivo cree que es necesaria la clasicacin realizada para las variables y cul ser su utilidad?
FIN DE PARA REFLEXIONAR
1.1.2. Ordenamiento y tabulacin de los datos
A partir de aqu se seguir la organizacin de los datos centrando la atencin en cada una de las variables y teniendo
en cuenta su complejidad.
Variable cualitativa no ordenable
Elegimos para esta categora la variable Rubro de la pyme de la matriz de ejemplo ME 3.
Los rubros relevados en la muestra son: servicios (S), industrial (I), agrcola (A) y comercial (C). Podra interesarnos
cuntas empresas hay de cada rubro, entonces armamos la siguiente tabla denominada tabla de distribucin de
frecuencias.
Rubro Cantidad de Pymes
A 6
C 5
I 9
S 4
Total 24
El conteo realizado para la segunda columna de la tabla constituye lo que llamaremos de aqu en ms frecuencia
absoluta.
COMIENZO DE LEER ATENTO
Se denomina frecuencia absoluta a la cantidad de veces que aparece cada valor de la variable en el grupo de
datos estudiado.
Es importante tener en cuenta que la suma de todas las frecuencias absolutas es igual a la cantidad total
de datos.
FIN DE LEER ATENTO
COMIENZO DE PASTILLA EN freouenoia absoluta
La notacin usual para la frecuencia absoluta es f y para la cantidad total de datos muestrales n.
FIN DE PASTILLA
COMIENZO DE PASTILLA EN oantidad total de datos
La notacin usual para la fre-
cuencia absoluta es f y para la
cantidad total de datos
muestrales n.
Si el grupo relevado es
una poblacin denota-
remos con N a la cantidad total
de datos.
La frecuencia relativa se abrevia
con f
r
y el total es 1.
La frecuencia porcentual
se abrevia con f
%
y el total
es 100.
Tabla 1.1.
Variable cualitativa ordenable
Como ejemplo para este tipo de variables tomaremos el nivel de detalles de
terminacin de las piezas plsticas de la ME 4.
Tabla 1.2.
Como puede apreciarse, en la tabla de distribucin de frecuencias se consig-
naron los valores o categoras en sentido creciente, acorde con la natura-
leza ordenable de la variable. En la tabla podemos leer, por ejemplo, cuntas
piezas de plstico (o qu porcentaje de ellas) cumplen con un determinado
nivel de detalle de terminacin.
El carcter de ordenables que adquieren las categoras nos habilita a crear lo
que denominaremos un arreglo de datos ordenados:
Donde: Detalle de terminacin Regular: R; Bueno: B; Muy bueno: MB y Exce-
lente: E.
Por una cuestin de economa de espacio hemos elegido representar el arre-
glo mediante una matriz fila, pero puede usarse una matriz columna sin que
ello altere la esencia del ordenamiento.
Aprovechando la propiedad de ordenamiento de las categoras, sometere-
mos las frecuencias de la tabla 1.2. a un mecanismo de acumulacin y defi-
niremos las frecuencias acumuladas absoluta, relativa y porcentual, esto es
cuntas piezas de plstico (o qu porcentaje) cumplen con un nivel mximo
de detalles de terminacin.
16
Universidad Virtual de Quilmes
Rubro f f
r
f
%
A 6 0,25 25
C 5 0,21 21
I 9 0,37 37
S 4 0,17 17
Total 24 1,00 100
Donde: Rubro Agrcola: A; Comercial: C; Industrial: I y Servicios: S.
Tabla 1.2.
Detalle de
terminacin
f f
r
f
%
Regular 5 0,25 25
Bueno 5 0,25 25
Muy bueno 5 0,25 25
Excelente 5 0,25 25
Total 20 1 100
Si el grupo relevado es una poblacin denotaremos con N a la cantidad total de datos.
FIN DE PASTILLA
Ampliando el concepto de frecuencia de tal manera de involucrar no slo las cantidades con que aparece cada rubro
sino tambin su incidencia respecto del total, surgen las denominadas frecuencias porcentuales y relativas.

COMIENZO DE LEER ATENTO
La frecuencia relativa se calcula dividiendo cada frecuencia absoluta por el total de datos.
La frecuencia porcentual se calcula multiplicando por 100 la respectiva frecuencia relativa.
FIN DE LEER ATENTO
COMIENZO DE PASTILLA EN freouenoia relativa
La freouenoia relativa se abrevia oon f
r
y el total es 1
FIN DE PASTILLA
COMIENZO DE PASTILLA EN freouenoia poroentual
La freouenoia poroentual se abrevia oon f
%
y el total es 100.
FIN DE PASTILLA
La tabla que sigue, que llamaremos de aqu en adelante tabla de distribucin de frecuencias o distribucin de frecuencias
a secas, incluye a los tres tipos de frecuencias denidas anteriormente.
Tabla 1.1.
Rubro f f
r
f
%
A 6 0,25 25
C 5 0,21 21
I 9 0,37 37
S 4 0,17 17
Total 24 1,00 100
Uonde: Rubro Agrioola: A, Comeroial: C, lndustrial: l y 3ervioios: 3.
Variable cualitativa ordenable
Como ejemplo para este tipo de variables tomaremos el nivel de detalles de terminacin de las piezas plsticas de la
ME 4.
Tabla 1.2.
Detalle de
terminacin
f f
r
f
%
Regular 5 0,25 25
Bueno 5 0,25 25
Muy bueno 5 0,25 25
Excelente 5 0,25 25
Total 20 1 100
Como puede apreciarse, en la tabla de distribucin de frecuencias se consignaron los valores o categoras en
sentido creciente, acorde con la naturaleza ordenable de la variable. En la tabla podemos leer, por ejemplo, cuntas
piezas de plstico (o qu porcentaje de ellas) cumplen con un determinado nivel de detalle de terminacin.
El carcter de ordenables que adquieren las categoras nos habilita a crear lo que denominaremos un arreglo de datos
ordenados:
R R R R R B B B B B MB MB MB MB MB E E E E E
Uonde: Uetalle de terminaoion Regular: R, Bueno: B, Muy bueno: MB y Lxoelente: L.
Por una cuestin de economa de espacio hemos elegido representar el arreglo mediante una matriz la, pero puede
usarse una matriz columna sin que ello altere la esencia del ordenamiento.
Aprovechando la propiedad de ordenamiento de las categoras, someteremos las frecuencias de la tabla 1.2. a un
mecanismo de acumulacin y deniremos las frecuencias acumuladas absoluta, relativa y porcentual, esto es cuntas
piezas de plstico (o qu porcentaje) cumplen con un nivel mximo de detalles de terminacin.
COMIENZO DE LEER ATENTO
La frecuencia absoluta acumulada que denotamos con F hasta una determinada categora de la variable resulta
de sumarle a su frecuencia absoluta todas las frecuencias absolutas de los valores o categoras menores.
La frecuencia relativa acumulada Fr hasta una categora se calcula sumndole a su frecuencia relativa las
frecuencias relativas de las categoras anteriores.
La frecuencia porcentual acumulada F% hasta una determinada categora o valor se calcula sumndole a
su frecuencia porcentual las frecuencias porcentuales anteriores.
FIN DE LEER ATENTO
En la siguiente distribucin se encuentran ya consignadas todas las frecuencias denidas anteriormente.
Tabla 1.3.
Detalle de
terminacin
f f
r
f
%
F F
r
F
%
Regular 5 0,25 25 5 0,25 25
Bueno 5 0,25 25 10 0,50 50
Muy bueno 5 0,25 25 15 0,75 75
Excelente 5 0,25 25 20 1,00 100
Total 20 1 100
Variable cuantitativa discreta
Caso 1. Edad de los trabajadores de una empresa cooperativa, (extrada de la EM 1).
Para el tratamiento de esta variable procederemos como se hizo para la cualitativa ordenable.
Arreglo de datos ordenados
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Distribucin de frecuencias
La frecuencia absoluta acumulada que denotamos con F hasta una deter-
minada categora de la variable resulta de sumarle a su frecuencia absolu-
ta todas las frecuencias absolutas de los valores o categoras menores.
La frecuencia relativa acumulada Fr hasta una categora se calcula sumn-
dole a su frecuencia relativa las frecuencias relativas de las categoras
anteriores.
La frecuencia porcentual acumulada F% hasta una determinada cate-
gora o valor se calcula sumndole a su frecuencia porcentual las fre-
cuencias porcentuales anteriores.
En la siguiente distribucin se encuentran ya consignadas todas las frecuen-
cias definidas anteriormente.
Tabla 1.3.
Variable cuantitativa discreta
Caso 1. Edad de los trabajadores de una empresa cooperativa, (extrada de
la EM 1).
Para el tratamiento de esta variable procederemos como se hizo para la cua-
litativa ordenable.
Arreglo de datos ordenados
Distribucin de frecuencias
17
Estadistica
R R R R R B B B B B MB MB MB MB MB E E E E E
Uonde: Uetalle de terminaoion Regular: R, Bueno: B, Muy bueno: MB y Lxoelente: L.
Por una cuestin de economa de espacio hemos elegido representar el arreglo mediante una matriz la, pero puede
usarse una matriz columna sin que ello altere la esencia del ordenamiento.
Aprovechando la propiedad de ordenamiento de las categoras, someteremos las frecuencias de la tabla 1.2. a un
mecanismo de acumulacin y deniremos las frecuencias acumuladas absoluta, relativa y porcentual, esto es cuntas
piezas de plstico (o qu porcentaje) cumplen con un nivel mximo de detalles de terminacin.
COMIENZO DE LEER ATENTO
La frecuencia absoluta acumulada que denotamos con F hasta una determinada categora de la variable resulta
de sumarle a su frecuencia absoluta todas las frecuencias absolutas de los valores o categoras menores.
La frecuencia relativa acumulada Fr hasta una categora se calcula sumndole a su frecuencia relativa las
frecuencias relativas de las categoras anteriores.
La frecuencia porcentual acumulada F% hasta una determinada categora o valor se calcula sumndole a
su frecuencia porcentual las frecuencias porcentuales anteriores.
FIN DE LEER ATENTO
En la siguiente distribucin se encuentran ya consignadas todas las frecuencias denidas anteriormente.
Tabla 1.3.
Detalle de
terminacin
f f
r
f
%
F F
r
F
%
Regular 5 0,25 25 5 0,25 25
Bueno 5 0,25 25 10 0,50 50
Muy bueno 5 0,25 25 15 0,75 75
Excelente 5 0,25 25 20 1,00 100
Total 20 1 100
Variable cuantitativa discreta
Caso 1. Edad de los trabajadores de una empresa cooperativa, (extrada de la EM 1).
Para el tratamiento de esta variable procederemos como se hizo para la cualitativa ordenable.
Arreglo de datos ordenados
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Distribucin de frecuencias
R R R R R B B B B B MB MB MB MB MB E E E E E
Uonde: Uetalle de terminaoion Regular: R, Bueno: B, Muy bueno: MB y Lxoelente: L.
Por una cuestin de economa de espacio hemos elegido representar el arreglo mediante una matriz la, pero puede
usarse una matriz columna sin que ello altere la esencia del ordenamiento.
Aprovechando la propiedad de ordenamiento de las categoras, someteremos las frecuencias de la tabla 1.2. a un
mecanismo de acumulacin y deniremos las frecuencias acumuladas absoluta, relativa y porcentual, esto es cuntas
piezas de plstico (o qu porcentaje) cumplen con un nivel mximo de detalles de terminacin.
COMIENZO DE LEER ATENTO
La frecuencia absoluta acumulada que denotamos con F hasta una determinada categora de la variable resulta
de sumarle a su frecuencia absoluta todas las frecuencias absolutas de los valores o categoras menores.
La frecuencia relativa acumulada Fr hasta una categora se calcula sumndole a su frecuencia relativa las
frecuencias relativas de las categoras anteriores.
La frecuencia porcentual acumulada F% hasta una determinada categora o valor se calcula sumndole a
su frecuencia porcentual las frecuencias porcentuales anteriores.
FIN DE LEER ATENTO
En la siguiente distribucin se encuentran ya consignadas todas las frecuencias denidas anteriormente.
Tabla 1.3.
Detalle de
terminacin
f f
r
f
%
F F
r
F
%
Regular 5 0,25 25 5 0,25 25
Bueno 5 0,25 25 10 0,50 50
Muy bueno 5 0,25 25 15 0,75 75
Excelente 5 0,25 25 20 1,00 100
Total 20 1 100
Variable cuantitativa discreta
Caso 1. Edad de los trabajadores de una empresa cooperativa, (extrada de la EM 1).
Para el tratamiento de esta variable procederemos como se hizo para la cualitativa ordenable.
Arreglo de datos ordenados
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Distribucin de frecuencias
Tabla 1.4.
Caso 2. Edad de los empleados de una fbrica automotriz.
A continuacin se transcriben las edades de una muestra de 80 empleados
de una fbrica automotriz.
Arreglo de datos ordenados
Si intentramos listar en una tabla de frecuencias los 80 datos nos encon-
traramos con una gran variedad de valores. Adems, sus correspondientes fre-
cuencias son similares. Ante este panorama el sentido comn aconseja orga-
nizar los datos por franjas de edad.
18
Universidad Virtual de Quilmes
Tabla 1.4.
Edad f f
r
f
%
F
i
F
r
F
%
21 1 0,05 5 1 0,05 5
25 1 0,05 5 2 0,10 10
28 1 0,05 5 3 0,15 15
30 1 0,05 5 4 0,20 20
34 1 0,05 5 5 0,25 25
36 2 0,1 10 7 0,35 35
37 3 0,15 15 10 0,50 50
38 1 0,05 5 11 0,55 55
39 2 0,1 10 13 0,65 65
40 2 0,1 10 15 0,75 75
42 1 0,05 5 16 0,80 80
48 1 0,05 5 17 0,85 85
51 1 0,05 5 18 0,90 90
57 1 0,05 5 19 0,95 95
63 1 0,05 5 20 1,00 100
Total 20 1 100
Caso 2. Edad de los empleados de una fbrica automotriz.
A continuacin se transcriben las edades de una muestra de 80 empleados de una fbrica automotriz.
40 33 18 33 54 20 42 36 40 39 24 42 38 64 27 48 58 37 29 49
30 31 41 50 32 18 42 53 46 34 34 34 35 35 44 36 21 55 36 15
29 37 62 38 25 39 22 39 49 40 21 41 31 33 25 20 43 43 35 44
45 17 46 27 48 30 49 37 50 32 51 33 54 19 36 56 28 59 38 27
Arreglo de datos ordenados
15 17 18 18 19 20 20 21 21 22 24 25 25 27 27 27 28 29 29 30
30 31 31 32 32 33 33 33 33 34 34 34 35 35 35 36 36 36 36 37
37 37 38 38 38 39 39 39 40 40 40 41 41 42 42 42 43 43 44 44
45 46 46 48 48 49 49 49 50 50 51 53 54 54 55 56 58 59 62 64
Si intentramos listar en una tabla de frecuencias los 80 datos nos encontraramos con una gran variedad de valores.
Adems, sus correspondientes frecuencias son similares. Ante este panorama el sentido comn aconseja organizar los
datos por franjas de edad.
Tabla 1.5.
Franja de edad f
15 a 19 5
20 a 24 6
25 a 29 8
30 a 34 13
35 a 39 16
40 a 44 12
45 a 49 8
50 a 54 6
55 a 59 4
60 a 64 2
Total 80
Tabla 1.4.
Edad f f
r
f
%
F
i
F
r
F
%
21 1 0,05 5 1 0,05 5
25 1 0,05 5 2 0,10 10
28 1 0,05 5 3 0,15 15
30 1 0,05 5 4 0,20 20
34 1 0,05 5 5 0,25 25
36 2 0,1 10 7 0,35 35
37 3 0,15 15 10 0,50 50
38 1 0,05 5 11 0,55 55
39 2 0,1 10 13 0,65 65
40 2 0,1 10 15 0,75 75
42 1 0,05 5 16 0,80 80
48 1 0,05 5 17 0,85 85
51 1 0,05 5 18 0,90 90
57 1 0,05 5 19 0,95 95
63 1 0,05 5 20 1,00 100
Total 20 1 100
Caso 2. Edad de los empleados de una fbrica automotriz.
A continuacin se transcriben las edades de una muestra de 80 empleados de una fbrica automotriz.
40 33 18 33 54 20 42 36 40 39 24 42 38 64 27 48 58 37 29 49
30 31 41 50 32 18 42 53 46 34 34 34 35 35 44 36 21 55 36 15
29 37 62 38 25 39 22 39 49 40 21 41 31 33 25 20 43 43 35 44
45 17 46 27 48 30 49 37 50 32 51 33 54 19 36 56 28 59 38 27
Arreglo de datos ordenados
15 17 18 18 19 20 20 21 21 22 24 25 25 27 27 27 28 29 29 30
30 31 31 32 32 33 33 33 33 34 34 34 35 35 35 36 36 36 36 37
37 37 38 38 38 39 39 39 40 40 40 41 41 42 42 42 43 43 44 44
45 46 46 48 48 49 49 49 50 50 51 53 54 54 55 56 58 59 62 64
Si intentramos listar en una tabla de frecuencias los 80 datos nos encontraramos con una gran variedad de valores.
Adems, sus correspondientes frecuencias son similares. Ante este panorama el sentido comn aconseja organizar los
datos por franjas de edad.
Tabla 1.5.
Franja de edad f
15 a 19 5
20 a 24 6
25 a 29 8
30 a 34 13
35 a 39 16
40 a 44 12
45 a 49 8
50 a 54 6
55 a 59 4
60 a 64 2
Total 80
Tabla 1.4.
Edad f f
r
f
%
F
i
F
r
F
%
21 1 0,05 5 1 0,05 5
25 1 0,05 5 2 0,10 10
28 1 0,05 5 3 0,15 15
30 1 0,05 5 4 0,20 20
34 1 0,05 5 5 0,25 25
36 2 0,1 10 7 0,35 35
37 3 0,15 15 10 0,50 50
38 1 0,05 5 11 0,55 55
39 2 0,1 10 13 0,65 65
40 2 0,1 10 15 0,75 75
42 1 0,05 5 16 0,80 80
48 1 0,05 5 17 0,85 85
51 1 0,05 5 18 0,90 90
57 1 0,05 5 19 0,95 95
63 1 0,05 5 20 1,00 100
Total 20 1 100
Caso 2. Edad de los empleados de una fbrica automotriz.
A continuacin se transcriben las edades de una muestra de 80 empleados de una fbrica automotriz.
40 33 18 33 54 20 42 36 40 39 24 42 38 64 27 48 58 37 29 49
30 31 41 50 32 18 42 53 46 34 34 34 35 35 44 36 21 55 36 15
29 37 62 38 25 39 22 39 49 40 21 41 31 33 25 20 43 43 35 44
45 17 46 27 48 30 49 37 50 32 51 33 54 19 36 56 28 59 38 27
Arreglo de datos ordenados
15 17 18 18 19 20 20 21 21 22 24 25 25 27 27 27 28 29 29 30
30 31 31 32 32 33 33 33 33 34 34 34 35 35 35 36 36 36 36 37
37 37 38 38 38 39 39 39 40 40 40 41 41 42 42 42 43 43 44 44
45 46 46 48 48 49 49 49 50 50 51 53 54 54 55 56 58 59 62 64
Si intentramos listar en una tabla de frecuencias los 80 datos nos encontraramos con una gran variedad de valores.
Adems, sus correspondientes frecuencias son similares. Ante este panorama el sentido comn aconseja organizar los
datos por franjas de edad.
Tabla 1.5.
Franja de edad f
15 a 19 5
20 a 24 6
25 a 29 8
30 a 34 13
35 a 39 16
40 a 44 12
45 a 49 8
50 a 54 6
55 a 59 4
60 a 64 2
Total 80
Tabla 1.5.
Para poder usar, ms adelante, con comodidad este material llamamos a esas
franjas intervalos de clase y los describimos agregando para el conteo algu-
na convencin.
Tabla 1.6.
La convencin que se us para ajustar los intervalos de clase y hacerlos adya-
centes, fue cerrarlos a izquierda y abrirlos a derecha. Podra haber sido al
revs, abiertos a izquierda y cerrados a derecha, pero una vez elegida una de
las dos convenciones debe mantenrsela para toda la distribucin.
Por qu es necesario mantener la convencin elegida en toda la distri-
bucin? Qu problemas acarreara utilizar las dos convenciones en una
misma tabla?
Caso 3. En la siguiente tabla elaborada por los editores de una revista estu-
diantil universitaria con base en informacin del Nunca Ms (Informe de la
CONADEP, Eudeba, 1984), se presenta la edad de las personas desaparecidas
en la Argentina por la ltima dictadura militar (1976-1983).
19
Estadistica
Tabla 1.4.
Edad f f
r
f
%
F
i
F
r
F
%
21 1 0,05 5 1 0,05 5
25 1 0,05 5 2 0,10 10
28 1 0,05 5 3 0,15 15
30 1 0,05 5 4 0,20 20
34 1 0,05 5 5 0,25 25
36 2 0,1 10 7 0,35 35
37 3 0,15 15 10 0,50 50
38 1 0,05 5 11 0,55 55
39 2 0,1 10 13 0,65 65
40 2 0,1 10 15 0,75 75
42 1 0,05 5 16 0,80 80
48 1 0,05 5 17 0,85 85
51 1 0,05 5 18 0,90 90
57 1 0,05 5 19 0,95 95
63 1 0,05 5 20 1,00 100
Total 20 1 100
Caso 2. Edad de los empleados de una fbrica automotriz.
A continuacin se transcriben las edades de una muestra de 80 empleados de una fbrica automotriz.
40 33 18 33 54 20 42 36 40 39 24 42 38 64 27 48 58 37 29 49
30 31 41 50 32 18 42 53 46 34 34 34 35 35 44 36 21 55 36 15
29 37 62 38 25 39 22 39 49 40 21 41 31 33 25 20 43 43 35 44
45 17 46 27 48 30 49 37 50 32 51 33 54 19 36 56 28 59 38 27
Arreglo de datos ordenados
15 17 18 18 19 20 20 21 21 22 24 25 25 27 27 27 28 29 29 30
30 31 31 32 32 33 33 33 33 34 34 34 35 35 35 36 36 36 36 37
37 37 38 38 38 39 39 39 40 40 40 41 41 42 42 42 43 43 44 44
45 46 46 48 48 49 49 49 50 50 51 53 54 54 55 56 58 59 62 64
Si intentramos listar en una tabla de frecuencias los 80 datos nos encontraramos con una gran variedad de valores.
Adems, sus correspondientes frecuencias son similares. Ante este panorama el sentido comn aconseja organizar los
datos por franjas de edad.
Tabla 1.5.
Franja de edad f
15 a 19 5
20 a 24 6
25 a 29 8
30 a 34 13
35 a 39 16
40 a 44 12
45 a 49 8
50 a 54 6
55 a 59 4
60 a 64 2
Total 80
Para poder usar, ms adelante, con comodidad este material llamamos a esas franjas intervalos de clase y los describimos
agregando para el conteo alguna convencin.
Tabla 1.6.
Edad F f
r
f
%
F
i
F
r
F
%
[15 - 20) 5 0,0625 6,25 5 0,0625 6,25
[20 - 25) 6 0,0750 7,50 11 0,1375 13,75
[25 - 30) 8 0,1000 10,00 19 0,2375 23,75
[30 - 35) 13 0,1625 16,25 32 0,4000 40,00
[35 - 40) 16 0,2000 20,00 48 0,6000 60,00
[40 - 45) 12 0,1500 15,00 60 0,7500 75,00
[45 - 50) 8 0,1000 10,00 68 0,8500 85,00
[50 - 55) 6 0,0750 7,50 74 0,9250 92,50
[55 - 60) 4 0,0500 5,00 78 0,9750 97,50
[60 - 65) 2 0,0250 2,50 80 1,0000 100,00
Total 80 1,0000 100,00
La convencin que se us para ajustar los intervalos de clase y hacerlos adyacentes, fue cerrarlos a izquierda y abrirlos
a derecha. Podra haber sido al revs, abiertos a izquierda y cerrados a derecha, pero una vez elegida una de las dos
convenciones debe mantenrsela para toda la distribucin.
COMIENZO DE PASTILLA EN intervalos de olase
Ll oonjunto de intervalos debe ser exhaustivo -es deoir ningun dato puede quedar exoluido- los intervalos son exoluyentes entre si por eso
deben ser semiabiertos.
FIN DE PASTILLA
COMIENZO DE PARA REFLEXIONAR
Por qu es necesario mantener la convencin elegida en toda la distribucin? Qu problemas acarreara utilizar
Caso 3. En la siguiente tabla elaborada por los editores de una revista estudiantil universitaria con base en informacin
del Nunca Ms (Informe de la CONADEP, Eudeba, 1984), se presenta la edad de las personas desaparecidas en la
Argentina por la ltima dictadura militar (1976-1983).
Tabla 1.7.
Edad al momento de la
desaparicin forzada
f%
0 a 5 0,82
6 a 10 0,25
11 a 15 0,58
16 a 20 10,61
21 a 25 32,62
26 a 30 25,90
31 a 35 12,26
36 a 40 6,73
41 a 45 3,40
46 a 50 2,41
51 a 55 1,84
56 a 60 1,17
61 a 65 0,75
66 a 70 0,41
+ de 70 0,25
Total 100,00
El conjunto de interva-
los debe ser exhaustivo
es decir, ningn dato puede que-
dar excluido y los intervalos son
excluyentes entre s por eso deben
ser semiabiertos.
Tabla 1.7.
Notemos que en este caso no disponemos de los datos de campo y que en con-
secuencia no necesitamos adoptar convencin alguna para el conteo. Para futu-
ros usos retocamos algunos lmites de los intervalos de tal forma que sean
rigurosamente adyacentes en el dominio de los nmeros reales y tengan la
misma amplitud, y agregamos una columna con frecuencias acumuladas:
Tabla 1.8.
20
Universidad Virtual de Quilmes
Para poder usar, ms adelante, con comodidad este material llamamos a esas franjas intervalos de clase y los describimos
agregando para el conteo alguna convencin.
Tabla 1.6.
Edad F f
r
f
%
F
i
F
r
F
%
[15 - 20) 5 0,0625 6,25 5 0,0625 6,25
[20 - 25) 6 0,0750 7,50 11 0,1375 13,75
[25 - 30) 8 0,1000 10,00 19 0,2375 23,75
[30 - 35) 13 0,1625 16,25 32 0,4000 40,00
[35 - 40) 16 0,2000 20,00 48 0,6000 60,00
[40 - 45) 12 0,1500 15,00 60 0,7500 75,00
[45 - 50) 8 0,1000 10,00 68 0,8500 85,00
[50 - 55) 6 0,0750 7,50 74 0,9250 92,50
[55 - 60) 4 0,0500 5,00 78 0,9750 97,50
[60 - 65) 2 0,0250 2,50 80 1,0000 100,00
Total 80 1,0000 100,00
La convencin que se us para ajustar los intervalos de clase y hacerlos adyacentes, fue cerrarlos a izquierda y abrirlos
a derecha. Podra haber sido al revs, abiertos a izquierda y cerrados a derecha, pero una vez elegida una de las dos
convenciones debe mantenrsela para toda la distribucin.
COMIENZO DE PASTILLA EN intervalos de olase
Ll oonjunto de intervalos debe ser exhaustivo -es deoir ningun dato puede quedar exoluido- los intervalos son exoluyentes entre si por eso
deben ser semiabiertos.
FIN DE PASTILLA
COMIENZO DE PARA REFLEXIONAR
Por qu es necesario mantener la convencin elegida en toda la distribucin? Qu problemas acarreara utilizar
Caso 3. En la siguiente tabla elaborada por los editores de una revista estudiantil universitaria con base en informacin
del Nunca Ms (Informe de la CONADEP, Eudeba, 1984), se presenta la edad de las personas desaparecidas en la
Argentina por la ltima dictadura militar (1976-1983).
Tabla 1.7.
Edad al momento de la
desaparicin forzada
f%
0 a 5 0,82
6 a 10 0,25
11 a 15 0,58
16 a 20 10,61
21 a 25 32,62
26 a 30 25,90
31 a 35 12,26
36 a 40 6,73
41 a 45 3,40
46 a 50 2,41
51 a 55 1,84
56 a 60 1,17
61 a 65 0,75
66 a 70 0,41
+ de 70 0,25
Total 100,00
Notemos que en este caso no disponemos de los datos de campo y que en consecuencia no necesitamos adoptar
convencin alguna para el conteo.
Para futuros usos retocamos algunos lmites de los intervalos de tal forma que sean rigurosamente adyacentes en el
dominio de los nmeros reales y tengan la misma amplitud, y agregamos una columna con frecuencias acumuladas:
Tabla 1.8.
Edad al momento de la
desaparicin forzada
f% F%
0 - 5 0,82 0,82
5 - 10 0,25 1,07
10 - 15 0,58 1,65
15 - 20 10,61 12,26
20 - 25 32,62 44,88
25 - 30 25,90 70,78
30 - 35 12,26 83,04
35 - 40 6,73 89,77
40 - 45 3,40 93,17
45 - 50 2,41 95,58
50 - 55 1,84 97,42
55 - 60 1,17 98,59
60 - 65 0,75 99,34
65 - 70 0,41 99,75
70 - 75 0,25 100,00
Total 100,00
Variable cuantitativa continua
familia, de 96 familias escogidas al azar de cierta localidad.
40,50 20,65 18,10 30,45 42,70 29,95 23,70 33,10 23,60 30,70
39,40 29,80 39,55 21,90 23,10 53,10 43,70 72,40 58,90 20,27
46,50 47,20 91,00 43,90 33,30 63,90 33,20 43,90 27,85 26,80
51,34 52,90 88,90 33,70 49,30 75,30 45,10 37,90 43,10 31,55
60,00 39,55 69,45 45,95 29,90 53,90 23,10 65,30 33,90 70,80
43,20 72,70 55,50 33,90 34,65 62,65 32,15 43,90 45,30 65,45
57,30 71,10 67,30 39,65 39,90 30,75 52,60 72,65 23,90 45,30
68,40 63,70 39,45 27,99 49,30 43,65 38,75 29,30 32,65 38,10
47,30 58,40 46,00 29,15 63,90 71,00 19,50 37,20 41,20 29,90
29,95 39,65 61,80 37,70 39,65 38,90
Variable cuantitativa continua
Consideremos el siguiente conjunto de datos correspondiente a gastos por
consumo medio diario de alimentos por familia, de 96 familias escogidas al
azar de cierta localidad.
Arreglo de datos ordenados
Como se puede apreciar se opt por organizar el arreglo con forma de matriz
columna, la que adems se parti en cinco tramos para economizar espacio.
De forma similar a lo que se hizo anteriormente con la variable discreta del
21
Estadistica
Notemos que en este caso no disponemos de los datos de campo y que en consecuencia no necesitamos adoptar
convencin alguna para el conteo.
Para futuros usos retocamos algunos lmites de los intervalos de tal forma que sean rigurosamente adyacentes en el
dominio de los nmeros reales y tengan la misma amplitud, y agregamos una columna con frecuencias acumuladas:
Tabla 1.8.
Edad al momento de la
desaparicin forzada
f% F%
0 - 5 0,82 0,82
5 - 10 0,25 1,07
10 - 15 0,58 1,65
15 - 20 10,61 12,26
20 - 25 32,62 44,88
25 - 30 25,90 70,78
30 - 35 12,26 83,04
35 - 40 6,73 89,77
40 - 45 3,40 93,17
45 - 50 2,41 95,58
50 - 55 1,84 97,42
55 - 60 1,17 98,59
60 - 65 0,75 99,34
65 - 70 0,41 99,75
70 - 75 0,25 100,00
Total 100,00
Variable cuantitativa continua
familia, de 96 familias escogidas al azar de cierta localidad.
40,50 20,65 18,10 30,45 42,70 29,95 23,70 33,10 23,60 30,70
39,40 29,80 39,55 21,90 23,10 53,10 43,70 72,40 58,90 20,27
46,50 47,20 91,00 43,90 33,30 63,90 33,20 43,90 27,85 26,80
51,34 52,90 88,90 33,70 49,30 75,30 45,10 37,90 43,10 31,55
60,00 39,55 69,45 45,95 29,90 53,90 23,10 65,30 33,90 70,80
43,20 72,70 55,50 33,90 34,65 62,65 32,15 43,90 45,30 65,45
57,30 71,10 67,30 39,65 39,90 30,75 52,60 72,65 23,90 45,30
68,40 63,70 39,45 27,99 49,30 43,65 38,75 29,30 32,65 38,10
47,30 58,40 46,00 29,15 63,90 71,00 19,50 37,20 41,20 29,90
29,95 39,65 61,80 37,70 39,65 38,90
Arreglo de datos ordenados
18,10 29,95 39,40 45,95 63,90
19,50 30,45 39,45 46,00 63,90
20,27 30,70 39,55 46,50 65,30
20,65 30,75 39,55 47,20 65,45
21,90 31,55 39,65 47,30 67,30
23,10 32,15 39,65 49,30 68,40
23,10 32,65 39,65 49,30 69,45
23,60 33,10 39,90 51,34 70,80
23,70 33,20 41,20 52,60 71,00
23,90 33,30 42,70 52,90 71,10
24,05 33,70 43,10 53,10 72,40
26,80 33,90 43,20 53,90 72,65
27,85 33,90 43,65 55,50 72,70
27,99 34,65 43,70 57,30 75,30
29,15 37,20 43,90 58,40 88,90
29,30 37,70 43,90 58,90 91,00
29,80 37,90 43,90 60,00
29,90 38,10 45,10 61,80
29,90 38,75 45,30 62,65
29,95 38,90 45,30 63,70
Como se puede apreciar se opt por organizar el arreglo con forma de matriz columna, la que adems se parti en cinco
tramos para economizar espacio.
De forma similar a lo que se hizo anteriormente con la variable discreta del Caso 2, y por idnticos motivos, se
confecciona a continuacin una distribucin de frecuencias agrupando los datos en intervalos de clase:
Tabla 1.9.
Gasto medio
diario
f f
%
F F
%
(15 25] 11 11,45 11 11,45
(25 - 35] 23 23,96 34 35,41
(35 - 45] 23 23,96 57 59,37
(45 55] 15 15,63 72 75,00
(55 65] 10 10,42 82 85,42
(65 - 75] 11 11,46 93 96,88
(75 - 85] 1 1,04 94 97,92
(85 - 95] 2 2,08 96 100,00
Total 96 100,00
Tabla de distribucin conjunta
Para armar la siguiente tabla de doble entrada se consideraron las variables Puesto de trabajo entre 2001 y 2003 y
Rubro, ambas de la ME 3.
Caso 2, y por idnticos motivos, se confecciona a continuacin una distribu-
cin de frecuencias agrupando los datos en intervalos de clase:
Tabla 1.9.
Tabla de distribucin conjunta
Para armar la siguiente tabla de doble entrada se consideraron las variables
Puesto de trabajo entre 2001 y 2003 y Rubro, ambas de la ME 3.
Tabla 1.10.
Cada uno de los nmeros que figuran en la tabla result del conteo simult-
neo o conjunto de dos categoras, donde cada categora pertenece a una varia-
ble distinta.
Se puede observar que hay cuatro pymes en la muestra que son del rubro
industrial y que aumentaron los puestos de trabajo entre 2001 y 2003.
Tabla 1.11.
Las frecuencias que figuran en la tabla 1.10. se denominan frecuencias abso-
lutas conjuntas y estn sombreadas en la tabla 1.11. En esta ltima se incor-
poraron adems los totales por filas y columnas que son las frecuencias mar-
ginales o totales.
22
Universidad Virtual de Quilmes
Arreglo de datos ordenados
18,10 29,95 39,40 45,95 63,90
19,50 30,45 39,45 46,00 63,90
20,27 30,70 39,55 46,50 65,30
20,65 30,75 39,55 47,20 65,45
21,90 31,55 39,65 47,30 67,30
23,10 32,15 39,65 49,30 68,40
23,10 32,65 39,65 49,30 69,45
23,60 33,10 39,90 51,34 70,80
23,70 33,20 41,20 52,60 71,00
23,90 33,30 42,70 52,90 71,10
24,05 33,70 43,10 53,10 72,40
26,80 33,90 43,20 53,90 72,65
27,85 33,90 43,65 55,50 72,70
27,99 34,65 43,70 57,30 75,30
29,15 37,20 43,90 58,40 88,90
29,30 37,70 43,90 58,90 91,00
29,80 37,90 43,90 60,00
29,90 38,10 45,10 61,80
29,90 38,75 45,30 62,65
29,95 38,90 45,30 63,70
Como se puede apreciar se opt por organizar el arreglo con forma de matriz columna, la que adems se parti en cinco
tramos para economizar espacio.
De forma similar a lo que se hizo anteriormente con la variable discreta del Caso 2, y por idnticos motivos, se
confecciona a continuacin una distribucin de frecuencias agrupando los datos en intervalos de clase:
Tabla 1.9.
Gasto medio
diario
f f
%
F F
%
(15 25] 11 11,45 11 11,45
(25 - 35] 23 23,96 34 35,41
(35 - 45] 23 23,96 57 59,37
(45 55] 15 15,63 72 75,00
(55 65] 10 10,42 82 85,42
(65 - 75] 11 11,46 93 96,88
(75 - 85] 1 1,04 94 97,92
(85 - 95] 2 2,08 96 100,00
Total 96 100,00
Tabla de distribucin conjunta
Para armar la siguiente tabla de doble entrada se consideraron las variables Puesto de trabajo entre 2001 y 2003 y
Rubro, ambas de la ME 3.
Tabla 1.10.
Puestos de trabajo
2001-2003
Rubro
Agrioola Comeroial lndustrial 3ervioios
Uisminuyo 1 1 3 2
Mantuvo 2 3 3 1
Aumento 2 1 4 1
Cada uno de los nmeros que guran en la tabla result del conteo simultneo o conjunto de dos categoras, donde
cada categora pertenece a una variable distinta.
Se puede observar que hay cuatro pymes en la muestra que son del rubro industrial y que aumentaron los puestos
de trabajo entre 2001 y 2003.
Tabla 1.11.
Puestos de trabajo
2001-2003
Rubro
Agrioola Comeroial lndustrial 3ervioios Total
Uisminuyo 1 1 3 2 7
Mantuvo 2 3 3 1 9
Aumento 2 1 4 1 8
Total 5 5 10 4 24
Las frecuencias que guran en la tabla 1.10. se denominan frecuencias absolutas conjuntas y estn sombreadas en la
tabla 1.11. En esta ltima se incorporaron adems los totales por las y columnas que son las frecuencias marginales o
totales.
COMIENZO DE LEER ATENTO
Si bien las palabras valor, categora y clase pueden usarse como sinnimos, en lo sucesivo seremos ms rigurosos
respecto del signicado de cada una. En ese sentido diremos que las variables cualitativas asumen categoras y las
cuantitativas toman valores o se agrupan en clases (de valores).
FIN DE LEER ATENTO
1.1.3. Representaciones grcas
Para visualizar las distribuciones de frecuencias realizadas previamente recurriremos a distintos grcos. Como el
mundo de los grcos es muy amplio y slo limitado por la imaginacin, seleccionaremos aquellos que consideramos
ms convenientes segn su adecuacin con el tipo de variable analizada.
Variables cualitativas
Para la confeccin de los siguientes grcos se utiliz la informacin de las tablas 1.1. y 1.2.
Grco circular o de torta
Insertar Imagen N G.1.2.
Insertar Imagen N G.1.3.
G.1.2. G.1.3.
2
Tabla 1.10.
Puestos de trabajo
2001-2003
Rubro
Agrioola Comeroial lndustrial 3ervioios
Uisminuyo 1 1 3 2
Mantuvo 2 3 3 1
Aumento 2 1 4 1
Cada uno de los nmeros que guran en la tabla result del conteo simultneo o conjunto de dos categoras, donde
cada categora pertenece a una variable distinta.
Se puede observar que hay cuatro pymes en la muestra que son del rubro industrial y que aumentaron los puestos
de trabajo entre 2001 y 2003.
Tabla 1.11.
Puestos de trabajo
2001-2003
Rubro
Agrioola Comeroial lndustrial 3ervioios Total
Uisminuyo 1 1 3 2 7
Mantuvo 2 3 3 1 9
Aumento 2 1 4 1 8
Total 5 5 10 4 24
Las frecuencias que guran en la tabla 1.10. se denominan frecuencias absolutas conjuntas y estn sombreadas en la
tabla 1.11. En esta ltima se incorporaron adems los totales por las y columnas que son las frecuencias marginales o
totales.
COMIENZO DE LEER ATENTO
Si bien las palabras valor, categora y clase pueden usarse como sinnimos, en lo sucesivo seremos ms rigurosos
respecto del signicado de cada una. En ese sentido diremos que las variables cualitativas asumen categoras y las
cuantitativas toman valores o se agrupan en clases (de valores).
FIN DE LEER ATENTO
1.1.3. Representaciones grcas
Para visualizar las distribuciones de frecuencias realizadas previamente recurriremos a distintos grcos. Como el
mundo de los grcos es muy amplio y slo limitado por la imaginacin, seleccionaremos aquellos que consideramos
ms convenientes segn su adecuacin con el tipo de variable analizada.
Variables cualitativas
Para la confeccin de los siguientes grcos se utiliz la informacin de las tablas 1.1. y 1.2.
Grco circular o de torta
Insertar Imagen N G.1.2.
Insertar Imagen N G.1.3.
G.1.2. G.1.3.
2
Si bien las palabras valor, categora y clase pueden usarse como sinni-
mos, en lo sucesivo seremos ms rigurosos respecto del significado de
cada una. En ese sentido diremos que las variables cualitativas asumen
categoras y las cuantitativas toman valores o se agrupan en clases (de
valores).
1.1.3. Representaciones grficas
Para visualizar las distribuciones de frecuencias realizadas previamente recu-
rriremos a distintos grficos. Como el mundo de los grficos es muy amplio y
slo limitado por la imaginacin, seleccionaremos aquellos que consideramos
ms convenientes segn su adecuacin con el tipo de variable analizada.
Variables cualitativas
Para la confeccin de los siguientes grficos se utiliz la informacin de las
tablas 1.1. y 1.2.
Grfico circular o de torta
Grfico de barras
23
Estadistica
G.1.2. G.1.3.
Grfico de barras
G.1.4. G.1.5.
Servicios 17%
Servicios
Agrcola 25%
Agrcola
Industrial 37%
Industrial
Comercial 21%
Comercial
0 0,1 0,2 0,3 0,4 fr
Regular
Regular
Bueno
Bueno
Muy bueno
Muy bueno
Excelente
Excelente
Detalle de terminacin
Tabla 1.2.
Detalle de terminacin
Tabla 1.2.
Rubro de la PyME
Tabla 1.1.
Rubro de la PyME
Tabla 1.1.
f
6
5
4
3
2
1
0
G.1.2. G.1.3.
Grfico de barras
G.1.4. G.1.5.
Servicios 17%
Servicios
Agrcola 25%
Agrcola
Industrial 37%
Industrial
Comercial 21%
Comercial
0 0,1 0,2 0,3 0,4 fr
Regular
Regular
Bueno
Bueno
Muy bueno
Muy bueno
Excelente
Excelente
Detalle de terminacin
Tabla 1.2.
Detalle de terminacin
Tabla 1.2.
Rubro de la PyME
Tabla 1.1.
Rubro de la PyME
Tabla 1.1.
f
6
5
4
3
2
1
0
En el grfico circular es necesario explicitar la frecuencia de cada valor
de la variable porque no es un grfico lineal como el de barras.
Variables cuantitativas
Para representar grficamente las variables cuantitativas se utiliz la infor-
macin de las tablas 1.4. a 1.9.
Grfico de bastones
Grfico de escalones
Histogramas de Pearson y polgonos de frecuencias
24
Universidad Virtual de Quilmes
El ojo humano es ms efi-
ciente para reconocer
pequeas diferencias lineales que
para advertir diferencias angulares
o de reas, por lo que un grfico
lineal como el de barras no nece-
sita especificacin adicional.
dad de |es em|eades de
Tabla 1.4.
|a emresa ceeerat|va
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,1
0,11
0,12
0,13
0,14
0,15
0,16
19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65
fr
Grfico de escalones
Insertar Imagen N G
dad de |es em|eades de |a emresa ceeerat|va
0
20
40
60
80
100
120
17192123252729313335373941434547495153555759616365

Tabla 1.4.
Desde la Biometra las contribu-
ciones de Karl Pearson a la teo-
ra estadstica son importantes
y numerosas. Fue cofundador en
1901 de la revista Biometrika que
se convirti en el receptculo de
todos los aportes a la estadsti-
ca provenientes de distintas cien-
cias y que se sigue publi-
cando hast a hoy.
Los grficos 1.8., 1.10. y 1.12. son histogramas, los 1.9. y 1.11. son polgo-
nos de frecuencias y en el 1.13. se combinan ambos.
Tanto el histograma como el polgono de frecuencias encierran la misma
rea, el rea es igual al total de los datos si se grafican las frecuencias
absolutas, uno si se trata de las frecuencias relativas y cien si es la f% la
representada.
Ojiva de Galton
25
Estadistica
Grfico 1.8. Grfico 1.9.
Grfico 1.10. Grfico 1.11.
Grfico 1.12. Grfico 1.13.
Edad de los empleados
f Tabla 1.6.
Edad al momento de la desaparicin
Tabla 1.8.
Gasto medio diario
Tabla 1.9.
Gasto medio diario
Tabla 1.9.
Edad al momento de la desaparicin
Tabla 1.8.
20
15
10
35
30
25
20
15
10
5
0
35
30
25
20
15
10
5
0
35
30
25
20
15
10
5
0
5
0
f
20
15
10
5
0
Tabla 1.6.
Edad de los empleados
15 20 25 30 35 40 45 50 55 60 65
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75
15 25 35 45 55 65 75 85 95 15 25 35 45 55 65 75 85 95
El grfico de frecuencias acumu-
ladas Ojiva se debe a Francis Galton,
tambin bimetra y maestro de K.
Pearson; cofundador con
l de Biometrika.
Grficos para representar tablas de distribucin conjunta
Los siguientes grficos sirven para representar tablas del tipo de la tabla 1.11
en la que intervienen dos variables.
Grfico de barras adyacentes y grfico de barras segmentadas
Grfico 1.17. Grfico 1.18.
Puede observarse que en el grfico de barras segmentadas se incluy
informacin sobre la frecuencia de cada segmento. Esto se debe a que
las comparaciones entre distintos segmentos son areales, no lineales, lo
mismo que ocurre con el grfico circular.
26
Universidad Virtual de Quilmes
19
Grfico 1.14. Grfico 1.15.
Edad acumulativa
Tabla 1.6.
Edad acumulativa
Tabla 1.8.
Gasto medio diario acumulativo
Tabla 1.9.
Grfico 1.16.
Rubro y puestos de trabajo de las PyMEs
Tabla 1.11.
Grfico 1.18.
Rubro y puestos de trabajo de las PyMEs
Tabla 1.11.
Grfico 1.17.
100
120
100
80
60
40
20
0
120
100
80
60
40
20
0
15 25 35 45 55 65 75 85 95 105
f %
f %
f %
80
60
40
20
0
15 20 25 30 35 40 45 50 55 60 65 70
0 10 20 30 40 50 60 70
1
2
3
4
5
19
Grfico 1.14. Grfico 1.15.
Edad acumulativa
Tabla 1.6.
Edad acumulativa
Tabla 1.8.
Gasto medio diario acumulativo
Tabla 1.9.
Grfico 1.16.
Rubro y puestos de trabajo de las PyMEs
Tabla 1.11.
Grfico 1.18.
Rubro y puestos de trabajo de las PyMEs
Tabla 1.11.
Grfico 1.17.
100
120
100
80
60
40
20
0
120
100
80
60
40
20
0
15 25 35 45 55 65 75 85 95 105
f %
f %
f %
80
60
40
20
0
15 20 25 30 35 40 45 50 55 60 65 70
0 10 20 30 40 50 60 70
1
2
3
4
5
Pirmides de poblacin
Una pirmide de poblacin es un grfico que se aplica a distribuciones bivariadas donde las
variables son sexo y edad, esta ltima organizada generalmente en intervalos.
La siguiente distribucin de frecuencias conjuntas corresponde a un grupo de 1000
personas,
Tabla 1.12.
La correspondiente pirmide de poblacin es
Grfico 1.19.
3.
Representar grficamente las variables de la ME 2.
27
Estadistica
Grco de barras adyacentes y grco de barras segmentadas
Insertar Imagen N G.1.17.
Insertar Imagen N G.1.18
Grco 1.17. Grco 1.18.
COMIENZO DE LEER ATENTO
Puede observarse que en el grco de barras segmentadas se incluy informacin sobre la frecuencia de cada
segmento. Esto se debe a que las comparaciones entre distintos segmentos son areales, no lineales, lo mismo
que ocurre con el grco circular.
FIN DE LEER ATENTO
COMIENZO DE TEXTO APARTE
Pirmides de poblacin
Una pirmide de poblacin es un grco que se aplica a distribuciones bivariadas donde las variables son sexo y edad, esta
ltima organizada generalmente en intervalos.
La siguiente distribucin de frecuencias conjuntas corresponde a un grupo de 1000 personas
Tabla 1.12.
Sexo
Edades F M
[ 0 - 10) 120 90
[10 - 20) 100 90
[20 - 30) 90 70
[30 - 40) 80 50
[40 - 50) 70 30
[50 - 60) 50 30
[60 - 70) 40 20
[70 - 80) 20 10
[80 - 90) 20 7
[90 - 100) 10 3
Uonde lemenino: l y Masoulino: M.
21
FIN DE TEXTO APARTE
COMIENZO DE ACTIVIDAD

Representar graIicamente las variables de la ME 2.


FIN DE ACTIVIDAD
Las construcciones que acabamos de realizar distribucion de
Irecuencias, arreglo de datos ordenados y graIicos sobre el eje
numerico involucran cuatro espacios abstractos bien diIerenciados, el
espacio de los valores (primera columna de la tabla de Irecuencias), el
espacio de las frecuencias (las columnas de Irecuencias de la
distribucion), el espacio de los datos ordenados (el arreglo) y el espacio
de los numeros reales (el eje horizontal de los graIicos hechos). Ellos
son los espacios de definicion de las medidas estadisticas, tambien
denominados indicadores estadisticos, y a las cuales nos dedicaremos
en el proximo apartado.
COMIENZO DE LEER ATENTO
Los graIicos elaborados permiten tener una idea de conjunto
del grupo de datos relevados complementando la lectura de la
inIormacion que hacen los indicadores estadisticos. Su objetivo
principal es maximizar la extraccion de la inIormacion
contenida en los datos empiricos.
FIN DE LEER ATENTO
1.2. edidas esadsicas
Las medidas estadisticas son resumenes o indicadores que permiten
caracterizar el comportamiento del grupo de datos en estudio.
mujeres hcmbres
LD^D

Las construcciones que acabamos de realizar distribucin de frecuencias,


arreglo de datos ordenados y grficos sobre el eje numrico involucran cua-
tro espacios abstractos bien diferenciados, el espacio de los valores (prime-
ra columna de la tabla de frecuencias), el espacio de las frecuencias (las
columnas de frecuencias de la distribucin), el espacio de los datos ordena-
dos (el arreglo) y el espacio de los nmeros reales (el eje horizontal de los gr-
ficos hechos). Ellos son los espacios de definicin de las medidas estadsti-
cas, tambin denominados indicadores estadsticos, y a las cuales nos
dedicaremos en el prximo apartado.
Los grficos elaborados permiten tener una idea de conjunto del grupo
de datos relevados complementando la lectura de la informacin que
hacen los indicadores estadsticos. Su objetivo principal es maximizar
la extraccin de la informacin contenida en los datos empricos.
1.2. Medidas estadsticas
Las medidas estadsticas son resmenes o indicadores que permiten carac-
terizar el comportamiento del grupo de datos en estudio. Segn el criterio de
diseo existen distintos tipos de medidas, las de posicin, las de dispersin
y las de intensidad.
1.2.1. Medidas de posicin
Las medidas de posicin determinan, con distintos criterios, ubicaciones un-
vocas en el conjunto de datos.
Moda o modo
Observando las distribuciones tratadas anteriormente notamos que sobresa-
le que predomina algn valor o categora o clase.
La moda o modo que denotaremos como Mo es el valor, categora o
clase que registra la frecuencia mayor en la distribucin de la variable.
En la variable rubro de las pymes (tabla 1.1. y grficos G.1.2. y G.1.4.) obser-
vamos que predomina la categora industrial.
En el nivel de terminacin de las piezas de plstico (tabla 1.2. y grfico
G.1.5.) no predomina ninguna categora de datos, no hay moda.
La edad de los empleados (tabla 1.4 y grfico G.1.7) ms frecuente es 37
aos.
En la tabla 1.6. y en el grfico G.1.8. empleados de una fbrica nota-
mos que la clase de edad franja etaria que tiene mayor frecuencia es [35
40] y repasando los datos sobre el arreglo concluimos que entre los emplea-
dos de la fbrica predominan las edades que van de 35 a 39 aos.
En la distribucin de la tabla 1.10. y en el grfico 1.12. se aprecian dos inter-
28
Universidad Virtual de Quilmes
valos modales [25-35] y [35-45], que interpretamos volviendo nuevamente
a los datos de la siguiente manera: en la muestra predominan las familias
que tienen un gasto medio diario en alimentos de entre $26,80 y $34,65 y
entre $37,20 y $43,90. Como en esta distribucin los intervalos modales
resultaron ser adyacentes, con un criterio prctico puede tambin interpre-
tarse que en la muestra predominan las familias que tienen un gasto diario
medio en alimentos de entre $26,80 y $43,90.
En el caso de la tabla 1.8., la interpretacin del intervalo modal 20-25 no
puede hacerse sobre los datos originales porque no contamos con ellos (desde
la publicacin estudiantil, se entiende). Y decimos entonces que en el uni-
verso de las personas desaparecidas por la dictadura militar 1976-1983 en
la Argentina, la edad predominante al momento de la desaparicin forzada es
de entre 21 y 25 aos (aprovechando la informacin de la tabla 1.7. y los gr-
ficos 1.10. y 1.11.)
Es factible concluir que la moda es aplicable a cualquier tipo de variable?
Tanto en la tabla conjunta 1.11. como en el grfico G.1.17 se ve que en la
muestra de 24 pymes predominan las del rubro industrial que aumentaron los
puestos de trabajo entre 2001 y 2003.
Finalmente, en el caso de la tabla 1.12. predominan las mujeres que tie-
nen hasta 10 aos de edad. Adems, se observa que hay predominio de pobla-
cin joven y eso queda reflejado en el grfico G.1.19. (en las poblaciones
donde predominan las edades mayores la pirmide se vera invertida).
4.
a. Determinar la moda de las variables de la ME 2.
b. Determinar la moda de la distribucin conjunta de edad y sexo de
la tabla 1.12.
Media aritmtica o promedio
La media aritmtica, comnmente conocida como promedio, es una medida
que incumbe slo a las variables cuantitativas.
La media aritmtica representa, en el dominio de los nmeros reales, el
punto de equilibrio del conjunto de datos.
Vemos entonces que la edad promedio de los empleados de una cooperativa
que integran la muestra del caso 1, es de 38,9 aos. O que los 80 emplea-
dos seleccionados al azar entre todos los de una fbrica automotriz (caso 2)
tienen, en promedio, una edad de 37,4 aos.
Tambin, en la muestra de las 96 familias, el gasto medio diario en ali-
mentos es, en promedio, de $44,27 por familia.
29
Estadistica
El promedio se denota
con X si el grupo de datos
es una muestra y con si es toda
la poblacin.
Adems, de la forma ms popular de calcular la media sumando los valo-
res de todos los datos y dividiendo por el total surgen otras formas de cl-
culo ligadas al empleo de las tablas de frecuencias.
A modo de ejemplificacin se explicitan a continuacin dos formas de calcular uno de los
resultados expuestos anteriormente (edad promedio de los empleados de una cooperativa que
integran la muestra):
Si estuviramos en una situacin similar al caso 3, donde no se cuenta con
los datos, se podra calcular igualmente un promedio aproximado aplicando la
misma frmula 1.1. pero considerando como valores de la variable x
i
los pun-
tos medios de cada intervalo denominados a partir de aqu marca de clase.
Si se hace el clculo se tiene que la edad promedio de los desaparecidos
en Argentina por la ltima dictadura militar es de 28,09 aos aproximadamente.
5.
Determinar la media aritmtica de las variables cuantitativas de la ME 2.
Cul es la diferencia de calidad entre una media aritmtica calculada con
los datos y la calculada a partir del agrupamiento en intervalos de clase?
Mediana
Mediana es el lugar geomtrico del arreglo de datos ordenado que lo divide
en dos partes iguales.
30
Universidad Virtual de Quilmes
23

Tanto en la tabla conjunta 1.11. como en el grfico G.1.17 se ve que en
la muestra de 24 pymes predominan las del rubro industrial que
aumentaron los puestos de trabajo entre 2001 y 2003.
Finalmente, en el caso de la Tabla 1.12. predominan las mujeres que
tienen hasta 10 aos de edad. Adems, se observa que hay predominio
de poblacin joven y eso queda reflejado en el grfico G.1.19. (en las
poblaciones donde predominan las edades mayores la pirmide se vera
invertida).

COMIENZO DE ACTIVIDAD
4.
a. Determinar la moda de las variables de la ME 2.
b. Determinar la moda de la distribucin conjunta de edad y sexo
de la Tabla 1.12.
FIN DE ACTIVIDAD


Media aritmtica o promedio

La media aritmtica, comnmente conocida como promedio es una
medida que incumbe slo a las variables cuantitativas.

COMIENZO DE PASTILLA EN
El promedio se denota con si el grupo de datos es una muestra y con si es toda la
poblacin.
FIN DE PASTILLA

COMIENZO DE LEER ATENTO
La media aritmtica representa, en el dominio de los nmeros
reales, el punto de equilibrio del conjunto de datos.
FIN DE LEER ATENTO

Vemos entonces que la edad promedio de los empleados de una
cooperativa que integran la muestra del caso 1, es de 38,9 aos. O que
los 80 empleados seleccionados al azar entre todos los de una fbrica
automotriz (caso 2) tienen, en promedio, una edad de 37,4 aos.
Tambin, en la muestra de las 96 familias, el gasto medio diario en
alimentos es, en promedio, de $44,27 por familia.
Adems, de la forma ms popular de calcular la media sumando los
valores de todos los datos y dividiendo por el total surgen otras formas
de clculo ligadas al empleo de las tablas de frecuencias.




COMIENZO DE TEXTO APARTE
A modo de ejemplificacin se explicitan a continuacin dos formas de
calcular uno de los resultados expuestos anteriormente (edad promedio
de los empleados de una cooperativa que integran la muestra):

(1.1.)
En el arreglo ordenado de la variable nivel de detalles de terminacin de las
piezas plsticas ubicamos la posicin de la mediana,
y leemos la informacin que ella nos da de la siguiente manera: la mitad (infe-
rior) de las piezas de plstico como mximo tienen un nivel de detalle de ter-
minacin Bueno y la otra mitad (superior) tiene como mnimo un nivel de deta-
lle de terminacin Muy Bueno.
Si ahora determinamos la mediana sobre el arreglo de datos ordenado de
la variable edad de los empleados de la muestra de la empresa cooperativa,
leemos lo siguiente: la mitad de los empleados de la muestra tienen hasta 37
aos y la otra mitad desde 38 aos.
6.
Determinar e interpretar la mediana de todas las variables de la ME 2
que lo permitan.
En el caso de la variable edad de las personas desaparecidas, recordemos que
no se cuenta con los datos originales. Sin embargo, si es necesario contar
con algn valor tentativo que la aproxime y que permita extraer informacin de
forma similar a lo ya realizado, debe elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento de
datos en intervalos, primero debe localizarse el intervalo mediano el inter-
valo donde caera la mediana y luego para ese intervalo se aplica como cri-
terio alguna de las frmulas que siguen.
Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del intervalo
mediano, el subndice i de las frecuencias simples se refiere al intervalo media-
no y el (i-1) de las frecuencias acumuladas hace referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30] y
reemplazando valores:
31
Estadistica
COMIENZO DE PARA REFLEXIONAR
Cul es la diferencia de calidad entre una media aritmtica calculada con los datos y la calculada a partir del
agrupamiento en intervalos de clase?
FIN DE PARA REFLEXIONAR
Mediana
Mediana es el lugar geomtrico del arreglo de datos ordenado que lo divide en dos partes iguales.
En el arreglo ordenado de la variable nivel de detalles de terminacin de las piezas plsticas ubicamos la posicin
de la mediana,
R R R R R B B B B B MB MB MB MB MB E E E E E
10 datos
Me
10 datos
y leemos la informacin que ella nos da de la siguiente manera: la mitad (inferior) de las piezas de plstico como
mximo tienen un nivel de detalle de terminacin Bueno y la otra mitad (superior) tiene como mnimo un nivel de
detalle de terminacin Muy Bueno.
Si ahora determinamos la mediana sobre el arreglo de datos ordenado de la variable edad de los empleados de la
muestra de la empresa cooperativa,
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Me
leemos lo siguiente: la mitad de los empleados de la muestra tienen hasta 37 aos y la otra mitad desde 38 aos.
COMIENZO DE ACTIVIDAD
6.
Determinar e interpretar la mediana de todas las variables de la ME 2 que lo permitan.
FIN DE ACTIVIDAD
En el caso de la variable edad de las personas desaparecidas, recordemos que no se cuenta con los datos originales. Sin
embargo, si es necesario contar con algn valor tentativo que la aproxime y que permita extraer informacin de forma
similar a lo ya realizado, debe elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento de datos en intervalos, primero debe localizarse
el intervalo mediano el intervalo donde caera la mediana y luego para ese intervalo se aplica como criterio alguna
de las frmulas que siguen.
COMIENZO DE PASTILLA ENfrmulas
Estas frmulas pueden obtenerse rpida y sencillamente mediante interpolacin lineal.
FIN DE PASTILLA
Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del intervalo mediano, el subndice i de las frecuencias
simples se reere al intervalo mediano y el (i-1) de las frecuencias acumuladas hace referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30] y reemplazando valores:
El valor obtenido signica que la edad mxima aproximada al momento de la desaparicin forzada de la mitad de las
personas desaparecidas era de 25,99 aos.
EstadisticasU1.indd 22 8/26/09 6:33:19 PM
COMIENZO DE PARA REFLEXIONAR
Cul es la diferencia de calidad entre una media aritmtica calculada con los datos y la calculada a partir del
agrupamiento en intervalos de clase?
FIN DE PARA REFLEXIONAR
Mediana
Mediana es el lugar geomtrico del arreglo de datos ordenado que lo divide en dos partes iguales.
En el arreglo ordenado de la variable nivel de detalles de terminacin de las piezas plsticas ubicamos la posicin
de la mediana,
R R R R R B B B B B MB MB MB MB MB E E E E E
10 datos
Me
10 datos
y leemos la informacin que ella nos da de la siguiente manera: la mitad (inferior) de las piezas de plstico como
mximo tienen un nivel de detalle de terminacin Bueno y la otra mitad (superior) tiene como mnimo un nivel de
detalle de terminacin Muy Bueno.
Si ahora determinamos la mediana sobre el arreglo de datos ordenado de la variable edad de los empleados de la
muestra de la empresa cooperativa,
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Me
leemos lo siguiente: la mitad de los empleados de la muestra tienen hasta 37 aos y la otra mitad desde 38 aos.
COMIENZO DE ACTIVIDAD
6.
Determinar e interpretar la mediana de todas las variables de la ME 2 que lo permitan.
FIN DE ACTIVIDAD
En el caso de la variable edad de las personas desaparecidas, recordemos que no se cuenta con los datos originales. Sin
embargo, si es necesario contar con algn valor tentativo que la aproxime y que permita extraer informacin de forma
similar a lo ya realizado, debe elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento de datos en intervalos, primero debe localizarse
el intervalo mediano el intervalo donde caera la mediana y luego para ese intervalo se aplica como criterio alguna
de las frmulas que siguen.
COMIENZO DE PASTILLA ENfrmulas
Estas frmulas pueden obtenerse rpida y sencillamente mediante interpolacin lineal.
FIN DE PASTILLA
Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del intervalo mediano, el subndice i de las frecuencias
simples se reere al intervalo mediano y el (i-1) de las frecuencias acumuladas hace referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30] y reemplazando valores:
El valor obtenido signica que la edad mxima aproximada al momento de la desaparicin forzada de la mitad de las
personas desaparecidas era de 25,99 aos.
EstadisticasU1.indd 22 8/26/09 6:33:19 PM
25
Si ahora determinamos la mediana sobre el arreglo de datos ordenado
de la variable edad de los empleados de la muestra de la empresa
cooperativa,

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Me

leemos lo siguiente: la mitad de los empleados de la muestra tienen
hasta 37 aos y la otra mitad desde 38 aos.

COMIENZO DE ACTIVIDAD
6.
Determinar e interpretar la mediana de todas las variables de la
ME 2 que lo permitan.
FIN DE ACTIVIDAD

En el caso de la variable edad de las personas desaparecidas,
recordemos que no se cuenta con los datos originales. Sin embargo, si es
necesario contar con algn valor tentativo que la aproxime y que
permita extraer informacin de forma similar a lo ya realizado, debe
elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento
de datos en intervalos, primero debe localizarse el intervalo mediano el
intervalo donde caera la mediana y luego para ese intervalo se aplica
como criterio alguna de las frmulas que siguen.

COMIENZO DE PASTILLA EN frmulas
Estas frmulas pueden obtenerse rpida y sencillamente mediante interpolacin lineal.
FIN DE PASTILLA



Me = l
i
+ a
n
2
F
(i1)
f
i
= l
i
+ a
0, 5Fr
(i1)
fr
i
= l
i
+ a
50 F%
(i1)
f%
i


Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del
intervalo mediano, el subndice i de las frecuencias simples se refiere al
intervalo mediano y el (i-1) de las frecuencias acumuladas hace
referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30]
y reemplazando valores:



El valor obtenido significa que la edad mxima aproximada al momento
de la desaparicin forzada de la mitad de las personas desaparecidas era
de 25,99 aos.

COMIENZO DE PARA REFLEXIONAR
Es posible determinar la mediana en cualquier tipo de variable?
25
Si ahora determinamos la mediana sobre el arreglo de datos ordenado
de la variable edad de los empleados de la muestra de la empresa
cooperativa,

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Me

leemos lo siguiente: la mitad de los empleados de la muestra tienen
hasta 37 aos y la otra mitad desde 38 aos.

COMIENZO DE ACTIVIDAD
6.
Determinar e interpretar la mediana de todas las variables de la
ME 2 que lo permitan.
FIN DE ACTIVIDAD

En el caso de la variable edad de las personas desaparecidas,
recordemos que no se cuenta con los datos originales. Sin embargo, si es
necesario contar con algn valor tentativo que la aproxime y que
permita extraer informacin de forma similar a lo ya realizado, debe
elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento
de datos en intervalos, primero debe localizarse el intervalo mediano el
intervalo donde caera la mediana y luego para ese intervalo se aplica
como criterio alguna de las frmulas que siguen.

COMIENZO DE PASTILLA EN frmulas
Estas frmulas pueden obtenerse rpida y sencillamente mediante interpolacin lineal.
FIN DE PASTILLA


Me = l
i
+ a
n
2
F
(i1)
f
i
= l
i
+ a
0, 5Fr
(i1)
fr
i
= l
i
+ a
50 F%
(i1)
f%
i


Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del
intervalo mediano, el subndice i de las frecuencias simples se refiere al
intervalo mediano y el (i-1) de las frecuencias acumuladas hace
referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30]
y reemplazando valores:



El valor obtenido significa que la edad mxima aproximada al momento
de la desaparicin forzada de la mitad de las personas desaparecidas era
de 25,99 aos.

COMIENZO DE PARA REFLEXIONAR
Es posible determinar la mediana en cualquier tipo de variable?
Estas frmulas pueden
obtenerse rpida y sen-
cillamente mediante interpolacin
lineal.
El valor obtenido significa que la edad mxima aproximada al momento de
la desaparicin forzada de la mitad de las personas desaparecidas era de
25,99 aos.
Es posible determinar la mediana en cualquier tipo de variable?
En las variables cuantitativas, las tres medidas de posicin vistas hasta
ahora modo, media aritmtica y mediana tambin se denominan medi-
das de tendencia central por su comportamiento en relacin con la zona
central de la distribucin. Si la distribucin de los datos es simtrica estas
tres medidas se posicionan geomtricamente en el mismo punto.
Anlisis de la asimetra estadstica de una distribucin
Los grficos que siguen permiten vizualizar los tipos de asimetras estadsti-
cas y sus denominaciones.
Grfico 1.20.
Observando la forma que adoptan los grficos G.1.6.; G.1.8.; G.1.10. y
G.1.12. de las distribuciones de las variables cuantitativas analizadas, se
puede notar tanto en el G.1.10. como en el G.1.12. que hay una clara asi-
metra en ambos casos hacia la derecha, porque en esa direccin es donde
se registran los valores ms alejados de la regin con mayor densidad de
datos. Sin embargo, no queda muy claro si existen asimetras en G.1.6 y G.1.8.
Las evidentes limitaciones del anlisis grfico obligan a encontrar alguna
forma analtica para el estudio de la asimetra de una distribucin, como la
de comparar las tres medidas de tendencia central aprovechando de ellas
su distinto comportamiento dinmico (concepto ste, que se aclarar ms
adelante).
32
Universidad Virtual de Quilmes
26
FIN DE PARA REFLEXIONAR
COMIENZO DE LEER ATENTO
En las variables cuantitativas, las tres medidas de posicion
vistas hasta ahora modo, media aritmetica y mediana
tambien se denominan medidas de tendencia central por su
comportamiento en relacion con la zona central de la
distribucion. Si la distribucion de los datos es simetrica estas
tres medidas se posicionan geometricamente en el mismo
punto.
FIN DE LEER ATENTO
Analisis de la asimetra estadstica de una distribucin
Los graIicos que siguen permiten vizualizar los tipos de asimetrias
estadisticas y sus denominaciones.
Insertar Imagen N G.1.20.
^slmetrloa a lzqulerda Slmetrloa ^slmetrloa a dereoha
Observando la 'Iorma que adoptan los graIicos G.1.6.; G.1.8.; G.1.10.
y G.1.12. de las distribuciones de las variables cuantitativas analizadas,
se puede notar tanto en el G.1.10. como en el G.1.12. que hay una clara
asimetria en ambos casos hacia la derecha, porque en esa direccion es
donde se registran los valores mas alejados de la region con mayor
densidad de datos. Sin embargo, no queda muy claro si existen
asimetrias en G.1.6 y G.1.8.
Las evidentes limitaciones del analisis graIico obligan a encontrar
alguna Iorma analitica para el estudio de la asimetria de una
distribucion, como la de comparar las tres medidas de tendencia central
aprovechando de ellas su distinto comportamiento dinamico (concepto
este, que se aclarara mas adelante).
Insertar Imagen N G.1.21.
Asiric izquierd Siric Asiric derech
Grfico 1.21.
Como el anlisis de asimetra se realiza en el dominio de los nmeros
reales se necesita contar con un nmero real para cada una de las tres
medidas de tendencia central.
La media por definicin es un nmero real, pero no as la moda
ni la mediana para las cuales hay que emplear alguna convencin que
permita asignarles un nmero real.
Estudiaremos analticamente la asimetra de la Edad de los empleados de la
empresa cooperativa (grfico G.1.6.).
Al modo puede asignrsele el nmero real 37 directamente porque, para
la variable en tratamiento, su valor es un nmero.
La marca de la mediana qued posicionada entre dos datos cuyos valores
son 37 y 38 y, si bien cualquier nmero real entre esos dos valores podra
representarla en el dominio de los nmeros reales, convenimos en usar de
aqu en ms el promedio entre ambos valores, en este caso 37,5.
Como la media aritmtica es un nmero real tal cual se la determin no
necesitamos aplicarle ninguna convencin para volcarla en el dominio de los
nmeros reales.
Entonces tenemos:
M
o
= 37 aos M
e
= 37,5 aos x = 38,9 aos
Resultando: Mo Me X
Como el valor del promedio es el ms alto, concluimos que hay una asimetra
hacia la derecha.
Las tres medidas de tendencia central tienen en el dominio de los
nmeros reales comportamientos dinmicos diferenciados.
El promedio es, de las tres, la medida ms sensible ante la pre-
sencia de valores muy alejados de la zona de mayor densidad, los cuales
la atraen rpidamente hacia ellos. Por esta particularidad la media es
determinante en el anlisis de la asimetra de una distribucin; si hay
asimetra hacia un lado (derecho o izquierdo), la media consecuente-
mente se desplaza en esa direccin.
La mediana, a la sazn sacada de su dominio natural el arreglo de
33
Estadistica
27

COMIENZO DE LEER ATENTO
Como el analisis de asimetria se reali:a en el dominio de los
numeros reales se necesita contar con un numero real para cada
una de las tres medidas de tendencia central.
La media por deIinicion es un numero real, pero no asi la
moda ni la mediana para las cuales hay que emplear alguna
convencion que permita asignarles un numero real.
FIN DE LEER ATENTO
Estudiaremos analiticamente la asimetria de la 'Edad de los empleados
de la empresa cooperativa (graIico G.1.6.)
Al modo puede asignarsele el numero real 37 directamente porque,
para la variable en tratamiento, su valor es un numero.
La marca de la mediana quedo posicionada entre dos datos cuyos
valores son 37 y 38 y, si bien cualquier numero real entre esos dos
valores podria representarla en el dominio de los numeros reales,
convenimos en usar de aqui en mas el promedio entre ambos valores, en
este caso 37,5.
Como la media aritmetica es un numero real tal cual se la
determino no necesitamos aplicarle ninguna convencion para volcarla
en el dominio de los numeros reales.
Entonces tenemos:
Mo 37 aos Me 37,5 aos 38,9 aos
Resultando:
Como el valor del promedio es el mas alto, concluimos que hay una
asimetria hacia la derecha.
COMIENZO DE LEER ATENTO
Las tres medidas de tendencia central tienen en el dominio de
los numeros reales comportamientos dinamicos diIerenciados.
El promedio es, de las tres, la medida mas sensible ante la
presencia de valores muy alejados de la zona de mayor
densidad, los cuales la atraen rapidamente hacia ellos. Por esta
particularidad la media es determinante en el analisis de la
asimetria de una distribucion; si hay asimetria hacia un lado


^slmetrloa a lzqulerda Slmetrloa ^slmetrloa a dereoha
datos ordenados y transferida convencin mediante al de los nme-
ros reales, obviamente no tiene la misma sensibilidad que la media. Una
situacin parecida se da con la moda, quien es an ms insensible que
la mediana.
En anlisis de asimetra que presenten situaciones ambiguas o con-
fusas donde la ubicacin relativa de estas medidas no se encuadre en
algunos de los tres casos prescritos anteriormente, conviene descartar la
moda y slo comparar la mediana y la media aritmtica.
7.
a. Verificar analticamente la asimetra de las distribuciones corres-
pondientes a los grficos G.1.8.; G.1.10. y G.1.12.
b. Analizar qu tipo de asimetra presentan las variables cuantitativas
de la ME 2.
Cuartiles
Los cuartiles son tres lugares geomtricos del arreglo de datos ordenado que
lo dividen en cuatro partes iguales
Extendiendo el concepto aplicado para el posicionamiento de la mediana,
en el arreglo ordenado de la variable nivel de detalles de terminacin de las
piezas plsticas ubicamos los tres cuartiles,
y leemos la informacin que nos brindan de la siguiente manera: el cuarto de
las piezas con menor nivel de detalle de terminacin como mximo presenta
un nivel Regular, la mitad de las piezas de plstico a lo sumo posee un nivel
de detalle de terminacin Bueno y las tres cuartas partes de las piezas de
plstico tienen hasta un nivel de detalle de terminacin Muy Bueno.
La mitad central de los niveles de detalle de terminacin de las piezas se
encuentra entre Bueno y Muy Bueno. Esta informacin se extrae combinando
Q
1
y Q
3
.
8.
Determinar e interpretar los cuartiles de la variable Puestos de trabajo
2001-2003, de la matriz EM 3.
Para la variable edad de los empleados de la muestra de la empresa coo-
perativa la posicin de los cuartiles es:
34
Universidad Virtual de Quilmes
28
(derecho o izquierdo), la media consecuentemente se
desplaza en esa direccin.
La mediana, a la sazn sacada de su dominio natural el
arreglo de datos ordenados y transferida convencin
mediante al de los nmeros reales, obviamente no tiene la
misma sensibilidad que la media. Una situacin parecida se da
con la moda, quien es an ms insensible que la mediana.
En anlisis de asimetra que presenten situaciones ambiguas
o confusas donde la ubicacin relativa de estas medidas no se
encuadre en algunos de los tres casos prescritos anteriormente,
conviene descartar la moda y slo comparar la mediana y la
media aritmtica.
FIN DE LEER ATENTO


COMIENZO DE ACTIVIDAD
7.
a. Verificar analticamente la asimetra de las distribuciones
correspondientes a los grficos G.1.8.; G.1.10. y G.1.12.
b. Analizar qu tipo de asimetra presentan las variables
cuantitativas de la ME 2.
FIN DE ACTIVIDAD

Cuartiles

Los cuartiles son tres lugares geomtricos del arreglo de datos ordenado
que lo dividen en cuatro partes iguales
Extendiendo el concepto aplicado para el posicionamiento de la
mediana, en el arreglo ordenado de la variable nivel de detalles de
terminacin de las piezas plsticas ubicamos los tres cuartiles,

R R R R R B B B B B MB MB MB MB MB E E E E E
5 datos Q
1
5 datos Q
2
= Me 5 datos Q
3
5 datos
1/4 1/4 1/4 1/4

y leemos la informacin que nos brindan de la siguiente manera: el
cuarto de las piezas con menor nivel de detalle de terminacin como
mximo presenta un nivel Regular, la mitad de las piezas de plstico a
lo sumo posee un nivel de detalle de terminacin Bueno y las tres
cuartas partes de las piezas de plstico tienen hasta un nivel de detalle
de terminacin Muy Bueno.
La mitad central de los niveles de detalle de terminacin de las
piezas se encuentra entre Bueno y Muy Bueno. Esta informacin se
extrae combinando Q
1
y Q
3
.

COMIENZO DE ACTIVIDAD
8.
Determinar e interpretar los cuartiles de la variable Puestos de
trabajo 2001-2003 , de la matriz EM 3.
Interpretando la informacin se tiene que el primer cuarto de los empleados
tiene a lo sumo 34 aos y las tres cuartas partes restantes como mnimo 36
aos. La mitad de los empleados de la muestra detenta hasta 37 aos y la
otra mitad desde 38 aos y que las tres cuartas partes de los empleados
ms jvenes como mximo tienen 40 aos y el cuarto de mayor edad como
mnimo cuenta con 42 aos de edad.
En el caso 3, Edad promedio de los desaparecidos en Argentina durante
la ltima dictadura, se procede de la misma manera que para el clculo de
la mediana, con las siguientes frmulas de interpolacin:
Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del intervalo
donde se encuentra el cuartil, el subndice i de las frecuencias simples se
refiere al intervalo del cuartil y el (i-1) de las frecuencias acumuladas hace
referencia al intervalo anterior.
9.
Calcular e interpretar los cuartiles de la Edad de los desaparecidos en
Argentina por la ltima dictadura.
Fractiles y percentiles
Continuando con la idea de subdividir a la masa de datos en distintas partes
o fracciones iguales se tienen los fractiles, que pueden expresarse como per-
centiles usando un lenguaje de porcentajes en los casos que sea necesa-
rio hacer ms comprensible la informacin que suministran.
Fractiles son las m-1 marcas del arreglo de datos ordenado que lo dividen
en m partes iguales.
Un fractil determina el mximo de una cierta fraccin del conjunto de los
datos y consecuentemente, el mnimo de la fraccin restante.
Percentiles son los fractiles mismos, pero expresados en un lenguaje ms
amigable como es el de los porcentajes.
35
Estadistica
29
FIN DE ACTIVIDAD

Para la variable edad de los empleados de la muestra de la empresa
cooperativa la posicin de los cuartiles es:

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Q
1
Q
2
= Me Q
3


Interpretando la informacin se tiene que el primer cuarto de los
empleados tiene a lo sumo 34 aos y las tres cuartas partes restantes
como mnimo 36 aos. La mitad de los empleados de la muestra detenta
hasta 37 aos y la otra mitad desde 38 aos y que las tres cuartas partes
de los empleados ms jvenes como mximo tienen 40 aos y el cuarto
de mayor edad como mnimo cuenta con 42 aos de edad.
En el caso 3, Edad promedio de los desaparecidos en Argentina
durante la ltima dictadura , se procede de la misma manera que para el
clculo de la mediana, con las siguientes frmulas de interpolacin:




Q
2
= Me





Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del
intervalo donde se encuentra el cuartil, el subndice i de las
frecuencias simples se refiere al intervalo del cuartil y el (i-1) de las
frecuencias acumuladas hace referencia al intervalo anterior.

COMIENZO DE ACTIVIDAD
9.
Calcular e interpretar los cuartiles de la Edad de los
desaparecidos en Argentina por la ltima dictadura .
FIN DE ACTIVIDAD

Fractiles y percentiles

Continuando con la idea de subdividir a la masa de datos en distintas
partes o fracciones iguales se tienen los fractiles, que pueden expresarse
como percentiles usando un lenguaje de porcentajes en los casos que
sea necesario hacer ms comprensible la informacin que suministran.
Fractiles son las m-1 marcas del arreglo de datos ordenado que lo
dividen en m partes iguales.
29
FIN DE ACTIVIDAD

Para la variable edad de los empleados de la muestra de la empresa
cooperativa la posicin de los cuartiles es:

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Q
1
Q
2
= Me Q
3


Interpretando la informacin se tiene que el primer cuarto de los
empleados tiene a lo sumo 34 aos y las tres cuartas partes restantes
como mnimo 36 aos. La mitad de los empleados de la muestra detenta
hasta 37 aos y la otra mitad desde 38 aos y que las tres cuartas partes
de los empleados ms jvenes como mximo tienen 40 aos y el cuarto
de mayor edad como mnimo cuenta con 42 aos de edad.
En el caso 3, Edad promedio de los desaparecidos en Argentina
durante la ltima dictadura , se procede de la misma manera que para el
clculo de la mediana, con las siguientes frmulas de interpolacin:




Q
2
= Me





Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del
intervalo donde se encuentra el cuartil, el subndice i de las
frecuencias simples se refiere al intervalo del cuartil y el (i-1) de las
frecuencias acumuladas hace referencia al intervalo anterior.

COMIENZO DE ACTIVIDAD
9.
Calcular e interpretar los cuartiles de la Edad de los
desaparecidos en Argentina por la ltima dictadura .
FIN DE ACTIVIDAD

Fractiles y percentiles

Continuando con la idea de subdividir a la masa de datos en distintas
partes o fracciones iguales se tienen los fractiles, que pueden expresarse
como percentiles usando un lenguaje de porcentajes en los casos que
sea necesario hacer ms comprensible la informacin que suministran.
Fractiles son las m-1 marcas del arreglo de datos ordenado que lo
dividen en m partes iguales.
Retomando la variable edad de los trabajadores de la empresa cooperativa:
Explorando los datos observamos que el salto ms grande de edades se da
entre 42 y 48 aos, marcando esa posicin podemos ver que 16 de los 20
empleados tienen una edad mxima de 42 aos y los 4 restantes como mni-
mo 48 aos.
Esa marca que es el fractil 16/20 y se lee: la dieciseis veinteava parte
de los trabajadores tienen a lo sumo 42 aos conviene expresarla como per-
centil 80 (P
80
) y decir que el 80% de los trabajadores tienen hasta 42 aos.
O, que el 20% de los trabajadores tiene como mnimo 48 aos.
Para el mismo caso tambin podramos habernos preguntado cul es la
edad mxima del 80% de los empleados y la respuesta es 42 aos.
El uso de porcentajes, que es el lenguaje de los percentiles, puede intro-
ducir algunas inconsistencias al momento de producir informacin,
sobre todo cuando el conjunto de datos es pequeo.
10.
Determinar e interpretar algunos percentiles de la variable Puestos de
trabajo 2001-2003, de la matriz EM 3.
Si no se contara con los datos originales, como es el caso de la variable edad
de las personas al momento de la desaparicin forzada y se quisiera calcu-
lar algn percentil, en forma anloga a lo hecho con la mediana, se puede uti-
lizar la siguiente frmula de interpolacin:
Donde: k es el % de datos que el percentil deja hacia atrs (valores menores
a l), a es la amplitud de los intervalos, l
i
es el lmite inferior del intervalo
donde se encuentra el percentil, el subndice i de las frecuencias simples se
refiere al intervalo del percentil y el (i-1) de las frecuencias acumuladas hace
referencia al intervalo anterior.
11.
a. Calcular la edad mxima del 90% de los desaparecidos en Argentina.
b. Qu porcentaje de personas tena hasta 32 aos al momento de desa-
parecer?
36
Universidad Virtual de Quilmes
30
Un fractil determina el mximo de una cierta fraccin del conjunto
de los datos y consecuentemente, el mnimo de la fraccin restante.
Percentiles son los fractiles mismos, pero expresados en un lenguaje
ms amigable como es el de los porcentajes.
Retomando la variable edad de los trabajadores de la empresa
cooperativa,

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63


Explorando los datos observamos que el salto ms grande de edades se
da entre 42 y 48 aos, marcando esa posicin podemos ver que 16 de
los 20 empleados tienen una edad mxima de 42 aos y los 4 restantes
como mnimo 48 aos.
Esa marca que es el fractil 16/20 y se lee: la dieciseis veinteava
parte de los trabajadores tienen a lo sumo 42 aos conviene expresarla
como percentil 80 (P
80
) y decir que el 80% de los trabajadores tienen
hasta 42 aos. O, que el 20% de los trabajadores tiene como mnimo 48
aos.
Para el mismo caso tambin podramos habernos preguntado cul es
la edad mxima del 80% de los empleados y la respuesta es 42 aos.

COMIENZO DE LEER ATENTO
El uso de porcentajes, que es el lenguaje de los percentiles,
puede introducir algunas inconsistencias al momento de
producir informacin, sobre todo cuando el conjunto de datos
es pequeo.
FIN DE LEER ATENTO

COMIENZO DE ACTIVIDAD
10.
Determinar e interpretar algunos percentiles de la variable
Puestos de trabajo 2001-2003 , de la matriz EM 3.
FIN DE ACTIVIDAD

Si no se contara con los datos originales, como es el caso de la variable
edad de las personas al momento de la desaparicin forzada y se
quisiera calcular algn percentil, en forma anloga a lo hecho con la
mediana, se puede utilizar la siguiente frmula de interpolacin:



Donde: k es el % de datos que el percentil deja hacia atrs
(valores menores a l), a es la amplitud de los intervalos, l
i

es el lmite inferior del intervalo donde se encuentra el
percentil, el subndice i de las frecuencias simples se refiere
al intervalo del percentil y el (i-1) de las frecuencias
acumuladas hace referencia al intervalo anterior.

El grfico de caja y bigotes (box-and-whisker plots)
Este grfico suele llamarse usualmente box-plot, y es aplicable con exclusivi-
dad a los casos de variables cuantitativas en los que se cuenta con los datos.
El box-plot es un grfico delineado en el dominio de los nmeros reales y
que se basa en una caja construida con Q
1
y Q
3
como lmites que contie-
ne nominalmente al 50% central de los datos. El 50% nominal restante se
encuentra distribuido en partes iguales a ambos lados de la caja y los valo-
res comprendidos en l se representan con distintas simbologas.
El siguiente grfico, que corresponde a la edad de los empleados de la coo-
perativa, presenta todos los elementos (algunos auxiliares y otros definitivos)
con los que se construye un box-plot.
Grfico 1.22.
Las lneas continuas (horizontales) que se extienden a partir de Q
1
y Q
3
(con-
vertidos a nmeros reales mediante el mismo procedimiento que se us para
la mediana) son los bigotes y su finalidad es describir al conjunto de valores
llamados adyacentes, sin identificarlos individualmente. Por afuera de ellos
se ubican los valores externos (que aqu los representamos con un crculo) y
los lejanos (cuyo smbolo es un asterisco) ambos denominados tambin valo-
res raros (outliers) o atpicos para el grupo.
Las lneas auxiliares identificadas al pie como Vi y Ve se llaman vallas inte-
riores y exteriores, se encuentran respectivamente a una distancia de la caja
de una vez y media la medida de su base y de tres veces dicha medida, y se
usan como referencia para delimitar las zonas donde se encuentran los valo-
res atpicos.
A continuacin, se presentan los clculos ligados a la construccin del box-plot
de edad de los trabajadores de una cooperativa que integran una muestra.
Q
3
Q
1
= 41 35 = 6
Q
1
1,5(Q
3
Q
1
) = 35 9 = 26 y Q
3
+ 1,5(Q
3
Q
1
) = 41 + 9 = 50
Q
1
3(Q
3
Q
1
) = 35 18 = 17 y Q
3
+ 3(Q
3
Q
1
) = 41 + 18 = 59
El box-plot definitivo, libre de lneas auxiliares, queda como sigue
Grfico 1.23.
37
Estadistica
El box-and-whisker plot
fue diseado por John W.
Tukey y presentado en su libro
Exploratory data analysis de 1977,
aunque ya lo haba usado en papers
anteriores a esa fecha.
Cuando ambos cuartiles
quedan ubicados sobre
datos, no entre dos datos, los por-
centajes no llegan al 50%.
Existen otros criterios para esta-
blecer las distancias de las vallas
a la caja distintos al de Tukey, pero
ste es el ms usado.
Base:
Q
3
Q
1
Vallas interiores:
Q
1
1,5 . (Q
3
Q
1
) y
Q
3
+ 1,5. (Q
3
Q
1
)
Vallas exteriores:
Q
1
3 . (Q
3
Q
1
) y
Q
3
+ 3. (Q
3
Q
1
)
En el grfico G.1.23. puede observarse que en la cooperativa las edades de
21, 25, 51, 57 y, sobre todo, 63 aos son atpicas o raras para el grupo. Si
una distribucin de datos no tuviera valores atpicos entonces todos los que
estn fuera de la caja seran adyacentes por lo que los bigotes llegaran hasta
el mximo y el mnimo y se vera de la siguiente forma.
Grfico 1.24.
El box-plot precedente es el caso de la muestra de empleados de la fbrica
automotriz, en la cual no se detectan edades atpicas.
12.
Confeccionar y analizar los box-plot de las variables cuantitativas de la
EM 2.
En el siguiente grfico se presentan conjuntamente los dos box-plots realiza-
dos anteriormente para ejemplificar la comparacin de dos distribuciones de
datos bajo una misma variable.
Grfico 1.25.
Las siguientes son algunas lecturas que surgen de la comparacin.
En ambas distribuciones la mitad de los empleados tienen como mnimo
prcticamente la misma edad.
El 50% central de las edades de los empleados de la cooperativa es ms
concentrado que el 50% central de las edades de la fbrica automotriz.
Si bien una edad de 63 aos es rara en la muestra de la cooperativa, no
ocurre lo mismo en la muestra de la fbrica automotriz.
13.
Confeccionar en un mismo grfico, analizar y comparar los box-plots de
las variables participacin quincenal actual y participacin quince-
nal anterior de la ME 1.
38
Universidad Virtual de Quilmes
El box-plot, en complemento con los dems grficos vistos, conforma
una herramienta visual que se puede utilizar para ilustrar la distribu-
cin, estudiar asimetras y sus colas, bosquejar supuestos sobre la dis-
tribucin y comparar distintas distribuciones.
1.2.2. Medidas de dispersin
Para describir completamente una distribucin de datos no basta con los indi-
cadores elaborados hasta el momento a travs de las medidas de posicin,
sino que adems es necesario tener una idea del grado de variabilidad de los
valores que esos datos toman.
Ese grado de variabilidad hablar de la variedad, de la diversidad de
valores en el conjunto de datos y para cuantificarlo surgen las medidas de
dispersin que se definen al igual que la media en el dominio de los nme-
ros reales, por lo que se aplican slo a las variables cuantitativas.
Las medidas de dispersin que se tratarn en este curso son el rango o
amplitud total, el rango intercuartlico, la varianza, el desvo estndar y, como
un caso de medida de dispersin relativa, el coeficiente de variacin.
Rango o amplitud total
El rango indica la longitud o extensin total de una distribucin de datos y se
calcula de la siguiente manera:
Rg = A
T
= x
mx
x
mn
Constituye una forma simple de determinar la dispersin de los datos de una
distribucin. Es una medida limitada porque explica la variabilidad a partir de
slo dos valores, sin tener en cuenta todos los valores intermedios entre los
extremos.
En la variable edad de los trabajadores de la muestra de la empresa coo-
perativa, el rango es:
Rg = 63 21 = 42 aos
Quiere decir que en una franja o amplitud de 42 aos se encuentra toda la
diversidad en cuanto a la edad de los trabajadores de la muestra de la coo-
perativa.
Rango intercuartlico
Esta medida expresa algo parecido a lo que representa el rango de toda la
distribucin con sus mismas limitaciones pero se refiere nicamente a los
datos centrales que, como ya se vio, quedan encerrados entre el primero y el
tercer cuartil.
d = Q
3
Q
1
39
Estadistica
Varianza y desvo estndar
La varianza es una medida que fue propuesta por Gauss y tiene en cuenta
todos los valores de los datos de la distribucin. Para su construccin se uti-
liza la media aritmtica como referencia para calcular las desviaciones (Xi )
del valor de cada uno de los datos respecto a ella.
En el grfico G.1.26. se observan algunas magnitudes y sentidos de estos
desvos respecto de la media:
Grfico 1.26.
El objetivo es elaborar una medida que sintetice al conjunto de todos los des-
vos y para calcularla podramos promediarlos contando as con un desvo
promedio.
Pero al momento de realizar ese promedio nos encontraramos con la dificul-
tad de que la suma de las desviaciones siempre da cero, como obvia conse-
cuencia de que la media es el centro de equilibrio de todos los desvos, es decir:
Para salvar este escollo el criterio que utiliz Gauss, y que lo hacemos nues-
tro, es promediar los cuadrados de las desviaciones. La medida as determi-
nada se denomina varianza.
Formalmente la varianza se expresa como
si el grupo de datos es una poblacin o
si el grupo de datos es una muestra.
El divisor N o el n-1, segn el caso, se llama grados de libertad. A este tpi-
co nos arrimaremos con ms detalle en estadstica inferencial.
Para la distribucin del gasto medio mensual en alimentos de la matriz
ME 2, la varianza muestral (recordemos que esas 32 viviendas son una mues-
tra extrada de un universo ms grande de viviendas del barrio) es:
S = 195.607,537 $
Recordando que la media es X= 1.227,25$, se aprecia que la magnitud
de la varianza es el cuadrado de la magnitud de la variable y esto complica las
40
Universidad Virtual de Quilmes
Karl Friedrich Gauss en
Theora motus corporum
clestium, Hamgurgo (1809).
35
d Q
3
Q
1
Varianza y desvo estandar
La varianza es una medida que Iue propuesta por Gauss y tiene en
cuenta todos los valores de los datos de la distribucion. Para su
construccion se utiliza la media aritmetica como reIerencia para calcular
las desviaciones (Xi ) del valor de cada uno de los datos respecto a
ella.
COMENZO DE PASTLLA EN Gauss
Karl Friedrich Gauss en Theoa otu opou letiu, Hamgurgo (1809).
FN DE PASTLLA
En el graIico G.1.26. se observan algunas magnitudes y sentidos de
estos desvios respecto de la media:
Insertar Imagen N G.1.26.
El objetivo es elaborar una medida que sintetice al conjunto de todos los
desvios y para calcularla podriamos promediarlos contando asi con un
desvio promedio.
Pero al momento de realizar ese promedio nos encontrariamos con la
diIicultad de que la suma de las desviaciones siempre da cero, como
obvia consecuencia de que la media es el centro de equilibrio de todos
los desvios, es decir que,


Para salvar este escollo el criterio que utilizo Gauss, y que lo hacemos
nuestro, es promediar los cuadrados de las desviaciones. La medida asi
determinada se denomina .
Formalmente la varianza se expresa como

(x
i

Ii
N
si el grupo de datos es una poblacion o

(x
i

Ii
n -1
si el grupo de datos es una muestra.
35
d Q
3
Q
1
Varianza y desvo estandar
La varianza es una medida que Iue propuesta por Gauss y tiene en
cuenta todos los valores de los datos de la distribucion. Para su
construccion se utiliza la media aritmetica como reIerencia para calcular
las desviaciones (Xi ) del valor de cada uno de los datos respecto a
ella.
COMENZO DE PASTLLA EN Gauss
Karl Friedrich Gauss en Theoa otu opou letiu, Hamgurgo (1809).
FN DE PASTLLA
En el graIico G.1.26. se observan algunas magnitudes y sentidos de
estos desvios respecto de la media:
Insertar Imagen N G.1.26.
El objetivo es elaborar una medida que sintetice al conjunto de todos los
desvios y para calcularla podriamos promediarlos contando asi con un
desvio promedio.
Pero al momento de realizar ese promedio nos encontrariamos con la
diIicultad de que la suma de las desviaciones siempre da cero, como
obvia consecuencia de que la media es el centro de equilibrio de todos
los desvios, es decir que,


Para salvar este escollo el criterio que utilizo Gauss, y que lo hacemos
nuestro, es promediar los cuadrados de las desviaciones. La medida asi
determinada se denomina .
Formalmente la varianza se expresa como

(x
i

Ii
N
si el grupo de datos es una poblacion o

(x
i

Ii
n -1
si el grupo de datos es una muestra.
La media poblacional es una sola,
como tambin lo es la varianza
poblacional. En cambio hay tantas
medias muestrales como muestras
distintas se puedan extraer de la
poblacin; y tambin hay tantas
varianzas muestrales como medias
muestrales puedan obtenerse. Por
lo que una varianza muestral est
atada a una determinada media,
tiene un (1) condicionamiento que
no tena la poblacional. Ese condi-
cionamiento le resta (1)
un grado de libertad.
cosas al momento de interpretar esta medida de variabilidad. Para poder com-
patibilizar la magnitud de la dispersin con la magnitud de la variable, sim-
plemente le sacamos la raz cuadrada a la varianza, resultando una nueva
medida llamada desvo estndar.
Formalmente, el desvo se expresa como
si el grupo de datos es una poblacin o
si el grupo de datos es una muestra.
Para el gasto mensual de los hogares encuestados el desvo estndar mues-
tral es: S = $422,28. Esta lectura absoluta aisladamente no suministra una
informacin muy clara sobre los alcances de la dispersin.
En una distribucin simtrica el desvo estndar describe un entorno
alrededor de la media que contiene aproximadamente las 2/3 partes (~
68%) de los datos.
Si se tuviera que el gasto mensual est distribudo simtricamente, slo podr-
amos hacer una interpretacin en el sentido de lo expuesto diciendo que apro-
ximadamente las dos terceras partes de las viviendas de la muestra tienen un
gasto mensual comprendido entre $804,97 y $1649,53 ($1227,25
$422,28).
Para ampliar el concepto anterior rescatamos los indicadores de los casos
1 y 2 de variables cuantitativas discretas donde, en ambos, la variable es
edad.
41
Estadistica
36

El divisor N o el n-1, segn el caso, se llama grados de libertad. A este
tpico nos arrimaremos con ms detalle en estadstica inferencial.

COMIENZO DE PASTILLA EN divisor
La media poblacional es una sola, como tambin lo es la varianza poblacional. En
cambio hay tantas medias muestrales como muestras distintas se puedan extraer de la
poblacin; y tambin hay tantas varianzas muestrales como medias muestrales
puedan obtenerse. Por lo que una varianza muestral est atada a una determinada
media, tiene un (1) condicionamiento que no tena la poblacional. Ese
condicionamiento le resta (1) un grado de libertad.
FIN DE PASTILLA

Para la distribucin del gasto medio mensual en alimentos de la
matriz ME 2, la varianza muestral (recordemos que esas 32 viviendas
son una muestra extrada de un universo ms grande de viviendas del
barrio) es:
S = 195.607,537 $
Recordando que la media es , se aprecia que la
magnitud de la varianza es el cuadrado de la magnitud de la variable y
esto complica las cosas al momento de interpretar esta medida de
variabilidad. Para poder compatibilizar la magnitud de la dispersin con
la magnitud de la variable, simplemente le sacamos la raz cuadrada a la
varianza, resultando una nueva medida llamada desvo estndar.

Formalmente, el desvo se expresa como


=
(x
i
x )
2

fi
N
si el grupo de datos es una poblacin o


S =
(x
i
x )
2

fi
n-1
si el grupo de datos es una muestra.

Para el gasto mensual de los hogares encuestados el desvo estndar
muestral es: S = $422,28. Esta lectura absoluta, aisladamente no
suministra una informacin muy clara sobre los alcances de la
dispersin.

COMIENZO DE LEER ATENTO
En una distribucin simtrica el desvo estndar describe un
entorno alrededor de la media que contiene aproximadamente las
2/3 partes (~ 68%) de los datos.
FIN DE LEER ATENTO

Si se tuviera que el gasto mensual est distribudo simtricamente, slo
podramos hacer una interpretacin en el sentido de lo expuesto
diciendo que aproximadamente las dos terceras partes de las viviendas
de la muestra tienen un gasto mensual comprendido entre $804,97 y
$1649,53 ($1227,25 $422,28).
donde, en ambos, la variable es edad.
Medidas
Caso 1: Ldad de los
trabajadores de una
empresa oooperativa"
Caso 2: Ldad de los empleados de una fabrioa
automotriz"
X
38,9 aos 37,4 aos
Me 37,5 aos 37 aos
Mo 37 aos 37,5 aos (maroa de olase del intervalo modal)
R 42 aos 49 aos
S
2
100,73 aos
2
127,56 aos
2
S 10,0 aos 11,3 aos
Asimetria a dereoha Casi simtrioa
2/3 de los oasos
aproximadamente
No se puede
Comprende las edades de 27 aos a 48 aos
(valores que oaen dentro del intervalo 37,4 | 11,3)
COMIENZO DE LEER ATENTO
La utilidad de las medidas de dispersin aparece claramente cuando se comparan distintas distribuciones de datos
referidas a la misma variable.
FIN DE LEER ATENTO
Utilizando la informacin del cuadro anterior para comparar las distribuciones de edades de los grupos analizados,
notamos que todas las medidas de dispersin calculadas son mayores en el caso 2 respecto del caso 1. Esto estara
indicando que las edades de los empleados de la muestra de la fbrica automotriz estn ms dispersas que las edades de
los trabajadores de la muestra de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son similares, caracterstica que permiti comparar
sin problemas las medidas de dispersin. Si los grupos analizados no tuvieren similar promedio entonces la comparacin
de la dispersin de las distribuciones debera intentarse por otro camino.
Otro problema se presenta cuando se quieren comparar las dispersiones de variables distintas surgidas de un mismo
grupo de estudio.
Coeciente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de las distribuciones de variables que tienen
distinta magnitud.
Este coeciente puede utilizarse tambin para comparar variables de igual magnitud pero con promedios
signicativamente distintos.
Medidas
Cantidad de
ambientes
Cantidad de personas
ocupantes
Gasto medio
mensual
Cantidad de personas
mayores con trabajo
S 1,26 amb. 0,94 pers. $421,23 0,98 pers.
3,34 amb. 3,12 pers. $1201,68 2,25 pers.
CV 0,3772 0,3013 0,3505 0,4355
Cv100 38,72 30,13 35,05 43,55
De la comparacin de los CV se concluye que el grupo de viviendas relevadas es ms compacto, ms homogneo,
menos disperso, en cuanto a la cantidad de personas ocupantes, porque tiene el menor de los coecientes calculados.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms heterogneo, ms disperso, menos compacto,
en cuanto a la cantidad de personas mayores con trabajo.
La utilidad de las medidas de dispersin aparece claramente cuando se
comparan distintas distribuciones de datos referidas a la misma variable.
Utilizando la informacin del cuadro anterior, para comparar las distribuciones
de edades de los grupos analizados, notamos que todas las medidas de dis-
persin calculadas son mayores en el caso 2 respecto del caso 1. Esto esta-
ra indicando que las edades de los empleados de la muestra de la fbrica auto-
motriz estn ms dispersas que las edades de los trabajadores de la muestra
de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son
similares, caracterstica que permiti comparar sin problemas las medidas de
dispersin. Si los grupos analizados no tuvieren similar promedio entonces la
comparacin de la dispersin de las distribuciones debera intentarse por otro
camino.
Otro problema se presenta cuando se quieren comparar las dispersiones
de variables distintas surgidas de un mismo grupo de estudio.
Coeficiente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de
las distribuciones de variables que tienen distinta magnitud.
Este coeficiente puede utilizarse tambin para comparar variables de igual
magnitud pero con promedios significativamente distintos.
Es en realidad una dispersin relativa no absoluta como el desvo estn-
dar y se calcula como el cociente entre el desvo estndar y la media.
Tambin se puede expresar en porcentajes
Compararemos todas las variables cuantitativas de la ME 2 calculando todos
los CV.
De la comparacin de los CV se concluye que el grupo de viviendas relevadas
es ms compacto, ms homogneo, menos disperso, en cuanto a la cantidad
de personas ocupantes, porque tiene el menor de los coeficientes calculados.
42
Universidad Virtual de Quilmes
donde, en ambos, la variable es edad.
Medidas
Caso 1: Ldad de los
trabajadores de una
empresa oooperativa"
Caso 2: Ldad de los empleados de una fabrioa
automotriz"
38,9 aos 37,4 aos
Me 37,5 aos 37 aos
Mo 37 aos 37,5 aos (maroa de olase del intervalo modal)
R 42 aos 49 aos
S
2
100,73 aos
2
127,56 aos
2
S 10,0 aos 11,3 aos
Asimetria a dereoha Casi simtrioa
2/3 de los oasos
aproximadamente
No se puede
Comprende las edades de 27 aos a 48 aos
(valores que oaen dentro del intervalo 37,4 | 11,3)
COMIENZO DE LEER ATENTO
La utilidad de las medidas de dispersin aparece claramente cuando se comparan distintas distribuciones de datos
referidas a la misma variable.
FIN DE LEER ATENTO
Utilizando la informacin del cuadro anterior para comparar las distribuciones de edades de los grupos analizados,
notamos que todas las medidas de dispersin calculadas son mayores en el caso 2 respecto del caso 1. Esto estara
indicando que las edades de los empleados de la muestra de la fbrica automotriz estn ms dispersas que las edades de
los trabajadores de la muestra de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son similares, caracterstica que permiti comparar
sin problemas las medidas de dispersin. Si los grupos analizados no tuvieren similar promedio entonces la comparacin
de la dispersin de las distribuciones debera intentarse por otro camino.
Otro problema se presenta cuando se quieren comparar las dispersiones de variables distintas surgidas de un mismo
grupo de estudio.
Coeciente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de las distribuciones de variables que tienen
distinta magnitud.
Este coeciente puede utilizarse tambin para comparar variables de igual magnitud pero con promedios
signicativamente distintos.
Medidas
Cantidad de
ambientes
Cantidad de personas
ocupantes
Gasto medio
mensual
Cantidad de personas
mayores con trabajo
S 1,26 amb. 0,94 pers. $421,23 0,98 pers.
X
3,34 amb. 3,12 pers. $1201,68 2,25 pers.
CV 0,3772 0,3013 0,3505 0,4355
Cv100 38,72 30,13 35,05 43,55
De la comparacin de los CV se concluye que el grupo de viviendas relevadas es ms compacto, ms homogneo,
menos disperso, en cuanto a la cantidad de personas ocupantes, porque tiene el menor de los coecientes calculados.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms heterogneo, ms disperso, menos compacto,
en cuanto a la cantidad de personas mayores con trabajo.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms
heterogneo, ms disperso, menos compacto, en cuanto a la cantidad de per-
sonas mayores con trabajo.
14.
Calcular las medidas de dispersin para todas las variables cuantitativas
de la ME 1 y hacer todas las comparaciones posibles.
1.2.3. Medidas de intensidad
Cotidianamente se utilizan indicadores socio-econmicos denominados tasas
para mostrar la incidencia relativa de algn valor de la variable o sus cambios
espacio-temporales. Esos indicadores son las medidas estadsticas de inten-
sidad y se expresan como coeficientes o como porcentajes.
Previo al tratamiento de estas medidas leemos el artculo periodstico que
sigue.
04 de Junio de 2005
NO CEDE EL DESEMPLEO DEL CONURBANO
Cordones sin reaccin
La cantidad de desocupados en los 28 centros urbanos encuestados por el Indec result de
1.369.000 personas durante el primer trimestre, de los cuales 677 mil estaban localizados en
los partidos del Gran Buenos Aires. Los datos surgen de la Encuesta Permanente de Hogares
del Indec publicados ayer, dos semanas despus de conocerse la tasa de desocupacin para el
perodo, del 13 por ciento. Los subocupados demandantes, es decir aquellos que no llegan a
completar la jornada laboral y estn buscando otro trabajo, suman otras 948 mil personas con
problemas de empleo. Las zonas urbanas del pas ms afectadas por el problema global de deso-
cupacin y subocupacin demandante resultaron, en el primer trimestre, el conurbano bona-
erense y el ncleo Gran Tucumn (ciudad capital y sus alrededores) Taf Viejo. El primero
sumaba 15,5 por ciento de desocupados ms 10,4 por ciento de subocupados demandantes;
el segundo, 14,2, ms 16,5 por ciento. La desocupacin, en los partidos del Gran Buenos Aires
fue superior a la del cuarto trimestre de 2004 en siete dcimas e idntica a la registrada en el
primer trimestre de ese mismo ao. Es decir que la regin muestra un estancamiento en la
recuperacin del empleo. En tanto, en el Gran Tucumn-Taf Viejo el dato ms preocupante
es el aumento de la subocupacin demandante, del 15,5 por ciento en el primer trimestre, con
un salto de 1,4 punto en la ltima medicin con respecto a la inmediata anterior y 2,3 puntos
cuando se la compara con la de un ao antes. Los otros grandes distritos urbanos (con ms de
500 mil habitantes) que registraron tasas de desocupacin por encima del promedio del pas
fueron el Gran Rosario, 14 por ciento, y el Gran La Plata, con el 13,5 por ciento. Entre los gran-
des aglomerados, la tasa ms baja de desocupacin corresponde al Gran Mendoza, con el 8 por
ciento, y entre las regiones a la Patagonia, con el 7,6 por ciento. Adems, en esta ltima regin,
la tasa de subocupacin demandante reflejada por el Indec es prcticamente insignificante, del
3,4 por ciento, en tanto en el Noroeste se eleva al 11,2 por ciento.
2000-2002 Pagina12/WEB Repblica Argentina
43
Estadistica
Del artculo anterior rescatamos la siguiente informacin referida al 2005:
la tasa de desocupacin para el Gran Rosario es del 14%;
hay 1,44 desocupados por cada subocupado demandante;
la desocupacin en los partidos del Gran Buenos Aires creci un 0,7% entre
el 4to. trimestre del 2004 y el 1er. trimestre de 2005.
Recrearemos las lecturas anteriores de la siguiente manera:
la proporcin de desocupados en el Gran Rosario es del 14%;
la relacin entre desocupacin y subocupacin es a razn de 1,44 deso-
cupados por cada subocupado demandante;
tomando como base de referencia (100%) el 4to. trimestre de 2004, el
ndice de desocupacin para el 1er. trimestre del 2005 es del 100,7%.
Proporcin
De las variables ya tratadas podemos decir, por ejemplo, que la proporcin de
pymes del rubro industrial es del 37,5%, o tambin que la proporcin de pie-
zas de plstico con un nivel de terminacin bueno o muy bueno es del 50%.
La proporcin mide el peso incidencia que tiene una o varias cate-
goras/valores de la variable en el conjunto total de datos.
La proporcin se calcula haciendo el cociente entre la frecuencia correspon-
diente a una categora o valor de la variable y el total de los datos.
En smbolos:
Si bien el resultado es un coeficiente comprendido entre 0 y 1, la proporcin
tambin se expresa en porcentajes (multiplicndola por 100).
Los clculos implcitos en el prrafo inicial son:
El primer ejemplo tiene en cuenta slo una categora de la variable por eso se
lo considera una proporcin simple y el segundo es una proporcin compuesta
porque interviene ms de una categora.
15.
a. Determinar e interpretar la proporcin de viviendas de 4 ambientes
de la ME 2.
b. Qu porcentaje de empleados estn al menos conformes con el fun-
44
Universidad Virtual de Quilmes
cionamiento de la empresa cooperativa (ME 1)?
c. Cul es la proporcin de desaparecidos con una edad de entre 30 y
35 aos?
d. Identificar qu tipo de proporcin (simple o compuesta) es cada una
de las calculadas en los tems anteriores.
Razn
La razn, a diferencia de la proporcin, es un indicador que se obtiene calcu-
lando el cociente entre las frecuencias de valores distintos de una variable.
La razn mide el peso incidencia que tiene una o varias categor-
as/valores de la variable con respecto a otra u otras categoras/valores.
La razn entre A y B se calcula haciendo el cociente entre sus respectivas fre-
cuencias, siendo A y B valores/categoras o grupos de valores/categoras.
En smbolos:
Ejemplos
Por cada 1 vivienda de dos ambientes hay 1,6 viviendas de tres ambientes (o
tambin, en la muestra hay un 60% ms de viviendas con 3 ambientes que con
2 ambientes).
Por cada pieza que se fabrica con un nivel de terminacin regular hay dos pie-
zas con nivel bueno o muy bueno.
El primer ejemplo tiene en cuenta slo una categora de la variable en
ambos factores del cociente, por ello es una razn simple y el segundo es una
razn compuesta porque interviene ms de una categora en por lo menos
uno de los dos factores.
16.
a. Cul es la razn entre los empleados que estn conformes y los que
estn muy conformes con el funcionamiento de la empresa coope-
rativa? (ME 1).
b. Por cada trabajador mayor a 40 aos, cuntos hay de entre 30 y 40
aos? (ME 1).
c. Identificar qu tipo de razn (simple o compuesta) es cada una de las
calculadas en los tems anteriores.
45
Estadistica
Como en el caso de las
proporciones, las razo-
nes pueden ser simples o com-
puestas.
En las distribuciones bivariadas (tablas de doble entrada), son compuestas todas las tasas cal-
culadas a partir de las frecuencias conjuntas.
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo de las pymes
(ver tabla 1.10.) se puede observar que el 16,67% (4/24100) de las pymes de la muestra son
del rubro industrial y aumentaron los puestos de trabajo entre 2001 y 2003, o que por cada
pymes del rubro comercial que mantuvo hay 1,33 (4/3) industrial que aument sus puestos
de trabajo.
Nmeros ndice
Un nmero ndice mide las variaciones relativas de la ocurrencia de los valo-
res/categoras de una variable a travs de distintas situaciones espaciales o
temporales.
En smbolos:
Donde i indica una situacin espacial o temporal cualquiera y o indica la
situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores (ME 1)
que cobran actualmente ms de $750 respecto de los que cobraban tambin
ms de $750 en el perodo anterior, calculamos
El grupo de trabajadores que hoy tienen un salario quincenal superior a los
$750 es el 260% del grupo de trabajadores que en el perodo anterior tenan
tambin ms de $750 de salario quincenal. Es decir, que la cantidad de tra-
bajadores que hoy ganan ms de $750 aument un 160% con respecto a la
situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica automotriz
podemos comparar una determinada franja de edad, por ejemplo empleados
de entre 20 y 30 aos, haciendo
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de los
trabajadores de la fbrica. Es decir que hay un 75% menos de personas de 20
a 30 aos trabajando en la cooperativa que en la fbrica automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices gene-
rales de precios.
46
Universidad Virtual de Quilmes
42
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo
de las pymes (ver tabla 1.10) se puede observar que el 16,67% (4/24100) de
las pymes de la muestra son del rubro industrial y aumentaron los puestos de
trabajo entre 2001 y 2003, o que por cada pymes del rubro comercial que
mantuvo hay 1,33 (4/3) industrial que aument sus puestos de trabajo.
FIN DE TEXTO APARTE

Nmeros ndice

Un nmero ndice mide las variaciones relativas de la ocurrencia de los
valores/categoras de una variable a travs de distintas situaciones
espaciales o temporales.
En smbolos:

Donde i indica una situacin espacial o temporal cualquiera y o
indica la situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores
(ME 1) que cobran actualmente ms de $750 respecto de los que
cobraban tambin ms de $750 en el perodo anterior, calculamos


I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60

El grupo de trabajadores que hoy tienen un salario quincenal superior a
los $750 es el 260% del grupo de trabajadores que en el perodo anterior
tenan tambin ms de $750 de salario quincenal. Es decir, que la
cantidad de trabajadores que hoy ganan ms de $750 aument un 160%
con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica
automotriz podemos comparar una determinada franja de edad, por
ejemplo empleados de entre 20 y 30 aos, haciendo


I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25

El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de
los trabajadores de la fbrica. Es decir que hay un 75% menos de
personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica
automotriz.

ndices de precios

Veremos a continuacin cmo se construyen y cmo se usan los ndices
generales de precios.
42
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo
de las pymes (ver tabla 1.10) se puede observar que el 16,67% (4/24100) de
las pymes de la muestra son del rubro industrial y aumentaron los puestos de
trabajo entre 2001 y 2003, o que por cada pymes del rubro comercial que
mantuvo hay 1,33 (4/3) industrial que aument sus puestos de trabajo.
FIN DE TEXTO APARTE

Nmeros ndice

Un nmero ndice mide las variaciones relativas de la ocurrencia de los
valores/categoras de una variable a travs de distintas situaciones
espaciales o temporales.
En smbolos:

Donde i indica una situacin espacial o temporal cualquiera y o
indica la situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores
(ME 1) que cobran actualmente ms de $750 respecto de los que
cobraban tambin ms de $750 en el perodo anterior, calculamos


I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60

El grupo de trabajadores que hoy tienen un salario quincenal superior a
los $750 es el 260% del grupo de trabajadores que en el perodo anterior
tenan tambin ms de $750 de salario quincenal. Es decir, que la
cantidad de trabajadores que hoy ganan ms de $750 aument un 160%
con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica
automotriz podemos comparar una determinada franja de edad, por
ejemplo empleados de entre 20 y 30 aos, haciendo


I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25

El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de
los trabajadores de la fbrica. Es decir que hay un 75% menos de
personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica
automotriz.

ndices de precios

Veremos a continuacin cmo se construyen y cmo se usan los ndices
generales de precios.
42
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo
de las pymes (ver tabla 1.10) se puede observar que el 16,67% (4/24100) de
las pymes de la muestra son del rubro industrial y aumentaron los puestos de
trabajo entre 2001 y 2003, o que por cada pymes del rubro comercial que
mantuvo hay 1,33 (4/3) industrial que aument sus puestos de trabajo.
FIN DE TEXTO APARTE

Nmeros ndice

Un nmero ndice mide las variaciones relativas de la ocurrencia de los
valores/categoras de una variable a travs de distintas situaciones
espaciales o temporales.
En smbolos:

Donde i indica una situacin espacial o temporal cualquiera y o
indica la situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores
(ME 1) que cobran actualmente ms de $750 respecto de los que
cobraban tambin ms de $750 en el perodo anterior, calculamos


I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60

El grupo de trabajadores que hoy tienen un salario quincenal superior a
los $750 es el 260% del grupo de trabajadores que en el perodo anterior
tenan tambin ms de $750 de salario quincenal. Es decir, que la
cantidad de trabajadores que hoy ganan ms de $750 aument un 160%
con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica
automotriz podemos comparar una determinada franja de edad, por
ejemplo empleados de entre 20 y 30 aos, haciendo


I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25

El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de
los trabajadores de la fbrica. Es decir que hay un 75% menos de
personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica
automotriz.

ndices de precios

Veremos a continuacin cmo se construyen y cmo se usan los ndices
generales de precios.
Construccin de ndices de precios
Convengamos que todos los productos de la canasta familiar se puedan redu-
cir a, digamos, tres (A, B y C) y que en dos aos distintos se relevaron los pre-
cios (p) y las cantidades (q) consumidas de cada uno de ellos:
Podemos analizar cmo evolucion el precio de cada uno de los productos,
haciendo tres ndices simples de precios.
I
2004/2003
(A) = 15 / 13 100 = 115,38%
El precio del producto A subi un 15,38% entre el 2003 y el 2004.
I
2004/2003
(B) = 21 / 25 100 = 84,00%
El precio del producto B baj un 16,00% entre el 2003 y el 2004.
I
2004/2003
(C) = 6 / 5 100 = 120,00%
El precio del producto A subi un 20,00% entre el 2003 y el 2004.
Para medir la evolucin del conjunto de precios de los tres productos necesi-
tamos contar con ndices compuestos.
Media de relativos simples (o media de ndices simples)
Es la media aritmtica de todos los ndices simples de todos los productos.
Para el ejemplo que estamos viendo, el clculo sera.
Los precios de los productos A, B y C subieron en conjunto un 6,46% entre los
aos 2003 y 2004.
Relativo de agregados no ponderados (o ndice de agregados no ponderados)
Se construye como cociente entre la sumatoria (agregacin) de los precios para
el ao 2004 y la sumatoria (agregacin) de los precios para el ao base 2003.
Los precios de los productos A, B y C bajaron en conjunto un 2,33% entre los
aos 2003 y 2004.
Relativo de agregados ponderados (o ndice de agregados ponderados)
Se construyen no solamente con los precios sino con algn otro elemento de pon-
deracin que permita darle un peso distinto a cada producto. Ese elemento
de ponderacin generalmente es la cantidad consumida de cada producto.
47
Estadistica
En realidad la canasta
familiar est integrada por
muchos productos. En este caso,
como recurso didctico, usamos
tres productos como representati-
vos de todos slo para reducir la
cantidad de clculos.
que hoy ganan ms de $750 aument un 160% con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica automotriz podemos comparar una determinada
franja de edad, por ejemplo empleados de entre 20 y 30 aos, haciendo
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de los trabajadores de la fbrica. Es decir que hay
un 75% menos de personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices generales de precios.
Construccin de ndices de precios
Convengamos que todos los productos de la canasta familiar se puedan reducir a, digamos, tres (A, B y C) y que en dos
aos distintos se relevaron los precios (p) y las cantidades (q) consumidas de cada uno de ellos:
Producto Precio 2003 Cantidad 2003 Precio 2004 Cantidad 2004
A $13 500 $15 550
B $25 280 $21 250
C $5 990 $6 1200
COMIENZO DE PASTILLA EN oanasta familiar
Ln realidad la oanasta familiar esta integrada por muohos produotos. Ln este oaso, oomo reourso didaotioo, usamos tres produotos oomo
representativos de todos solo para reduoir la oantidad de oaloulos.
FIN DE PASTILLA
Podemos analizar cmo evolucion el precio de cada uno de los productos, haciendo tres ndices simples de precios.
I
2004/2003
(A) = 15 / 13 100 = 115,38%
El precio del producto A subi un 15,38% entre el 2003 y el 2004.
I
2004/2003
(B) = 21 / 25 100 = 84,00%
El precio del producto B baj un 16,00% entre el 2003 y el 2004.
I
2004/2003
(C) = 6 / 5 100 = 120,00%
El precio del producto A subi un 20,00% entre el 2003 y el 2004.
Para medir la evolucin del conjunto de precios de los tres productos necesitamos contar con ndices compuestos.
Media de relativos simples (o media de ndices simples)
Es la media aritmtica de todos los ndices simples de todos los productos. Para el ejemplo que estamos viendo, el
clculo sera.
43

Construccin de ndices de precios
Convengamos que todos los productos de la canasta familiar se puedan
reducir a, digamos, tres (A, B y C) y que en dos aos distintos se
relevaron los precios (p) y las cantidades (q) consumidas de cada uno de
ellos:

Producto Precio 2003 Cantidad 2003 Precio 2004 Cantidad 2004
A $13 500 $15 550
B $25 280 $21 250
C $5 990 $6 1200



COMIENZO DE PASTILLA EN canasta familiar
En realidad la canasta familiar est integrada por muchos productos. En este caso,
como recurso didctico, usamos tres productos como representativos de todos slo
para reducir la cantidad de clculos.
FIN DE PASTILLA

Podemos analizar cmo evolucion el precio de cada uno de los
productos, haciendo tres ndices simples de precios.

I
2004/2003
(A) = 15 / 13 100 = 115,38%
El precio del producto A subi un 15,38% entre el 2003 y el 2004.
I
2004/2003
(B) = 21 / 25 100 = 84,00%
El precio del producto B baj un 16,00% entre el 2003 y el 2004.
I
2004/2003
(C) = 6 / 5 100 = 120,00%
El precio del producto A subi un 20,00% entre el 2003 y el 2004.

Para medir la evolucin del conjunto de precios de los tres productos
necesitamos contar con ndices compuestos.

Media de relativos simples (o media de ndices simples)
Es la media aritmtica de todos los ndices simples de todos los
productos. Para el ejemplo que estamos viendo, el clculo sera.

I
2004
2003
( A, B, C) =
I
2004
2003
( A) + I
2004
2003
(B) + I
2004
2003
(C)
3
=106, 46%
Los precios de los productos A, B y C subieron en conjunto un
6,46% entre los aos 2003 y 2004.

Relativo de agregados no ponderados (o ndice de agregados no
ponderados)
La cuestin que aparece a continuacin es decidir con qu cantidades
ponderar, las del ao tomado como base o las del ao para el que se hace
el estudio que convenimos en llamar ao dado.
Entre los criterios existentes, el de Laspeyres adopta, para ponderar las can-
tidades consumidas en el ao base, la siguiente manera:
Este es el criterio que utiliza el Sistema Estadstico Nacional (INDEC y Direc-
ciones Provinciales de Estadsticas) para la construccin de todos los ndices
generales de precios: ndice de Precios al consumidor (IPC), Sistema de ndi-
ces de precios mayoristas (SIPM) e ndice de costos de la construccin (ICC).
Para el ejemplo que estamos desarrollando, el clculo del ndice de pre-
cios segn el criterio de Laspeyres para el conjunto de los productos A, B,
C es:
Los precios de los productos A, B, C subieron en conjunto un 4,72% entre los
aos 2003 y 2004. Es decir que en 2004 esos productos fueron en conjunto
un 4,72% ms caros respecto del ao 2003.
Si esos tres productos fueran todos los de la canasta familiar, como esta-
mos simulando, las cantidades consumidas podran entrar en la frmula de Las-
peyres como porcentajes del total:
Esta estructura de ponderacin es la que usa el INDEC para publicar los ndi-
ces Generales de precios. El criterio de Paasche usa para ponderar las canti-
dades del ao dado.
Para los mismos productos y el mismo perodo, un ndice de precios elabora-
do con este criterio es:
48
Universidad Virtual de Quilmes
Fue publicado en 1870
por el economista y esta-
dstico alemn Ernst Louis Etienne
Laspeyres.
La estructura de ponde-
racin actual del IPC asig-
na para Alimentos y bebidas: 31,29%,
Indumentaria: 5,18%, Vivienda:
12,68%, Equipamiento y manteni-
miento del hogar: 6,55%, Atencin
mdica y gastos para la salud:
10,04%, Transporte y comunica-
ciones: 16,96%, Esparcimiento:
8,67%, Educacin: 4,20%, Bienes
y servicios varios: 4,43%.
En este caso hay que contar con la informacin de las cantidades consumi-
das en el ao dado y para la elaboracin de ndices generales eso implica un
serio problema operativo. Este criterio puede usarse en trabajos locales, donde
se tengan planificados y asegurados los recursos y se pueda encarar la moda-
lidad operativa que requiere ese ndice.
Un tercer criterio, el de Fisher, combina las virtudes de los dos anteriores
mediante el empleo de la media geomtrica entre I
L
y I
P
, pero tambin carga
con las mismas limitaciones operativas de P.
Para los tres productos del ejemplo:
Uso de los nmeros ndices
Llamemos i, j a dos aos dados cualesquiera y o al ao base.
En las publicaciones, todos los ndices generales aparecen referidos a un
ao base por lo que se cuenta entonces con los ndices I
i/
o
y I
j/
o
.
Para algn uso especfico en el que necesitramos un ndice I
j/
o
que des-
criba la evolucin entre los aos i y j, utilizaremos las llamadas cadenas o
enlaces relativos.
Supongamos que el ndice compuesto de precios de varios productos fue de
120 en 2000 y de 129 en 2001, calculados ambos con base 1999, y quere-
mos saber cunto aument el nivel de precios entre 2000 y 2001. La res-
puesta es que el nivel de precios aument un 7,50 % (se calcula: 129 / 120
x 100 =107,50 %).
El ndice de precios al consumidor y el promedio de salarios por hora en cier-
tas industrias seleccionadas se encuentran en la tabla siguiente.
Analizaremos cmo evolucion el salario real de un empleado tipo en cada
una de las tres industrias seleccionadas, entre el ao base 1988 y el ao
1991.
Para este anlisis utilizaremos el IPC cuyo rol ser el de mover en el tiem-
po una magnitud econmica en este caso el salario y hacer comparaciones.
49
Estadistica
I
i
o
I
j
i
= I
j
o
I
j
i
=
I
j
o
I
i
o
Por ejemplo: representa el salario del ao 1988
8,67, Lduoaoion: 4,20, Bienes y servioios varios: 4,43.
FIN DE PASTILLA
El criterio de Paasche usa para ponderar las cantidades del ao dado.
Para los mismos productos y el mismo perodo, un ndice de precios elaborado con este criterio es:
En este caso hay que contar con la informacin de las cantidades consumidas en el ao dado y para la elaboracin
de ndices generales eso implica un serio problema operativo. Este criterio puede usarse en trabajos locales, donde se
tengan planicados y asegurados los recursos y se pueda encarar la modalidad operativa que requiere ese ndice.
Un tercer criterio, el de Fisher, combina las virtudes de los dos anteriores mediante el empleo de la media geomtrica
entre I
L
y I
P
, pero tambin carga con las mismas limitaciones operativas de P.

Para los tres productos del ejemplo:

Uso de los nmeros ndices
Llamemos i, j a dos aos dados cualesquiera y o al ao base.
En las publicaciones, todos los ndices generales aparecen referidos a un ao base por lo que se cuenta entonces con
los ndices y .
Para algn uso especco en el que necesitramos un ndice que describa la evolucin entre los aos i y j,
utilizaremos las llamadas cadenas o enlaces relativos.
Supongamos que el ndice compuesto de precios de varios productos fue de 120 en 2000 y de 129 en 2001, calculados
ambos con base 1999, y queremos saber cunto aument el nivel de precios entre 2000 y 2001. La respuesta es que el
nivel de precios aument un 7,50 % (se calcula: 129 / 120 x 100 =107,50 %).
El ndice de precios al consumidor y el promedio de salarios por hora en ciertas industrias seleccionadas se encuentran
en la tabla siguiente.
Salarios por hora (en $)
Ao IPC Servicios Comercio al menudeo Manufactura
1988
1989
1990
1991
100,0
109,6
113,6
117,1
7,17
8,18
8,81
9,49
5,50
5,95
6,06
6,60
8,48
9,37
9,37
10,01
Analizaremos cmo evolucion el salario real de un empleado tipo en cada una de las tres industrias seleccionadas,
entre el ao base 1988 y el ao 1991.
Para este anlisis utilizaremos el IPC cuyo rol ser el de mover en el tiempo una magnitud econmica en este caso
Cualquier ndice general utilizado con esta finalidad recibe el nombre de ndi-
ce deflactor.
Por ejemplo: representa el salario del ao 1988
trasladado al ao 1991, para un empleado del sector servicios. Este es el
valor del salario del ao 1988 corregido por el costo de la vida en el lapso
1988-1991.
Si comparamos el valor obtenido ($8,40) con el que realmente recibe en 1991
($9,49), vemos que su salario real aument un 12,98% (=9,49/8,40 x 100).
17.
Usando la informacin de la tabla anterior describir la evolucin del
salario del sector servicios entre 1989 y 1990.
Es posible concluir que las medidas de intensidad son aplicables a cual-
quier tipo de variable?
18.
Extraer todas las conclusiones posibles a partir de la lectura del texto
que se transcribe a continuacin y que es parte de un artculo publica-
do en el diario Pgina 12.
Todos los libros el libro
Por Gabriel D. Lerman
[] Segn estimaciones publicadas por el SINCA (Sistema de Infor-
macin Cultural de la Argentina), la cultura argentina constituye un
3% del PBI nacional, cifra que supera, por ejemplo, al sector de la mine-
ra. Ms 9100 millones de pesos producidos y ms 200 mil puestos de
trabajo generados componen un sector diverso, heterogneo, que sin
embargo se caracteriza por una alta concentracin econmica y geo-
grfica, que reproduce el ms feroz centralismo porteo.
La industria editorial ha sido por dcadas uno de los puntales de la cul-
tura argentina, punto de referencia para toda Amrica latina y el mundo
hispanoparlante. Hacia mediados de la dcada del setenta, el pas pro-
duca unos 50 millones de ejemplares al ao, cifra que diez aos ms
tarde haba cado a 17. En 1996 se produjeron 42 millones de libros, en
el 2000 se lleg a 74 millones y en el 2002, tras la crisis, la produccin
cay a la mitad. A partir de la devaluacin, Argentina recuper condi-
ciones favorables e inici una franca recuperacin: de 38 millones de
libros en 2003 se pas a 56 en 2004. En 2007, la industria editorial
argentina tuvo el record histrico de 93 millones de ejemplares impre-
sos []
[] Cerca del 75% de las editoriales se encuentra emplazada en la regin
metropolitana, mientras que el resto se ubica en los principales centros
urbanos. Si bien esto responde a la concentracin de la poblacin, hay
provincias que slo poseen una o dos editoriales que apenas sobreviven
con ayuda oficial.
50
Universidad Virtual de Quilmes
I
i
o
I
j
i
= I
j
o
I
j
i
=
I
j
o
I
i
o
Por ejemplo: representa el salario del ao 1988
Se puede ver el art-
c u l o c o mp l e t o e n
www. p a g i n a 1 2 . c o m. a r ,
Suplemento Radar libros del
di ari o Pgi na 12, con fecha
22/03/2009.
[...] Tres de cada cuatro libros les corresponden a las grandes editoriales
[...]
[...] Argentina y Colombia lideran el comercio exterior de libros en Am-
rica del Sur.
[...] Segn la publicacin Nosotros y los otros, del Mercosur Cultural,
un 77% de los libros exportados por la regin sudamericana quedan en
el continente. Esto muestra una baja capacidad de penetracin en mer-
cados internacionales ms vigorosos, incluso Espaa, que adquiere slo
el 1,6% del total exportado. Por el contrario, si se miden las importa-
ciones se comprueba que slo el 41% proviene de los mismos pases,
mientras que las compras a Espaa trepan al 29% [...]
1.3. Matrices ejemplos
Las siguientes matrices corresponden a muestras representativas seleccio-
nadas de diferentes poblaciones objetivo de estudio, con distintos tipos de
unidades de observacin.
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada tra-
bajador es una unidad de observacin.
Referencias:
Nivel de especializacin: B: bajo, M: mediano, A: alto.
Conformidad con el funcionamiento de la empresa cooperativa: P: poco con-
forme, C: conforme, M: muy conforme.
Quincena actual: salario quincenal de los trabajadores (participacin quince-
nal en las ganancias de la cooperativa) en el mes en curso despus de haber-
se producido un incremento en las ventas.
Quincena anterior: salario quincenal de los trabajadores previo al incremento
de las ventas.
51
Estadistica
1.3. Matrices ejemplos
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada trabajador es una unidad de observacin.
ME 1-
Empleado edad sexo
Anti-
gedad
Especia-
lizacin
Confor-
midad
Quincena$
actual
Quincena$
anterior
1 34 M 1 B C 345 310
2 36 F 5 A M 950 810
3 51 M 7 M P 670 570
4 21 F 4 M C 810 730
5 37 F 0 M M 800 680
6 38 M 0 B P 500 450
7 39 F 9 B C 690 580
8 25 F 4 M M 840 715
9 36 M 3 M P 835 750
10 40 F 3 M P 735 660
11 63 F 5 A M 1550 1320
12 40 M 5 A M 850 730
13 39 F 0 B C 505 452
14 37 M 8 A M 1135 965
15 57 F 13 A M 1280 1100
16 30 F 2 M M 820 700
17 28 M 3 B C 480 410
18 48 F 1 M M 830 720
19 42 M 7 A P 1145 970
20 37 F 1 M M 775 698
Vivienda
Cant. de
ambientes
Mantenimiento
Personas
ocupantes
Gasto
medio
mensual
Personas
mayores con
trabajo
Hay nios
que trabajan?
1 3 B 3 780,50 1 N
2 2 M 3 1500,35 1 N
3 5 B 4 1200,05 2 N
4 3 B 2 986,65 1 N
5 4 R 3 2010,90 2 S
6 1 B 3 780 ,10 1 N
7 2 M 3 1452,25 3 N
8 4 E 2 1200,00 2 N
9 5 B 5 900,98 2 N
10 4 R 3 2010,09 3 N
11 3 B 3 891,75 2 N
12 4 M 3 1205,40 3 N
13 3 B 3 909,90 1 S
14 2 B 2 2010,10 2 N
15 4 M 3 899,50 3 N
16 2 B 2 780,00 2 N
17 4 R 5 1505,10 3 N
18 1 B 3 1224,69 3 N
19 2 M 3 890,70 3 N
20 4 E 3 780,50 2 S
21 5 B 3 1312,80 3 N
22 3 R 2 1219,40 2 N
23 4 B 5 986,20 4 N
24 4 R 3 2010,35 3 N
25 3 B 3 890,10 1 S
26 5 B 3 780,09 1 N
27 3 R 3 1510,69 3 N
28 6 B 2 1200,75 2 N
29 4 M 5 942,70 5 N
30 1 E 2 2010,00 1 S
31 4 B 3 890,40 2 N
32 3 R 5 780,80 3 N
Referencias
Matriz 2. Poblacin: viviendas de un determinado barrio donde cada vivienda
es la unidad de anlisis.
Referencias:
Mantenimiento o estado de mantenimiento: M: malo, R: regular, B: bueno, E:
excelente.
Gasto medio mensual en alimentos del grupo que vive en la vivienda en $.
Hay nios que trabajan?: S: s, N: no.
52
Universidad Virtual de Quilmes
1.3. Matrices ejemplos
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada trabajador es una unidad de observacin.
ME 1-
Empleado edad sexo
Anti-
gedad
Especia-
lizacin
Confor-
midad
Quincena$
actual
Quincena$
anterior
1 34 M 1 B C 345 310
2 36 F 5 A M 950 810
3 51 M 7 M P 670 570
4 21 F 4 M C 810 730
5 37 F 0 M M 800 680
6 38 M 0 B P 500 450
7 39 F 9 B C 690 580
8 25 F 4 M M 840 715
9 36 M 3 M P 835 750
10 40 F 3 M P 735 660
11 63 F 5 A M 1550 1320
12 40 M 5 A M 850 730
13 39 F 0 B C 505 452
14 37 M 8 A M 1135 965
15 57 F 13 A M 1280 1100
16 30 F 2 M M 820 700
17 28 M 3 B C 480 410
18 48 F 1 M M 830 720
19 42 M 7 A P 1145 970
20 37 F 1 M M 775 698
Vivienda
Cant. de
ambientes
Mantenimiento
Personas
ocupantes
Gasto
medio
mensual
Personas
mayores con
trabajo
Hay nios
que trabajan?
1 3 B 3 780,50 1 N
2 2 M 3 1500,35 1 N
3 5 B 4 1200,05 2 N
4 3 B 2 986,65 1 N
5 4 R 3 2010,90 2 S
6 1 B 3 780 ,10 1 N
7 2 M 3 1452,25 3 N
8 4 E 2 1200,00 2 N
9 5 B 5 900,98 2 N
10 4 R 3 2010,09 3 N
11 3 B 3 891,75 2 N
12 4 M 3 1205,40 3 N
13 3 B 3 909,90 1 S
14 2 B 2 2010,10 2 N
15 4 M 3 899,50 3 N
16 2 B 2 780,00 2 N
17 4 R 5 1505,10 3 N
18 1 B 3 1224,69 3 N
19 2 M 3 890,70 3 N
20 4 E 3 780,50 2 S
21 5 B 3 1312,80 3 N
22 3 R 2 1219,40 2 N
23 4 B 5 986,20 4 N
24 4 R 3 2010,35 3 N
25 3 B 3 890,10 1 S
26 5 B 3 780,09 1 N
27 3 R 3 1510,69 3 N
28 6 B 2 1200,75 2 N
29 4 M 5 942,70 5 N
30 1 E 2 2010,00 1 S
31 4 B 3 890,40 2 N
32 3 R 5 780,80 3 N
Referencias
Matriz 3. Poblacin: pymes de la Repblica Argentina ao 2004/2005 donde
cada pyme es la unidad de estudio.
Referencias:
Tipo de pyme: R: recuperada, P: privada.
Rubro: A: agrcola, C: comercial, I: industrial, S: servicios.
Antigedad, en aos, al 2005.
Nivel de endeudamiento: N: ninguno, B: bajo, M: medio, A: alto, MA: muy alto.
Puestos de trabajo durante 2001-2003: D: disminuy, M: mantuvo, A: aument.
53
Estadistica
Mantenimiento o estado de mantenimiento: M: malo, R: regular, B: bueno, E: excelente
Gasto medio mensual en alimentos del grupo que vive em la vivienda em $
Hay nios que trabajan?: S: s, N: no
Matriz 3. Poblacin: pymes de la Repblica Argentina ao 2004/2005 donde cada pyme es la unidad de estudio.
ME 3-
PyME Tipo Rubro Antigedad
Endeu-
damiento
Cantidad de
Personal
Puestos de trabajo
2001-2003
1 P S 1 M 128 M
2 P I 6 M 150 D
3 R A 8 N 19 A
4 R C 4 M 170 M
5 P I 8 MA 112 M
6 P A 3 A 140 D
7 R I 10 B 20 A
8 P S 8 MA 23 D
9 P C 4 M 114 M
10 P A 0 MA 148 A
11 R A 2 M 154 A
12 P I 4 B 100 D
13 P C 5 MA 250 D
14 R I 6 A 142 A
15 P A 7 MA 105 M
16 R I 2 A 160 M
17 p C 9 M 22 M
18 R I 17 B 5 M
19 P S 11 M 120 D
20 R I 6 N 137 A
21 P I 7 M 80 D
22 P A 4 A 109 M
23 P C 25 MA 110 A
24 R S 11 B 144 A
Referencias:
Tipo de pyme: R: recuperada, P: privada.
Rubro: A: agrcola, C: comercial, I: industrial, S: servicios.
Antigedad, en aos, al 2005.
Nivel de endeudamiento: N: ninguno, B: bajo, M: medio, A: alto, MA: muy alto.
Puestos de trabajo durante 2001-2003: D: disminuy, M: mantuvo, A: aument.
Matriz 4. Poblacin: todas las piezas plsticas especiales fabricadas por una
determinada empresa, donde cada pieza es la unidad que se observa para su
estudio y anlisis.
Referencias:
Materia prima: N: nacional, I: importada.
Tiempo de fabricacin: tiempo, en das, que lleva de fabricada la pieza.
Nivel de detalles de terminacin: R: regular, B: bueno, MB: muy bueno, E: exce-
lente.
Tiene alguna caracterstica sealable?: S: s, N: no.
54
Universidad Virtual de Quilmes
Matriz 4. Poblacin: todas las piezas plsticas especiales fabricadas por una determinada empresa, donde cada pieza es
la unidad que se observa para su estudio y anlisis.
ME 4
Pieza
Longitud
[cm]
Materia
prima
Tiempo de
Detalles
de
Peso
[gr]
Caracterstica
sealable
1 5,59 N 261 R 71,1 N
2 5,53 I 145 E 71,9 N
3 5,59 N 137 B 72,0 N
4 5,49 N 168 MB 70,5 S
5 5,50 I 150 MB 70,1 N
6 5,47 N 140 R 71,4 N
7 5,15 I 139 R 70,7 S
8 5,51 N 194 MB 71,5 N
9 5,54 N 93 B 71,7 S
10 5,49 I 39 MB 71,2 N
11 5,56 N 59 E 71,3 S
12 5,49 N 65 B 69,5 N
13 5,64 I 110 R 72,5 S
14 5,59 N 128 E 71,7 N
15 5,57 N 13 E 71,9 S
16 5,45 I 22 MB 70,9 N
17 5,30 N 113 R 64,1 S
18 5,46 I 81 B 70,3 S
19 5,55 N 79 E 67,1 N
20 5,61 N 11 B 72,1 N
Referencias
Materia prima: N: nacional, I: importada.
Tiempo de fabricacin: tiempo, en das, que lleva de fabricada la pieza.
Nivel de detalles de terminacin: R: regular, B: bueno, MB: muy bueno, E: excelente.
Tiene alguna caracterstica sealable?: S: s, N: no.

You might also like