Professional Documents
Culture Documents
Escala de razn
1.1 INTRODUCCION
Para muchos parece una materia lejana, pero la Estadstica y muchas de sus herramientas nos
acompaan diariamente, aunque no nos percatemos de ello. Durante el curso tendremos oportunidad de
ver ejemplos muy familiares y entender algunos trminos que escuchamos y manejamos diariamente.
Este primer mdulo nos introducir en el mundo de la estadstica, particularmente la estadstica
descriptiva, aprendiendo el vocabulario y los conceptos fundamentales para poder abordar los prximos
temas. Tambin repasaremos algunos procedimientos matemticos que usaremos durante todo el curso..
Su origen en la historia La estadstica cientfica tal como se entiende actualmente tiene sus
origenes en el SXIX, cada vez ms vinculada a la teora de la probabilidad. Dos puntos de referencia
bsicos son los trabajos de F. Galton, fundador de la biometra, y de K. Pearson que sent las bases de la
estadstica moderna.
Sin embargo, los orgenes de las herramientas estadsticas pueden ser rastreados al menos hasta el
antiguo Egipto y ms atrs an. El inters por el registro sistemtico sobre la poblacin y los recursos
econmicos y la elaboracin de instrumentos matemticos de resumen de la informacin aparecen desde
la antigedad vinculados con la administracin y la poltica de los gobiernos.
http://www.eumed.net/cursecon/libreria/drm/cap1.pdf
El origen de la palabra La palabra "estadstica" procede del latn statisticum collegium ("consejo de
Estado") y de ella deriva el trmino italiano statista ("hombre de Estado" o "poltico"). A su vez, el trmino
alemn Statistik es introducido por Gottfried Achenwall en 1749 al publicar su obra Compendio de la
constitucin poltica de los principales pases y pueblos europeos, asocindolo con el anlisis de datos del
Estado, es decir, "la ciencia del Estado" . Sin embargo, recin a partir del siglo XIX el trmino comienza a
ser utilizado en su acepcin moderna.
Resumir los datos y extraer informacin relevante, esto es de las mediciones observadas
Ayudar en la bsqueda y evaluacin de los modelos y pautas que ofrecen los datos, pero que se
encuentran ocultos por la inherente variabilidad de los mismos.
Facilitar la comunicacin entre los cientficos, ya que siempre ser ms fcil comprender la
referencia a un procedimiento estndar, sin necesidad de mayor detalle.
Nuestro curso, por la carga horaria y los objetivos que se ha planteado, va a realizar un recorrido bsico
por herramientas de estadstica descriptiva.
Sin embargo, es necesario considerar que una parte fundamental de la disciplina estadstica est
dedicada a la INFERENCIA. En ella, se incorporan los conceptos de variable aleatoria, distribuciones de
probabilidad, estimadores e intervalos de confianza, entre otros, que no utilizaremos en el curso.
Con las herramientas estadsticas que vamos a trabajar durante este curso vamos a describir el
comportamiento de conjuntos de individuos, instituciones, pases, etc. pero no vamos a utilizarlas para
generalizar los resultados a una poblacin mayor. Esto lo veremos con detenimiento al hablar del
concepto de POBLACION y MUESTRA.
Sin embargo, veremos que estos instrumentos y mtodos nos habilitan a realizar anlisis sumamente
tiles, a partir de la descripcin de nuestra poblacin. Y, por otra parte, como plantea el texto de Mayte
Rodrguez, constituyen el punto de partida para los procedimientos de la Estadstica Inferencial.
Por ejemplo:
Cuando queremos conocer el perfil de los trabajadores de una empresa podemos averiguar las
caractersticas de todos los empleados, con lo cual no necesitamos inferir ninguno de los
1.3
Por una parte, en lo que queda de este mdulo veremos algunos conceptos fundamentales que nos
permiten comenzar a trabajar con las herramientas estadsticas. Entender qu es una poblacin y una
unidad y cmo caracterizo a esas unidades a travs de variables, que tienen un sistema de
categoras y una escala de medicin. A partir de estos conceptos podemos elaborar la idea de
matriz de datos originales, que contiene toda la informacin que tengo sobre la poblacin.
En los mdulos 1, 2, 3 y 4
conceptos de inflacin, precios corrientes y precios constantes, y obtendremos una herramienta que nos
permite comparar precios tomados en distintos momentos del tiempo.
POBLACIN o UNIVERSO: Es el conjunto de elementos sobre el que se realiza el estudio. Debe estar
acotada en espacio y tiempo.
Ejemplos de poblaciones en estudios de ciencias sociales:
habitantes de un barrio o un pas, alumnos de una escuela, empresas, organizaciones, partidos polticos,
ciudades, pases, etc.
Lo fundamental al definir una poblacin es que sea acorde a los objetivos que nos planteamos en el
estudio y que est delimitada en el tiempo y en el espacio, de modo que sea identificable y podamos
distinguir entre quienes componen la poblacin y quienes no.
MUESTRA: Al recoger datos relativos a las caractersticas de una poblacin muchas veces es difcil,
costoso o poco prctico observar todo el grupo, sobre todo cuando se trata de conjuntos grandes.
En ese caso, se relevan los datos slo para una parte de la poblacin, a la cual se le llama MUESTRA.
Una muestra tomada con determinados criterios de aleatoriedad (para ello nos servimos de la teora del
muestro) puede considerarse representativa de la poblacin y los estadsticos que construyamos a partir
de ella permiten realizar estimaciones sobre lo que sucede con esas caractersticas en toda la poblacin.
Como ya dijimos, estas estimaciones corresponden a la estadstica inferencial, que se basa en la teora
de las probabilidades. Existe un margen de incertidumbre sobre las conclusiones que se sacan para la
poblacin y se trabaja bajo determinados supuestos sobre la pertinencia de generalizar a la poblacin a
partir de la informacin obtenida en al muestra. En estos casos, la estadstica descriptiva se encarga de
resumir la informacin y analizar solamente la muestra, sin inferir conclusiones sobre la poblacin.
CENSO: Es un relevamiento de todos los elementos de la poblacin. Puede considerarse un caso
especial de muestra, cuando el tamao de la misma coincide con el de la poblacin.
Por ejemplo: para estudiar el mercado de trabajo en Uruguay peridicamente, no se entrevista a todos los
habitantes del pas sino que se toma una muestra de hogares e integrantes de los mismos, a los cuales
se les aplica la Encuesta Continua de Hogares.
En cambio, cuando se realiza un Censo de Poblacin, se entrevista a todas las personas que se
encuentran en el pas ese da. Dentro de los temas que releva el Censo de Poblacin se incluye el del
mercado de trabajo.
En el caso de la Encuesta de Hogares, obtenemos el nmero de desocupados de la muestra, el cual sirve
para estimar la desocupacin a nivel de toda la poblacin (por lo cual hay una margen de error, una
incertidumbre sobre en qu medida ese valor es el que corresponde a la poblacin). En el caso del
Censo, el nmero de desocupados nos indica (salvo errores de relevamiento) la desocupacin en el pas,
sin esa incertidumbre.
Durante este curso vamos a trabajar bajo el supuesto que siempre estamos observando a todos los
elementos de la poblacin, es decir, realizando un CENSO.
Extrado de Bueno, Concepcin y Escudero, Toms: Apuntes de Estadstica para profesores.Curso 2006/2007.Instituto de
Ciencias de la Educacin.Universidad de Zaragoza
Un sistema de categoras posible podra ser cada uno de los valores obtenidos, por ejemplo: $2000,
$4500, $ 7000, etc.
Para explicitar un sistema de categoras as (que tiene muchos valores posibles), lo mejor es buscar el
valor ms bajo y el ms alto y expresarlo como:
$ 2000, .., $ 70000.
Otro sistema de categoras posible, si no nos interesa tener tan desagregada la informacin, podra ser
identificar a los hogares en esta variable en tramos de ingreso.
Por ejemplo: $ 2000 a $10000, $10001 a $40000, $40001 a 70000.
En este caso tendramos tres categoras en nuestro sistema y los hogares tendran como valor o
categora en esta variable su pertenencia a uno de los tres tramos (nos olvidamos de sus valores
originales.
Pero nos interesa entender las propiedades del sistema de categoras. Supongamos que tenemos este
segundo sistema.
Si hubiramos armado los tramos de esta manera: $2000-10000, $10000-40000, $40000-70000,
tendramos dificultades para saber a qu categora corresponde un hogar que tiene $10000 como
ingreso. En qu categora lo coloco? En la primera (2000 a 10000) o en la segunda (10000 a 40000)?
A esto nos referimos con la idea que las categoras deben ser mutuamente excluyentes. Frente al
sistema, no tengo que tener duda de cul es la categora que le corresponde a cada unidad.
Supongamos ahora que mi sistema es $ 5000 a $10000, $10001 a $40000, $40001 a 70000. Cul es la
categora que le corresponde al hogar que gana $2000? No tengo ninguna categora que lo incluya. La
idea de exhaustividad implica que mi sistema debe cubrir todos los valores posibles de la variable para
mi poblacin.
La exhausitividad de un sistema de categoras est relacionado con la poblacin en estudio: si por
ejemplo estamos estudiando el nivel educativo de un pas, nuestro sistema de categoras para esa
variable tendra que tener por ejemplo, las siguientes categoras:
Sin instruccin, Primaria, Secundaria-UTU, Terciaria y posterciaria.
Sin embargo si estoy estudiando el nivel educativo de una poblacin de menores de 16 aos, alcanza con
tener el siguiente sistema: Sin instruccin, Primaria, Secundaria-UTU, ya que la educacin terciaria no ha
de aparecer como categora para ninguna de las unidades de anlisis de esta poblacin por la edad que
tienen.
La informacin sobre nuestra poblacin la vamos organizar en una MATRIZ DE DATOS. Una matriz de
datos contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan
a esas unidades. Y cada celda est compuesta por el valor que asume la variable de esa columan para la
unidad de anlisis de esa fila.
Un DATO, en el contexto de nuestra disciplina es el valor que toma una variable en una unidad de
anlisis. Por esta razn se dice que su estructura es tripartita: refiere simultneamente a la unidad de
anlisis, a la variable y a la categora o valor.
En la matriz de datos esta estructura tripartita se hace visible, al presentar las unidades en las filas, las
variables en las columnas y el DATO como cruce de esos dos vectores.
Siguiendo nuestro ejemplo de los hogares, una matriz de datos podra ser:
Ingresos
Hogar 1
Hogar 2
Hogar 3
.
hogar
$2000
$70000
$ 4500
del
Nmero
de
miembros
que
trabajan
2
4
0
Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus miembros, en el hogar 2, el
ingreso es $ 70000 y trabajan 4 miembros, etc.
La matriz de datos tiene tantas filas como el tamao de la poblacin y tantas columnas como variables.
10
11
Se trata de operaciones clasificatorias, o sea, ubicacin de las unidades de anlisis en clases, clases que
tienen ciertas propiedades formales. De estas propiedades se deducen definiciones exactas de las
caractersticas de la escala mucho ms precisas de lo que pueden darse en trminos verbales. Estas
propiedades pueden formularse en forma ms abstracta de lo hasta aqu expresado, mediante un
conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los
objetos a que se aplican.
Se distinguen cuatro tipos de escala:
nominal
ordinal
interval
de razn
A. LA ESCALA NOMINAL
Consiste en clasificar objetos o fenmenos, segn ciertas caractersticas, tipologas o nombres, dndoles
una denominacin o smbolo, sin que implique ninguna relacin de orden, distancia o proporcin entre los
objetos o fenmenos.
En la escala nominal los nmeros slo sirven para distinguir categoras, estos no poseen propiedades
cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la
clasificacin no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con
sentido.
La medicin se da a nivel elemental en estos casos (se dice que es el nivel ms bajo de medicin)
En una escala nominal, la operacin de escalamiento consiste en partir de una caracterstica dada y
formar un subconjunto de clases que se excluyen mutuamente. La nica relacin implicada es la de
equivalencia. Esto es, los miembros de cualquier clase deben ser equivalentes en la propiedad medida.
La relacin de equivalencia es reflexiva (x = x para todo x), simtrica (x = y luego y = x) y transitiva (x = y
et y = z luego x = z).
Los smbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin
alterar la informacin esencial de la escala; debido a esto, las estadsticas de tipo descriptivo admisibles
son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporcin, etc. Se
pueden desarrollar procesos analticos acerca de la distribucin de las categoras, as como la posible
12
relacin entre dos o ms caractersticas clasificadas mediante este tipo de escala que llamaremos
variables cualitativas.
B. LA ESCALA ORDINAL
Para las mismas personas tambin se pueden medir propiedades donde la clasificacin debe seguir un
orden jerrquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos o
fenmenos en estudio respecto a alguna caracterstica de inters, sin que se reflejen distancias entre
ellos.
Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la
calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas:
1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son
ordinales. Note que una valoracin de 1 no indica que el servicio es dos veces mejor que
cuando se da una valoracin de 2. Sin embargo podemos decir que la valoracin de 1 es
preferiblemente mejor que 2, y as en los dems casos.
Puede suceder que los objetos de una categora de las escala no sean precisamente diferentes a los
objetos de otra categora de la escala, sino que estn relacionados entre s, guardan una relacin de
jerarqua. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican
exclusivamente la posicin en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas
de la escala.
13
Las relaciones entre los elementos en clasificacin, pueden formularse con el signo >, mayor que, o sea
que axiomticamente la diferencia fundamental entre una escala nominal y una ordinal es que esta ltima
incorpora no solamente la relacin de equivalencia (=) sino tambin la relacin ''mas grande que'' (>).
Esta relacin es irreflexiva (no es verdad para ninguna x tal que x > x), asimtrica ( x > y luego x < y ) y
transitiva (x > y et y > z luego x > z ).
Puesto que cualquier transformacin tendiente a conservar el orden no altera la informacin contenida en
una escala ordinal, se dice que la escala es "nica hasta una transformacin monotnica". Esto es, no
importa que nmeros se den a una pareja de clases o a los miembros de esas clases, siempre que el
nmero mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse
nmeros menores para grados mas preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera
clase); en tanto se sea consecuente, es indiferente el uso del nmero mayor o menor para denotar
"mayor" o "mas preferido".
Fundamentalmente, las escalas ordinales se estudian en Estadstica, con base en las llamadas
"estadsticas de orden" o "estadsticas de rango": mximos, mnimos, mediana, percentiles, etc
Muy Satisfecho
Satisfecho
Insatisfecho
3
4
Muy insatisfecho
C. LA ESCALA DE INTERVALO
Representa un nivel de medicin ms preciso, matemticamente hablando, que las anteriores. No slo se
establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide tambin la
distancia entre los intervalos o las diferentes categoras o clases. En este caso, la medicin se ejecuta en
el sentido de una escala de intervalo; esto es, si la asignacin de nmeros a varias clases de objetos es
tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se
ha obtenido una medida de intervalo. Una escala de intervalo est caracterizada por una unidad de
medida comn y constante que asigna un nmero real a todos los pares de objetos en un conjunto
ordenado. En esta clase de medida, la proporcin de dos intervalos cualesquiera es independiente de la
14
unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son
arbitrarios.
Axiomticamente se puede ver que las operaciones y las relaciones en que se origina la estructura de
una escala de intervalo son tales que las diferencias en la escala son isomrficas a la estructura de la
aritmtica. Los nmeros pueden asociarse con las posiciones de los objetos de tal manera que las
operaciones de la aritmtica puedan realizarse significativamente con las diferencias entre los nmeros.
La consecuencia de cualquier cambio de los nmeros asociados con los objetos medidos en una escala
de intervalo debe preservar no solamente el orden de los objetos sino tambin las diferencias relativas
entre ellos. Esto es, la escala de intervalo es "nica hasta una transformacin lineal". La escala de
intervalo es la primera escala verdaderamente cuantitativa. Las estadsticas paramtricas, son las
aplicables a estudios en estas escalas.
15
ao
1950
2000
507.932.043
2050
800.592.305
D: LA ESCALA DE RAZON
Cuando una escala tiene todas las caractersticas de una escala de intervalo y adems un punto cero real
en su origen, se llama escala de razn. Adems de distincin, orden y distancia, sta es una escala que
permite establecer en que proporcin es mayor una categora de una escala que otra. El cero absoluto o
natural representa la nulidad de lo que se estudia. Las operaciones y relaciones hechas con los valores
numricos en una escala de razn son correspondientes a una escala isomrfica de la estructura de la
aritmtica. Por consiguiente las operaciones de la aritmtica son permisibles en los valores numricos
asignados a los objetos mismos, as como tambin en los intervalos entre los nmeros como sucede en
las escalas de intervalo. Implican que las relaciones de equivalencia, relacin de mayor a menor,
proporcin conocida de dos intervalos y proporcin conocida de dos valores de la escala, sean posibles
de obtener operacionalmente. Los nmeros asociados con los valores de la escala de razn son
"verdaderos" nmeros con un verdadero cero; solo la unidad de medida es arbitraria. As la escala de
razn es "nica hasta la multiplicacin por una constante positiva". Adems de los procesos paramtricos
bsicos de las escalas de intervalo, en las de razn pueden utilizarse estadsticas como la media
geomtrica, el coeficiente de variacin, las que requieren el conocimiento del verdadero valor cero
16
A menudo, datos provenientes de escalas ordinales numricas son tratados como si fuera informacin
verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque s clasifican. En este caso
se encuadran los tests psicomtricos, (las evaluaciones de desempeo, las calificaciones de los alumnos en la
facultad1), los cuales nicamente pueden estimar el orden de puntuacin, pero nunca la distancia entre dos
valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables
intervlicas y, consecuentemente, el clculo de medidas de tendencia central y dispersin, adems de otras
operaciones derivadas de ellas. Dichas operaciones no son vlidas por cuanto asignan a las escalas un status
que en realidad no tienen.
17
EJERCICIOS
1. En este mdulo es importante entender algunos conceptos bsicos antes de seguir adelante.
Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales aspectos del
mdulo.
Cul es la diferencia entre Estadstica y Estadsticos?
Piensa ejemplos de Estadsticos que puedan resultar tiles para aplicar en el campo de las
relaciones laborales.
Explica la diferencia entre Estadstica Descriptiva y Estadstica Inferencial.
Distingue entre poblacin y muestra. Cita ejemplos de estudios para los cuales sea factible trabajar
con toda la poblacin (censo) o con muestras. Fundamenta.
Qu relacin hay entre las unidades de anlisis y la poblacin?
Piensa ejemplos de variables con sus sistemas de categoras. Identifica el nivel de medicin.
2. Identifica las escalas de medicin de las siguientes variables, de acuerdo al sistema de categoras que
se les ha asignado.
Variable
Nivel educativo
Nivel educativo
Categora de
ocupacin
Categoras
Ninguno
Primaria
Secundaria
Terciaria
0 ao aprobado
1 ao aprobado
2 aos aprobados
Escala de medicin
Patrn
Empleado pblico
Empleado privado
Cooperativista
Trabajador por cuenta propia
Trabajador familiar no remunerado
3. Se quiere realizar un estudio para conocer el perfil de la plantilla de trabajadores de una empresa
comercial del rea del supermercadismo.
Imagina qu caractersticas podran ser de inters estudiar. Identifica las variables que se corresponden
con esas caractersticas y el sistema de categoras que les asignaras. Menciona el nivel de medicin de
cada variable.
Construye la estructura de la matriz de datos en la cual se volcara la informacin recogida.
18
4.La figura siguiente muestra una de las pginas del formulario de la Encuesta Nacional de Hogares
Ampliada, con preguntas que se relevan de cada integrante del hogar.
19
X 1 X 2 ... X n X i
i 1
X
i 1
X
i 1
X 1 X 2 X 3 X 4 3 8 17 5
Veremos que esta notacin es importante para expresar varias de las herramientas estadsticas que
veremos durante el curso.
20
La suma de una expresin que es la suma de dos ms trminos es igual a la suma de las
sumas de los trminos por separado:
(X
i 1
Yi Z i ) (2 5 8) (4 1 1) 21
i 2
i 2
i 2
X Y Z
i 1
i 1
i 1
(2 4) (5 1) (8 1) 21
La suma de una constante multiplicada por una variable es igual que la constante multiplicada por la
suma de la variable, esto es
aX i 3 * 5 3 * 4 3 * 2 33
i 1
i 3
a X i 3 * (5 4 2) 33
i 1
Ejemplo:
21
i 3
4 4 4 4 3 * 4 12
i 1
ejemplo:
2 3 23
4 4
4
a*k c*k a c
2 *5 3*5 2 3
* k ejemplo:
*5
b
d
3
4
b d
3 4
Uniendo ambas propiedades:
a*k c*k a c
2 *5 3*5 2 3
* k ejemplo:
*5
b
b
3
3
b
3
a
, tanto para expresarla como para calcularla. Sin embargo, muchas veces encontramos
b
Por ejemplo:
Decimos que hay una razn de 12 obreros cada 5 administrativos en una determinada empresa. En este
caso los obreros estn en un conjunto distinto al de los administrativos. En cambio si decimos hay una
22
La propiedad:
a c
a * d b * c , se denomina propiedad fundamental de las proporciones.
b d
La forma de verificar la proporcionalidad es comprobar que los productos cruzados son iguales.
Por ejemplo, el jornal diario de una determinada categora laboral en una empresa es de $200 por 4 horas
de trabajo. Se paga por hora trabajada, sin que el valor hora se modifique por jornadas con distinta carga
horaria. Entonces, el trabajador que realiza una jornada de 6 horas, va a ganar $300.
En este caso, utilizamos la idea de proporcionalidad:
200 300
4
6
y esto lo podramos verificar haciendo el producto cruzado, que debe dar el mismo resultado:
200*6=300*4=1200.
La propiedad fundamental de la proporcionalidad permite aplicar la llamada regla de tres, para hallar
un valor que es proporcional a otro.
En el ejemplo que utilizamos, si sabemos que por 4 horas de trabajo pagan $200, y que el jornal es
proporcional al nmero de horas, entonces podemos hallar cunto gana alguien que trabaja 6 horas
usando la regla de tres:
4 ----- 200
6 ------ x
Que leemos como: 4 es a 200, como 6 es a x, haciendo referencia a la idea de proporcionalidad.
Como sabemos que los productos cruzados deben ser iguales:
6*200=4*x, lo cual nos permite despejar nuestra incgnita (x): x
Es decir:
6 * 200
300
4
a ---- b
c ---- x
b*c
a
23
a
. Por ejemplo, si queremos saber qu proporcin
n
de integrantes de un hogar trabajan, a sera el nmero de integrantes del hogar y n el total de integrantes
del hogar (dentro de los cuales estn incluidos los miembros que trabajan).
Proporcin que trabaja = nmero de integrantes que trabajan/total integrantes del hogar
Los porcentajes: son fracciones que se obtienen al comparar un nmero con 100.
P%
a * 100
n
En el ejemplo anterior:
% que trabaja = nmero de integrantes que trabajan*100/total integrantes del hogar
Cuando se tiene una proporcin, alcanza con multiplicar sta por 100 para obtener el porcentaje.
En el prximo mdulo utilizaremos estas dos herramientas para construir las distribuciones de frecuencias
relativas y las frecuencias relativas porcentuales
24