You are on page 1of 24

Carrera de Relaciones Laborales Facultad de Derecho Universidad de la Repblica Estadsticas Laborales Profas.

Mariela Quiones y Mariana Cabrera

INTRODUCCIN: CONCEPTOS PREVIOS Objetivos del mdulo 1:


1. Presentar la disciplina Estadstica como ciencia y como ciencia auxiliar,
resaltando su utilidad en los estudios empricos de las ciencias sociales y en particular en el rea de las relaciones laborales. 2. Hacer una lectura global de los contenidos del curso, los alcances y lmites del mismo, as como el fundamento de los temas que se van a tratar. 3. Familiarizarse con algunos conceptos bsicos de la estadstica y la metodologa cuya comprensin es fundamental para seguir el curso. 4. Complementario: Repasar o incorporar algunos conocimientos matemticos necesarios para una mejor comprensin de los contenidos del curso.

Conceptos clave del mdulo 1:


Estadstica Estadstica descriptiva y Estadstica inferencial Estadstico Poblacin y muestra Unidades de anlisis Variables, sistema de categoras Matriz de datos y estructura tripartita de los datos Medicin Escalas de medicin Escala nomina, Escala ordinal Escala interval

Escala de razn

1.1 INTRODUCCION
Para muchos parece una materia lejana, pero la Estadstica y muchas de sus herramientas nos acompaan diariamente, aunque no nos percatemos de ello. Durante el curso tendremos oportunidad de ver ejemplos muy familiares y entender algunos trminos que escuchamos y manejamos diariamente. Este primer mdulo nos introducir en el mundo de la estadstica, particularmente la estadstica descriptiva, aprendiendo el vocabulario y los conceptos fundamentales para poder abordar los prximos temas. Tambin repasaremos algunos procedimientos matemticos que usaremos durante todo el curso..

1.2 LA CIENCIA ESTADISTICA


Qu es la ESTADISTICA? Estadstica, es algo ms que la recoleccin y publicacin (tal cual se ven
en revistas y diarios) de hechos y datos numricos. Es la aplicacin del mtodo cientfico de anlisis de datos numricos, con el fin de tomar decisiones racionales. Estadstica ser tratada aqu como una Ciencia que trata de la recopilacin, presentacin, anlisis e interpretacin de datos numricos (estadsticas) con el fin de realizar una toma de decisiones ms efectiva.

Si quieres ver algunas definiciones adicionales, puedes acceder a: Carrasco Arroyo, S (2005): Aproximacin a la Estadstica desde las Ciencias Sociales.Valencia, Espaa. http://www.uv.es/carrascs/PDF/aproximacion%20estadistica.pdf Zavrostsky, A: Varias definiciones de la Estadstica. Revista de Economa. Facultad de Ingeniera.Universidad de Los Andes, Venezuela. http://iies.faces.ula.ve/Revista/Articulos/Revista_02/Pdf/Rev02Zavrotsky.pdf

Su origen en la historia La estadstica cientfica tal como se entiende actualmente tiene sus
origenes en el SXIX, cada vez ms vinculada a la teora de la probabilidad. Dos puntos de referencia bsicos son los trabajos de F. Galton, fundador de la biometra, y de K. Pearson que sent las bases de la estadstica moderna. Sin embargo, los orgenes de las herramientas estadsticas pueden ser rastreados al menos hasta el antiguo Egipto y ms atrs an. El inters por el registro sistemtico sobre la poblacin y los recursos econmicos y la elaboracin de instrumentos matemticos de resumen de la informacin aparecen desde la antigedad vinculados con la administracin y la poltica de los gobiernos.

Si te interesa conocer ms sobre la historia de la estadstica te recomendamos leer:


Ruiz Muoz, David (2004):Manual de Estadstica. Ediciones Eumednet. Cap. 1. Historia de la estadstica.

http://www.eumed.net/cursecon/libreria/drm/cap1.pdf

El origen de la palabra La palabra "estadstica" procede del latn statisticum collegium ("consejo de
Estado") y de ella deriva el trmino italiano statista ("hombre de Estado" o "poltico"). A su vez, el trmino alemn Statistik es introducido por Gottfried Achenwall en 1749 al publicar su obra Compendio de la constitucin poltica de los principales pases y pueblos europeos, asocindolo con el anlisis de datos del Estado, es decir, "la ciencia del Estado" . Sin embargo, recin a partir del siglo XIX el trmino comienza a ser utilizado en su acepcin moderna.

Papel de la Estadstica para las ciencias sociales


Para las ciencias sociales la estadstica se ha convertido en una ciencia auxiliar fundamental, permitiendo: Encontrar relaciones y caractersticas no previstas en una poblacin, que permiten pensar en nuevas teoras e hiptesis. Resumir los datos y extraer informacin relevante, esto es de las mediciones observadas Ayudar en la bsqueda y evaluacin de los modelos y pautas que ofrecen los datos, pero que se encuentran ocultos por la inherente variabilidad de los mismos. Facilitar la comunicacin entre los cientficos, ya que siempre ser ms fcil comprender la referencia a un procedimiento estndar, sin necesidad de mayor detalle.

Estadstica Descriptiva y Estadstica Inferencial


Para entender el alcance que tiene el presente curso debemos en primer lugar entender los conceptos de ESTADISTICA DESCRIPTIVA y ESTADISTICA INFERENCIAL o INDUCTIVA. Estadstica Descriptiva: Consiste en un conjunto de instrumentos y temas relacionados con la descripcin de colecciones de observaciones estadsticas, se refiere tanto al total de la poblacin como a la muestra, y su finalidad es resumir un conjunto de datos numricos. Estadstica Inferencial o Inductiva: Se ocupa de la lgica y el procedimiento para la inferencia y la induccin de propiedades de una poblacin en bases a resultados obtenidos de una muestra conocida. Porqu es importante esta distincin?

Nuestro curso, por la carga horaria y los objetivos que se ha planteado, va a realizar un recorrido bsico por herramientas de estadstica descriptiva. Sin embargo, es necesario considerar que una parte fundamental de la disciplina estadstica est dedicada a la INFERENCIA. En ella, se incorporan los conceptos de variable aleatoria, distribuciones de probabilidad, estimadores e intervalos de confianza, entre otros, que no utilizaremos en el curso.

Si el nico propsito del investigador es describir los resultados de un


experimento concreto, los mtodos descriptivos pueden considerarse suficientes. No obstante, si lo que se pretende es utilizar la informacin obtenida para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces estos mtodos constituyen slo el principio del anlisis, y debe recurrirse a mtodos de inferencia estadstica, los cuales implican el uso de la teora de la probabilidad.La probabilidad constituye por s misma un concepto bsico que refleja su relacin con la faceta del mundo exterior que pretende estudiar: los fenmenos aleatorios, que suponen unas ciertas reglas de comportamiento. El nexo que une la teora de la probabilidad y la estadstica es la nocin de variable aleatoria, mostrando de esta manera cmo puede emplearse la teora de la probabilidad para extraer conclusiones precisas acerca de una poblacin sobre la base de una muestra extrada de ella. Muchos de los anlisis estadsticos son, de hecho, estudio de las propiedades de una o ms variables aleatorias.
Rodriguez, Mayte: Estadstica aplicada a las Ciencias Sociales II.Licenciatura de Sociologa. Curso 2001/02.Universidad autnoma de Madrid http://www.uam.es/personal_pdi/ciencias/mayter/docencia/sociolog/apuntes.pdf

Con las herramientas estadsticas que vamos a trabajar durante este curso vamos a describir el comportamiento de conjuntos de individuos, instituciones, pases, etc. pero no vamos a utilizarlas para generalizar los resultados a una poblacin mayor. Esto lo veremos con detenimiento al hablar del concepto de POBLACION y MUESTRA. Sin embargo, veremos que estos instrumentos y mtodos nos habilitan a realizar anlisis sumamente tiles, a partir de la descripcin de nuestra poblacin. Y, por otra parte, como plantea el texto de Mayte Rodrguez, constituyen el punto de partida para los procedimientos de la Estadstica Inferencial. Por ejemplo: Cuando queremos conocer el perfil de los trabajadores de una empresa podemos averiguar las caractersticas de todos los empleados, con lo cual no necesitamos inferir ninguno de los

resultados. Alcanza con generar formas de resumen de la informacin para describir el comportamiento de toda la plantilla de trabajadores. Es una aplicacin de la estadstica descriptiva. Pero, si la empresa fuera muy grande, podramos optar por encuestar o averiguar la informacin slo de un subconjunto de esos trabajadores. En este caso, tendramos que recurrir a la teora de muestreo para tener mecanismos que me garanticen una eleccin al azar de los empleados entrevistar y a la teora de la probabilidad para a partir de los resultados obtenidos para ese grupo, generalizar a toda la plantilla de trabajadores. En este caso, entonces, estaramos frente a procedimientos propios de la Estadstica Inferencial.

1.3

CULES INSTRUMENTOS VEREMOS EN EL CURSO?

Por una parte, en lo que queda de este mdulo veremos algunos conceptos fundamentales que nos permiten comenzar a trabajar con las herramientas estadsticas. Entender qu es una poblacin y una unidad y cmo caracterizo a esas unidades a travs de variables, que tienen un sistema de categoras y una escala de medicin. A partir de estos conceptos podemos elaborar la idea de matriz de datos originales, que contiene toda la informacin que tengo sobre la poblacin. En los mdulos 1, 2, 3 y 4 (estadsticos). En el mdulo 5, veremos como describir una poblacin en base a dos caractersticas simultneamente. Los ltimos 3 mdulos incluyen herramientas ms especficas, que pueden ser de mucha utilidad para la investigacin y los anlisis en el mbito de las relaciones laborales: En el mdulo 6, veremos una forma de medir y comparar el grado de concentracin de recursos que se distribuyen en una poblacin (por ejemplo, qu grado de desigualdad hay en la distribucin del ingreso total del pas, o la masa salarial de una empresa, entre todos los miembros de esa poblacin). El mdulo 7 est dedicado a la presentacin de algunos estadsticos que nos permiten analizar el comportamiento del mercado de trabajo. Los estadsticos que vamos a estudiar habitualmente se construyen en base a muestras y constituyen estimaciones de los valores de la poblacin (parmetros), pero no vamos a profundizar en este aspecto sino que trataremos de entender su construccin y uso. Finalmente, el mdulo 8 presenta dos herramientas que estn vinculadas al anlisis temporal de datos. Veremos en primer lugar los nmeros ndice nos permiten analizar la evolucin de una caracterstica numrica en el tiempo. Algunos nmeros ndice tienen incidencia cotidiana en nuestra vida, como tendremos oportunidad de ver al llegar a ese mdulo final del curso. Tambin nos familiarizaremos con aprenderemos cmo describir una poblacin en base a una de sus

caractersticas (descripcin univariada), sea a travs de tablas, grficos y medidas resumen

los conceptos de inflacin, precios corrientes y precios constantes, y obtendremos una herramienta que nos permite comparar precios tomados en distintos momentos del tiempo.

1.4 TERMINOS Y CONCEPTOS BASICOS


Es importante que conozcamos algunos trminos especializados de la disciplina estadstica. En primer lugar, muchas veces se confunden los trminos Estadstica con estadsticas o estadsticos. Cuando hablamos de Estadstica, nos estamos refiriendo a la disciplina cientfica. Los estadsticos, en cambio, son medidas de resumen calculadas sobre los datos provenientes de una muestra, que en estadstica inferencial se utilizan para estimar los valores correspondientes a nivel de la poblacin (parmetros). Es decir, son herramientas que asumen determinados valores, construidas en base a los datos de observaciones. Tambin podemos encontrarlas mencionadas como estadsticas. En el curso aprenderemos a calcular varios estadsticos. No los veremos, sin embargo, en su funcin de estimacin de los valores poblacionales, ya que no trabajaremos con la inferencia estadstica.

Antes de seguir adelante, veamos el concepto de POBLACION Y MUESTRA.

POBLACIN o UNIVERSO: Es el conjunto de elementos sobre el que se realiza el estudio. Debe estar acotada en espacio y tiempo. Ejemplos de poblaciones en estudios de ciencias sociales: habitantes de un barrio o un pas, alumnos de una escuela, empresas, organizaciones, partidos polticos, ciudades, pases, etc. Lo fundamental al definir una poblacin es que sea acorde a los objetivos que nos planteamos en el estudio y que est delimitada en el tiempo y en el espacio, de modo que sea identificable y podamos distinguir entre quienes componen la poblacin y quienes no. MUESTRA: Al recoger datos relativos a las caractersticas de una poblacin muchas veces es difcil, costoso o poco prctico observar todo el grupo, sobre todo cuando se trata de conjuntos grandes. En ese caso, se relevan los datos slo para una parte de la poblacin, a la cual se le llama MUESTRA. Una muestra tomada con determinados criterios de aleatoriedad (para ello nos servimos de la teora del muestro) puede considerarse representativa de la poblacin y los estadsticos que construyamos a partir de ella permiten realizar estimaciones sobre lo que sucede con esas caractersticas en toda la poblacin.

Como ya dijimos, estas estimaciones corresponden a la estadstica inferencial, que se basa en la teora de las probabilidades. Existe un margen de incertidumbre sobre las conclusiones que se sacan para la poblacin y se trabaja bajo determinados supuestos sobre la pertinencia de generalizar a la poblacin a partir de la informacin obtenida en al muestra. En estos casos, la estadstica descriptiva se encarga de resumir la informacin y analizar solamente la muestra, sin inferir conclusiones sobre la poblacin. CENSO: Es un relevamiento de todos los elementos de la poblacin. Puede considerarse un caso especial de muestra, cuando el tamao de la misma coincide con el de la poblacin. Por ejemplo: para estudiar el mercado de trabajo en Uruguay peridicamente, no se entrevista a todos los habitantes del pas sino que se toma una muestra de hogares e integrantes de los mismos, a los cuales se les aplica la Encuesta Continua de Hogares. En cambio, cuando se realiza un Censo de Poblacin, se entrevista a todas las personas que se encuentran en el pas ese da. Dentro de los temas que releva el Censo de Poblacin se incluye el del mercado de trabajo. En el caso de la Encuesta de Hogares, obtenemos el nmero de desocupados de la muestra, el cual sirve para estimar la desocupacin a nivel de toda la poblacin (por lo cual hay una margen de error, una incertidumbre sobre en qu medida ese valor es el que corresponde a la poblacin). En el caso del Censo, el nmero de desocupados nos indica (salvo errores de relevamiento) la desocupacin en el pas, sin esa incertidumbre. Durante este curso vamos a trabajar bajo el supuesto que siempre estamos observando a todos los elementos de la poblacin, es decir, realizando un CENSO.

Extrado de Bueno, Concepcin y Escudero, Toms: Apuntes de Estadstica para profesores.Curso 2006/2007.Instituto de Ciencias de la Educacin.Universidad de Zaragoza

La poblacin est compuesta por las UNIDADES DE ANALISIS. La UNIDAD DE ANALISIS es el elemento mnimo de una poblacin y de una muestra, en tanto se lo considera como poseedor de ciertas propiedades, atributos o caractersticas denominadas variables. Por ejemplo: los estudiantes univesitarios son unidades de anlisis si consideramos su ao de ingreso, su centro de estudios o su edad. O, por ejemplo, los centros de estudio universitario son unidades de anlisis si consideramos su nmero de estudiantes; cantidad de salones; nmeros de docentes por materia. En nuestros estudios, nos interesar relevar las carctersticas de la unidades de anlisis y sacar conclusiones sobre la poblacin en base a esta informacin. Para obtener los datos de las unidades de anlisis debemos relevar la informacin. Las herramientas para relevar la informacin pueden ser entrevistas (encuestas) pero tambin podemos obtener informacin de registros administrativos, documentos, artculos de prensa, observacin directa. La UNIDAD DE RELEVAMIENTO es la Unidad que aporta la informacin para la construccin del dato estadstico. Muchas veces coincide con la unidad de anlisis, pero en otros casos no. Por ejemplo, si estamos interesados en estudiar caractersticas de los hogares (por ejemplo: los ingresos del hogar, el nmero de miembros que trabajan, etc.) nuestro relevamiento lo haremos sobre los miembros del hogar (les preguntaremos por sus ingresos y su condicin laboral). Pero cuando construyamos los datos, tomaremos esa informacin y caracterizaremos con ella al hogar. En este caso, la unidad de relevamiento son los miembros del hogar pero la unidad de anlisis (que es la que queremos estudiar) son hogares. Hemos visto que nos interesa caracterizar a nuestra unidades de anlisis. De ahora en adelante hablaremos de VARIABLES, como los instrumentos que nos permiten hacer esa caracterizacin. Una VARIABLE es una propiedad, atributo o caracterstica de una unidad de anlisis, susceptible de adoptar diferentes valores o categoras. Los valores o categoras que adopta una variable constituyen un SISTEMA DE CATEGORIAS. Este sistema tiene dos propiedades fundamentales: sus categoras deben ser MUTUAMENTE EXCLUYENTES y el sistema debe ser EXHAUSTIVO para la poblacin en estudio. Sigamos con el ejemplo del estudio de los hogares de acuerdo a su nivel de ingresos y al nmero de miembros del hogar que trabajan. Tenemos dos variables. La primera podemos llamarla INGRESOS DEL HOGAR, y vamos a construir un sistema de categoras para ella. Supongamos que relevamos los ingresos de todos los miembros de un hogar. Con esta informacin podemos obtener el dato que corresponde a ese hogar. Deberemos hacer lo mismo con cada uno de los hogares que constituyen nuestra poblacin en estudio. Obtenidos nuestros datos para todos los hogares, queremos expresar el sistema de categoras de esta variable.

Un sistema de categoras posible podra ser cada uno de los valores obtenidos, por ejemplo: $2000, $4500, $ 7000, etc. Para explicitar un sistema de categoras as (que tiene muchos valores posibles), lo mejor es buscar el valor ms bajo y el ms alto y expresarlo como: $ 2000, .., $ 70000. Otro sistema de categoras posible, si no nos interesa tener tan desagregada la informacin, podra ser identificar a los hogares en esta variable en tramos de ingreso. Por ejemplo: $ 2000 a $10000, $10001 a $40000, $40001 a 70000. En este caso tendramos tres categoras en nuestro sistema y los hogares tendran como valor o categora en esta variable su pertenencia a uno de los tres tramos (nos olvidamos de sus valores originales. Pero nos interesa entender las propiedades del sistema de categoras. Supongamos que tenemos este segundo sistema. Si hubiramos armado los tramos de esta manera: $2000-10000, $10000-40000, $40000-70000, tendramos dificultades para saber a qu categora corresponde un hogar que tiene $10000 como ingreso. En qu categora lo coloco? En la primera (2000 a 10000) o en la segunda (10000 a 40000)? A esto nos referimos con la idea que las categoras deben ser mutuamente excluyentes. Frente al sistema, no tengo que tener duda de cul es la categora que le corresponde a cada unidad. Supongamos ahora que mi sistema es $ 5000 a $10000, $10001 a $40000, $40001 a 70000. Cul es la categora que le corresponde al hogar que gana $2000? No tengo ninguna categora que lo incluya. La idea de exhaustividad implica que mi sistema debe cubrir todos los valores posibles de la variable para mi poblacin. La exhausitividad de un sistema de categoras est relacionado con la poblacin en estudio: si por ejemplo estamos estudiando el nivel educativo de un pas, nuestro sistema de categoras para esa variable tendra que tener por ejemplo, las siguientes categoras: Sin instruccin, Primaria, Secundaria-UTU, Terciaria y posterciaria. Sin embargo si estoy estudiando el nivel educativo de una poblacin de menores de 16 aos, alcanza con tener el siguiente sistema: Sin instruccin, Primaria, Secundaria-UTU, ya que la educacin terciaria no ha de aparecer como categora para ninguna de las unidades de anlisis de esta poblacin por la edad que tienen. La informacin sobre nuestra poblacin la vamos organizar en una MATRIZ DE DATOS. Una matriz de datos contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan a esas unidades. Y cada celda est compuesta por el valor que asume la variable de esa columan para la unidad de anlisis de esa fila.

Un DATO, en el contexto de nuestra disciplina es el valor que toma una variable en una unidad de anlisis. Por esta razn se dice que su estructura es tripartita: refiere simultneamente a la unidad de anlisis, a la variable y a la categora o valor. En la matriz de datos esta estructura tripartita se hace visible, al presentar las unidades en las filas, las variables en las columnas y el DATO como cruce de esos dos vectores. Siguiendo nuestro ejemplo de los hogares, una matriz de datos podra ser:
Ingresos Hogar 1 Hogar 2 Hogar 3 . hogar $2000 $70000 $ 4500 del Nmero trabajan 2 4 0 de miembros que

Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus miembros, en el hogar 2, el ingreso es $ 70000 y trabajan 4 miembros, etc. La matriz de datos tiene tantas filas como el tamao de la poblacin y tantas columnas como variables.

10

MEDICIN Y ESCALAS DE MEDICIN


Qu se mide? Respecto a este problema encontramos referencias tales como: La medicin es un mtodo que permite establecer correspondencias entre magnitudes de un mismo gnero, y ciertas clases de nmeros (integrales, racionales o reales) en Russell (1938); Medir es asignar numerales a las propiedades de los sistemas materiales segn las leyes que presiden esos atributos (Campbell, 1938); Es la atribucin de numerales a los objetos o sucesos conforme con leyes o reglas (Stevens, 1951). Lo que destaca de cualquiera de estas definiciones es que si bien la medicin se realiza sobre los elementos u objetos (unidades de estudio) son las variables las que posibilitan la divisin en clases. Esto nos abre a la necesidad de conocer la naturaleza de las variables para conocer como medir sus propiedades.

2.1 Las Escalas y los Niveles de Medicin


Comenzaremos con un ejemplo que nos introducir en la idea de naturaleza distinta de las variables. Dada una poblacin puede decirse cules de los individuos son solteros, casados, divorciados o cualquiera otra categora de la variable "estado civil". Pero sobre estos mismos individuos se puede decir cules no tienen hijos y cuales s. Sobre este segundo atributo de las unidades de registro se puede, adems medir cuales no tienen hijos, cuales tienen un hijo, cuales dos, etc. Ahora bien, si relevamos la caracterstica tener o no tener hijos es diferente de si relevamos cuantos hijos tiene, a pesar que las caracterstica de inters es la misma. Lo que difiere son las mediciones en los modos en que se manifiesta la variable. En el caso de "tener hijos", el acto queda restringido a clasificar las unidades de registro y/o anlisis que muestran la presencia o ausencia de un atributo; se le puede asignar un nmero a esta caracterstica, pero no es cuantificable. Son caractersticas cualitativas. En el segundo caso, se puede estimar objetivamente no slo la presencia o ausencia de determinado atributo (tener hijos), sino tambin la intensidad con que la propiedad se manifiesta, propiedad que se asume en cantidades. Basndose en esta diferencia entre las formas de clasificar variables por referencia a este criterio de calidad-cantidad, la Estadstica distingue, ya en un grado mayor de complejidad, la medicin de acuerdo al tipo de escala o nivel de medicin, en que se encuentran expresados los atributos que queremos medir. Se trata de operaciones clasificatorias, o sea, ubicacin de las unidades de anlisis en clases, clases que tienen ciertas propiedades formales. De estas propiedades se deducen definiciones exactas de las

11

caractersticas de la escala mucho ms precisas de lo que pueden darse en trminos verbales. Estas propiedades pueden formularse en forma ms abstracta de lo hasta aqu expresado, mediante un conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los objetos a que se aplican. Se distinguen cuatro tipos de escala: nominal ordinal interval de razn

A. LA ESCALA NOMINAL Consiste en clasificar objetos o fenmenos, segn ciertas caractersticas, tipologas o nombres, dndoles una denominacin o smbolo, sin que implique ninguna relacin de orden, distancia o proporcin entre los objetos o fenmenos. En la escala nominal los nmeros slo sirven para distinguir categoras, estos no poseen propiedades cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la clasificacin no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con sentido. La medicin se da a nivel elemental en estos casos (se dice que es el nivel ms bajo de medicin) En una escala nominal, la operacin de escalamiento consiste en partir de una caracterstica dada y formar un subconjunto de clases que se excluyen mutuamente. La nica relacin implicada es la de equivalencia. Esto es, los miembros de cualquier clase deben ser equivalentes en la propiedad medida. La relacin de equivalencia es reflexiva (x = x para todo x), simtrica (x = y luego y = x) y transitiva (x = y et y = z luego x = z). Los smbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin alterar la informacin esencial de la escala; debido a esto, las estadsticas de tipo descriptivo admisibles son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporcin, etc. Se pueden desarrollar procesos analticos acerca de la distribucin de las categoras, as como la posible relacin entre dos o ms caractersticas clasificadas mediante este tipo de escala que llamaremos variables cualitativas.

12

Ejemplo de escala nominal: variable estado civil

Otros ejemplos de escala nominal:


Sexo (1. masculino; 2. femenino) Tipo de propiedad (1. oficial; 2. privada; 3. mixta; 4. cooperativa) Departamento de origen (1. Artigas; 2. Canelones; 3. Colonia, etc.) Conformidad (1. Si; 0. No)

B. LA ESCALA ORDINAL Para las mismas personas tambin se pueden medir propiedades donde la clasificacin debe seguir un orden jerrquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos o fenmenos en estudio respecto a alguna caracterstica de inters, sin que se reflejen distancias entre ellos.
Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son ordinales. Note que una valoracin de 1 no indica que el servicio es dos veces mejor que cuando se da una valoracin de 2. Sin embargo podemos decir que la valoracin de 1 es preferiblemente mejor que 2, y as en los dems casos.

Puede suceder que los objetos de una categora de las escala no sean precisamente diferentes a los objetos de otra categora de la escala, sino que estn relacionados entre s, guardan una relacin de jerarqua. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican exclusivamente la posicin en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas de la escala. Las relaciones entre los elementos en clasificacin, pueden formularse con el signo >, mayor que, o sea que axiomticamente la diferencia fundamental entre una escala nominal y una ordinal es que esta ltima incorpora no solamente la relacin de equivalencia (=) sino tambin la relacin ''mas grande que'' (>).

13

Esta relacin es irreflexiva (no es verdad para ninguna x tal que x > x), asimtrica ( x > y luego x < y ) y transitiva (x > y et y > z luego x > z ). Puesto que cualquier transformacin tendiente a conservar el orden no altera la informacin contenida en una escala ordinal, se dice que la escala es "nica hasta una transformacin monotnica". Esto es, no importa que nmeros se den a una pareja de clases o a los miembros de esas clases, siempre que el nmero mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse nmeros menores para grados mas preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera clase); en tanto se sea consecuente, es indiferente el uso del nmero mayor o menor para denotar "mayor" o "mas preferido". Fundamentalmente, las escalas ordinales se estudian en Estadstica, con base en las llamadas "estadsticas de orden" o "estadsticas de rango": mximos, mnimos, mediana, percentiles, etc

Ejemplo de escala ordinal: satisfaccin con el resultado


1 Muy Satisfecho Satisfecho 2 3 4 Muy insatisfecho Insatisfecho

C. LA ESCALA DE INTERVALO Representa un nivel de medicin ms preciso, matemticamente hablando, que las anteriores. No slo se establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide tambin la distancia entre los intervalos o las diferentes categoras o clases. En este caso, la medicin se ejecuta en el sentido de una escala de intervalo; esto es, si la asignacin de nmeros a varias clases de objetos es tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se ha obtenido una medida de intervalo. Una escala de intervalo est caracterizada por una unidad de medida comn y constante que asigna un nmero real a todos los pares de objetos en un conjunto ordenado. En esta clase de medida, la proporcin de dos intervalos cualesquiera es independiente de la unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son arbitrarios.

14

Axiomticamente se puede ver que las operaciones y las relaciones en que se origina la estructura de una escala de intervalo son tales que las diferencias en la escala son isomrficas a la estructura de la aritmtica. Los nmeros pueden asociarse con las posiciones de los objetos de tal manera que las operaciones de la aritmtica puedan realizarse significativamente con las diferencias entre los nmeros. La consecuencia de cualquier cambio de los nmeros asociados con los objetos medidos en una escala de intervalo debe preservar no solamente el orden de los objetos sino tambin las diferencias relativas entre ellos. Esto es, la escala de intervalo es "nica hasta una transformacin lineal". La escala de intervalo es la primera escala verdaderamente cuantitativa. Las estadsticas paramtricas, son las aplicables a estudios en estas escalas.

Ejemplo de variable interval: etapas cronolgicas

2050 2000 1950 1900


Suponga que se est interesado en algn perodo histrico especfico y se estn haciendo proyecciones demogrficas. Se quiere conocer el crecimiento poblacional cada 50 aos. Obviamente los datos pueden ser ordenados (semejante a los datos ordinales) en orden ascendente indicando pasado/s y futuro/s sucesivamente. Adems , las diferencias entre los valores ordenados pueden ser comparadas. Aqu el intervalo entre los valores de los datos 1900 y 1950 representan un incremento en la historia de 50 aos, y lo mismo en los dems intervalos. Hay que tener encuentra que en esta escala no hay un cero absoluto o real, el cero es arbitrario; depende del tipo de calendario que estemos usando.
La presente base de datos tiene por objeto presentar informacin detallada de la poblacin de los 20 pases de Amrica Latina, desglosada por edades simples y aos calendario, correspondiente al perodo 1950 - 2050. Estas estimaciones se generan a partir de las proyecciones nacionales utilizando un procedimiento diseado en el rea de Demografa del Centro Latinoamericano y Caribeo de Demografa- Divisin de Poblacin (CEPAL/CELADE). Una parte de esta informacin (1995 - 2005) se publica en este Boletn Demogrfico (No. 66) y corresponde a las estimaciones y proyecciones vigentes, sustituyendo as las publicadas en el Boletn Demogrfico No. 60 de julio de 1997.

ao

Poblacin Total Amrica Latina

15

1950 2000 2050

160.685.269 507.932.043 800.592.305

D: LA ESCALA DE RAZON Cuando una escala tiene todas las caractersticas de una escala de intervalo y adems un punto cero real en su origen, se llama escala de razn. Adems de distincin, orden y distancia, sta es una escala que permite establecer en que proporcin es mayor una categora de una escala que otra. El cero absoluto o natural representa la nulidad de lo que se estudia. Las operaciones y relaciones hechas con los valores numricos en una escala de razn son correspondientes a una escala isomrfica de la estructura de la aritmtica. Por consiguiente las operaciones de la aritmtica son permisibles en los valores numricos asignados a los objetos mismos, as como tambin en los intervalos entre los nmeros como sucede en las escalas de intervalo. Implican que las relaciones de equivalencia, relacin de mayor a menor, proporcin conocida de dos intervalos y proporcin conocida de dos valores de la escala, sean posibles de obtener operacionalmente. Los nmeros asociados con los valores de la escala de razn son "verdaderos" nmeros con un verdadero cero; solo la unidad de medida es arbitraria. As la escala de razn es "nica hasta la multiplicacin por una constante positiva". Adems de los procesos paramtricos bsicos de las escalas de intervalo, en las de razn pueden utilizarse estadsticas como la media geomtrica, el coeficiente de variacin, las que requieren el conocimiento del verdadero valor cero

16

Ejemplo de variable de razn: nmero de miembros del hogar ocupados

3 2 1 0
Suponga que se quiere medir los ingresos percibidos por las distintas personas empleadas en una empresa de servicios. Los valores relevados han sido, 2, 1 2, 2 2,3 en miles de pesos. El orden (ordinal) y la diferencia (intervalo) en el ingreso percibido puede ser comparado, pero tambin el incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo que el que existe entre 2.2 y 2.3 miles de pesos. Tambin, cuando comparamos los pesos de 2.0 a 2.2 miles de pesos, se encuentra una razn significativa, quien gana 2,2 gana 10 % ms que quien gana 2, 0 miles de pesos.

El Nmero como Nombre, Orden o Medida (tomado de Bar; 2000) Para Cohen y Nagel (1979), los nmeros pueden tener por lo menos tres usos distintos, como rtulos o marcas de identificacin; como signos que indican la posicin de un grado en una serie de grados; o como signos que indican las relaciones cuantitativas entre cualidades. De lo dicho se desprende que slo la ltima de las acepciones relaciona el nmero con la medicin. Esta forma de concebir los nmeros conduce a una clasificacin de variables o escalas en funcin de los atributos que presenta una serie numrica. Dichos atributos son, el orden, la distancia y el origen. Las escalas nominales carecen de todas estas propiedades, y en este caso el nmero slo puede adoptarse como nombre o identificacin. Las escalas ordinales, como su nombre lo indica, slo poseen orden, es decir que organizan sus datos a travs de las relaciones de igualdad, mayor o menor. Las escalas intervlicas poseen atributos de orden, y distancia o estimacin precisa de las unidades. Pero carecen de origen, o cero natural, o ausencia de la propiedad. No obstante estas escalas acuden a la utilizacin del cero convencional. Las escalas proporcionales o racionales son las nicas que cuentan con las tres propiedades y, por lo tanto, se constituyen en verdaderas series numricas. Las dos ltimas clases de escalas son las que realmente miden, no obstante, al carecer las intervlicas de cero natural, no pueden establecerse proporciones.

A menudo, datos provenientes de escalas ordinales numricas son tratados como si fuera informacin verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque s clasifican. En este caso se encuadran los tests psicomtricos, (las evaluaciones de desempeo, las calificaciones de los alumnos en la facultad1), los cuales nicamente pueden estimar el orden de puntuacin, pero nunca la distancia entre dos valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables intervlicas y, consecuentemente, el clculo de medidas de tendencia central y dispersin, adems de otras operaciones derivadas de ellas. Dichas operaciones no son vlidas por cuanto asignan a las escalas un status que en realidad no tienen.

El texto entre parntesis es agregado del autor

17

EJERCICIOS
1. En este mdulo es importante entender algunos conceptos bsicos antes de seguir adelante. Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales aspectos del mdulo. Cul es la diferencia entre Estadstica y Estadsticos? Piensa ejemplos de Estadsticos que puedan resultar tiles para aplicar en el campo de las relaciones laborales. Explica la diferencia entre Estadstica Descriptiva y Estadstica Inferencial. Distingue entre poblacin y muestra. Cita ejemplos de estudios para los cuales sea factible trabajar con toda la poblacin (censo) o con muestras. Fundamenta. Qu relacin hay entre las unidades de anlisis y la poblacin? Piensa ejemplos de variables con sus sistemas de categoras. Identifica el nivel de medicin. 2. Identifica las escalas de medicin de las siguientes variables, de acuerdo al sistema de categoras que se les ha asignado.
Variable Nivel educativo Categoras Ninguno Primaria Secundaria Terciaria 0 ao aprobado 1 ao aprobado 2 aos aprobados Patrn Empleado pblico Empleado privado Cooperativista Trabajador por cuenta propia Trabajador familiar no remunerado Escala de medicin

Nivel educativo

Categora de ocupacin

3. Se quiere realizar un estudio para conocer el perfil de la plantilla de trabajadores de una empresa comercial del rea del supermercadismo. Imagina qu caractersticas podran ser de inters estudiar. Identifica las variables que se corresponden con esas caractersticas y el sistema de categoras que les asignaras. Menciona el nivel de medicin de cada variable. Construye la estructura de la matriz de datos en la cual se volcara la informacin recogida.

18

4.La figura siguiente muestra una de las pginas del formulario de la Encuesta Nacional de Hogares Ampliada, con preguntas que se relevan de cada integrante del hogar.

Identifica las variables que aparecen, as como sus sistemas de categoras y niveles de medicin.

19

ANEXO: REPASANDO ALGUNOS CONCEPTOS MATEMATICOS


Sumatoria: Cuando queremos escribir en forma simplificada la suma de un conjunto grande (e incluso infinito) de sumandos utilizamos una notacin especial representada por la letra griega sigma ( ) Si tenemos n sumandos, representamos a cada uno con la letra X. El primer sumando es X1, el segundo es X2, el ltimo es Xn. Entonces, una suma de X1+ X2++ Xn la representamos de la forma:

X 1 + X 2 + ... + X n = X i
i =1

i =n

Xi es el i-simo sumando. En la notacin de sumatoria estamos expresando que vamos a ir sumando las X, desde la que tiene subndice 1 (i=1) hasta la que tiene subndice n (i=n). La letra i representa el ndice de la sumatoria. Por ejemplo: Tenemos los siguientes datos y queremos obtener su suma: 3, 8, 17, 5 . La forma no simplificada de representar esta suma sera: 3+ 8 + 17 + 5 Pero si identificamos cada dato de la siguiente forma: X1=3; X2=8; X3=17; X4=5;

Podemos expresar la suma como una sumatoria: representando la misma suma:


i =4 i =1

X
i =1

i =4

, lo cual simplifica la notacin y est

= X 1 + X 2 + X 3 + X 4 = 3 + 8 + 17 + 5

Veremos que esta notacin es importante para expresar varias de las herramientas estadsticas que veremos durante el curso.

20

Algunas propiedades de las sumatorias que utilizaremos en el curso: La suma de una expresin que es la suma de dos ms trminos es igual a la suma de las sumas de los trminos por separado:

Ejemplo: X1=2, X2=4; Y1=5, Y2=1, Z1=8, Z2=1.

(X
i =1 i=2 i =1 i

i=2

+ Yi + Z i ) = (2 + 5 + 8) + (4 + 1 + 1) = 21

X + Y + Z
i =1 i i =1

i=2

i =2

= (2 + 4) + (5 + 1) + (8 + 1) = 21

La suma de una constante multiplicada por una variable es igual que la constante multiplicada por la suma de la variable, esto es

Donde a es una constante, es decir, un nmero que no est indexado en la sumatoria. Ejemplo: a=3; X1=5; X2=4; X3=2

aX
i =1

i =3

= 3 * 5 + 3 * 4 + 3 * 2 = 33

a X i = 3 * (5 + 4 + 2) = 33
i =1

i =3

La suma de una constante, es igual a n veces la constante, esto es:

Ejemplo:

21

Sea a=4, y n=3,

4 = 4 + 4 + 4 = 3 * 4 = 12
i =1

i =3

Fracciones, Razones, Proporciones y Porcentajes: En el curso es importante manejar el concepto de proporcionalidad y algunas herramientas matemticas asociadas. Operando con fracciones Recordemos algunas propiedades de la operatoria con fracciones: a c a+c + = b b b 2 3 2+3 + = 4 4 4

ejemplo:

a*k c*k a c 2 *5 3*5 2 3 + = + * k ejemplo: + = + *5 b d 3 4 b d 3 4 Uniendo ambas propiedades: a*k c*k a + c 2 *5 3*5 2 + 3 + = + = * k ejemplo: *5 b b 3 3 b 3

Proporcionalidad y regla de tres Una razn entre dos cantidades es una comparacin por cociente, para lo cual nos servimos de las fracciones: a , tanto para expresarla como para calcularla. Sin embargo, muchas veces encontramos b

esta otra notacin: a:b. En las razones el numerador no es necesariamente un subconjunto del denominador.

Por ejemplo: Decimos que hay una razn de 12 obreros cada 5 administrativos en una determinada empresa. En este caso los obreros estn en un conjunto distinto al de los administrativos. En cambio si decimos hay una

22

razn de 8 obreros cada 20 empleados de la empresa, estamos comparando un subconjunto (obreros) con el conjunto total (empleados). La igualdad entre dos razones se denomina proporcin. a c = a * d = b * c , se denomina propiedad fundamental de las proporciones. b d

La propiedad:

La forma de verificar la proporcionalidad es comprobar que los productos cruzados son iguales. Por ejemplo, el jornal diario de una determinada categora laboral en una empresa es de $200 por 4 horas de trabajo. Se paga por hora trabajada, sin que el valor hora se modifique por jornadas con distinta carga horaria. Entonces, el trabajador que realiza una jornada de 6 horas, va a ganar $300. En este caso, utilizamos la idea de proporcionalidad: 200 300 = 4 6 y esto lo podramos verificar haciendo el producto cruzado, que debe dar el mismo resultado: 200*6=300*4=1200. La propiedad fundamental de la proporcionalidad permite aplicar la llamada regla de tres, para hallar un valor que es proporcional a otro. En el ejemplo que utilizamos, si sabemos que por 4 horas de trabajo pagan $200, y que el jornal es proporcional al nmero de horas, entonces podemos hallar cunto gana alguien que trabaja 6 horas usando la regla de tres: 4 ----- 200 6 ------ x Que leemos como: 4 es a 200, como 6 es a x, haciendo referencia a la idea de proporcionalidad. Como sabemos que los productos cruzados deben ser iguales: 6*200=4*x, lo cual nos permite despejar nuestra incgnita (x): x = Es decir: a ---- b c ---- x x= b*c a 6 * 200 = 300 4

23

Nos van a interesar en particular dos tipos de razones: Las proporciones a 1: Estas proporciones son fracciones que comparan un nmero con 1. Para hallar la proporcin de a en relacin a n: P = a . Por ejemplo, si queremos saber qu proporcin n

de integrantes de un hogar trabajan, a sera el nmero de integrantes del hogar y n el total de integrantes del hogar (dentro de los cuales estn incluidos los miembros que trabajan). Proporcin que trabaja = nmero de integrantes que trabajan/total integrantes del hogar Los porcentajes: son fracciones que se obtienen al comparar un nmero con 100. a * 100 n

P% =

En el ejemplo anterior: % que trabaja = nmero de integrantes que trabajan*100/total integrantes del hogar Cuando se tiene una proporcin, alcanza con multiplicar sta por 100 para obtener el porcentaje. En el prximo mdulo utilizaremos estas dos herramientas para construir las distribuciones de frecuencias relativas y las frecuencias relativas porcentuales

24

You might also like