Professional Documents
Culture Documents
Escala de razn
1.1 INTRODUCCION
Para muchos parece una materia lejana, pero la Estadstica y muchas de sus herramientas nos acompaan diariamente, aunque no nos percatemos de ello. Durante el curso tendremos oportunidad de ver ejemplos muy familiares y entender algunos trminos que escuchamos y manejamos diariamente. Este primer mdulo nos introducir en el mundo de la estadstica, particularmente la estadstica descriptiva, aprendiendo el vocabulario y los conceptos fundamentales para poder abordar los prximos temas. Tambin repasaremos algunos procedimientos matemticos que usaremos durante todo el curso..
Si quieres ver algunas definiciones adicionales, puedes acceder a: Carrasco Arroyo, S (2005): Aproximacin a la Estadstica desde las Ciencias Sociales.Valencia, Espaa. http://www.uv.es/carrascs/PDF/aproximacion%20estadistica.pdf Zavrostsky, A: Varias definiciones de la Estadstica. Revista de Economa. Facultad de Ingeniera.Universidad de Los Andes, Venezuela. http://iies.faces.ula.ve/Revista/Articulos/Revista_02/Pdf/Rev02Zavrotsky.pdf
Su origen en la historia La estadstica cientfica tal como se entiende actualmente tiene sus
origenes en el SXIX, cada vez ms vinculada a la teora de la probabilidad. Dos puntos de referencia bsicos son los trabajos de F. Galton, fundador de la biometra, y de K. Pearson que sent las bases de la estadstica moderna. Sin embargo, los orgenes de las herramientas estadsticas pueden ser rastreados al menos hasta el antiguo Egipto y ms atrs an. El inters por el registro sistemtico sobre la poblacin y los recursos econmicos y la elaboracin de instrumentos matemticos de resumen de la informacin aparecen desde la antigedad vinculados con la administracin y la poltica de los gobiernos.
http://www.eumed.net/cursecon/libreria/drm/cap1.pdf
El origen de la palabra La palabra "estadstica" procede del latn statisticum collegium ("consejo de
Estado") y de ella deriva el trmino italiano statista ("hombre de Estado" o "poltico"). A su vez, el trmino alemn Statistik es introducido por Gottfried Achenwall en 1749 al publicar su obra Compendio de la constitucin poltica de los principales pases y pueblos europeos, asocindolo con el anlisis de datos del Estado, es decir, "la ciencia del Estado" . Sin embargo, recin a partir del siglo XIX el trmino comienza a ser utilizado en su acepcin moderna.
Nuestro curso, por la carga horaria y los objetivos que se ha planteado, va a realizar un recorrido bsico por herramientas de estadstica descriptiva. Sin embargo, es necesario considerar que una parte fundamental de la disciplina estadstica est dedicada a la INFERENCIA. En ella, se incorporan los conceptos de variable aleatoria, distribuciones de probabilidad, estimadores e intervalos de confianza, entre otros, que no utilizaremos en el curso.
Con las herramientas estadsticas que vamos a trabajar durante este curso vamos a describir el comportamiento de conjuntos de individuos, instituciones, pases, etc. pero no vamos a utilizarlas para generalizar los resultados a una poblacin mayor. Esto lo veremos con detenimiento al hablar del concepto de POBLACION y MUESTRA. Sin embargo, veremos que estos instrumentos y mtodos nos habilitan a realizar anlisis sumamente tiles, a partir de la descripcin de nuestra poblacin. Y, por otra parte, como plantea el texto de Mayte Rodrguez, constituyen el punto de partida para los procedimientos de la Estadstica Inferencial. Por ejemplo: Cuando queremos conocer el perfil de los trabajadores de una empresa podemos averiguar las caractersticas de todos los empleados, con lo cual no necesitamos inferir ninguno de los
resultados. Alcanza con generar formas de resumen de la informacin para describir el comportamiento de toda la plantilla de trabajadores. Es una aplicacin de la estadstica descriptiva. Pero, si la empresa fuera muy grande, podramos optar por encuestar o averiguar la informacin slo de un subconjunto de esos trabajadores. En este caso, tendramos que recurrir a la teora de muestreo para tener mecanismos que me garanticen una eleccin al azar de los empleados entrevistar y a la teora de la probabilidad para a partir de los resultados obtenidos para ese grupo, generalizar a toda la plantilla de trabajadores. En este caso, entonces, estaramos frente a procedimientos propios de la Estadstica Inferencial.
1.3
Por una parte, en lo que queda de este mdulo veremos algunos conceptos fundamentales que nos permiten comenzar a trabajar con las herramientas estadsticas. Entender qu es una poblacin y una unidad y cmo caracterizo a esas unidades a travs de variables, que tienen un sistema de categoras y una escala de medicin. A partir de estos conceptos podemos elaborar la idea de matriz de datos originales, que contiene toda la informacin que tengo sobre la poblacin. En los mdulos 1, 2, 3 y 4 (estadsticos). En el mdulo 5, veremos como describir una poblacin en base a dos caractersticas simultneamente. Los ltimos 3 mdulos incluyen herramientas ms especficas, que pueden ser de mucha utilidad para la investigacin y los anlisis en el mbito de las relaciones laborales: En el mdulo 6, veremos una forma de medir y comparar el grado de concentracin de recursos que se distribuyen en una poblacin (por ejemplo, qu grado de desigualdad hay en la distribucin del ingreso total del pas, o la masa salarial de una empresa, entre todos los miembros de esa poblacin). El mdulo 7 est dedicado a la presentacin de algunos estadsticos que nos permiten analizar el comportamiento del mercado de trabajo. Los estadsticos que vamos a estudiar habitualmente se construyen en base a muestras y constituyen estimaciones de los valores de la poblacin (parmetros), pero no vamos a profundizar en este aspecto sino que trataremos de entender su construccin y uso. Finalmente, el mdulo 8 presenta dos herramientas que estn vinculadas al anlisis temporal de datos. Veremos en primer lugar los nmeros ndice nos permiten analizar la evolucin de una caracterstica numrica en el tiempo. Algunos nmeros ndice tienen incidencia cotidiana en nuestra vida, como tendremos oportunidad de ver al llegar a ese mdulo final del curso. Tambin nos familiarizaremos con aprenderemos cmo describir una poblacin en base a una de sus
los conceptos de inflacin, precios corrientes y precios constantes, y obtendremos una herramienta que nos permite comparar precios tomados en distintos momentos del tiempo.
POBLACIN o UNIVERSO: Es el conjunto de elementos sobre el que se realiza el estudio. Debe estar acotada en espacio y tiempo. Ejemplos de poblaciones en estudios de ciencias sociales: habitantes de un barrio o un pas, alumnos de una escuela, empresas, organizaciones, partidos polticos, ciudades, pases, etc. Lo fundamental al definir una poblacin es que sea acorde a los objetivos que nos planteamos en el estudio y que est delimitada en el tiempo y en el espacio, de modo que sea identificable y podamos distinguir entre quienes componen la poblacin y quienes no. MUESTRA: Al recoger datos relativos a las caractersticas de una poblacin muchas veces es difcil, costoso o poco prctico observar todo el grupo, sobre todo cuando se trata de conjuntos grandes. En ese caso, se relevan los datos slo para una parte de la poblacin, a la cual se le llama MUESTRA. Una muestra tomada con determinados criterios de aleatoriedad (para ello nos servimos de la teora del muestro) puede considerarse representativa de la poblacin y los estadsticos que construyamos a partir de ella permiten realizar estimaciones sobre lo que sucede con esas caractersticas en toda la poblacin.
Como ya dijimos, estas estimaciones corresponden a la estadstica inferencial, que se basa en la teora de las probabilidades. Existe un margen de incertidumbre sobre las conclusiones que se sacan para la poblacin y se trabaja bajo determinados supuestos sobre la pertinencia de generalizar a la poblacin a partir de la informacin obtenida en al muestra. En estos casos, la estadstica descriptiva se encarga de resumir la informacin y analizar solamente la muestra, sin inferir conclusiones sobre la poblacin. CENSO: Es un relevamiento de todos los elementos de la poblacin. Puede considerarse un caso especial de muestra, cuando el tamao de la misma coincide con el de la poblacin. Por ejemplo: para estudiar el mercado de trabajo en Uruguay peridicamente, no se entrevista a todos los habitantes del pas sino que se toma una muestra de hogares e integrantes de los mismos, a los cuales se les aplica la Encuesta Continua de Hogares. En cambio, cuando se realiza un Censo de Poblacin, se entrevista a todas las personas que se encuentran en el pas ese da. Dentro de los temas que releva el Censo de Poblacin se incluye el del mercado de trabajo. En el caso de la Encuesta de Hogares, obtenemos el nmero de desocupados de la muestra, el cual sirve para estimar la desocupacin a nivel de toda la poblacin (por lo cual hay una margen de error, una incertidumbre sobre en qu medida ese valor es el que corresponde a la poblacin). En el caso del Censo, el nmero de desocupados nos indica (salvo errores de relevamiento) la desocupacin en el pas, sin esa incertidumbre. Durante este curso vamos a trabajar bajo el supuesto que siempre estamos observando a todos los elementos de la poblacin, es decir, realizando un CENSO.
Extrado de Bueno, Concepcin y Escudero, Toms: Apuntes de Estadstica para profesores.Curso 2006/2007.Instituto de Ciencias de la Educacin.Universidad de Zaragoza
La poblacin est compuesta por las UNIDADES DE ANALISIS. La UNIDAD DE ANALISIS es el elemento mnimo de una poblacin y de una muestra, en tanto se lo considera como poseedor de ciertas propiedades, atributos o caractersticas denominadas variables. Por ejemplo: los estudiantes univesitarios son unidades de anlisis si consideramos su ao de ingreso, su centro de estudios o su edad. O, por ejemplo, los centros de estudio universitario son unidades de anlisis si consideramos su nmero de estudiantes; cantidad de salones; nmeros de docentes por materia. En nuestros estudios, nos interesar relevar las carctersticas de la unidades de anlisis y sacar conclusiones sobre la poblacin en base a esta informacin. Para obtener los datos de las unidades de anlisis debemos relevar la informacin. Las herramientas para relevar la informacin pueden ser entrevistas (encuestas) pero tambin podemos obtener informacin de registros administrativos, documentos, artculos de prensa, observacin directa. La UNIDAD DE RELEVAMIENTO es la Unidad que aporta la informacin para la construccin del dato estadstico. Muchas veces coincide con la unidad de anlisis, pero en otros casos no. Por ejemplo, si estamos interesados en estudiar caractersticas de los hogares (por ejemplo: los ingresos del hogar, el nmero de miembros que trabajan, etc.) nuestro relevamiento lo haremos sobre los miembros del hogar (les preguntaremos por sus ingresos y su condicin laboral). Pero cuando construyamos los datos, tomaremos esa informacin y caracterizaremos con ella al hogar. En este caso, la unidad de relevamiento son los miembros del hogar pero la unidad de anlisis (que es la que queremos estudiar) son hogares. Hemos visto que nos interesa caracterizar a nuestra unidades de anlisis. De ahora en adelante hablaremos de VARIABLES, como los instrumentos que nos permiten hacer esa caracterizacin. Una VARIABLE es una propiedad, atributo o caracterstica de una unidad de anlisis, susceptible de adoptar diferentes valores o categoras. Los valores o categoras que adopta una variable constituyen un SISTEMA DE CATEGORIAS. Este sistema tiene dos propiedades fundamentales: sus categoras deben ser MUTUAMENTE EXCLUYENTES y el sistema debe ser EXHAUSTIVO para la poblacin en estudio. Sigamos con el ejemplo del estudio de los hogares de acuerdo a su nivel de ingresos y al nmero de miembros del hogar que trabajan. Tenemos dos variables. La primera podemos llamarla INGRESOS DEL HOGAR, y vamos a construir un sistema de categoras para ella. Supongamos que relevamos los ingresos de todos los miembros de un hogar. Con esta informacin podemos obtener el dato que corresponde a ese hogar. Deberemos hacer lo mismo con cada uno de los hogares que constituyen nuestra poblacin en estudio. Obtenidos nuestros datos para todos los hogares, queremos expresar el sistema de categoras de esta variable.
Un sistema de categoras posible podra ser cada uno de los valores obtenidos, por ejemplo: $2000, $4500, $ 7000, etc. Para explicitar un sistema de categoras as (que tiene muchos valores posibles), lo mejor es buscar el valor ms bajo y el ms alto y expresarlo como: $ 2000, .., $ 70000. Otro sistema de categoras posible, si no nos interesa tener tan desagregada la informacin, podra ser identificar a los hogares en esta variable en tramos de ingreso. Por ejemplo: $ 2000 a $10000, $10001 a $40000, $40001 a 70000. En este caso tendramos tres categoras en nuestro sistema y los hogares tendran como valor o categora en esta variable su pertenencia a uno de los tres tramos (nos olvidamos de sus valores originales. Pero nos interesa entender las propiedades del sistema de categoras. Supongamos que tenemos este segundo sistema. Si hubiramos armado los tramos de esta manera: $2000-10000, $10000-40000, $40000-70000, tendramos dificultades para saber a qu categora corresponde un hogar que tiene $10000 como ingreso. En qu categora lo coloco? En la primera (2000 a 10000) o en la segunda (10000 a 40000)? A esto nos referimos con la idea que las categoras deben ser mutuamente excluyentes. Frente al sistema, no tengo que tener duda de cul es la categora que le corresponde a cada unidad. Supongamos ahora que mi sistema es $ 5000 a $10000, $10001 a $40000, $40001 a 70000. Cul es la categora que le corresponde al hogar que gana $2000? No tengo ninguna categora que lo incluya. La idea de exhaustividad implica que mi sistema debe cubrir todos los valores posibles de la variable para mi poblacin. La exhausitividad de un sistema de categoras est relacionado con la poblacin en estudio: si por ejemplo estamos estudiando el nivel educativo de un pas, nuestro sistema de categoras para esa variable tendra que tener por ejemplo, las siguientes categoras: Sin instruccin, Primaria, Secundaria-UTU, Terciaria y posterciaria. Sin embargo si estoy estudiando el nivel educativo de una poblacin de menores de 16 aos, alcanza con tener el siguiente sistema: Sin instruccin, Primaria, Secundaria-UTU, ya que la educacin terciaria no ha de aparecer como categora para ninguna de las unidades de anlisis de esta poblacin por la edad que tienen. La informacin sobre nuestra poblacin la vamos organizar en una MATRIZ DE DATOS. Una matriz de datos contiene en sus filas a cada una de las unidades, en sus columnas a las variables que caracterizan a esas unidades. Y cada celda est compuesta por el valor que asume la variable de esa columan para la unidad de anlisis de esa fila.
Un DATO, en el contexto de nuestra disciplina es el valor que toma una variable en una unidad de anlisis. Por esta razn se dice que su estructura es tripartita: refiere simultneamente a la unidad de anlisis, a la variable y a la categora o valor. En la matriz de datos esta estructura tripartita se hace visible, al presentar las unidades en las filas, las variables en las columnas y el DATO como cruce de esos dos vectores. Siguiendo nuestro ejemplo de los hogares, una matriz de datos podra ser:
Ingresos Hogar 1 Hogar 2 Hogar 3 . hogar $2000 $70000 $ 4500 del Nmero trabajan 2 4 0 de miembros que
Que indica que el hogar uno tiene $ 2000 de ingreso y trabajan 2 de sus miembros, en el hogar 2, el ingreso es $ 70000 y trabajan 4 miembros, etc. La matriz de datos tiene tantas filas como el tamao de la poblacin y tantas columnas como variables.
10
11
caractersticas de la escala mucho ms precisas de lo que pueden darse en trminos verbales. Estas propiedades pueden formularse en forma ms abstracta de lo hasta aqu expresado, mediante un conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los objetos a que se aplican. Se distinguen cuatro tipos de escala: nominal ordinal interval de razn
A. LA ESCALA NOMINAL Consiste en clasificar objetos o fenmenos, segn ciertas caractersticas, tipologas o nombres, dndoles una denominacin o smbolo, sin que implique ninguna relacin de orden, distancia o proporcin entre los objetos o fenmenos. En la escala nominal los nmeros slo sirven para distinguir categoras, estos no poseen propiedades cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la clasificacin no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con sentido. La medicin se da a nivel elemental en estos casos (se dice que es el nivel ms bajo de medicin) En una escala nominal, la operacin de escalamiento consiste en partir de una caracterstica dada y formar un subconjunto de clases que se excluyen mutuamente. La nica relacin implicada es la de equivalencia. Esto es, los miembros de cualquier clase deben ser equivalentes en la propiedad medida. La relacin de equivalencia es reflexiva (x = x para todo x), simtrica (x = y luego y = x) y transitiva (x = y et y = z luego x = z). Los smbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin alterar la informacin esencial de la escala; debido a esto, las estadsticas de tipo descriptivo admisibles son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporcin, etc. Se pueden desarrollar procesos analticos acerca de la distribucin de las categoras, as como la posible relacin entre dos o ms caractersticas clasificadas mediante este tipo de escala que llamaremos variables cualitativas.
12
B. LA ESCALA ORDINAL Para las mismas personas tambin se pueden medir propiedades donde la clasificacin debe seguir un orden jerrquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos o fenmenos en estudio respecto a alguna caracterstica de inters, sin que se reflejen distancias entre ellos.
Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son ordinales. Note que una valoracin de 1 no indica que el servicio es dos veces mejor que cuando se da una valoracin de 2. Sin embargo podemos decir que la valoracin de 1 es preferiblemente mejor que 2, y as en los dems casos.
Puede suceder que los objetos de una categora de las escala no sean precisamente diferentes a los objetos de otra categora de la escala, sino que estn relacionados entre s, guardan una relacin de jerarqua. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican exclusivamente la posicin en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas de la escala. Las relaciones entre los elementos en clasificacin, pueden formularse con el signo >, mayor que, o sea que axiomticamente la diferencia fundamental entre una escala nominal y una ordinal es que esta ltima incorpora no solamente la relacin de equivalencia (=) sino tambin la relacin ''mas grande que'' (>).
13
Esta relacin es irreflexiva (no es verdad para ninguna x tal que x > x), asimtrica ( x > y luego x < y ) y transitiva (x > y et y > z luego x > z ). Puesto que cualquier transformacin tendiente a conservar el orden no altera la informacin contenida en una escala ordinal, se dice que la escala es "nica hasta una transformacin monotnica". Esto es, no importa que nmeros se den a una pareja de clases o a los miembros de esas clases, siempre que el nmero mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse nmeros menores para grados mas preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera clase); en tanto se sea consecuente, es indiferente el uso del nmero mayor o menor para denotar "mayor" o "mas preferido". Fundamentalmente, las escalas ordinales se estudian en Estadstica, con base en las llamadas "estadsticas de orden" o "estadsticas de rango": mximos, mnimos, mediana, percentiles, etc
C. LA ESCALA DE INTERVALO Representa un nivel de medicin ms preciso, matemticamente hablando, que las anteriores. No slo se establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide tambin la distancia entre los intervalos o las diferentes categoras o clases. En este caso, la medicin se ejecuta en el sentido de una escala de intervalo; esto es, si la asignacin de nmeros a varias clases de objetos es tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se ha obtenido una medida de intervalo. Una escala de intervalo est caracterizada por una unidad de medida comn y constante que asigna un nmero real a todos los pares de objetos en un conjunto ordenado. En esta clase de medida, la proporcin de dos intervalos cualesquiera es independiente de la unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son arbitrarios.
14
Axiomticamente se puede ver que las operaciones y las relaciones en que se origina la estructura de una escala de intervalo son tales que las diferencias en la escala son isomrficas a la estructura de la aritmtica. Los nmeros pueden asociarse con las posiciones de los objetos de tal manera que las operaciones de la aritmtica puedan realizarse significativamente con las diferencias entre los nmeros. La consecuencia de cualquier cambio de los nmeros asociados con los objetos medidos en una escala de intervalo debe preservar no solamente el orden de los objetos sino tambin las diferencias relativas entre ellos. Esto es, la escala de intervalo es "nica hasta una transformacin lineal". La escala de intervalo es la primera escala verdaderamente cuantitativa. Las estadsticas paramtricas, son las aplicables a estudios en estas escalas.
ao
15
D: LA ESCALA DE RAZON Cuando una escala tiene todas las caractersticas de una escala de intervalo y adems un punto cero real en su origen, se llama escala de razn. Adems de distincin, orden y distancia, sta es una escala que permite establecer en que proporcin es mayor una categora de una escala que otra. El cero absoluto o natural representa la nulidad de lo que se estudia. Las operaciones y relaciones hechas con los valores numricos en una escala de razn son correspondientes a una escala isomrfica de la estructura de la aritmtica. Por consiguiente las operaciones de la aritmtica son permisibles en los valores numricos asignados a los objetos mismos, as como tambin en los intervalos entre los nmeros como sucede en las escalas de intervalo. Implican que las relaciones de equivalencia, relacin de mayor a menor, proporcin conocida de dos intervalos y proporcin conocida de dos valores de la escala, sean posibles de obtener operacionalmente. Los nmeros asociados con los valores de la escala de razn son "verdaderos" nmeros con un verdadero cero; solo la unidad de medida es arbitraria. As la escala de razn es "nica hasta la multiplicacin por una constante positiva". Adems de los procesos paramtricos bsicos de las escalas de intervalo, en las de razn pueden utilizarse estadsticas como la media geomtrica, el coeficiente de variacin, las que requieren el conocimiento del verdadero valor cero
16
3 2 1 0
Suponga que se quiere medir los ingresos percibidos por las distintas personas empleadas en una empresa de servicios. Los valores relevados han sido, 2, 1 2, 2 2,3 en miles de pesos. El orden (ordinal) y la diferencia (intervalo) en el ingreso percibido puede ser comparado, pero tambin el incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo que el que existe entre 2.2 y 2.3 miles de pesos. Tambin, cuando comparamos los pesos de 2.0 a 2.2 miles de pesos, se encuentra una razn significativa, quien gana 2,2 gana 10 % ms que quien gana 2, 0 miles de pesos.
El Nmero como Nombre, Orden o Medida (tomado de Bar; 2000) Para Cohen y Nagel (1979), los nmeros pueden tener por lo menos tres usos distintos, como rtulos o marcas de identificacin; como signos que indican la posicin de un grado en una serie de grados; o como signos que indican las relaciones cuantitativas entre cualidades. De lo dicho se desprende que slo la ltima de las acepciones relaciona el nmero con la medicin. Esta forma de concebir los nmeros conduce a una clasificacin de variables o escalas en funcin de los atributos que presenta una serie numrica. Dichos atributos son, el orden, la distancia y el origen. Las escalas nominales carecen de todas estas propiedades, y en este caso el nmero slo puede adoptarse como nombre o identificacin. Las escalas ordinales, como su nombre lo indica, slo poseen orden, es decir que organizan sus datos a travs de las relaciones de igualdad, mayor o menor. Las escalas intervlicas poseen atributos de orden, y distancia o estimacin precisa de las unidades. Pero carecen de origen, o cero natural, o ausencia de la propiedad. No obstante estas escalas acuden a la utilizacin del cero convencional. Las escalas proporcionales o racionales son las nicas que cuentan con las tres propiedades y, por lo tanto, se constituyen en verdaderas series numricas. Las dos ltimas clases de escalas son las que realmente miden, no obstante, al carecer las intervlicas de cero natural, no pueden establecerse proporciones.
A menudo, datos provenientes de escalas ordinales numricas son tratados como si fuera informacin verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque s clasifican. En este caso se encuadran los tests psicomtricos, (las evaluaciones de desempeo, las calificaciones de los alumnos en la facultad1), los cuales nicamente pueden estimar el orden de puntuacin, pero nunca la distancia entre dos valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables intervlicas y, consecuentemente, el clculo de medidas de tendencia central y dispersin, adems de otras operaciones derivadas de ellas. Dichas operaciones no son vlidas por cuanto asignan a las escalas un status que en realidad no tienen.
17
EJERCICIOS
1. En este mdulo es importante entender algunos conceptos bsicos antes de seguir adelante. Responde las preguntas y realiza las actividades siguientes, que sintetizan los principales aspectos del mdulo. Cul es la diferencia entre Estadstica y Estadsticos? Piensa ejemplos de Estadsticos que puedan resultar tiles para aplicar en el campo de las relaciones laborales. Explica la diferencia entre Estadstica Descriptiva y Estadstica Inferencial. Distingue entre poblacin y muestra. Cita ejemplos de estudios para los cuales sea factible trabajar con toda la poblacin (censo) o con muestras. Fundamenta. Qu relacin hay entre las unidades de anlisis y la poblacin? Piensa ejemplos de variables con sus sistemas de categoras. Identifica el nivel de medicin. 2. Identifica las escalas de medicin de las siguientes variables, de acuerdo al sistema de categoras que se les ha asignado.
Variable Nivel educativo Categoras Ninguno Primaria Secundaria Terciaria 0 ao aprobado 1 ao aprobado 2 aos aprobados Patrn Empleado pblico Empleado privado Cooperativista Trabajador por cuenta propia Trabajador familiar no remunerado Escala de medicin
Nivel educativo
Categora de ocupacin
3. Se quiere realizar un estudio para conocer el perfil de la plantilla de trabajadores de una empresa comercial del rea del supermercadismo. Imagina qu caractersticas podran ser de inters estudiar. Identifica las variables que se corresponden con esas caractersticas y el sistema de categoras que les asignaras. Menciona el nivel de medicin de cada variable. Construye la estructura de la matriz de datos en la cual se volcara la informacin recogida.
18
4.La figura siguiente muestra una de las pginas del formulario de la Encuesta Nacional de Hogares Ampliada, con preguntas que se relevan de cada integrante del hogar.
Identifica las variables que aparecen, as como sus sistemas de categoras y niveles de medicin.
19
X 1 + X 2 + ... + X n = X i
i =1
i =n
Xi es el i-simo sumando. En la notacin de sumatoria estamos expresando que vamos a ir sumando las X, desde la que tiene subndice 1 (i=1) hasta la que tiene subndice n (i=n). La letra i representa el ndice de la sumatoria. Por ejemplo: Tenemos los siguientes datos y queremos obtener su suma: 3, 8, 17, 5 . La forma no simplificada de representar esta suma sera: 3+ 8 + 17 + 5 Pero si identificamos cada dato de la siguiente forma: X1=3; X2=8; X3=17; X4=5;
X
i =1
i =4
= X 1 + X 2 + X 3 + X 4 = 3 + 8 + 17 + 5
Veremos que esta notacin es importante para expresar varias de las herramientas estadsticas que veremos durante el curso.
20
Algunas propiedades de las sumatorias que utilizaremos en el curso: La suma de una expresin que es la suma de dos ms trminos es igual a la suma de las sumas de los trminos por separado:
(X
i =1 i=2 i =1 i
i=2
+ Yi + Z i ) = (2 + 5 + 8) + (4 + 1 + 1) = 21
X + Y + Z
i =1 i i =1
i=2
i =2
= (2 + 4) + (5 + 1) + (8 + 1) = 21
La suma de una constante multiplicada por una variable es igual que la constante multiplicada por la suma de la variable, esto es
Donde a es una constante, es decir, un nmero que no est indexado en la sumatoria. Ejemplo: a=3; X1=5; X2=4; X3=2
aX
i =1
i =3
= 3 * 5 + 3 * 4 + 3 * 2 = 33
a X i = 3 * (5 + 4 + 2) = 33
i =1
i =3
Ejemplo:
21
4 = 4 + 4 + 4 = 3 * 4 = 12
i =1
i =3
Fracciones, Razones, Proporciones y Porcentajes: En el curso es importante manejar el concepto de proporcionalidad y algunas herramientas matemticas asociadas. Operando con fracciones Recordemos algunas propiedades de la operatoria con fracciones: a c a+c + = b b b 2 3 2+3 + = 4 4 4
ejemplo:
a*k c*k a c 2 *5 3*5 2 3 + = + * k ejemplo: + = + *5 b d 3 4 b d 3 4 Uniendo ambas propiedades: a*k c*k a + c 2 *5 3*5 2 + 3 + = + = * k ejemplo: *5 b b 3 3 b 3
Proporcionalidad y regla de tres Una razn entre dos cantidades es una comparacin por cociente, para lo cual nos servimos de las fracciones: a , tanto para expresarla como para calcularla. Sin embargo, muchas veces encontramos b
esta otra notacin: a:b. En las razones el numerador no es necesariamente un subconjunto del denominador.
Por ejemplo: Decimos que hay una razn de 12 obreros cada 5 administrativos en una determinada empresa. En este caso los obreros estn en un conjunto distinto al de los administrativos. En cambio si decimos hay una
22
razn de 8 obreros cada 20 empleados de la empresa, estamos comparando un subconjunto (obreros) con el conjunto total (empleados). La igualdad entre dos razones se denomina proporcin. a c = a * d = b * c , se denomina propiedad fundamental de las proporciones. b d
La propiedad:
La forma de verificar la proporcionalidad es comprobar que los productos cruzados son iguales. Por ejemplo, el jornal diario de una determinada categora laboral en una empresa es de $200 por 4 horas de trabajo. Se paga por hora trabajada, sin que el valor hora se modifique por jornadas con distinta carga horaria. Entonces, el trabajador que realiza una jornada de 6 horas, va a ganar $300. En este caso, utilizamos la idea de proporcionalidad: 200 300 = 4 6 y esto lo podramos verificar haciendo el producto cruzado, que debe dar el mismo resultado: 200*6=300*4=1200. La propiedad fundamental de la proporcionalidad permite aplicar la llamada regla de tres, para hallar un valor que es proporcional a otro. En el ejemplo que utilizamos, si sabemos que por 4 horas de trabajo pagan $200, y que el jornal es proporcional al nmero de horas, entonces podemos hallar cunto gana alguien que trabaja 6 horas usando la regla de tres: 4 ----- 200 6 ------ x Que leemos como: 4 es a 200, como 6 es a x, haciendo referencia a la idea de proporcionalidad. Como sabemos que los productos cruzados deben ser iguales: 6*200=4*x, lo cual nos permite despejar nuestra incgnita (x): x = Es decir: a ---- b c ---- x x= b*c a 6 * 200 = 300 4
23
Nos van a interesar en particular dos tipos de razones: Las proporciones a 1: Estas proporciones son fracciones que comparan un nmero con 1. Para hallar la proporcin de a en relacin a n: P = a . Por ejemplo, si queremos saber qu proporcin n
de integrantes de un hogar trabajan, a sera el nmero de integrantes del hogar y n el total de integrantes del hogar (dentro de los cuales estn incluidos los miembros que trabajan). Proporcin que trabaja = nmero de integrantes que trabajan/total integrantes del hogar Los porcentajes: son fracciones que se obtienen al comparar un nmero con 100. a * 100 n
P% =
En el ejemplo anterior: % que trabaja = nmero de integrantes que trabajan*100/total integrantes del hogar Cuando se tiene una proporcin, alcanza con multiplicar sta por 100 para obtener el porcentaje. En el prximo mdulo utilizaremos estas dos herramientas para construir las distribuciones de frecuencias relativas y las frecuencias relativas porcentuales
24