Professional Documents
Culture Documents
ndice
1. Organizacin de los datos: la distribucin de frecuencias............................................. 1.1. Agrupacin en intervalos ......................................................................................... 1.2. Nmero de intervalos............................................................................................... 1.3. Valor del intervalo ................................................................................................... 1.4. Cmo comenzar la agrupacin en intervalos ........................................................... 2. Representaciones grficas.............................................................................................. 2.1. Polgono de frecuencias ........................................................................................... 2.2. Polgono de frecuencias relativas ............................................................................ 2.3. Histograma............................................................................................................... 2.4. Diagrama de cajas .................................................................................................... 3 3 3 4 4 5 5 7 7 8
| | |
Tabla 1.
Sumamos una unidad a la diferencia entre las puntuaciones ms alta y ms baja porque el recorrido o amplitud se calcula a partir de los lmites extremos; por esto sumamos .5 a la puntuacin ms alta y restamos .5 a la puntuacin ms baja: suponemos que la puntuacin mayor no es en este
caso 77, sino 77.5, y que la ms baja no es 38, sino 37.5 (sobre la amplitud o recorrido trataremos en el contexto de las medidas de dispersin). En los datos de la tabla 1 la amplitud es 77.5 - 37.5 ( 77 - 38 + 1) = 40. Tenemos en principio 40 intervalos, demasiados. Si agrupamos las puntuaciones de dos en dos tendramos 20 intervalos, demasiados quizs en este caso, con slo 40 sujetos; si las agrupamos de tres en tres tenemos 14 intervalos, que es lo que hemos hecho en la agrupacin que figura en la tabla 2. X
75-77 72-74 69-71 66-68 63-65 60-62 57-59 54-56 51-53 48-50 45-47 42-44 39-41 36-38
f
|| |||| || || |||||||| |||| ||| |||||| || ||| | | | | 2 4 2 2 8 4 3 6 2 3 1 1 1 1
Tabla 2
El ltimo intervalo, el superior, se completa hasta incluir tres puntuaciones (pues 3 es el valor de i en este caso). Como la puntuacin ms alta es 77, no ha habido que aadir puntuaciones que de hecho nadie ha obtenido.
2. Representaciones grficas
A partir de la distribucin de frecuencias podemos hacer diversos tipos de representaciones grficas. Estas representaciones grficas son especialmente tiles: a) Para disponer de una visin de conjunto que sin ms clculos nos permite hacernos una idea de la situacin, comparar de manera intuitiva varios grupos, etc. b) Para comunicar resultados de manera intuitiva y fcilmente comprensible. La mera distribucin de frecuencias ya puede cumplir con estos propsitos, pero los distintos tipos de grficos son una ayuda importante. Aqu nos limitamos a exponer tres de los tipos de representaciones grficas ms comunes, polgonos de frecuencias, histogramas y diagrama de cajas Estas y otras representaciones grficas tambin se encuentran ya programadas en hojas de clculo como EXCEL.
8 7 6
x Figura I
Y
4 3 2 1 0
x x x x x x x x x x
33
36
39
42
45
48
51
54
57
60
63
66
69
72
75
78
X
Figura I: Polgono de frecuencias 2 Sobre el punto medio de cada intervalo sealamos la frecuencia, a la altura que corresponda del eje vertical de las ordenadas (que representa las frecuencias). Si unimos los puntos con lneas rectas, tenemos un polgono de frecuencias, si los unimos con un trazo curvo, tendremos una curva. En la tabla 3 y figura II hemos reducido el nmero de intervalos, agrupando las puntuaciones de 5 en 5 (i = 5). En este caso el intervalo ms bajo comienza con 35 (mltiplo de 5). Nos quedan 9 intervalos. i=5 X 75-79 || 70-74 |||||| 65-69 ||||| 60-64 ||||||||| 55-59 |||||||| 50-54 ||| 45-49 |||| 40-44 | 35-39 ||
Tabla 3
f 2 6 5 9 8 3 4 1 2
9 8 7 6 5 4 3 2 1 0 30
Figura II
x x x x x x x x
x x 35 40 45 5 0
55
60
65
70
75
80
85
Al reducir el nmero de intervalos el polgono queda simplificado y tiene menos picos; la figura queda suavizada y tender a parecerse ms a la distribucin normal. Es importante caer en la cuenta de que a menor nmero de intervalos se pierde informacin aunque se puede ganar en claridad. En la figura I hay dos picos centrales que sugieren una distribucin bimodal; y que han quedado reducidos a uno solo en la figura II. La figura queda ms clara y suavizada. El hacer esto o no hacerlo (reducir el nmero de intervalos, simplificar la informacin) depender del tipo de informacin que se
quiere dar. Para dar una impresin grfica general, y sin pretender mucho matiz, es preferible en principio reducir el nmero de intervalos.
100f N
En la tabla 4 y figura III tenemos un ejemplo de dos polgonos de frecuencias relativas de dos grupos con distinto nmero de sujetos. X i=6 75-79 69-74 63-68 57-62 51-56 45-50 39-44 grupo A grupo B f % f % 1 2 4 5 3 7 13 27 33 20
40% 35 % 30% Grupo A Grupo B
N = 15 Tabla 4
1 5 6 30 5 25 2 10 4 20 2 10 N = 20
35.5
42.5
47.5 53.5 59.5 65.5 71.5 77.5 Punto medio de cada intervalo
82.5
Figura III. Polgonos de frecuencias relativas de dos grupos con distinto nmero de sujetos.
El utilizar frecuencia relativas (tanto por ciento de sujetos en cada intervalo) permite hacer grficos comparativos cuando los grupos tienen un nmero distinto de sujetos (comparamos tantos por ciento, no nmeros absolutos).
2.3. Histograma
Otra representacin grfica sencilla y de frecuente uso es el histograma. En el histograma cada intervalo de frecuencias est representado por una barra. Cmo hacer un histograma puede verse fcilmente en la figura IV, donde aparece un histograma hecho a partir de los mismos datos de la tabla 3. En el eje de las abscisas (la base horizontal) se sealan los valores inferiores de cada intervalo. En el eje de ordenadas (eje vertical) se sealan las frecuencias o nmero de casos. En el histograma de la figura IV se ha superpuesto un polgono de frecuencias para facilitar la comparacin y ver las diferencias entre el histograma y el polgono de frecuencias.
9 8 7 6 5 4 3 2 1 0
Figura IV
30
35
40
45
50
55
60
65
70
75
85
25 %
Percentil 75 (Q3)
25 %
Mediana (Percentil 50)
25 %
Percentil 25 (Q1)
25 %
Puntuacin ms baja
Figura V
La figura V no es un diagrama de cajas, simplemente nos dice qu puntuaciones debemos calcular para hacer el diagrama. La mediana (o percentil 50) divide al grupo en dos mitades con idntico nmero de sujetos, entre el percentil 75 (o cuartil 3, Q3) y la puntuacin ms alta tenemos un 25 % de sujetos y entre el percentil 25 (o cuartil 2, Q2) y la puntuacin ms baja tenemos otro 25 %. Los percentiles y su clculo se entendern mejor al ver los distintos tipos de puntuaciones, pero el concepto de percentil (tanto por ciento de sujetos que caen debajo de una puntuacin) se capta con facilidad.
En los diagramas de cajas se visualiza el espacio que ocupa cada 25% del grupo en trminos de puntuaciones directas (columna de la izquierda). Estos diagramas de cajas son especialmente tiles para hacer una comparacin visual en dos tipos de situaciones: a) Cuando tenemos dos o ms grupos medidos en la misma variable; ste es probablemente el caso ms frecuente. En la figura VI tenemos el grfico que corresponde a tres grupos de alumnos universitarios (Psicologa, N = 65; Derecho, N = 65; Ingeniera N = 69) medidos con una escala de autoeficacia. La lnea que divide el recuadro corresponde a la mediana. De un golpe de vista vemos dnde estn las puntuaciones ms altas y ms bajas y encerrado en un recuadro dnde se sita el 50% central del grupo (entre los percentiles 75 y 25). La lnea doble dentro del recuadro indica dnde est la mediana, que divide al grupo en dos mitades iguales1.
Psic. 55 54 53 52 51 50 49 48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27
Derch.
Ing.
50%
Mediana
25%
Percentil 25
Puntaje ms bajo
Figura VI b) Cuando tenemos un mismo grupo medido en varias variables, como sucede en el ejemplo de la figura VII. Cada variable est medida por un idntico nmero de tems, por lo que son comparables las puntuaciones absolutas de cada subescala. En la figura VII tenemos el grfico correspondiente a un nico grupo de 283 sujetos que han respondido a un sencillo test que mide cinco variables propias del Anlisis Transaccional. Cada variable est medida por ocho tems con respuestas de 1 (nada) a 6 (mucho), por lo que las puntuaciones mxima y mnima posibles son 48 y 8.
1 Si el nmero de tems fuera distinto en cada subescala, a cada sujeto se le divide su total en cada subescala por el nmero de tems de la misma.
10
Padre Punitivo
48 47 46 45 44 43 42 41 40 39 38 37 36 35 34 33 32 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9
Padre Nutricio
Adulto
Nio Natural
Nio Adaptado
<
Figura VII De un golpe de vista vemos que en Padre Nutricio el 50% central est concentrado en unas pocas puntuaciones (aproximadamente entre 35 y 40) y que son adems las ms altas en trminos comparativos; vemos tambin que el lmite inferior del 50% central en Adulto coincide con el lmite superior del 50% central en Padre Punitivo (entre 28 y 29), etc.