Professional Documents
Culture Documents
CENTRO DE INVESTIGACION
DEPARTAMENTO DE MATEMATICA
EDUCATIVA
ESTADISTICA EN LA EXPERIMENTACION
EDUCATIVAS
Y EVALUACION
J. A. Riestra Vel
azquez
PROVISIONAL:
Segunda edicion 1985. Version preliminar.
Departamento de Matematica Educativa, CINVESTAV del IPN.
Revision Academica: C. Armando Cuevas V. y Gonzalo Zubieta B.
Impreso y hecho en Mexico.
Derechos reservados.
INDICE
ESTAD
ISTICA DESCRIPTIVA E INFERENCIAL
1. Medicion . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . . . .
100
105
109
. . . . . . . . . . .
115
121
Correlacion Lineal
. . . . . . . . . . . . . . . . . .
130
137
140
Ejercicios y problemas . . . . . . . . . . . . . . . . .
151
Concepto de confiabilidad . . . . . . . . . . . . . . .
153
156
. . . . . . .
161
Medici
on
CAPITULO 1:
MEDICION.
Medici
on
este sentido, que las variables fsicas tienen una naturaleza verdaderamente
numerica. Este no es ciertamente el caso para muchas variables sociales.
Para poner un ejemplo trivial, pensemos en la medicion del estado civil de
ciertos individuos. Aqu la medicion consiste, en realidad, en clasificar a los
individuos seg
un su estado civil: soltero, casado, viudo, divorciado, etc. Uno
podra, por supuesto, asignar claves numericas a las clasificaciones; digamos
1 a soltero, 2 a casado, 3 a viudo, etc. Del hecho de que 1 < 2 < 3,
no se sigue, claro esta, que soltero sea menor o inferior a casado, que este
u
ltimo sea menor o inferior a viudo, ni nada del estilo. En otras palabras,
estas claves numericas para las clasificaciones no hacen a la variable social
estado civil, una variable numerica.
En vez de hablar de variables verdaderamente numericas o aparentemente
numericas, se suele hablar, m
as tecnicamente, del nivel alcanzado en la medici
on o del nivel alcanzado en la escala de medicion. Dicho nivel se especifica
clasificando el tipo de escala de medicion; clasificacion que ahora veremos.
LA ESCALA NOMINAL.
Medici
on
los hostiles, existan diferencias entre dos maestros, la escala los considera
equivalentes. Esto tiene mucho sentido si uno desea estudiar en forma sistem
atica o estadstica las relaciones personales entre maestros y alumnos. Si se
va al extremo de considerar a cada maestro como un caso u
nico, el estudio
se vuelve probablemente imposible o, en todo caso, infructuoso. Aunque la
escala nominal se utiliza en condiciones pobres de medicion, puede resultar
verdaderamente u
til.
Consecuencia de la naturaleza particular de una escala nominal, es que solo es
admisible el empleo, para las variables por ella medidas, de estadsticos (que
veremos mas adelante) como frecuencia, moda, etc.; ya que estos u
ltimos no
se alteran por los nombres o smbolos empleados en la escala, siempre que
sean intercambiados de modo biunvoco.
Una escala ordinal es una escala clasificatoria como
la nominal, pero en ella se tienen ademas relaciones (jerarquicas) entre una
categora y otra del estilo: superior a, preferido a, mejor que, etc., las cuales,
se denotan con el smbolo > (el cual significa literalmente mayor que,
pero se emplea seg
un el contexto como superior a, preferido a, etc.).
LA ESCALA ORDINAL.
Medici
on
2, 4, 7, 9 dan la magnitud de cierta caracterstica de los objetos A, B, C, D
en una escala de intervalos, podemos decir que la diferencia entre A y B (de
esta caracterstica) es la misma que entre C y D. Tambien que la diferencia
entre B y C es 1.5 veces la diferencia entre A y B. En esta clase de medicion,
la relacion de cualesquiera dos intervalos es independiente de la unidad de
medida y del punto cero. En una escala de intervalos, la unidad y el punto
cero son arbitrarios (pero una vez elegida una unidad, esta es uniforme en
toda la escala).
Las temperaturas, por ejemplo, se miden en escalas de intervalos. Si se
comparan las escalas Celsius y Fahrenheit se vera que se transforman la una
en la otra por un cambio de origen (translacion) seguido (o precedido) por
un cambio de unidad (homotecia)
C=
5
(F 32)
9
F =
9
C + 32
5
LA ESCALA DE RAZON
Medici
on
CONTROL DE LECTURA
EVALUACION
1. Para cada uno de los siguientes ejemplos, especifique la escala de medicion correspondiente:
a) Lugar obtenido en una competencia deportiva.
. . . . .
b) Lugar de nacimiento.
. . . . .
. . . . .
Medici
on
5. En una escala de razon es posible intercambiar las categoras -3, 0, 3, 4,
6 por 0, 6, 12, 14, 18.
V
b)
excede en el atributo a
y que
c)
B
F
Medici
on
RESPUESTAS
1. a) ordinal
b) nominal
c) de razon
b) Falso.
c) Verdadero.
Agrupaci
on de datos. Distribuciones de frecuencia.
CAPITULO 2:
DE DATOS.
AGRUPACION
DISTRIBUCIONES DE FRECUENCIA.
Agrupaci
on de datos. Distribuciones de frecuencia.
31 alumnos; consistiendo de 10 reactivos del tipo verdadero-falso. El desempe
no de un alumno siendo juzgado por el n
umero de reactivos contestados
correctamente. El desempe
no de los 31 alumnos se describe en la siguiente
lista:
2
6
8
3
6
8
3
6
8
4
6
9
4
7
9
5
7
9
5
7
10
5
7
10
5
7
10
6
8
6
8
Frecuencia
Frecuencia
relativa
Frecuencia
acumulada
0
0
1
2
2
4
6
5
5
3
3
0
0
3
6.5
6.5
13
19
16
16
10
10
0
0
1
3
5
9
15
20
25
28
31
%
%
%
%
%
%
%
%
%
%
%
Frecuencia
acumulada
relativa
0
%
0
%
3
%
10
%
16
%
29
%
48
%
64.5 %
81
%
90
%
100
%
Distribuci
on de frecuencias de la variable:
n
umero de reactivos correctos
En la tabla, cada renglon corresponde a una categora de la variable en
cuestion. De hecho, las categoras estan constitudas por los valores posibles
de tal variable: 0, 1, 2, . . ., 9, 10. Con el termino FRECUENCIA se designa el
n
umero de datos que caen en una categora o clasificacion. As, en el sexto
renglon, que corresponde al valor 5 de la variable, la frecuencia (de ocurrencia
del valor 5) es 4, como puede verse en la lista, pues en ella el 5 aparece
en cuatro ocasiones. Con FRECUENCIA RELATIVA se designa la fraccion o
proporcion de los datos que caen en una categora dada. Tomando como
ejemplo de nuevo a la sexta categora (sexto renglon de la tabla), observamos
que de 31 datos el valor 5 aparece cuatro veces; luego, la frecuencia relativa
10
Agrupaci
on de datos. Distribuciones de frecuencia.
es 4/31 = 0.129 (aprox.) o sea el 12.9%, la cual hemos redondeado a 13% en
la tabla. La frecuencia relativa puede expresarse como un n
umero entre 0 y
1, o bien en por ciento. Con FRECUENCIA ACUMULADA se designa al n
umero
de datos que caen en la categora dada o en cualquiera de las anteriores. As,
tomando la sexta categora, la cual corresponde al valor 5, vemos que un total
de 0+0+1+2+2+4 = 9 datos caen en las categoras de la primera a la sexta
(vease la segunda columna de la tabla o la lista). Estrictamente hablando,
la frecuencia acumulada es, en el ejemplo anterior, el n
umero de datos que
son menores o iguales que 5. La FRECUENCIA ACUMULADA RELATIVA es la
proporcion de la frecuencia acumulada al total de los datos. Siguiendo con
nuestro ejemplo: 9/31 = 0.290 o sea el 29%.
Si hubiesemos hecho una tabla con solo las dos primeras columnas de la
tabla anterior, obtendramos una Distribucion de Frecuencias (a secas) de la
variable. Si formamos otra con la primera y tercera columnas, obtenemos
una Distribucion de Frecuencias Relativas. Si utilizamos solo la primera y la
cuarta columnas, obtenemos una Distribucion de Frecuencias Acumuladas,
etc.
Las distribuciones de frecuencias suelen representarse graficamente en forma
de histogramas, polgonos de frecuencia y polgonos de frecuencia acumula
da. Estos
se ilustran a continuacion para los datos de la pag. 10, seg
un la
tabulacion anterior.
El Histograma se forma del siguiente modo: En el eje horizontal se describen
las categoras. Con base en cada categora, se levantan rectangulos cuya
altura es igual a la frecuencia (relativa o no) correspondiente a la categora:
19%
f
r 16%
e
c
u 13%
e
n 10%
c
i 6.3%
a
3%
6
5
4
3
2
1
0
9 10
Histograma
El polgono de frecuencias se forma uniendo los puntos medios de las tapas
(o lados paralelos a las bases) de los rectangulos, de tal forma que el area
11
Agrupaci
on de datos. Distribuciones de frecuencia.
total de los rectangulos del histograma es igual al area bajo el polgono as
formado. Se notara que en los extremos se suponen rectangulos de altura
cero con igual base que los restantes. En nuestro ejemplo, el polgono de
frecuencia se obtiene teoricamente uniendo los puntos (0, 0), (1, 0), (2, 1),
(3, 2), (4, 2), (5, 4), . . ., (10, 3) y (11, 0) donde en cada pareja la primera
coordenada representa el valor central de la variable (en una categora dada),
y la segunda, la frecuencia correspondiente:
f
r
e
c
u
e
n
c
i
a
6
5
4
3
2
1
.......
..
.
..........
..............................
.
.
...
.
.
.
.. ...
.....
........
.
.
. ..
......
.........................
...
.
....
.
.....
........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...
....
.........
.........
.
.
.
.
...
...
.........
.......
.........
.
.
.
0 1 2 3 4 5 6 7 8 9 10 11
Polgono de frecuencia
Por u
ltimo, el polgono de frecuencia acumulada, se obtiene uniendo las parejas formadas por el valor del extremo superior (en cada categora) y la
frecuencia acumulada (relativa o no) correspondiente, en ese orden. En nuestro caso uniendo las parejas (1.5, 0), (2.5, 1), (3.5, 3), (4.5, 5), . . . , (9.5, 28) y
(10.5, 31) [o bien uniendo las parejas (1.5, 0%), (2.5, 3%), (3.5, 10%), . . . ] que
corresponden a la primera y cuarta columnas (resp. por la primera y quinta
columnas):
f
r
e
c
u 100% 31
..
...
......
e
.......
.......
.
.
.
.
.
.
.
n
........
.......
c
....
25
.....
.
.
.
.
75%
i
....
.....
.....
.
a
20
.....
.
.
.
.
..
.....
a
.....
....
50% 15
c
...
.
.
..
u
....
....
.....
m
.
.
.
.
.
9
.....
u
.....
25%
......
.......
.
.
.
.
.
.
.
.
.
l
5
...
..........
....
a
.........
.........
....................
....................
d
a
0 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5
Polgono de frecuencia acumulada
Comentamos finalmente que lo que hemos llamado categoras o clasificaciones, son llamadas clases. En nuestro ejemplo, cada clase estaba definida por
un u
nico valor de la variable y estaba denotada precisamente por ese valor
12
Agrupaci
on de datos. Distribuciones de frecuencia.
numerico. Estas clases constituyen la primera columna de la tabla de la pag.
10.
Veamos otro ejemplo. Un maestro de matematicas desea conocer la aptitud matematica de sus alumnos. Hablando tecnicamente, el desea medir la
(variable) aptitud matematica de sus estudiantes. Puesto que la variable
aptitud matematica resulta bastante vaga en su significacion, el maestro
la define operativamente como el puntaje en el test A. El test A ha sido
elaborado por el propio maestro para el fin deseado. Dicho test consiste en
70 reactivos y cada uno es calificado con 0 o 1; 0 por una respuesta incorrecta
y 1 por una respuesta correcta, al reactivo considerado. El puntaje en el test
A es computado sumando las calificaciones de los reactivos individuales, o lo
que es lo mismo, es el n
umero de reactivos contestados correctamente. Despues de que ha aplicado el test A a sus 21 alumnos, los 21 puntajes obtenidos
por ellos se enlistan abajo
62
60
60
59
58
57
57
56
55
55
54
53
52
51
50
50
48
47
40
37
32
30
37
44
51
58
36
43
50
57
64
Agrupaci
on de datos. Distribuciones de frecuencia.
clase. En nuestro ejemplo, la frecuencia de la primera clase (30 36) es 1,
pues solo el dato 32 pertenece a la clase.
A continuacion se expresa la distribucion, en forma de tabla:
Punto
medio
33
40
47
54
61
Clase
Frecuencia
(de puntajes)
30 36
37 43
44 50
51 57
58 64
totales:
1
2
4
9
5
21
Frecuencia
relativa
4.8 %
9.5 %
19.0 %
42.9 %
23.8 %
100.0 %
La u
nica columna nueva que aparece es la primera (la de PUNTOS MEDIOS).
Se entiende que el punto medio de la clase es el representante de la clase,
en el sentido de que se pueden suponer concentrados los datos en los puntos
medios (siempre que se trate de una distribucion de frecuencias, a secas, y
no de una distribucion acumulada).
Medici
on.
Otra clasificacion de las escalas numericas que va a resultar relevante posteriormente es:
n
continuas
escalas numericas
discretas
Continua. Entre dos marcas cualesquiera existe siempre una tercera. Si x e
y son dos tales marcas, digamos que se cumple que x < y, entonces existe
una marca c tal que x < c < y. Mas a
un, cualquier posicion intermedia entre
dos marcas es concebible: para pasar de una intensidad x a una mayor y se
pasa por todas las intensidades intermedias.
Discreta. En el caso infinito, se puede poner en correspondencia con el conjunto de los enteros positivos, de tal forma que la correspondencia es creciente
(o decreciente) en sentido estricto ya que, en particular, la correspondencia
es biunvoca (ademas de monotona). En el caso finito se puede poner en
correspondencia creciente o decreciente con un conjunto {1, . . . , N} para
alg
un N Z+ .
Por otro lado, tenemos que las restricciones propias de los aparatos de medici
on, dado su poder de resoluci
on, nos discretizan las escalas numericas. Por
ejemplo, supongamos que una cierta balanza puede precisar las mediciones
hasta decimos de gramo; as, las lecturas que se hicieran (en gramos) seran
de la forma N.d (N entero, d dgito).
14
51.3
98.3
82.3
60.0
31.9
24.3
40.1
66.3
60.4
34.3
7.5
9.6
14.3
18.6
66.0
42.5
8.4
46.6
16.1
26.5
88.2
12.9
10.0
63.6
18.5
Esta hip
otesis suele ser relajada. Esto es, ya sea la tecnica de este apartado, o bien,
los principios o ideas utilizados, se aplican, como tendremos oportunidad de verlo m
as
adelante, a variables discretas. Claro est
a, las ideas expuestas modelan mejor el caso
continuo, del que se fundamentan.
15
12.8
12.9
14.3
16.1
18.2
18.5
18.6
24.3
26.5
31.9
34.3
40.1
42.5
46.6
51.3
60.0
60.4
63.6
66.0
66.3
73.2
82.3
88.2
93.6
98.3
3o Calculamos m, el n
umero de datos posibles entre el mnimo y maximo
inclusives. (Para el ejemplo, m = 925; vease el calculo de m abajo)
m = #{5.9, 6.0, 6.1, . . . , 98.2, 98.3}
= #{59, 60, 61, . . . , 982, 983}
= #{1, 2, 3, . . . , 982, 983} #{1, 2, 3, . . . , 57, 58}
= 983 58
= 925.
16
m+N 1
N
m+N 1
N
si
+1
si
m+N 1
N
m+N 1
N
es impar
es par
m+N 1
N
928
4
929
5
930
6
931
7
932
8
= 232
233
= 185.8
185
= 155
155
= 133
133
= 116.5
117
11
17
..
..
..
..
ai
ai +
}|
..
..
..
..
ai+1
bi
y bi = a1 + (iT 1)
(i = 1, . . . , N)
= mn Sa + (m 1 + S)
pues NT = m + S
= mn + (m 1) + (S Sa )
= max + Sb
pues max = mn + (m 1)
Los puntos medios o marcas de clase que estamos denotando con ci , se
calculan (recuerde que T es impar), de acuerdo a la figura,
z ..
1
2 (T 1)
....
ai
marcas
}|
{
..
....
.
....
ci
z ..
1
2 (T 1)
....
marcas
}|
.
....
bi
b1 = a1 + (T 1)
ai+1 = ai + T
bi+1 = bi + T
1
c1 = a1 + (T 1)
2
ci+1 = ci + T
= 0.1
mn = 5.9
max = 98.3
clase
5.9
24.4
42.9
61.4
79.9
5.6
a1 = 5.6
S =6
Sa = 0.3 b1 = 18.8 18.9
32.2
Sb = 0.3 c1 = 15.1
45.5
58.8
72.1
(b7 = 98.6) 85.4
5.7
a1 = 5.7
S =5
21.2
Sa = 0.2 b1 = 21.1
36.7
Sb = 0.3 c1 = 13.4
52.2
67.7
(b6 = 98.6) 83.2
T = 185
S =0
Sa = 0
T = 18.5
(T 1) = 18.4 Sb = 0
1
(T 1) = 9.2
2
T = 133
T = 13.3
(T 1) = 13.2
1
2 (T 1) = 6.6
T = 155
T = 15.5
(T 1) = 15.4
1
2 (T 1) = 7.7
a1 = 5.9
b1 = 24.3
c1 = 15.1
(b5 = 98.3)
20
24.3
42.8
61.3
79.8
98.3
18.8
32.1
45.4
58.7
72.0
85.3
98.6
21.1
36.6
52.1
67.6
83.1
98.6
punto
medio frec.
13
15.1
5
33.6
52.1
4
70.6
4
89.1
4
12
12.2
3
25.5
38.8
3
2
52.1
5
65.4
78.7
2
92.0
3
12
13.4
4
28.9
4
44.4
5
59.9
2
75.4
3
90.9
..............
...................................
.......................
.......................
..
...
...
..
.....
..
....
...
...
..
...
..
...
...
...
..
...
..
...
...
..
...
...
.....
..
......................
..
...
...
..
....
...
...
...
..
..
...
...
....
..
....
..
..
..
...................
....
...
..
...
..
..
....
..................
....
...
..
...
...
..
.....
..
....
..
.
.......................
..
...
...
.
....
..
..
...
...
...
..
....
...
..
..
.
.......................
..
...
...
..
.....
..
....
...
...
..
...
..
...
...
...
..
...
..
...
...
..
...
...
.....
..
Poblaci
on de maestros
Poblaci
on de maestros
de la Universidad X
de la Universidad Y
22
x=
23
a+ x
99 =
10 + 99
1
, tenemos entonces que 10 x1 =
10 xi+1 se estima con 10+x
i
1
donde x1 = 10 10+x0 y como x0 = 10 entonces
x1 = 10
1
10+x0
de
1
199
1
= 10
=
= 9.95
10 + 10
20
20
1
1
= 10
= 9.949,
x1
10 + 9.95
...
etc.
59
57
55
52
50
40
60
58
56
54
51
48
37
60
57
55
53
50
47
32
..................
....................
..............
...................
..............
..............
...................................
........................
...........................
....................................
..........................
.
................................
..............
...................
...............
M
4
si
25
M
4
es entero;
M +3
4
21
En nuestro ejemplo M
andole obtenemos 6, por
4 = 4 = 5.25, estir
M +3
M +3
lo tanto N 6. Con 4 obtenemos 4 = 21+3
= 24
4
4 = 6
}|
dato m
aximo
30 31
33 34
32
60 61
62
clase
}|
...
........
.. ......
...
...
centro
(el centro de la clase es una marca inexistente)
El centro de la clase es el representante de la clase. Con T par, como
podemos ver en la figura, la clase va a ser representada por una marca que
no existe (i. e. el centro de la clase tiene una precision diferente, de hecho
mayor, a la de los datos). Esta es la razon fundamental por la que T debe
26
S = datos sobrantes
(S = NT m)
T = tama
no de la clase
m
)
(menor entero impar N
T
9
7
7
S
5
4
11
Como ya antes mencionamos, los sobrantes deben ser mnimos y de preferencia pares. Los valores de S que hemos obtenido son 4, 5 y 11 de los cuales 4
es el mnimo y es par por lo que nuestra eleccion claramente debe ser N = 5.
De esta manera los sobrantes pueden repartirse exactamente por exceso y
por defecto:
defecto
exceso
z }| {
z }| {
30 31
32
27
62
63 64
N =5
.......
........ T =7
.......
........
........
.......
........
N =5
.......
1
2
3
4
5
T =7
S0 = 4
30
31
37
44
51
58
38
45
52
59
32
39
46
53
60
33
40
47
54
61
34
41
48
55
62
35
42
49
56
36
43
50
57
63
64
1
2
3
4
5
clase
30 36
37 43
44 50
51 57
58 64
........................................................
...............................
.....................
.......................
..............................
.....................
.......................
...............................
.......................
......................
.............................
....................... .............................................
............................... ...............................
....................
...................................................... .................................. ..................................
............................. .............................. ..............................
...................... ...................... ......................
...................... ...................... ......................
............................... ............................... ...............................
..............................
.......................................................... ................................... ................................... ...................................
.............................. .............................. .............................. ..............................
.
. . . . . . . . .. .. . . . . . . . .. .. . . . . . . . .. .. . . . . . . . ..
......................................... .... . . . . . . . . .... .... . . . . . . . . .... .... . . . . . . . . .... .... . . . . . . . . ....
.. .
... ..
... ..
... ..
...
..
......
.
....
....
....
.
frecuencia
1
2
4
9
5
T
233
185
155
133
117
S
7
0
5
6
11
1o
3o
2o
3.0
5 mas bajos
}|
3.1
3.2
3.3
3.4
5 mas altos
}|
3.5
3.6
3.7
3.8
3.9
50 mas altos
z
}|
{
3.50, 3.51, 3.52, . . . , 3.98, 3.99,
29
= 1 + 6 104 + 9 108
= 1 + 0.0006 + 0.00000009
= 1. 00060009
| {z }
8 cifras significativas
Si la calculadora trunca, el resultado sera 1.0006000; si redondea, entonces el resultado sera 1.0006001.
Volviendo al ejemplo de las notas, en la tabla al final de la pagina 8 (de
este escrito), tenemos una columna para T : como se calculan estos valores?
m
, entonces (m = 925):
Veamos. T es el menor entero impar N
m/N
925/4 = 231.25
925/5 = 185.00
925/6 = 154.17
925/7 = 132.14
925/8 = 115.63
N
4
5
6
7
8
T
233
185
155
133
117
Ahora bien, debemos avanzar hacia la construccion de una Tabla de Frecuencias. En ella se especifican, ademas de la clase, los puntos medios
(marcas de clase), las frecuencias, las frecuencias relativas, las frecuencias
acumuladas y posiblemente las frecuencias acumuladas relativas. Tomemos
de nuevo los datos de la pagina 13 con las clases que ya habamos determinado
y veamos la siguiente tabla:
punto
frec.
clase medio frec. acum.
30 36
33
37 43
40
44 50
47
51 57
54
16
58 64
61
21
1
21
2
21
4
21
9
21
5
21
frecuencia
relativa
= 0.0476 = 4.76%
= 0.0952 = 9.52%
= 0.1905 = 19.05%
= 0.4285 = 42.85%
= 0.2381 = 23.81%
1
21
3
21
7
21
16
21
21
21
frec. acum.
relativa
= 0.0476 = 4.76%
= 0.1429 = 14.29%
= 0.3333 = 33.33%
= 0.7619 = 76.19%
= 1.0000 = 100.00%
[43.5, 50.5] 44 50
[50.5, 57.5] 51 57
[57.5, 64.5] 58 64
5
4
2
1
26
33
29.5
40
36.5
47
43.5
54
50.5
Histograma
31
61
57.5
64.5
68
.....
......
........
.
.
......
......
........
.
.
. ..
......
........
.
.
...
......
......
.......
.
.
.
.......
.......
...
.
.
.
...
.....
........
.
.
.
...
..
.....
........
.
.
.
.......
.......
.....
.......
.
.
.....
.........
......
............
.
.
.
.
.
.
.. .
.........
....... ..
..........
..........
.
.
.
.
.
.
..
...........
.....................
f
r
e
c
u 23.8%5
e
19% 4
n
c
i
a
9.5%2
4.8%1
26
33
40
47
54
61
68
Polgono de frecuencia
La siguiente figura es el Polgono de frecuencia acumulada al que corresponden los datos de la u
ltima columna de la tabla:
f
r
e
c
u 100%
e
n
c
75%
i
a
a
c
50%
u
m
u
25%
l
a
d
a
21
16
7
3
1
..
.
...
...
...
.
.
...
...
...
.
.
..
...
...
...
.
..
....
...
....
.
.
...
....
....
...
.
.
.
....
....
....
.....
.
.
.
.
.....
.....
.....
.....
.
.
.
.
.
.
........
.........
........
.........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..............
29.5
36.5
43.5
50.5
57.5
64.5
intervalos
reales
clase
punto frec.
medio acum.
[29.5 , 36.5] 30 36
33
[36.5 , 43.5] 37 43
40
[43.5 , 50.5] 44 50
47
[50.5 , 57.5] 51 57
54
16
[57.5 , 64.5] 58 64
61
21
1
21
3
21
7
21
16
21
21
21
frec. acum.
relativa
= 0.0476 = 4.76% hasta 36.5
= 0.1429 = 14.29% hasta 43.5
= 0.3333 = 33.33% hasta 50.5
= 0.7619 = 76.19% hasta 57.5
= 1.0000 = 100.00% hasta 64.5
33
La aptitud para la lectura al nivel del primer grado ha sido definida operativamente como el puntaje de un cierto test. Dos grupos han sido sometidos
a dicha prueba y sus puntajes se presentan abajo.
Grupo
62
60
60
59
58
57
57
56
55
55
54
53
52
51
Grupo
50
50
48
47
40
37
32
69
68
68
67
65
64
64
64
63
62
61
60
58
58
56
56
54
54
51
50
48
A,
B,
B,
B,
B,
la moda es B.
La moda puede no existir, por ejemplo, los datos A, B, C, R, no admiten moda.
Tambien puede aceptarse que no es u
nica; por ejemplo, para los datos
10,
9,
9,
8,
8,
8,
7,
7,
7,
6,
6,
C,
A,
A,
B,
B,
C,
B,
A,
B,
B,
B,
B,
B,
C,
B)
es
1,
2,
2,
2,
3,
3,
4,
5,
2, 2,
2,
3, 3,
4,
5, 5
Pero como tal dato no existe, se toma la semisuma de los dos datos medios
(a saber, el 2 y el 3):
1,
1, 2,
2, 2 | 3, 3, 4, 5, 5
2+3
= 2.5.
2
Si en el n
umero par de datos, estos no tienen un caracter numerico, se elige
cualesquiera de los dos puntos medios o se dice que esta entre ellos; por
ejemplo, para los datos
Mediana =
A,
A,
B,
B,
C,
C,
C,
C,
C,
A,
B,
y C).
Medida de tendencia
central apropiada
Nominal
Moda
Ordinal
Mediana, moda
Intervalo
Razon
38
Punto
medio
33
40
47
54
61
Clase
(de puntajes)
30 36
37 43
44 50
51 57
58 64
totales:
Frecuencia
1
2
4
9
5
21
Frecuencia
relativa
4.8 %
9.5 %
19.0 %
42.9 %
23.8 %
100.0 %
GRUPO B
Punto
medio
48
53
58
63
68
Clase
(de puntajes)
46 50
51 55
56 60
61 65
66 70
totales:
Frecuencia
2
3
5
7
4
21
Frecuencia
relativa
9.5
%
14.3
%
23.8
%
33.3
%
19.0
%
99.9 %
N
otese que las clases en el grupo A (y en el B) tienen el mismo n
umero de
puntajes (7 para todas las clases del A y 5 para todas las clases del B). La
frecuencia de clase es, por supuesto, el n
umero de puntajes que caen en la
clase dada. As, por ejemplo, hay dos puntajes de B comprendidos entre 46
y 50, esto es, en la clase 46 50; estos dos puntajes son a saber, 48 y 50,
como puede verse en la pagina 33. Los puntos medios de cada clase son los
centros de la clase. As, 48 es el centro de los puntajes comprendidos entre
46 y 50:
46, 47, 48 49, 50
....
...
.
.
.
.
....
|
.
....
|
...
.
.
....
.
....
|
...
....
|
...
.
....
.
.
....
|
...
....
|
...
.
....
.
.
...
|
.... P .....
.... ...
|
.......
2
......
... ...
.. ... ......
.
.
1
|
.. . ...
... ... .......
...
....
.
|
...
.
.
.
|
.
.
.
....
.
...
....
...
|
....
|
...
.
.
.
.
....
.
.
...
...
|
..
.
...
...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ...... ......... ...... ...... ....... ...... ...... ...... .....
5
...
|
....
...
...
.
.
....
..
|
.
.
...
..
...
...... ...... ...... ...... ...... ...... ...... .....
.
4
...
.
...
43.5
CLASE
CLASE MODAL
CLASE
44 50
51 . 57
58 64
..
.
...
.
...
.
..
..
...
.........
.......
.......
.
.
.
.
.
.
.
.....
.......
.......
L1
50.5
41
X
Moda
57.5
64.5
1
C
1 + 2
= 50.5 +
1
5
C = 50.5 +
7
1 + 2
5+4
35
54.39
9
Y para el grupo B:
L1 = 60.5
C
1 =
2 =
luego
B = L1 +
X
1
2
C = 60.5 +
5 = 60.5 + 2 = 62.5
1 + 2
2+3
Ejemplo 2. El sistema
Ejemplo 3. El sistema
2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9
tiene de moda 9.
no tiene moda.
tiene dos modas: 4 y 7,
y se llama bimodal.
Una distribuci
on que tiene una s
ola moda se llama unimodal.
En el caso de datos agrupados donde se ha construdo una curva de frecuencias para ajustar
los datos, la moda ser
a el valor (o valores) de X correspondientes al m
aximo (o m
aximos)
.
de la curva. Este valor de X se representa a veces por X
De una distribuci
on de frecuencias, o de un histograma, la moda puede sacarse de la
f
ormula
Moda=L1 +
1
1 +2
donde
L1
= Lmite
(9)
|
|
|
Fig. 3 - 4
|
|
|
Moda
X=
43
|
|
|
|
Sean X=L1 y X=U1 los lmites reales inferior y superior de la clase modal, y 1 y 2
representen, respectivamente, el exceso de frecuencia de la clase modal sobre las dos clases
contiguas a ella.
EP
De los tri
angulos semejantes PQR y PST se tiene RQ
Entonces:
2 (XL
1 )=1 (U1 X)
2 X
2 L1 =1 U1 1 X
PF
XL
1
ST o
1
U1 X
2 .
2 X+
1 X=1 U1 +2 L1
( + )L +1 C
= 1 2+1
=L1 +
1
2
1
1 +2
= P
3.1
X=
f1 + f2 + + fK
fi
44
Frecuencia
relativa
Frecuencia
relativa en %
Clase
Frecuencia
2
10
= 0.2
20%
3
10
= 0.3
30%
5
10
= 0.5
50%
totales:
10
10
10
= 1.0
100%
Utilizando a
un la formula 3.1 para las frecuencias relativas (entre 0 y 1):
P
fi Yi
(0.2)1 + (0.3)2 + (0.5)4
Y = P
= 2.8
=
fi
1
Clase
(de puntajes)
30 36
37 43
44 50
51 57
58 64
totales:
Frecuencia
1
2
4
9
5
21
Frecuencia
relativa
0.048
0.095
0.190
0.429
0.238
1.000
Frecuencia
relativa en %
4.8%
9.5%
19.0%
42.9%
23.8%
100.0%
i=1 fi Xi
= P
X
3.3
K
f
i
i=1
Para el grupo
tenemos
(exacto)
A
Comparese este resultado con el obtenido directamente en la pag. 37: X
52.05. El error es muy peque
no. Este se debe a que hemos supuesto, al
aplicar la formula 3.3, que los datos (puntajes para el grupo A) se encuentran
centrados en las marcas de clase, pero esto no es as en la realidad. Por
ejemplo, en la clase 30 36 la marca de clase es 33, la frecuencia de clase es
1 y corresponde al puntaje 32.
Si se hiciese un histograma de la distribucion de frecuencias de los puntajes
= 52 corresponde a la abscisa de
del grupo A, se encontrara que el valor X
la recta vertical que lo divide en dos, de tal forma que apoyandose a la figura
quedara en equilibrio (es decir, X
= 52 es la abscisa del centro de
en X,
gravedad de la figura):
46
29.5
30 36
36.5
37 43
43.5
44 50
50.5
51 57
6
= 52
X
57.5
58 64
64.5
(punto de equilibrio)
X
X1
X2
X3
..
............
...........................
......................................................................
.
.
.........
.
.
.
.
.
.
.
.
.
.
..........................................................................
..........................................................................
XN
47
area = area
6
= mediana
X
(1 + 2 + 4) 7 + fraccion de (9 7) =
es decir
49 + f 63 =
147
2
de donde
f=
147
2
49
126
As, debemos sumar, a partir del lmite inferior de la base del rectangulo, la
fraccion f de la base del mismo.
El lmite inferior real del rectangulo de altura 9 es 50.5 y como su base tiene
magnitud 7 tendremos
= 50.5 + f 7 = 50.5 + 49 7
X
= 50.5 + 2.72
= 53.2
126
La mediana tambien puede ilustrarse geometricamente en un polgono de
frecuencias acumuladas relativas (esto se vera mas adelante al considerar los
cuartiles, deciles y percentiles).
Nota: M. R. Spiegel (o los traductores) le llaman a los polgonos de frecuencias acumuladas relativas, ojivas percentuales.
48
AUTOEVALUACION
0,
2,
5,
8,
8,
9,
9,
(b) Moda
9,
13
encuentre:
(c) Mediana
0,
2,
7,
7,
9,
9,
)
)
)
)
Moda
Media
Frecuencia
Mediana
Escala de razon
B. Escala ordinal
C. Escala de intervalo
D. Escala nominal
A.
Frecuencia
1
3
8
9
5
4
2
5. Aparee:
A.
Mediana
B. Media
C. Moda
(
(
(
49
)
)
)
1. a) 7
b) 9
c) 8.
A
C
B
)
)
)
50
Medidas de dispersi
on.
CAPITULO 4:
MEDIDAS DE DISPERSION.
56
55
55
54
53
52
51
Grupo
50
50
48
47
40
37
32
69
68
68
67
65
64
64
64
63
62
61
60
58
58
56
56
54
54
51
50
48
Medidas de dispersi
on.
mediana, media) constituyen un valor promedio para la coleccion de los datos
(valores de una cierta variable) las medidas de dispersion constituyen un valor
promedio de que tanto se dispersan los datos de la coleccion.
La medida de dispersion mas conocida es, seguramente, la desviaci
on est
andar (o desviacion tpica). Esta medida de dispersion se utiliza asociada con la
media aritmetica y, por lo tanto, es aplicable a mediciones al nivel de escala
de intervalo o de razon.
Veamos primero la definicion de la desviacion estandar y luego comentaremos
por que es definida precisamente de esa manera.
Si la variable X asume los valores X1 , X2 , . . . , XN , la dispersi
on de tales valores, medida seg
un su desviaci
on est
andar
(denotada en este caso por SX ), est
a dada por
v
u
N
u1 X
t
2
(Xi X)
SX =
N i=1
=
donde X
X1 +X2 ++XN
N
(Xi X)
N
i=1
52
Medidas de dispersi
on.
Consideremos tal suma para ver que ocurre:
N
N
N
1 X
1 X
1 X
1 (N X)
=X
X
=0
(Xi X) =
Xi
X =X
N
N
N
N
i=1
i=1
..
i=1
N
1 X
=0
(Xi X)
N i=1
N
X
i=1
=0
(Xi X)
SX
v
u
N
u1 X
t
2
(Xi X)
=
N i=1
2 queda en
(esto es, si los Xi estan medidos, por ejemplo, en cm, (Xi X)
cm2 ; de aqu la necesidad al final de tomar raz cuadrada).
S
olo queda una cuestion pendiente. No haba necesidad estricta de tomar
2 para evitar el problema del signo (i. e. lo insensato de tener
(Xi X)
desviaciones negativas en este contexto de dispersi
on). Se pudo resolver
, con lo cual la
el problema de otra manera, por ejemplo tomando Xi X
siguiente expresion sera una buena medida promedio de las desviaciones:
N
1 X
Xi X
N i=1
De hecho, esta u
ltima medida de la dispersion recibe el nombre de desviaci
on
media.
53
Medidas de dispersi
on.
Veamos por que resulta mas adecuado utilizar la raz de la desviacion cuadr
atica media1.
Habamos dicho antes que medir desviaciones implicaba tener un origen respecto al cual se medan. Si tenemos datos como se muestra en la figura y se
miden sus desviaciones respecto a un punto A (que tambien se muestra), los
datos luciran mas desviados a medida que A se aleje de ellos:
.
.
.
.
.
.................................................................................................................................................................................................................................................................................................................................................................................................................
.
.
.
.
.
X1
X2
X3
X4
Esto es, cambiando el origen A cambia el valor de la dispersion de los datos (medida desde A), de tal forma que no existe un valor maximo para tal
dispersion (si A se aleja indefinidamente de X1 , X2 , . . . , el valor de la dispersi
on crece indefinidamente. Mdase esta u
ltima en terminos de la raz de la
desviacion cuadratica media o en terminos de la media de valores absolutos
de las desviaciones o de cualquier otra formula sensata).
M
as precisamente, si definimos una suerte de dispersion como la raz cuadrada de la desviacion cuadratica media con respecto a A:
v
u
N
u1 X
t
S(A) =
(Xi A)2
N
i=1
La dispersion depende del origen elegido desde el cual se midan las desviaciones, sean estas cuadraticas o no, de tal manera que no habra una cota (un
valor tope o maximo) para tales valores de la dispersion. Sin embargo, s hay
un tope inferior, esto es, un valor mnimo posible para tales dispersiones.
Podemos razonablemente pensar que el verdadero valor de la dispersion
es aquel que se mide con el mejor origen A posible, en el sentido de que
1
1
N
PN
i=1
2 es llamada desviaci
(Xi X)
on cuadr
atica media, pues es la media de las
desviaciones cuadr
aticas.
54
Medidas de dispersi
on.
este u
ltimo haga mnima a tal dispersion. Es decir, podemos pensar ilusoriamente que la dispersion es grande porque nuestro origen o punto de
referencia esta mal elegido (vease la siguiente figura).
X1
X3
.
.
.
.
.
.................................................................................................................................................................................................................................................................................................................................................................................................................
.
.
.
.
.
X2
X4
Los datos se ven muy dispersos si se juzgan con A como punto de referencia,
pues |Xi A| y (Xi A)2 resultan muy grandes en relacion con |Xi Xj | o
(Xi Xj )2 , i 6= j. Tal eleccion de A es muy artificial.
Ahora bien, mostraremos que el punto A, que hace mnima a S(A), es precisamente la media aritmetica. Esto es
v
u
N
u1 X
t
Mn
(Xi A)2 ,
ocurre cuando A = X.
N i=1
En efecto, el valor de A que hace mnimo a S(A) es el mismo que hace mnimo
2
a S(A) , pero
N
N
2
1 X
1 X
2
+ (X
A) 2
S(A) =
(Xi A) =
(Xi X)
N i=1
N i=1
N
1 X
2
2
=
(Xi X) + 2(Xi X)(X A) + (X A)
N
i=1
N
N
N
2
2
1 X
2 X
1 X
Xi X +
Xi X X A +
=
X A
N
N
N
i=1
i=1
i=1
N
N
X
1 X
2+ 2 X A
+ 1N X
A 2
=
Xi X
Xi X
N
N
N
i=1
i=1
N
X
i=1
= 0; luego, nuestra expresion se reduce a:
Xi X
N
2
1 X
2+ X
A 2
S(A) =
Xi X
N
i=1
55
Medidas de dispersi
on.
N
1 X
2 no depende de A, la expresion como funcion de
puesto que
Xi X
N
i=1
2
A sera mnima cuando Xi A sea mnima. Esta u
ltima expresion, por
adquirir solo valores positivos o el cero, sera mnima cuando A se elija igual
en cuyo caso:
a X,
N
2
1 X
2
Mn S(A)
=
Xi X
N i=1
B = 60.00
X
SA
(62 52.05)2 + + (32 52.05)2 =
=
= 58.14
21
21
..
SA
=
58.14
= 7.6
Mientras que
782
2 1
SB
(69 60)2 + + (48 60)2 =
=
= 37.24
21
21
..
SB
= 37.24
= 6.1
2
56
Medidas de dispersi
on.
Observamos que SB < SA , esto es, la dispersion del grupo B (seg
un la desviacion estandar) es menor que la del grupo A; luego, el grupo B es mas
homogeneo que el A. En resumen, si la escala de medicion que determinan
los puntajes del test estan al nivel de una escala de intervalo o superior,
entonces puede decirse que, en cuanto a aptitud, el grupo B es ligeramente
m
as homogeneo que el grupo A; luego, puede predecirse un desempe
no mas
homogeneo en tareas de lectura en el grupo B que en el A.
Cuando se tienen datos agrupados como los de la tabla del grupo A (pag. 37)
o del grupo B (pag. 38), la desviacion estandar se calcula como si los valores
de los datos fuesen los puntos medios o marcas de clase, repetidos tantas
veces como su frecuencia, tal como se hace para calcular la media. As, para
el grupo A tenemos
SA =
donde la media de los datos agrupados ya se haba calculado como 52 (exacto). Existen otras medidas de la dispersion, como veremos.
El rango se obtiene para una coleccion de datos restando del mayor
de ellos el menor:
RANGO.
0,
1,
2,
Coleccion 2: 3,
3,
3,
3,
3,
3,
Sin embargo, es claro que los datos de la coleccion 2 estan menos dispersos
que los de la coleccion 1.
57
Medidas de dispersi
on.
Percentiles, deciles, cuartiles.
La desviacion estandar es muy buena medida de la dispersi
on, cuando la
variable en cuestion se mide en una escala de intervalo. Esto es as por
varias razones. Baste por ahora observar que la desviacion estandar esta
naturalmente asociada a la media aritmetica y que, esta u
ltima solo puede
ser utilizada apropiadamente cuando la medicion se realiza al menos al nivel
de la escala de intervalo. Recuerdese, para insistir en este respecto, que la
media aritmetica representa el promedio o centro de los datos, en el sentido
de que apoyando una balanza en la media y poniendo una misma masa en
lugar de cada dato, se obtiene una situacion de equilibrio.
.
.
.
.
.
..............................................................................................................................................................................................................................................................................................................................................................................
.
.
.
.
..........
.................................................
.
.
.
...................................
......................................................
1
2
3
N
=0
M Xi X
Medidas de dispersi
on.
Cuando se realiza un test con cierto cuidado para medir una cierta variable en educacion (o en general en las ciencias de la conducta), cabe esperar,
que puntajes mas altos correspondan verdaderamente a valores mas altos
de la variable (p. ej. mayor puntaje corresponde a mayor inteligencia; mayor puntaje corresponde a mayor habilidad matematica. Entendiendo que
el test define operativamente a las variables inteligencia y habilidad matem
atica, respectivamente). En otras palabras, cabe esperar, si el test ha
sido cuidadosamente elaborado, que la escala de los puntajes constituya una
escala ordinal con respecto a la medicion de la variable en cuestion.
Nuestro asunto, en el presente captulo, es el de medidas de dispersion y estamos precisamente observando que las escalas que nos ata
nen son jerarquicas
u ordinales y que por tanto, no podemos medir la dispersion, con buen grado de confianza, con la desviacion estandar. Desafortunadamente, no existe
ninguna medida de dispersion (que los autores conozcan) tan perfectamente
adecuada o impecable, para escalas ordinales, como lo es la desviacion estandar para las de intervalo. Sin embargo, hay una serie de conceptos y medidas
de dispersion asociados a ellos, los cuales, utilizados con buen tino pueden
servirnos para la dispersion en escalas ordinales. Los conceptos a que nos
referimos son los de percentil, decil y cuartil.
Se recordara que la mediana era el valor (o medida de la variable) la cual
divida, en cuanto al orden, a la coleccion de datos en dos partes iguales: un
mismo n
umero de datos mayores que los menores que la mediana. Esta idea,
puede generalizarse. El percentil 20 (denotado P20 ) es aquel que divide a la
coleccion de datos en dos grupos de tal suerte, que el 20% de los datos caigan
por debajo de el y el restante 80% por encima. En este sentido, la mediana
es el percentil 50 (se designa con P50 ).
Este lenguaje es, por supuesto, solo aproximado. Cuando se tiene, por ejemplo, cinco datos: X1 , X2 , X3 , X4 , X5 puestos en orden
X1 < X2 < X3 < X4 < X5
la mediana es X3 . Estrictamente hablando, solo el 40% de los datos (X1 y
X2 ) son menores que la mediana y el 40% mayores. Lo que ocurre es que
X3 mismo se toma en cuenta: medio X3 se considera inferior a X3 y otro
medio X3 se considera superior a X3 . De este modo, 2.5 datos (el 50%) son
superiores a X3 y 2.5 (el otro 50%) son inferiores a X3 .
La utilizacion adecuada de los percentiles ocurre cuando se tiene una buena cantidad de datos, para la cual las aproximaciones sujetas a criterio se
vuelven menos significativas. Esto es especialmente cierto cuando se consideran datos agrupados (por ejemplo en distribuciones de frecuencia). Cuando
59
Medidas de dispersi
on.
se construye un polgono de frecuencias acumuladas relativas en por ciento, el percentil P35 , por ejemplo, es la abcisa cuya ordenada en el polgono
corresponde a 35%.
Los percentiles P1 , P2 , . . . , P99 dividen a los datos (al menos teoricamente)
en 100 partes iguales. De modo similar, los deciles los dividen en 10 partes
iguales. As, el primer decil D1 corresponde a P10 ; D2 a P20 , etc.
Los cuartiles Q1 , Q2 , Q3 dividen a los datos en cuatro partes iguales (siempre
con respecto al orden). As Q1 = P25 , Q2 = P50 = mediana, Q3 = P75 .
Ahora veremos como se pueden utilizar los percentiles para medir la dispersi
on. Habamos apuntado antes que las marcas 1, 2, 3, 4, 5 de una escala
ordinal podan ser cambiadas por las marcas 0, 3, 7, 11, 16 sin alterar esencialmente la escala. Mas precisamente, que las escalas ordinales son u
nicas
excepto por transformaciones monotonas. Conviene, sin embargo, para fines de medicion de la dispersion, nombrar las distintas marcas de la escala
(rangos), de la jerarquicamente menor a la mayor, con enteros consecutivos,
como 1, 2, 3, 4, . . ., etc. De este modo, un incremento en dos unidades, por
ejemplo, representa un ascenso de dos rangos o categoras.
Observemos que entre los cuartiles Q1 y Q3 (que corresponden a P25 y P75
respectivamente) se encuentran el 50% de los datos, con la mediana ocupando una posicion intermedia entre Q1 y Q3 . El llamado Rango semi
intercuartlico se define por
Q3 Q1
2
Este rango semi-intercuartlico es una medida de la desviacion de la mediana
del 50% central de los datos y puesto que este 50% es la mitad de los datos,
parece una buena medida de la dispersion de los mismos.
Rango semi-intercuartlico =
Debe, empero, utilizarsele con cuidado en las escalas ordinales. Para nuestro
muy trillado ejemplo de los grupos A y B, tenemos:
Grupo A:
21
= 5.25;
4
Q1 = 49.5,
Q3 = 57.25
Q3 Q1
57.25 49.5
7.75
=
=
=4
2
2
2
60
Medidas de dispersi
on.
Grupo B:
21
= 5.25;
4
Q01 = 55.5,
Q03 = 64.25
Q3 Q1
64.25 55.5
8.75
=
=
= 4.5
2
2
2
Los redondeos son debidos a que menos de media unidad representa un incremento o decremento de menos de medio rango, lo cual es poco significativo
(tal vez, un incremento o decremento de medio rango tampoco lo sea, de
hecho).
Aparentemente, la dispersion, seg
un esta medida, es mayor para los datos
del grupo B, pero solo ligeramente. Sin embargo, debe tomarse en cuenta
la posicion de los cuartiles: Q1 = 49.5, Q3 = 57.25, Q01 = 55.5, Q03 = 64.25.
Observese que los intervalos intercuartlicos comprenden puntajes que son
pr
acticamente ajenos y esto tiene mucha importancia, pues no hay una unidad uniforme de medida en una escala ordinal. El brinco de Q1 a Q3 de
aprox. 8 unidades, no se puede claramente comparar con el de Q01 a Q03 de
aprox. 9 unidades, pues son 8 y 9 unidades medidas en porciones distintas
de las escala:
Q1
55.5
Q3
64.25
49.5
Q01
57.25
Q03
.
.
.
...
...........................................................................................................................................................................................................................................................................................................................................................................................................................................
.
.
.
.
61
Medidas de dispersi
on.
Para el caso de los grupos A y B, puesto que el 10% de los datos quiere decir
10
on 1.5, 40 la
21 = 2.1 datos y como para el grupo A 37 ocupa la posici
posicion 2.5, etc., tenemos
P10 = 37 +
P90 = 60
2.1 1.5
(40 37) = 37 + 0.6(3) = 38.8
2.5 1.5
(60 ocupa las posiciones 21 2.5 y 21 1.5)
con lo que
P90 P10 = 60 38.8 = 21.2 .
Mientras que para el grupo B, 50 ocupa la posicion 1.5, 51 la posicion
2.5, etc. Luego
0
P10
= 50 +
2.1 1.5
(51 50) = 50.6 ,
2.5 1.5
0
P90
= 68
0
0
y P90
P10
= 17.4
De nuevo, aunque P90 P10 excede (no por mucho, en un 20% mas o menos)
0
0
a P90
P10
, el intervalo [P10 , P90 ] tiene, relativamente, poca interseccion con
0
0
[P10 , P90 ] por lo que no se concluyen diferencias en la dispersion y por ende,
en la homogeneidad.
Aunque en este caso no funciono, la recomendacion es probar, de ser necesario, con ambos rangos, el semi-intercuartlico y el rango entre percentliles
10 90. Si para uno de ellos, digamos el intercuartlico, el intervalo entre
el primer y tercer cuartil de un grupo esta contenido en el correspondiente
intervalo del otro grupo, la cuestion se decide facilmente: el intervalo mas
peque
no probablemente corresponde al grupo mas homogeneo o menos disperso.
62
NOCIONES DE PROBABILIDAD.
DISTRIBUCIONES TEORICAS.
Cuando realizamos un experimento cuyos resultados no pueden ser controlados a voluntad, o cuando no puede predecirse con seguridad, cual precisamente, entre los varios posibles (resultados), va a ocurrir, decimos que se
trata de un experimento de azar o aleatorio. Tal es el caso del lanzamiento
de una moneda en un volado; no es posible predecir cual sera la cara de
la moneda que quedara expuesta: aguila o sol. Este es, probablemente,
el ejemplo mas clasico de experimento de azar, seguramente porque resulta
did
acticamente adecuado. Este ejemplo, resultara especialmente u
til para
nuestros propositos, por lo cual, para economizar la escritura, denotaremos
al evento (o resultado) consistente en que la cara expuesta de la moneda sea
ASA
ASS
SSA
AAS
SAA
SAS
SSS
donde, por ejemplo, ASA denota la ocurrencia de aguila en el primer lanzamiento, de sol en el segundo y finalmente, de aguila en el tercero. El lector
habra notado que esta serie de tres lanzamientos es un experimento de azar.
No puede de antemano saberse cual de entre esos 8 posibles resultados va a
tener lugar.
Sup
ongase, siempre que se piense en lanzamientos, que la moneda en cuestion
es decente. Esto es, la moneda no esta deformada, ni esta cargada; no
tiene cara privilegiada.
Regresando a la serie de 3 lanzamientos, notemos que cada uno de los ocho
eventos enlistados es posible. Es posible tambien que al efectuar CINCO series
de 3 lanzamientos cada una, ocurra solamente el evento AAA; esto es, que
el evento AAA ocurra en cinco realizaciones del experimento consistente en
una serie de 3 lanzamientos. Nos preguntamos si el lector estara dispuesto a
hacer una apuesta con un amigo, en los siguientes terminos:
1. Cuando ocurra el evento
AAA,
64
(# total de intentos)
N2
veces cae
2 veces cae
segundo
lanzamiento
4 veces cae
N
4
A se obtiene AA
veces cae
S se obtiene AS
4 veces cae
A se obtiene SA
N
4
veces cae
S se obtiene SS
............
....................................
.......
....
....
.....
.
..
.........
...................
.
.....
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
......
........ .............
...
........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.................................
.
...... ..........
........
..............
......
.....................
1 ..................................
...........................
........
.......
.
.
.
.
.
........... ...............
.
........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.........................
........... .........
....
2.........
................
1
.....
.
.
.
.
......
...
......
......
.....
2
.
.
.
.
.
.
.
.
.
........... .............
..
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
...........
....
.........
.....
.....
............................................
.
.
.....
.
.
......
.....
....
......
.....
1 ........................
.....
.....
.....
....... ......
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2
.
.......
........
.
1 .......... . ............. .............. ...............
.
.
.
.
.
.
.
.
.
................................
............
.
.
.
.
.
.
.
.
.............
2 ................
............
......
....... ...............
..........................................
.........
......
.....
........................................
.........
..
.....
1 .....................................
.
......
....
2
.......
........
.
.
.
.
..............................
...........
AA
SA
inicio
AS
SS
65
X = n
umero de aguilas en una serie de 3 lanzamientos.
As, los posibles valores de X son 0, 1, 2 y 3. Note que la condicion X = 2,
por ejemplo, constituye el evento ocurrencia de 2 aguilas en tres lanzamientos. Note tambien que no todos los valores posibles de X tiene la misma
oportunidad.
X =0
X =1
X =2
X =3
SSS.
o SAS o SSA.
AAS o ASA o SAA.
ASS
AAA.
X
0
1
2
3
Total:
(probabilidad)
1
8
3
8
3
8
1
8
8
8
= 0.125
= 0.375
= 0.375
= 0.125
=1
66
1
8
0
X
0
1
2
3
(prob. acum.)
1
8
4
8
7
8
8
8
= 0.125
= 0.5
= 0.875
=1
En el primer renglon, la entrada 18 corresponde a la frecuencia teorica o probabilidad de que X 0. En el segundo renglon la probabilidad de que X 1.
67
= 0.125
= 0.500
= 0.875
= 1.000
Una variable como la descrita, la cual adquiere sus posibles valores con una
cierta probabilidad para cada uno, se llama variable aleatoria (discreta).
M
as precisamente, una variable, digamos X, la cual tiene valores posibles
X1 , X2 , X3 , . . . , XN , . . . , se dice ser una variable aleatoria discreta, si para cada uno de sus valores existe asignada una cierta probabilidad de adquirirlos. Esto es, existen n
umeros p1 , p2 , p3 , . . . , pN , . . . , que representan
las probabilidades de que X adquiera el valor X1 , X2 , X3 , . . . , XN , . . . ,
respectivamente, i.e.
Pr(X = Xi ) = pi
i = 1, 2, . . . , N, . . .
Pr(X = 0) =
donde
1 3 3 1
+ + + = 1.
8 8 8 8
Lo anterior describe, bajo el punto de vista matematico, a la variable aleatoria X. Esta asignacion de probabilidades constituye una distribucion de
frecuencias relativas teoricas o, como suele decirse, una distribucion de probabilidad, la cual en forma de tabla nos quedo
Pr(X=0) + Pr(X=1) + Pr(X=2) + Pr(X=3)
frecuencia
relativa te
orica
X
0
1
2
3
Total:
(probabilidad)
1
8
3
8
3
8
1
8
8
8
= 0.125
= 0.375
= 0.375
= 0.125
=1
La distribucion anterior constituye un caso particular de una familia de distribuciones de probabilidad englobadas bajo el nombre generico de distribucion
binomial. La palabra binomial que ah aparece no es un adorno; tiene
efectivamente que ver con el teorema del binomio.
Note por el momento que
(a + b)3 = 1 a3 + 3 a2 b + 3 ab2 + 1 b3
siendo los coeficientes (binomiales) 1, 3, 3, 1. Estos coeficientes coinciden
con los numeradores de la probabilidad asignada a X = 0, X = 1, etc., a
1 3 3 1
saber, , , y .
8 8 8 8
69
1 1
+
2 2
3
1
2
tendremos
1
1
1
1
=1
+3
+3
+1
8
8
8
8
Y
0
1
2
3
4
Total:
(probabilidad)
1
16
4
16
6
16
4
16
1
16
16
16
= 0.0625
= 0.25
= 0.375
= 0.25
= 0.0625
=1
S AAA
A S AA
AA S A
AAA S
A S SA
S SA S
S S AA
AS AS
SA S S
SA SA
AA S S
AS S S
S AA S
S S SA
SSSS
1 1
1=
+
2 2
4
4 3
2 2 3 4
1
1
1
1
1
1
1
1
=1
+4
+6
+4
+1
2
2
2
2
2
2
2
2
70
1 1
+
2 2
4
1
4
6
4
1
+
+
+
+
16 16 16 16 16
(a + b)
N N 0
N N 1 1
N N 2 2
N 0 N
=
a b +
a
b +
a
b + +
a b
0
1
2
N
N
X
N N k k
=
a
b
k
k=0
(a + b)
N
X
N
k=0
ak bN k
o sea
N
(a + b)
N N 0
N 2 N 2
N 1 N 1
N 0 N
a b
a b
+ +
a b
+
a b +
=
N
2
1
0
Es la u
ltima forma la queen realidad nos conviene. Se recordara que los
coeficientes binomiales, Nk , se definen como sigue:
N
N!
=
k
(N k)! k!
EF,
FE,
FF
Pr(X = 0) = Pr(ocurrencia de
Pr(X = 1) = Pr(ocurrencia de
FF)
= Pr(ocurrencia de
EF)
+ Pr(ocurrencia de
EE)
= p2
EF
FE)
= pq + qp = 2pq
Pr(X = 2) = Pr(ocurrencia de
Note que X = 1 tiene lugar ya sea que ocurra EF o bien FE; pensando en
la probabilidad como frecuencia es claro que la frecuencia con la cual ocurre
cualquiera de los dos, EF o FE, debe ser la suma de las frecuencias individuales
de EF y FE.
72
Probabilidad
frecuencia
relativa te
orica
q2
2pq
p2
Total: p2 + 2pq + q 2
Note que p2 + 2pq + q 2 = (p + q)2 = 12 = 1. Como debe de ser, la suma de
las frecuencias relativas de todas las posibilidades es igual a 1. Asimismo, se
aprecia la aparicion de la formula del binomio:
1 = (p + q)2 = 1 p0 q 2 + 2 p1 q 1 + 1 p2 q 0
2 0 20
2 1 21
2 2 22
=
p q
+
p q
+
p q
0
1
2
(recuerde que por convencion 0! = 1).
N
otase pues que
2 0 20
Pr(X = 0) =
p q
= q2
0
2 1 21
Pr(X = 1) =
p q
= 2pq
1
2 2 22
Pr(X = 2) =
p q
= p2
2
etc.
En general pues:
N k N k
Pr(X = k) =
p q
k
73
N
X
N!
pk q N k
(N k)!k!
N (N 1)!
ppk1 q N k
(N k)!k(k 1)!
k=1
N
X
k=1
kN X
(N 1)!
p
pk1 q N k
k
(N k)!(k 1)!
k=1
= Np
N
X
k=1
(N 1)!
pk1 q (N 1)(k1)
(N 1) (k 1) !(k 1)!
1)
(k)
!(k)!
k=0
N
1
X
(N 1)!
pk q N 1k
(N 1 k)!(k)!
k=0
N
1
X
N 1 k N 1k
= Np
p q
k
= Np
k=0
= Np(p + q)N 1
y como p + q = 1:
= Np
X
74
(N g)
en estas u
ltimas preguntas debido al azar (en un intento, la probabilidad
de aciertos al azar es S1 pues se tienen S opciones). As, el alumno tendra
aparentemente
N g
g+
aciertos
S
esto es C = g +
N g
S .
Despejando g:
C =g+
N g
S
SC = Sg + N g
Sg g = SC N
g(S 1) = SC N
por lo tanto:
g=
SC N
S1
SC N
SC C N + C
(S 1)C (N C)
N C
=
=
=C
S1
S1
S1
S1
es decir
g=C
Ahora traduciremos el resultado:
N C
S1
C = n
umero aparente de aciertos (respuestas correctas)
N C = n
umero aparente de respuestas incorrectas
As probablemente (i.e. a la larga)
n
umero real de aciertos = respuestas correctas
76
respuestas incorrectas
opciones 1
N
X
i=1
pi (Xi X )2
Desviacion Estandar = X =
2
X
v
uN
uX
pi (Xi X )2
=t
i=1
2
La notacion X para la media va acompa
nada de la notacion X
para la
varianza, y X para la desviacion estandar.
Junto con la notacion E(X) para la media se utiliza la notacion E (X X )2
2
para la varianza. Puesto que en estadstica son mas frecuentes X , X
y
X nosotros las preferiremos.
77
N
X
i=0
N
X
N !i
pi q N i i (Np)2
(N i)!i!
Np
i=0
= Np
(N 1)!
pi1 q N 1(i1)i (Np)2
[N 1 (i 1)]!(i 1)!
N
X1
i1=0
= Np
N
X1
i=0
N1
X
= Np
i=0
(N 1)!
p(i1) q (N1)(i1) [(i1)+1](Np)2
[N 1(i1)]!(i1)!
(N 1)!
pi q (N 1)i(i+1)(Np)2
[(N 1) i] ! i !
(N 1)!
[(N 1)i]!i!
i (N 1)i
pq
i+ N p
i=0
N1
X
N
1
X
i=0
(N 1)!
[(N 1)i]!i!
pi q (N1)i (N p)2
(N 1)!
pi q (N 1)ii
[(N 1) i]!i!
2
X
= Np[(N 1)p] + Np(p + q)N 1 (Np)2
= Np[Np p] + Np (Np)2
= Np[Np p + 1 Np]
= Np(1 p)
= Npq
es decir:
2
X
= Npq
78
X =
Npq
DISTRIBUCIONES CONTINUAS.
NORMAL.
DISTRIBUCION
14 16,
17 19,
20 22
frecuencia
11 13
14 16
17 19
20 22
3
12
Total:
79
3......
2......
1......
..
.
10
..
.
11
12
..
.
13 14
..
.
15
18
16 17
..
.
19
20
21
22
figura 6.1
se trata de una distribucion uniforme.
Supongamos ahora que artificialmente tomamos clases de tama
nos diferentes,
digamos las clases:
11 13,
14 16,
17 22
frecuencia
11 13
14 16
17 22
6
12
Total:
Si convertimos la u
ltima tabla literalmente en un histograma, obtenemos:
frec.
6 ......
5 ......
4 ......
3 ......
2 ......
1 ......
....
10
....
11
12
....
13 14
15
16 17
....
....
....
....
18
19
20
21
22
figura 6.2
Observando al histograma as obtenido, la figura nos sugiere que los datos
del intervalo 17 22 (de hecho 16.5 22.5) son m
as frecuentes, lo cual es
literalmente cierto. Pero nos sugiere, desafortunadamente, algo mas: que los
datos estan concentrados en ese rango de valores. Mas precisamente, que
la manera en que los datos se distribuyen en el rango total 11 22 no es
80
3......
2......
1......
...
10
...
11
12
...
13 14
15
16 17
...
...
...
...
18
19
20
21
22
figura 6.3
Este u
ltimo histograma s sugiere la misma idea que el de la figura 6.1 (como
debe de ser, pues se trata de los mismos datos.)
81
frecuencia
tama
no de la clase
38.75
40.25
41.75
43.25
44.75
46.25
47.75
49.25
50.75
52.25
punto medio
de la clase
38.0
39.5
41.0
42.5
44.0
45.5
47.0
48.5
50.0
51.5
total:
84
Frecuencia
1
2
5
9
13
8
11
6
2
3
60
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
figura 6.4
Observese que, como el tama
no de clase es 1.5 (i.e. las bases de los rectangulos
miden 1.5), en este caso las
areas no son iguales a las frecuencias, sino que
area = 1.5 frecuencia (el area es proporcional a la frecuencia, con constante
.
..
.... ....
.
.
...
.
.
. .
.. .............. ....
.. ........ ..
................
............................................
.............
.......... ..
....................
.
.
.
.
... ...... ...
.
..
.
......................................................................................................... .....
.. ..............
. ..... .
.............................................................
.. .....................
.
.
.
.
.
.
......... ......
38
figura 6.5
52
.
.
....
.
.
...
.
.
.
.....
.
.
...
.
.
..
.......
...
.
.
...... ....
...
.
. ............
.
...
.
..
...
.
.
...
...
.
...
.
...
...
.
.
...
.
.
..
...
.
.
...
..
.
.
...
..
.
.
...
.
.
.
.
...
.
.
.
.
...
..
.
.
.
...
..
.
.
...
.
.
..
.
...
.
.......................
.
.
.
.
....
.
....
....
.
.
.
.....
...
...
...
.
.
.
.
......
...
..
...
.
.
.
.
.
.
.
.
.
.
.
...
..............
...
.
.
.
.
.
...
..
.
.
.
.
.
.
...
...
.
.
.
.
.
.
.
...
..
.
.
.
.
.
.
.
.
.
...
....
.
.
.
.
.
.
.
.
.
.
.
...
..............
.
42
46
area sombreada
1.5
6.1
frecuencia
y area total = 1.5 60 ; luego, de 6.1:
60
area sombreada
area total
6.2
..........................
......... ...........
....... .........
...... ............
.
.
.
.
.......
.....
......
...
......
......
....
...
......
.
......
.
.
.
......
.
.
.
......
.
.
.
......
.
.
......
.
.
.
......
.
.
......
.
.
.
......
.
.
.......
.
.......
........
...........
.........
b
figura 6.7
87
area sombreada
area total
La distribucion de las figuras 6.5 y 6.6 es una distribucion continua emprica, en el sentido de que ha sido obtenida por medio de datos empricos y
s
olo constituye una aproximacion a la verdadera distribucion continua de la
variable.
Una manera de evitar el denominador en la formula anterior consiste en
modificar la escala en el eje vertical (eje de los ordenadas) de tal forma que el
area total resulte igual a 1. De este modo, la frecuencia relativa en cuestion
a
figura 6.8
Este hecho puede producir a primera vista desconcierto: C
omo es posible
que la frecuencia relativa con la cual X toma el valor a pueda ser igual a
cero? Quiere esto decir que la igualdad X = a no ocurre nunca? Pero si
esto u
ltimo fuese cierto, eso que se dice del valor a se puede decir de cualquier
otro valor, luego la variable X no asumira valor alguno del todo.
Definitivamente esta frecuencia relativa cero no quiere decir que el valor a
no ocurre nunca, aunque no es tan facil explicarlo. Tratemos de verlo.
88
b
figura 6.9
............................................
........
........
......
.......
......
......
.
.
.
......
..
.
.
......
.
.
.
......
.
.
.
......
.
.
.
.
......
.
.
.
......
..
.
.
......
.
.
......
.
.
.
......
.
.
.
......
.
.
......
.
.
.
......
.
.
.......
...
.......
.......
f(x)
.
.......................
.
figura 6.10
De este modo se especifica, para cada valor de X, genericamente x, la densidad de frecuencia relativa con el n
umero f(x). Aunque la frecuencia relativa
asignada a X sea cero, la densidad tiene el valor f(x), el cual no tiene que
ser cero; esto es semejante a la densidad de masa que en general no es cero
para los puntos de un solido, aunque la masa asignada a cada punto es cero,
por fuerza. Desafortunadamente, no encuentro espacio suficiente para llevar
m
as adelante esta interesante comparacion.
Del mismo modo que se establecio un smil entre las distribuciones de frecuencia empricas y las distribuciones teoricas o probalilsticas discretas, cambiando la frecuencia relativa por probabilidad (como frecuencia relativa teorica
o esperada), se establece en el caso continuo entre las distribuciones empricas de una variable continua y las distribuciones de probabilididad de una
variable continua.
Una variable aleatoria continua, es una variable que asume valores en un
intervalo real (un segmento o la totalidad de la recta real) y la cual tiene
asignada una densidad de probabilidad (i.e. una densidad de frecuencias
relativas teoricas) dada por una funcion y = f(x). En la figura 6.11 se
ilustra una curva dada por y = f(x) [densidad de probabilidad]:
90
y = f(x)
.....
............... ..................
........ .........
...... .............
.
.
.
.
.......
.
......
.....
...
......
......
....
......
...
.
.
......
..
.
.
......
..
.
......
.
.
......
.
.
.
......
.
.
.
......
.
......
..
.
......
.
.
.
.......
..
.......
......
.
.......................
.
figura 6.11
Se entiende que la probabilidad de que la variable X adquiera un valor entre
a y b esta dada por el area sombreada (ver figura 6.11), y que el area total
bajo la curva es la unidad. Con Pr(a X b) se denota la probabilidad de
que X se encuentre entre a y b.
Recordando el significado de la integral definida tenemos
Pr(a X b) =
Zb
f(x)dx
< x <
Z(x)dx = 1.
91
Distribuci
on normal.
CAPITULO 7:
NORMAL.
DISTRIBUCION
......
.
.
..
.
.. ...
.
. ..
.
. ....
.
.
.
..
.
. ..
.
... .....
.
.
.
.
...
.
.
.
...
.
.
.
..
...
..
..
....
....
.
.
.
.
....
..
.
.
.
.
.
.
...
.
.
.
.
.
.
....
.
.
.
.
.
.
.....
.
.
.
.
.
..
.
.
.....
.
.
.
.
..
.
......
.
.
.
.
.
.
.
.
.......
..
.
.
.
.
.
.
.
.
.
.
........
...
.
.
.
.
.
...........
.
.
.
...
.
.
.
.
.
.
.
.
...............................
.
.
.
.
.
.
.
.
.
.
.
.
........................
.....
.
.
-1
figura 7.1
Hay una lista de propiedades que conviene conocer de la grafica de y = z(x):
1) y = z(x) es simetrica respecto al eje Y ; esto es claro pues z(x) = z(x).
2) y = z(x) tiene dos puntos de inflexion en x = 1.
Tenemos
x2
x
y 0 = e 2 ;
2
y 00 =
(x2 1) x2
e 2 ;
2
y 000 =
x(x2 3) x2
e 2
2
Distribuci
on normal.
Se entiende que Pr(a Z b) denota la probabilidad de que la variable Z
tome un valor entre a y b. Tenemos
Z b
x2
1
e 2
Pr(a Z b) =
2
a
Valores de las areas bajo y = z(x) generalmente vienen tabulados en los
textos de estadstica. Sin embargo, casi nunca se encuentran areas entre dos
puntos dados y es necesario efectuar algunas operaciones (a proposito, no
x2
puede integrarse e 2 por los metodos ordinarios; se integra en forma aproximada siempre, pues no hay formula elemental para la integral indefinida
de y = z(x)).
Algunas relaciones que pueden auxiliar el uso de las tablas:
Z 0
Z
1
I. Por simetra:
z(x)dx =
z(x)dx = (haga un dibujo marcando
2
0
las areas correspondientes).
II. Si a > 0, se tienen
Z
1
z(x)dx = +
2
1
z(x)dx =
2
Z
Z
z(x)dx
0
a
z(x)dx
0
EJEMPLO.
0
figura 7.2
94
Distribuci
on normal.
Si se requiere calcular la Pr(3 Z 1) y la tabla solo da
areas como las de la figura 7.3, con a > 0, diga como resolvera la situacion.
EJERCICIO.
.......
........ ............
.....
.....
....
....
...
...
.
.
.
...
.
.
...
.
.
.
...
.
.
.
...
.
...
...
.
.
.
.
.........
..
.
... .....
.
.
.
.
.. .. ......
.
.
.
.. .. .. ......
..
.
... . . . .....
.
.
.
.
.
.. .. .. .. .. .......
..
.
.
.
.. .. .. .. .. .. .........
..
.
.
.
... . . . . . . . ......
.
...
.
.
.
.
.. .. .. .. .. .. .. .. .. ..........
..
.
.
.
.
.
.. .. .. .. .. .. .. .. .. .. .. .............
..
.
.
.
.
.
.
.
.
... . . . . . . . . . . . . . ..................
.
..............
.
..............................................................................................................................................................................................................................................................
figura 7.3
Veamos ahora que la media de esta distribucion es cero y su desviacion estandar es la unidad. Para empezar, debemos definir lo que significa la media de
una distribucion continua. Se recordara que si una variable discreta asuma
los valores X1 , . . . , XN con probabilidades p1 , . . . , pN tenamos
X = media de X = p1 X1 + + pN XN =
2
X
= varianza de X =
N
X
i=1
pi Xi X
X = desviacion estandar =
N
X
pi Xi
i=1
2
v
uN
uX
2
2
X = t
pi Xi X
i=1
xf(x)dx
A
Distribuci
on normal.
Es posible que A sea o que B sea . Ambas ocurren para la distribucion
normal. Para la distribucion normal tpica tenemos entonces
Z
Z
x2
1
xe 2 dx
Z =
x z(x)dx =
2
2
Z
Z
X
x2
2
Z
Z2 =
X Z z(x)dx =
e 2 dx
2
x2
2
1+
x2
2 .
Distribuci
on normal.
Es necesario saber tambien que ex = e1x lo cual es consecuencia de que
ea+b = ea eb . Esta u
ltima relacion puede probarse como sigue:
Sea g(x) =
ea+x
; as, g(0) = ea ; ademas
ex
d x
d a+x
e
ea+x dx
e
ex dx
ex ea+x ea+xex
g (x) =
=
=0
2
2
ex
ex
0
1
ex
Encontremos ahora Z y Z :
Z
1
1 x2
Z =
x e 2 dx =
2
2
Como
Z
xe
xe
x2
2
x2
2
dx =
x
d
2
(e
dx
dx = lm
a
b+
)dx = e
xe
x2
2
x2
2
xe
dx.
, entonces:
dx = lm e
b2
2
x2
2
+ lm
a2
2
Por lo tanto
Z
xe
x2
2
dx = lm e
b2
2
pero
a)
0e
x2
2
e)
x2
2
d)
+ lm
a2
2
1
2
=
x2
2 + x2
1+ 2
b2
2
por lo tanto
lm e
= lm
97
a2
2
=0
7.1
Distribuci
on normal.
y nos queda:
Z
xe
x2
2
(1)
dx = 0 + 0 = 0
entonces
Z = 0
b+
x2
2
dx (con lo que v = e
x2
2
b Z
b Z
b
b
x2
x2
1
1
e 2 dx
lm uv
vdu = lm xe 2 +
a
a
2
2
a
a
b+
b+
a2
b2
1
1
=
lm ae 2
lm be 2 + lm
a
2 a
2 b+
b+
pero
lm
ae
a2
2
= lm
b+
be
b2
2
1
=
2
x e
x2
2
dx =
=0
x2
1
e 2 dx
2
7.2
1 x2
e 2 dx
2
y, por lo tanto
98
Z = 1
Distribuci
on normal.
Recordemos que
a) ex > 0 para todo n
umero real x.
d x
0
x
b) e = 1 y dx e = e .
c) f(x) = ex es estrictamente creciente.
d) ex 1 + x se cumple para todo x y en particular, e
e) ea+b = ea eb ; en particular, ex = e1x .
As, para la expresion
ke
k2
2
x2
2
1+
x2
2 .
i) k > 0.
a)
0
ke
e)
=
k2
2
d)
k
e
k2
2
2
k
k
=
2
1 + k2
2
k2
+1
luego, si k
0 lm ke
k2
2
2
k
lm
k 22
k
+1
0
= 0
0+1
es decir
0 lm ke
k2
2
lm ke
k2
2
= 0
ii) k < 0
a)
0
ke
e)
=
k2
2
d)
k
e
k2
2
k
=
2
1 + k2
2
k
2
k2
+1
luego, si k
0
lm ke
k2
2
2
k
lm
k 22
k
+1
0
= 0
0+1
es decir
0
lm ke
k2
2
lm ke
k2
2
lm ke
k2
2
= 0
k2
2
= 0
<x<
es la distribucion normal tipificada. Aclaremos ahora el termino tipificada o tipificar; a proposito, el tipificar una variable tiene aplicaciones en
evaluacion del aprendizaje, como veremos.
Sea X una variable aleatoria para la cual se tiene una distribuci
on (emprica
o te
orica) discreta. Digamos que asume los valores X1 , . . . , XN (puede
tratarse de valores exactos o puntos medios de clase, seg
un sea teorica o
emprica la distribucion) con probabilidades (o frecuencia relativas empricas)
p1 , . . . , pN respectivamente. Tenemos entonces que
v
uN
N
uX
X
2
=
pi Xi X
X
pi Xi
y
SX = t
i=1
i=1
XX
SX
XN X
X1 X
, ... ,
SX
SX
con probabilidades (o frecuencias relativas) p1 , . . . , pN respectivamente.
As, tenemos que
Z =
N
X
i=1
pi Zi =
N
X
i=1
100
pi
Xi X
SX
Z =
pi Xi X
pi Xi pi X
SX i=1
SX i=1
"N
#
N
X
1 X
=
pi Xi
pi X
SX
i=1
i=1
"N
#
N
X
1 X
=
pi Xi X
pi
SX
i=1
pero
N
X
N
X
y por fuerza
pi Xi = X
i=1
pi = 1 ; luego
i=1
1
1 =0
X X
Z =
SX
Por otra parte, por definicion
SZ2
N
X
i=1
es decir
N
X
i=1
entonces
SZ2
i=1
pi Zi2
N
X
i=1
pi
Xi X
SX
2
pi Zi Z
= 0.
Z
2
y como Z = 0 ,
N
1 X
2 = 1 S2 = 1
pi Xi X
2
2 X
SX i=1
SX
es decir
SZ2 = 1
SZ = 1.
X
clases de uno al otro de acuerdo a la formula X
de la tipificacion.
SX
1
X i X
SX
101
en qumica: ZQ =
en matematicas: ZM
102
Juan
Pedro
Juan
Pedro
40
63
40
34
0.11
19
23
17
37
45
41
148
155
examen
SX
42
18
34
3
4
sumas:
1.00
1.17
0.00
0.50 0.25
2.00
1.00
3.39
1.92
AX B
es equivalente a
103
A
X
B
B
A
Pr(A X B) = Pr
Z
.
a su vez equivalente a
Por definicion:
Pr
A
B
Z
A
t=
t=
t2
1
e 2 dt ;
2
, tenemos que dt =
corresponde a x = B
1
dx ;
ademas
corresponde a x = A ,
Pr(A X B) =
(
1
e
2
x 2
dx
x 2
dx
7.3
Ejercicios.
1. Muestre, haciendo un cambio de variable, que
Z
Z, (x)dx = 1
(suponga que
Z(x)dx = 1).
Distribuci
on normal acumulada.
La relacion dada en 7.3 y el ejercicio 2 muestran que la familia de distribuciones normales esta dada por dos parametros: y . Es decir, los valores
de la media y la desviacion , determinan a la distribucion normal; equivalentemente, hay una y solo una distribucion normal con media y desviacion
est
andar dadas y su distribucion esta dada por la formula 7.3. Mas a
un, si
X es variable aleatoria Normal con media y desviacion estandar , se tiene
la relacion
B
A
Pr(A X B) = Pr
Z
7.4
0.4772
+
0.3413
=
=
0.8185
Distribuci
on normal acumulada.
Se recordara, cuando se vieron distribuciones de frecuencia, la distribucion
de frecuencias acumuladas. Se define en forma similar una distribucion continua acumulada: Si X es una variable aleatoria continua con densidad de
105
Distribuci
on normal acumulada.
probabilidad y = f(x), entonces su distribucion acumulada esta dada por
y = F (x) donde
Z x
F (x) =
f(t)dt
A
z(t)dt =
1
t2
e 2 dt
2
7.5
y = z(x)
x
area sombreada = P (x)
figura 7.4
O Funci
on de Distribuci
on Acumulada.
106
Distribuci
on normal acumulada.
..
...
..
...
.............................................................................
...
................................................
.........................
..
..............
..
...........
.
.
.
.
.
.
.
...
.
.
........
..
....... ..............
..
....... .
...
...... ...
.
.
.
.
..
.
..
.....
..
.....
..
...
......
..
..
......
.
.
.
.
..
x
..
.
.
...
.
...
.
..
.
.
.
..
.
.
1 .. ......
.
. .....
.
.
.
2..........
............. .....................................................
... ..............
..
.. .
x
x
..... ..
..
...
..... ....
.
.
..
..
.
.
..
.
.
.
.
.
.
..
.
..
.....
....
.....
..
..
..
.....
x ..
...
..
......
.
..
.
.
.
.
.
.
.
.
.
..
...
.
.
.
.
....
.. ...........
..
..
..
...........................
...
.
.
.
.
.
.
.
.
.
.
..
..... ..
....
........
.
.
.
.
.
.
...
.
.
.
.
.
....
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..
...
.
...
.........................
..............................................................................................................................................................................................................................................................................................................................................................................................................................................
..
...
.
y = P (x)
figura 7.5
Una de las ventajas de y = P (x) sobre y = z(x) es que la primera (la version
acumulada) establece una correspondencia biunvoca entre los valores de la
variable y los valores de la funcion, en este caso entre los valores < x <
y los valores 0 < y < 1, de tal forma que a cada valor posible de x le
corresponde uno y solo uno de y dado por y = P (x), y a cada valor posible
de y (entre 0 y 1) le corresponde uno y solo uno de x tal que satisface
y = P (x).
Esto no ocurre para y = z(x) como podemos ver en la figura 7.6: si bien es
cierto que a cada valor de x le corresponde uno y solo uno de y, esto no se
tiene a la inversa, es decir que para cada valor posible de y (entre 0 y 12 ,
con excepcion de y = 12 ), le corresponden dos valores de x porque se tiene
z(x) = z(x) siendo z(x) =
1
2
x2
2
.
....
..
1 .....
.
2
...............
.........
figura 7.6
107
Distribuci
on normal acumulada.
Hablabamos de que esto es una ventaja porque le sacaremos provecho cuando
veamos ajuste de una distribucion normal a una emprica, en lo que se
refiere a la bondad de tal ajuste.
La propiedad de establecer una correspondencia biunvoca de y = P (x) nos
permite poder hablar de la funci
on inversa de y = P (x). Esa tal funcion
invierte la relacion entre los valores de x e y.
La funcion inversa de P (x) se denota en matematicas con
P 1 (x) y se tiene
por ejemplo: si x = 0, P (0) = 21 ; luego entonces, P 1 21 = 0. No intentamos
dar una expresion analtica para P 1 (x) ya que esta se describe en tablas
que son las que utilizaremos. La relacion abstracta que rige a las funciones
inversas es
P 1 [P (x)] = P P 1 (x) = x
Para hacer uso de la tabla 26.5 que anexamos a este captulo, se requiere el
conocimiento de otra funcion denotada con y = Q(x), definida por:
Q(x) =
z(t)dt =
t2
1
e 2 dt
2
y = z(x)
x
area sombreada = Q(x)
figura 7.7
Puesto que el area total bajo la grafica de y = z(x) es la unidad se tiene que
Q(x) = 1 P (x)
Al final de este captulo, se anexa la tabla 26.5 para Q(x) .
108
.
.
.
.
.
.
.
.
...... ..............
.
.
.
.
.
.
.
......
...
.
.
.
.
.
.
......
..
.
.
.
.
.
.....
..
.
.
.
.
.
....
.
....
......
.
.
.
..
...
.
.
...
.....
.....
.....
....
....
....
....
.
...
....
.
...
.
...
.......
.
...
....
.
...
......
....
....
.....
.....
.....
.....
.....
......
......
.......
......
.......
.
...
.
.
.
........
.
.
.
.
.
.
.
.........
.
...
.
.
.
.
........
.
.
...
.
.
.........
.
.
.
.
.
.
...
.
..............
.
.
.
.
.
.
.
.
.
.
..
........................
...........................
....
figura 7.8
La bondad del ajuste de la normal puede juzgarse dibujando el histograma
y la curva normal de ajuste y luego comparando las areas, pero este metodo
es algo largo y no da una vision de golpe o global de tal bondad. Por
esta razon, nos proponemos ver otro metodo mas ventajoso, por ser mas
gr
afico y mas rapido. Para explicarlo, veremos primero el uso del papel
semilogartmico, pues las ideas esenciales son las mismas y esperemos que,
por su relativa simpleza, constituya un recurso didactico.
El papel semilogartmico se emplea cuando se desea averiguar si ciertas variables, x e y , medidas simultaneamente a un mismo fenomeno, se encuentran
ligadas por una ley tipo exponencial, esto es, de la forma y = Kbx , donde K
y b son constantes. Se entiende que se dispone de parejas de datos empricos
(X1 , Y1 ) , . . . , (Xn , Yn ) y se desea saber si existen constantes K y b tales
que Yi
= Kbxi , i = 1 , . . . , n.
Ahora bien, la escala semilogartmica consiste de una pareja de ejes mutuamente perpendiculares, siendo el horizontal provisto de una escala uniforme
(una escala ordinaria) y el vertical con una escala logartmica base 10 (usualmente). La escala logartmica se construye escribiendo los n
umeros en una
posicion que corresponden en realidad a los logaritmos de tales n
umeros.
Vease la siguiente figura que ilustra esto:
109
10
100
1,000
10,000
100,000
uniforme
logartmica
figura 7.9
Puesto que3 log(1) = 0, el 1 se pone en la posicion del 0; como log(10) = 1,
el 10 se pone en la posicion del 1; puesto que log(100) = 2, el 100 se marca
en la posicion del 2, etc. Conviene recordar que log(x) es la funcion inversa
de la exponencial 10x , esto es
10log(x) = log(10x ) = x
as pues, log(1) = log(100 ) = 0; log(100) = log(102 ) = 2; etc.
Cuando graficamos los puntos (x, y) en el papel semilogartmico, estamos en
realidad graficando (con respecto a un sistema Cartesiano normal u ordinario)
el punto (x, log y).
3
1,000
100
10
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ..
..
..
.
...
.
..
..
1
1
(3,10)
1
10
figura 7.10
El punto (3, 10) se grafica en realidad como el punto (3, 1), esto es, como
el punto (3, log 10). As pues, los datos a ensayar (Xi , Yi ) se grafican en
realidad como (Xi , log Yi ). Si estos u
ltimos quedan alineados, en realidad se
encuentran ligados por una ley de la forma: log(y) = Ax+B. Luego entonces
10log(y) = 10Ax+B , o sea, y = 10Ax+B .
As que, si los puntos (Xi , log Yi ) estan alineados, entonces los datos Xi
est
an relacionados funcionalmente con los Yi por la ley y = 10Ax+B , o sea,
3
110
X : extre-
0.023
2.5
- 1.99539
0.159
4.0
- 0.99858
4.0 5.5
15
22
0.500
5.5
5.5 7.0
15
37
0.841
7.0
0.99858
7.0 8.5
43
0.977
8.5
1.99539
8.5 10.0
44
1.000
10.0
Intervalo
de clase
frecuencia
1.0 2.5
2.5 4.0
i
i
frecuencia
acumulada mo superior
acumulada
relativa
del intervalo
{z
P 1 (Yi )
111
..............................
......
......
.....
.....
.....
....
.
.
.
...
..
.
.
...
.
.
.
...
..
....
.
.
.
....
.
.
.
.
....
.
.
.
.
....
.
.
..
.
..
.
.
..
......
.
.
.
.
.
.
......
.
.
.
.
......
...
.....
.........
.....
.
.
...
.
.
...
............
......
.
.
.
.
.
.
..............
..
.
.
.
.
.
.
.
.
..............................
.........
........................
....
area = P (x)
area = Q(x)
figura 7.11
112
y = P (mx + b) =
mx+b
z(t)dt =
mx+b
2
1
et /2 dt
2
2
1
e(mu+b) /2 mdu
2
pero
mu + b =
b
luego, tomando = m
y =
y=
1
m
b
u m
1
m
nos queda
e
2
( u
)
2
du
b
As que y es la distribucion acumulada normal con media = m
y des1
viacion estandar = m .
1
2
1
2
.
.
115
X : extre-
i
i
frecuencia
acumulada mo superior
acumulada
del intervalo
relativa
Intervalo
de clase
frecuencia
< 154
29
29
0.0005
153.5
154 159
155
1,631
184
1,815
8,899
20,773
20,492
10,714
31,487
51,979
0.0030
0.0291
0.1718
159.5
165.5
171.5
0.5048
0.8334
177.5
183.5
190 195
8,560
1,684
60,539
62,223
196 201
138
> 201
11
62,361
62,372
0.9706
0.9976
0.9998
189.5
195.5
201.5
160 165
166 171
172 177
178 183
184 189
1.0000
P 1 (Yi )
3.31
2.75
1.89
0.95
0.01
0.97
{z
1.89
2.82
3.54
Enseguida mostramos graficados los puntos obtenidos (Xi vs. P 1 (Yi )). Se
ha trazado una recta sobre ellos solo para que, a simple vista, se aprecie
mejor que tan alineados quedan los puntos.
P 1 (Y )
3
2
1
0
1
2
3
.....
......
.
......
......
.......
.
.
.
.
.
...
......
.......
....
.......
.
.
.
.
.
....
.......
......
.......
..
.
.
.
.
.
.
.......
......
......
.......
.
.
.
.
.
.
.
.......
......
.......
......
.
.
.
.
.
.......
.......
......
......
.
.
.
.
.
.
.
.......
......
......
.......
.
.
.
.
.
.
.......
......
.......
......
.
.
.
.
.
.......
.......
......
......
.
.
.
.
.
.
...
......
.......
............
.
.
.
.
....
153.5
159.5
165.5
171.5
177.5
183.5
figura 8.1
116
189.5
195.5
201.5
............
.....
....
.
.
.
....
..
.
.
....
..
.
.
....
..
.
.
....
.
.
.
.
....
.
.
....
.
.
..
.
.....
.
.
.
......
...
.
.
.
.
......
..
.
.
.
.
.
......
..
.
.
.
.
........
.
.
...
.
.
.
..........
.
.
.
.
...
.
.
...............
.
.
.
.
.
.
.
.
.
.
.
.
.............. .
.................
.........................................
atributo
figura 8.2
Ahora bien, veamos como podemos aprovechar esto. Supongamos que tenemos en mente como atributo a la habilidad para resolver problemas matem
aticos de cierto tipo, y se disponen de una sucesion de reactivos 1, 2, 3,
etc., donde se entiende que cada uno de ellos ofrece diferente grado de dificultad y pone precisamente en juego y a prueba a tal atributo. As, por ejemplo,
el reactivo i suponese que requiere un mnimo del atributo para su correcta
solucion, de tal modo que si un individuo posee ese atributo en cantidad
no menor que la mnima, lo resolvera y, en caso contrario, si posee el atributo
en menor cantidad que la mnima, no podra resolverlo. Sean
pi = fraccion de individuos que resolvieron el reactivo i;
qi = fraccion de individuos que no resolvieron el reactivo i.
Entonces pi + qi = 1. Para fijar ideas, supongamos que pi = 84.13% (o
pi = 0.8413); luego, qi = 15.87% (o qi = 0.1587). As pues, el 84.13% de los
117
......
.
.
....
....
...
...
....
....
.
.
....
.
.
.
.
....
.
.
.
.
....
.
..
.
.....
.
.
.
.
......
.
.
.
.
.
..
.
.
.
........
.
.
...
.
.
.
.
.
.............
..
.
.
.
.
.
.
...
.
.............
.
.
.
.
.
.
.
.
..................................
.............
..... .....
.........................
...
...........
............
................
.
area
= 0.8413
figura 8.3
Pero esta magnitud de la habilidad es tal que el 84.13% la poseen en grado
mayor; luego, dada la distribucion normal (para la habilidad), la posicion
requerida por el reactivo i es tal que la probabilidad de encontrarse a su
derecha (poseerla en mayor grado) es 84.13% o 0.8413; as que la posicion es
tal que el area a su derecha y bajo la curva normal es 0.8413.
Consultando una tabla para la distribucion normal tipificada vemos que
Pr(Z 1) = P (1) = 0.8413 aprox.
es decir, el area bajo la curva a la izquierda de la posicion para x = 1 es
0.8413, como se muestra en la siguiente figura
....
............ .............
....... ...........
..
......
..... .........
.
.
.
..
...
... ......
.
.
..
..
... ......
.
.
.. ..... ...........
...
.... .....
.
.
. ............
...
...........
...
... .........
............
....
..
.... .......
..
.
.
.. ......
.
.
.
...
.
.
.
....
.
.
.
....
..
....
....
.
.
.
.....
.
.
.
.
.
......
.
.
..
.
.
......
.
.
..
.
......
.
.
.
.
..
.......
.
.
.
.
.
........
...
.
.
.
.
.
.
.........
...
.
.
.
.
.
.
.............
.
.
.
....
.
.
.
.
.
.
.
.........................
.
.
.
.
.
.
.
.
.
....
...........
. .
...............................................
area
= 0.8413
figura 8.4
luego entonces, por la simetra de la distribucion normal, la posicion de i
corresponde a 1 (fig. 8.5)
118
.
...........
... .
...
.
.
..
....
....
figura 8.5
reactivos:
-0.5
0.5
-2
-1
figura 8.6
Veamos ahora como se utiliza esto. Subrayemos en primer termino que el atributo de que se trate, se refiere a individuos. Lo que deseamos es, por tanto,
medir la magnitud del atributo para diferentes individuos; pero para hacerlo,
nos servimos de los reactivos como paso intermedio. Esto es, solo podemos
conocer el atributo a traves de su respuesta a los reactivos. As, pensando en
la figura 6, si un individuo es capaz de resolver satisfactoriamente el reactivo
3 pero no el 4, lo ubicaremos (su atributo) entre 0 y 1. Podramos precisar
119
p2 = 99.38% ;
p3 = 94.52% y p4 = 78.23% .
120
INDEPENDENCIA Y DEPENDENCIA
LINEAL.
DE VARIABLES. CORRELACION
Si en vez de considerar una serie de dos lanzamientos consideramos el lanzamiento simultaneo de dos monedas decentes, se obtendran probabilidades
similares porque los resultados (de cada moneda) seguiran siendo independientes. En el caso de una serie de dos lanzamientos, decamos que la moneda
no tiene historia (o que en todo caso, la desconoce). En el caso de lanzamiento simultaneo, cada una de las monedas ignora a la otra.
Introduzcamos ahora el lanzamiento de dos dados no cargados. Se entiende entonces que cada uno de los dados no favorece a cara alguna, as que
habiendo seis caras, la probabilidad de obtener una cierta cara como resultado sera 61 . Sean X e Y dos variables de modo que X es el n
umero de puntos
de la cara que queda hacia arriba del primer dado e Y similarmente para el
segundo dado. As entonces, X e Y son variables aleatorias (discretas) con
rangos iguales, a saber, {1, 2, 3, 4, 5, 6} y con
1
6
1
Pr(Y = 1) = = Pr(Y = 6) =
6
Pr(X = 1) = = Pr(X = 6) =
En lanzamientos simultaneos, obtenemos parejas de resultados (Xi , Yj ) , refiriendose el primer dato al valor de X y el segundo al de Y . Los resultados
posibles son 36:
(1, 1)
(2, 1)
(3, 1)
(4, 1)
(5, 1)
(6, 1)
(1, 2)
(2, 2)
(3, 2)
(4, 2)
(5, 2)
(6, 2)
(1, 3)
(2, 3)
(3, 3)
(4, 3)
(5, 3)
(6, 3)
(1, 4)
(2, 4)
(3, 4)
(4, 4)
(5, 4)
(6, 4)
121
(1, 5)
(2, 5)
(3, 5)
(4, 5)
(5, 5)
(6, 5)
(1, 6)
(2, 6)
(3, 6)
(4, 6)
(5, 6)
(6, 6)
1 1
1
=
6 6
36
8
2
4 2
=
=
6 6
36
9
8
36
2
9
(1, 6)
(2, 6)
(3, 6)
(4, 6)
Sin embargo, en muchas ocasiones, es mas comodo aplicar la regla, pues para
conocer el efecto simultaneo de dos variables independientes basta conocer
por separado el comportamiento de cada una de ellas.
En este momento podramos definir (o caracterizar) en terminos matematicos
la independencia de variables aleatorias por la siguiente regla: X e Y son
variables independientes si, para cualesquiera a y b, se cumple que:
Pr(X a , Y b) = Pr(X a) Pr(Y b)
Pero de hacerlo as, esta version de la independencia estara algo lejos de
nuestra idea intuitiva que nos dice que una variable es independiente de
otra si los valores de la primera no se ven afectados por los valores de la
segunda; mas precisamente y en particular: dos variables aleatorias se dicen
independientes cuando las probabilidades de que la primera variable adquiera
tales o cuales valores no se vean afectados por el hecho de que la segunda
122
En resumen:
3
1
4
2
+
=
= .
10 10
10
5
Visto de otra forma, en la primera extraccion, de 100 veces ocurren, teoricamente, 60 rojas y 40 negras; en la segunda extraccion, te
oricamente, un
medio de las 60 rojas (o sea 30) y la cuarta parte de las 40 negras (o sea 10)
se aparearan con bolas negras. As pues, de 100 series de dos extracciones, en
30+10 = 40 casos ocurre (teoricamente) bola negra en la segunda extraccion;
luego
2
3
40
=
y, como ya se vio,
Pr(B) =
Pr(A) =
100
5
5
En el razonamiento u
ltimo, para hallar la probabilidad del evento A, hemos
utilizado la probabilidad en un sentido determinista: si la probabilidad de
algo es 53 , de cinco veces1 ocurre 3. Por supuesto, lo anterior es incorrecto
estrictamente hablando, pero como recurso funciona muchas veces.
Existe otra tecnica a la que se recurre con mucha frecuencia para estimar
probabilidades y que resulta u
til para este caso, a saber, el de interpretar
los posibles resultados de forma que resulten equiprobables. Para ello, distinguimos provisionalmente todas las bolas entre s; consideremos a las bolas
como
R1 , R2 , R3 , N1 y N2
(esto es la bola roja 1, la bola roja 2, etc.). Cada uno de estos objetos
tiene igual oportunidad de ser escogido cuando se encuentra en la urna.
Los posibles resultados del experimento son (recuerde que la primera bola
extrada no se regresa antes de la segunda extraccion):
(R1 , R2 ) (R2 , R1 ) (R3 , R1 ) (N1 , R1 ) (N2 , R1 )
(R1 , R3 ) (R2 , R3 ) (R3 , R2 ) (N1 , R2 ) (N2 , R2 )
(R1 , N1 ) (R2 , N1 ) (R3 , N1 ) (N1 , R3 ) (N2 , R3 )
(R1 , N2 ) (R2 , N2 ) (R3 , N2 ) (N1 , N2 ) (N2 , N1 )
1
O intentos
124
Recuerde que el evento A ocurre en todos los casos en que la segunda bola
es negra (por definicion); esto es, en el nuevo lenguaje, en los casos en que la
segunda bola sea N1 o N2 . As, claramente tenemos
Pr(A) =
8
2
=
20
5
Por otra parte, recordando que B ocurre (por definicion) cuando la primera
bola es roja, este evento ocurre con cualquiera de las parejas de las primeras
tres columnas y siendo mas facil contar que expresar conjuntistamente a B,
tenemos claramente
12
3
Pr(B) =
=
20
5
Introducimos ahora el concepto de probabilidad condicional. Pr(A | B), lease
probabilidad de A dado B, denota la probabilidad de la ocurrencia del
evento A dado que con certeza ha ocurrido B. Esto es, si se sabe que B ha
tenido lugar, lo que mide Pr(A | B) es que probabilidad existe de que A haya
ocurrido tambien. Veamoslo en nuestro ejemplo.
Sup
ongase que nuestro experimento de azar se realiza y antes de la segunda
extraccion se nos dice: la primera bola fue roja (esto es, que ha ocurrido B),
cu
al sera entonces la probabilidad de que en la segunda extraccion la bola
resulte negra (esto es, que ocurra A)? Nada mas facil: si en la primera
extraccion la bola elegida fue roja, quedan en la urna dos bolas rojas y dos
negras; luego, la probabilidad de que la segunda bola sea negra, en estas
condiciones, es claramente 21 (literalmente, 24 ). As pues, en nuestro ejemplo
Pr(A | B) = 21 y es importante notar que2 Pr(A | B) 6= Pr(A).
De acuerdo con nuestra noci
on intuitiva de independencia, A sera independiente de B si
Pr(A | B) = Pr(A)
2
125
Pr(A B)
,
Pr(B)
donde Pr(B) 6= 0
Pr(A B) = Pr(R N ) =
y, como ya sabamos, Pr(B) = 35 ; luego
Pr(A B)
=
Pr(B)
3
10
3
5
1
2
6
1
=
12
2
Frec. teorica de A B
Frec. teorica de B
Pero no hay problema en sustituir las frecuencias teoricas por las frecuencias
relativas teoricas en numerador y denominador (equivale a dividir numerador
y denominador por el mismo n
umero, en nuestro caso, entre 20):
Pr(A | B) =
o sea, finalmente
Pr(A | B) =
Pr(A B)
Pr(B)
Ahora bien, podemos pensar este esquema anterior en abstracto y convencernos de la validez general de la formula. Se deja al lector que medite a este
respecto hasta adquirir una impresion intuitiva de la validez de la formula.
Tambien se recomienda que calcule Pr(B | A) utilizando la formula
Pr(B | A) =
Pr(B A)
Pr(A)
ya que, en este caso, para los eventos de nuestro ejemplo no es facil calcularla
del mismo modo que hicimos sin utilizar la segunda version (puede, eso s,
utilizar esta segunda version y ver de paso la validez del cociente propuesto).
Ahora bien, con el concepto de probabilidad condicional establecido (y esperamos que bien comprendido), podemos definir matematicamente (como se
esperaba) el significado de independencia: Dos eventos A y B se dicen ser
independientes cuando simult
aneamente:
Pr(A | B) = Pr(A)
Pr(B | A) = Pr(B)
Exceptuando casos mas bien triviales (Pr(A) = 0 o Pr(B) = 0), basta una
de las relaciones. Mas precisamente, de una se deduce la otra; por ejemplo:
Supongamos que A es independiente de B, es decir, que
Pr(A | B) = Pr(A)
127
Pr(A B)
= Pr(A)
Pr(B)
por lo tanto
Pr(A B) = Pr(A) Pr(B)
Pr(A B)
= Pr(B)
Pr(A)
Todas estas propiedades (no mencionamos todas las esenciales, por cierto)
pueden verificarse intuitivamente pensando en la probabilidad como frecuencia relativa teorica. Como ejemplo, verificaremos 1) a partir de la definicion:
Claramente (piense en terminos de frecuencia)
Pr(Y b) = Pr(X a , Y b) + Pr(X > a , Y b)
y utilizando la definicion:
Pr(Y b) = Pr(X a) Pr(Y b) + Pr(X > a , Y b)
luego
Pr(X > a , Y b) = Pr(Y b) Pr(X a) Pr(Y b)
de donde
Pr(X > a , Y b) = 1 Pr(X a) Pr(Y b)
129
Correlaci
on lineal.
Correlaci
on lineal.
Es frecuente, en aplicaciones estadsticas, el tratar de encontrar relaciones
entre variables aleatorias. En nuestro caso, entre variables educativas. Por
ejemplo, suele decirse que el factor economico tiene influencia en el rendimiento escolar, en un sentido positivo; mas precisamente, a mayor ingreso
familiar mejores probabilidades de buen rendimiento escolar. Se dice tambien
que existe una fuerte relacion (positiva) entre las variables INTELIGENCIA y
APROVECHAMIENTO ESCOLAR. M
as precisamente, a mayor inteligencia mayor aprovechamiento escolar. El mas simple modelo de este tipo de relacion
entre dos variables, es el lineal. Si para un mismo sujeto, digamos el i-esimo,
medimos las dos variables obteniendo (Xi , Yi ) y graficamos los resultados
para N sujetos, este modelo sera perfecto si obtuvieramos puntos alineados
(sobre una recta). En vez de hablar de relacion entre variables y modelo
lineal, se utiliza el termino correlaci
on lineal. Puede ocurrir tambien que en
vez de tener una relacion positiva se tenga una negativa. Esto es, a mayor
valor de una variable menor de la otra. Vease la figura 9.1
.....
......
......
......
Y3 .... .... .... .... .... .... .... .... .... .... .... .... .... ........................................
Y2
Y2
Y1
.
......
......
.......
......
.
.
.
.
.
.... .... .... .... .... .... .... .... .... ........
.....
..... ..
....... ...
.......
.
.
.
.
.
...
...
......
...
......
.... .... .... ........
.........
.
.
...
.
.
.
...... ...
...
...
...
...
...
..
X1
X2
...
...
...
...
...
...
...
...
...
...
..
Y3
..
......
.......
...
.......
......
...
.. .
........
.... .... .... .... .... .... .... .... .... ........
...
. ........
.......
..
......
...
.......
.......
...
...
.....
.
........
.... .... .... .... ....... .... .... .... .... .... ...... .... .... .... .... .........
.. .........
.
..
...
...
..
.
.
.
...
.
..
.
..
...
...
..
...
.
X3
X1
Correlaci
on lineal
perfecta (positiva)
X2
X3
Correlaci
on lineal
perfecta (negativa)
figura 9.1
En cualquier caso, el modelo de recta no tiene que pasar por el origen ni tener
pendiente 1. No es de esperarse que las escalas, al medir digamosinteligencia y aprovechamiento, sean las mismas. Ademas los orgenes de las
escalas de medicion de estas variables, son mas o menos arbitrarios (que
puede significar estrictamente inteligencia cero?). Dos variables aleatorias
tienen pues una correlacion maxima o perfecta cuando hay una formula lineal
que expresa una en terminos de la otra. Mas claramente, X e Y estan
perfectamente correlaciondadas si
Y = aX + b
130
9.1
Correlaci
on lineal.
donde la correlacion es positiva cuando a > 0 y negativa cuando a < 0. Debe
entenderse aqu que X e Y se miden en el mismo sujeto. Esto es, la relacion
anterior se entiende como Yi = aXi + b (con a y b fijos) para toda i (Xi , Yi
siendo medidas en el sujeto iesimo).
En la practica es mucho pedir tal correlacion lineal perfecta. Nos contentamos con una buena aproximacion. Pero que significa buena aproximacion?
Veremos mas adelante un coeficiente (llamado coeficiente de correlacion lineal) que mide la bondad con que las parejas (Xi , Yi ) siguen un modelo
lineal, esto es, que tan alineadas estan dichas parejas .
En vez de proceder directamente con los puntajes directos de las variables
X e Y veamos la conveniencia de transformarlos en puntajes estandar ZX y
ZY con objeto de simplificar los calculos.
Para empezar veamos como se traduce la relacion 9.1 en terminos de puntajes
est
andar:
Si
Yi = aXi + b
(a 6= 0)
entonces
+ b.
Y = aX
En efecto
Y =
N
N
N
X
1 X
1 X
1
1
+ b.
Yi =
(aXi + b) = a
Xi + (Nb) = aX
N
N
N
N
i=1
i=1
i=1
2
Y tambien SY2 = a2 SX
(S = desviacion estandar), o sea SY = |a| SX ; en
efecto
SY2
N
N
1 X
1 X
2
+ b) 2
=
(Yi Y ) =
(aXi + b) (aX
N
N
i=1
1
=
N
=
1
N
N
X
i=1
N
X
i=1
i=1
N
2
1 X
2
aXi + b aX b =
(aXi aX)
N
i=1
2
a2 (Xi X)
As entonces
+ b)
Y Y
aX + b (aX
=
SY
|a| SX
a(X X)
a X X
a
=
=
=
ZX = ZX
|a| SX
|a|
SX
|a|
ZY =
131
Correlaci
on lineal.
donde se toma + si a > 0 y si a < 0.
La relacion 9.1 es de hecho equivalente (se deja al lector probar el recproco)
a
ZY = ZX
9.2
a saber, una recta que pasa por el origen con pendiente 1.
Lo anterior sugiere que el modelo lineal se simplifica cuando se utilizan puntajes estandar. Por otra parte, no hay nada que perder al utilizar puntajes
est
andar, pues representan un cambio lineal de coordenadas. Esto es, un
buen modelo lineal para X e Y se traducira en un buen modelo lineal
para ZX y ZY ; y recprocamente.
El desarrollo que sigue para deducir una medida de la bondad de la correlaci
on lineal entre dos variables (coeficiente de correlacion lineal) lo haremos
con los puntajes estandar de las variables. Entremos en materia.
Supongamos que tenemos parejas de valores X e Y como los mostrados en
la figura 9.2. Que queremos decir con la bondad de un modelo lineal que
las relacione?
figura 9.2
M
as precisamente, existen muchas rectas posibles (una infinidad) como candidatos a modelos lineales. A la bondad de cual de ellas nos referimos?
Recordemos que al referirnos a una correlacion lineal perfecta nos bastaba
con que los puntos estuvieran sobre una recta (de hecho que esten a la vez
sobre mas de una, tratandose de N 2 puntos, es absurdo). Esto es, en la
correlacion perfecta haba una recta que era la buena, la conveniente. Si
para el caso de nuestra figura no existe la buena, como podemos hablar
de la bondad? Habra entonces que hablar de bondad para cada modelo
lineal posible; pero hay una infinidad de posibles rectas.
Lo que haremos es inventarnos una recta buena y con respecto a ella mediremos la bondad del ajuste de esa mejor recta a los datos. En realidad
132
Correlaci
on lineal.
tomaremos la mejor recta en el sentido de los cuadrados mnimos. Explcitamente, si tenemos puntos (Xi , Yi ), i = 1, . . . , N, la mejor recta en el
sentido de los cuadrados mnimos es la determinada por los coeficientes a y
b que hacen mnima a la expresion
N
X
i=1
2
Yi (aXi + b)
Xi X
Yi Y
y
vi =
9.3
ui =
SX
SY
con i = 1 , . . . , N . En la figura 9.3 podemos ver una recta definida por los
par
ametros a y b
..
.......
......
......
.
.
.
.
.
.
.......
......
......
.......
.
.
.
.
.
.
..
.......
......
.......
......
.
.
.
.
.
.......
.......
..
j ........................................................
......
......
.
.
.
.
..
.
.
....
..
.......
.
.
.
.
.
.
..
.
.
.
.
...
.
.
........................
.
....
...... ...
.
...
.
.
.
.
..
.
.
.
.
.
..
.
.
.....
...
..
......
.
.
.
.
.
.
..
.
.
.
.
...
.
.
.
..
..
.
.
.
.
.
.
..
.
.......
...
..
.......
...
........................
...
i
..
...
..
..
..
..
..
..
...
.
v = au + b
aui + b
desviaci
on
ui
uj
figura 9.3
Dada esta recta, la bondad del ajuste de la recta en el sentido de los
cuadrados esta dada (vease la figura) por la relacion:
N
N
X
2 X
2
D =
vi (aui + b) =
vi aui b
2
i=1
N
X
i=1
N
X
i=1
i=1
+a
N
X
i=1
u2i
+ Nb 2a
133
N
X
i=1
ui vi 2b
N
X
i=1
vi + 2ab
N
X
i=1
ui
Correlaci
on lineal.
pero como ui y vi son puntajes estandar
u =
N
1 X
ui = 0
N i=1
1
Su =
N
N
X
u2i
N
X
=1
i=1
N
X
i=1
ui = 0
u2i = N
i=1
#
N
X
2a
D2 = N + a2 N + Nb2 2a
ui vi = N 1 + a2 + b2
ui vi
N
i=1
i=1
!2
!2
N
N
N
X
X
X
2a
1
1
= N 1+ b2 + a2
ui vi +
ui vi
ui vi
N
N
N
N
X
i=1
i=1
i=1
2 X
2
N
N
1 X
1
2
=N 1+b + a
ui vi
ui vi
N
N
i=1
i=1
X
2
2
N
N
1
1 X
2
=N 1
ui vi + b + a
ui vi
N
N
i=1
i=1
Ahora bien, los valores de a y b (con todo lo demas fijo, por supuesto) que
hacen mnima a D2 corresponden a la mejor recta y son claramente
b=0
a=
N
1 X
ui vi
N
i=1
=N 1
2
N
1 X
ui vi
N
i=1
Puesto que N es el n
umero de datos que suponemos fijo, el tama
no de la
desviacion cuadratica para el mejor modelo (o, si se quiere, la media de la
3
134
Correlaci
on lineal.
1 2
desviacion cuadratica trasponiendo la N y considerando
D ) depende
N min
del termino
2
X
N
1
1
ui vi
N i=1
2
puesto que Dmin
0, tal termino es no negativo, lo que significa que necesariamente
N
1 X
1
ui vi 1
N i=1
2
Es claro que la bondad sera mayor cuanto menor sea Dmin
(o
1 2
D ).
N min
N
1 X
ui vi tenemos que
N
i=1
1 2
D
= 1 r2XY
N min
As la bondad sera mejor en la medida en que | rXY | se aproxime a 1.
Siendo maxima cuando | rXY | sea maximo, o sea, cuando | rXY | = 1.
En otras palabras, la bondad del modelo lineal (del mejor) esta dada
por | rXY |
rXY
N
N
X
1 X
9.3
ui vi =
=
N i=1
i=1
1
N
Yi Y
Xi X
SX SY
135
N
1 X
ui vi , o sea
N i=1
Correlaci
on lineal.
2
1) Si rXY = 1, entonces Dmin
= 0, o sea que
N
X
i=1
(vi rXY ui ) =
N
X
i=1
(vi ui )2 = 0
(vi rXY ui ) =
N
X
(vi + ui )2 = 0
i=1
Y Y
X X
= rXY
SY
SX
Y Y
X X
= rXY
SY
SX
es llamada la recta de regresi
on para estimar Y a partir de X.
4) En terminos de los puntajes originales, el coeficiente de correlacion nos
queda:
N
N
X
X
Yi Y
Xi X
ui vi =
rXY =
SX
SY
i=1
i=1
rXY =
N
i Y )
1 X (Xi X)(Y
N
SX SY
i=1
Estamos afirmando, sin probar, que la mejor recta para ZX , ZY corresponde a la mejor
recta para X e Y
136
)=
N
1 X
i Y )
(Xi X)(Y
N i=1
As pues
rXY =
COV(X, Y
SX SY
Obtenci
on del coeficiente de correlaci
on. Un punto de vista vectorial.
Que tan bien se puede expresar linealmente Y en funcion de X (es decir,
Y = aX + b)? o que tan bien se puede expresar linealmente X en funcion
de Y (es decir, X = cY + d)? Equivalentemente: que tan bien resulta la
relacion aX + b = cY + d para los mejores a, b, c y d posibles (ac 6= 0)?
Para lo anterior se dispone de la informacion siguiente: se tiene un conjunto
de n puntos
(X1 , Y1 ) , (X2 , Y2 ) , . . . , (Xn , Yn )
y se desea optimizar la coleccion de igualdades5
aXi + b = cY i + d
i = 1, ... , n
o sea:
X1
Y1
b
d
.
.
.
.
a .. + .. = c .. + ..
Xn
Yn
X1
Y1
1
1
.
.
.
.
a .. + b .. = c .. + d ..
1
Xn
Yn
~ = (Y1 , . . . , Yn )
Y
137
y ~e = (1 , . . . , 1)
~e
~
X
~
Y
figura 9.4
Para evitar ambig
uedades comparemos la parte positiva de ambos planos;
~ eY
~ (vease figura 9.5)
esto es, tomando positivas a las direcciones de X
.
..........
........ ...
....... ...
....... ......
.
.
.
.
.
.
..
........
....
.......
...
.......
....
........
.
.
.
.
.
.
.
.
.
.
..
........
....
........
....
.......
....
...
.
.
.
.
..
...
....
...
....
....................................................................................................................
...
.......
.
.
.
.
.
.
.....
.
.
.
.......
...........
...
..
.......
...
............... .....................
.......
.
....
.
. ........
.
.
.
.
.
.
.
.
.
.
.. ........
.......
....
.......
...
.............
..
..
.......
.........................................................................
........
... ..............
.
.
.
.
.
.
.
.
...
.............
........
....................................................................................................................
~
X
~e
~
Y
figura 9.5
Un modo plausible de medir la proximidad de los semiplanos, con una medida normalizada, es con el coseno del angulo que forman los semiplanos6 .
Este angulo esta dado por dos vectores ortogonales a ~e en cada uno de los
semiplanos (ver figura 9.6)
6
El angulo para cerrar las dos hojas formadas por los semiplanos.
138
Algunos resultados te
oricos.
.....
.........
....... ....
....... ......
.
.
.
.
.
.
.
.
...
.......
...
.......
...
.......
....
.......
.
.
.
.
.
.
.
.
.
..
...
.......
....
.......
........
....
......
...
.
.
.
.
..
..
....
....
...
...
...
.................................................
.
.
.
.
.
.
.
.
.
.......................
..
......
.......................
... ...........
.......
...
....
.
.......
.......
...... .......................
....
.
.
.......
.
.
.
.
.
.
.
.
.......
..
.
................
.
.
.
.
.
.
.
.
.
.
...
.......
....
....................................
........
.... ........
.......
... ......
.......
.
..............
.
.
.
.
.
.
.
.
..
.......................
.......
.......................
.......................
........
.................................
~u ~e
~v
figura 9.6
la media de X y Y la media de Y , se verifica inmediatamente que
Siendo X
los vectores desviacion de la media, a saber,
~ = X1 X
, . . . , Xn X
~ = Y1 Y , . . . , Yn Y
Y
~ =1Y
~ Y ~e
Y
satisfacen lo siguiente
~ = 1X
~ X~
e
X
~ y Y
~ pertenecen a los semiplanos; y ademas
i.e. X
~ ~e =
X
n
X
=0
(Xi X)
i=1
~ ~e =
Y
n
X
i=1
(Yi Y ) = 0
~ eY
~ son ortogonales al eje de giro ~e.
lo que implica que X
As, definimos la correlacion de X y Y , denotada rXY , justamente como el
coseno del angulo que hacen los semiplanos, es decir
rXY
n
X
i Y )
(Xi X)(Y
~
~
i=1
~ Y
~ ) = X Y
v
=v
= cos(X,
uX
uX
~ kY
~k
kXk
u n
u n
2 t (Yi Y )2
t (Xi X)
i=1
i=1
o equivalentemente
1
n
n
X
i Y )
(Xi X)(Y
i=1
v
rXY = v
=
u X
u X
n
u1 n
u
2 t1
t
(Xi X)
(Yi Y )2
n
n
i=1
i=1
139
1
n
n
X
i=1
i Y )
(Xi X)(Y
SX SY
Algunos resultados te
oricos.
Algunos resultados te
oricos.
Es conveniente introducir una serie de formulas y relaciones dentro del contexto de independencia de variables y correlacion lineal para preparar el terreno al siguiente captulo sobre la teora elemental de la confiabilidad bajo
el punto de vista estadstico.
En lo que sigue, las relaciones con asterisco (*) se satisfacen por definicion.
Las otras seran demostradas cuando se crea que lo ameriten. Todas se refieren
a variables aleatorias. Se ejemplifica con variables discretas, aunque todas
ellas se generalizan o extienden al caso continuo.
Vale la pena hacer un comentario acerca de la notacion: las medidas estadsticas cuando se aplican a datos o valores empricos se denotan con letras
(media de X, obtenida empricamente para la variable X), SX
latinas; as, X
(desviacion estandar de la variable X, estimada a partir de valores empricos), etc. Cuando tales medidas se obtienen de un modo teorico o se refieren
a poblaciones (teoricas) y no a muestras de las mismas, son denotadas con
letras griegas; v.gr. X (media de la variable X tomada en toda una poblaci
on teorica, o bien cuando X tiene una distribucion teorica; p.ej., X es
normal o binomial); X (desviacion estandar), etc.
En nuestro caso, las relaciones siguientes son para variables aleatorias (discretas) concebidas matematicamente, por lo tanto con una distribucion teorica
asociada.
Las primeras tres relaciones son en realidad un recordatorio:
1 ) X =
N
X
pi Xi
i=1
v
uN
uX
2 ) X = t
pi (Xi X )2
i=1
3 ) Varianza de X = X =
N
X
i=1
pi (Xi X )2
i = 1, ... , N
N
X
pi = 1
i=1
Las primeras relaciones que siguen son consecuencias casi directas de las
definiciones anteriores (excepto por ciertas consideraciones elementales):
140
Algunos resultados te
oricos.
4.a) X
4.b)
M
X
Sij = pi ,
j=1
Sij = qj donde
i=1
pi = Pr(X = Xi ) ;
qj = Pr(Y = Yj )
si y solo si
ocurre
X = Xi
i = 1, ... , N
Algunos resultados te
oricos.
Aplicando 1* (definicion de media de variable aleatoria)
X
N
X
i=1
pi (Xi X ) =
N
X
i=1
pi Xi
N
X
pi X
i=1
= X
N
X
i=1
N
X
pi X = X X
i=1
siendo el u
ltimo paso valido en virtud de que
pi = X X = 0
N
X
pi = 1.
i=1
Prueba de 4.b:
PN
Justificaremos la validez de
on muy
i=1 Sij = qj , siendo la de la otra relaci
similar. Recordemos que (convencionalmente)
Sij = Pr(X = Xi , Y = Yj );
qj = Pr(Y = Yj )
Algunos resultados te
oricos.
lanzamientos. Este se
nor las ha registrado en forma de una tabla, como la
que sigue:
dado
rojo
dado
negro
0.0270
0.0280
0.0272
1
..
.
4
..
.
0.0278
..
.
2
..
.
1
..
.
0.0265
..
.
frecuencia
relativa
Ocurre ahora el siguiente evento: otro lector (usted, por ejemplo) aparece en
escena. Al contemplar la tabla le comenta al autor (de la tabla): Caray!,
no me sirve. Lo que necesito son las frecuencias relativas de la ocurrencia de
Y = 1, Y = 2, etc., solamente; y t
u las tienes para ocurrencias conjuntas. A
lo que nuestro profesional responde: Calma hombre!, no hay problema. Si
he registrado el comportamiento de ambos dados, de pasada he registrado el
del dado negro, que es el que te interesa. Naturalmente, ha quedado implcito
en la tabla pero es facilmente rescatable. Entonces el autor de la tabla le
explica como hay que hacerle:
Si deseas la frecuencia relativa con que ocurre Y = 1, por ejempo, solo
fjate en la columna de Y en todos aquellos casos en los que Y es igual a
1, no te importe el valor de X. Marca los renglones en que esto ocurre y
finalmente suma las frecuencias relativas correspondientes (a todos los casos
en que Y = 1).
Algunos resultados te
oricos.
etc., cuando ocurre X = 6 e Y = 1; y, mas a
un, Y = 1 solo tiene lugar
cuando ocurre alguno de esos 6 casos. Dicho de otro modo, el evento Y = 1
es enteramente equivalente al evento
{(1, 1), (2, 1), (3, 1), (4, 1), (5, 1), (6, 1)}
donde la pareja (i, 1) denota X = i e Y = 1. As que
Frec.(Y = 1) = Frec.{(1, 1), (2, 1), (3, 1), (4, 1), (5, 1), (6, 1)}
Hasta aqu todo parece en regla. Pero lo que se haba apuntado antes era la
suma de las frecuencias, esto es,
Frec.(Y = 1) = Frec.{(1, 1)} + Frec.{(2, 1)} + + Frec.{(6, 1)}
Esto u
ltimo es consecuencia de que los eventos elementales {(1, 1)} , {(2, 1)},
etc., son ajenos entre s, as que la frecuencia con que ocurre alguno de ellos
es la suma de las frecuencias individuales.
Regresando a nuestro problema original, vemos que los eventos
Y = Yj
{(X1 , Yj ), . . . , (XN , Yj )}
N
X
Pr(X = Xi e Y = Yj ) =
i=1
N
X
i=1
144
Sij
N
X
i=1
Pr{(Xi , Yj )}
Algunos resultados te
oricos.
Prueba de 4.c:
Antes de pasar a la prueba de que la media de una suma es la suma de las
medias, abusando quiza de la paciencia del lector, creo que es conveniente
el siguiente rollo.
Con X + Y se denota a la suma de las variables (aleatorias) X e Y , la cual,
como se vera, es tambien una variable aleatoria cuyo rango consiste de todos
los valores de la forma Xi + Yj i = 1 , . . . , N j = 1 , . . . , M. Esto es,
un valor posible de X + Y es cualquier valor posible de X sumado con un
posible de Y . El rango de la suma queda denotado entonces como el siguiente
conjunto
{Xi + Yj | i = 1, . . . , N j = 1, . . . , M}.
Hasta ahora X + Y es una variable. Para caracterizarla (matematicamente)
como variable aleatoria, debemos asignarle probabilidades a la ocurrencia de
cada uno de los posibles valores. Aqu empiezan los problemas. Estamos
tentados a escribir
Pr(X + Y = Xi + Yj ) = Pr(X = Xi e Y = Yj ) = Sij
puesto que se ocurre que X + Y = Xi + Yj es equivalente a que se tengan
simultaneamente X = Xi e Y = Yj . Sin embargo, esto u
ltimo (y la relacion
de arriba por consiguiente) es FALSO, en general.
Probablemente lo que sugiere como valida la falacia anterior, sea el hecho
de que cuando se expresa la suma de a y b con a + b, estamos escribiendo
tal operacion en forma INDICADA, pero la estamos pensando REALIZADA.
Despues de todo, el termino suma se refiere al resultado de la adicion.
Concretamente, el evento X + Y = Xi + Yj se refiere a que la variable
(X + Y ) adquiera el valor resultante de sumar Xi con Yj aunque la notacion
pareciera sugerir erroneamente una igualdad de parejas (X con Xi e Y con
Yj ). Para aclarar mejor esto, veamos un ejemplo: el de los dados rojo y
negro. Ah, tendremos que el rango de valores es
{1 + 1 , 1 + 2 , . . . , 2 + 1 , . . . , 2 + 6 , . . . , 6 + 1 , . . . , 6 + 6}
que se reduce a {2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12}.
El conjunto de mas arriba perecera sugerir 6 6 = 36 valores posibles.
Sin embargo, debido a las repeticiones, solo son 11 distintos. Las sumas
expresadas en forma indicada, con su implcita sugerencia de parejas, nos
puede hacer pensar en la primera version del conjunto rango en 6 6 = 36
valores. Pero al realizar las operaciones no hay tales.
145
Algunos resultados te
oricos.
As, el evento X + Y = 1 + 3 no es equivalente a X = 1 e Y = 3 o a {(1, 3)}
sino que X + Y = 1 + 3 equivale al evento {(1, 3), (2, 2), (3, 1)}.
Despues de todo 1 + 3 no es sino otro modo de escribir 4. Esto es,
X + Y = 1 + 3 quiere decir X + Y = 4 y ninguna otra cosa (cualquier otra
cosa que sugiera es sicologica, no matematica).
Una vez aclarado lo anterior, vemos que es posible que ocurra X+Y = Xi +Yj
a
un cuando X 6= Xi e Y 6= Yj . Naturalmente que esto nos causa problemas
en la asignacion de probabilidades a eventos de la forma: X + Y = Xi + Yj .
Esto es debido a que en el manejo teorico en el que estamos involucrados
no podemos saber para que valores de X e Y (i.e., para que parejas) puede
ocurrir tal igualdad, al desconocer los valores efectivos de los Xi y los Yj .
(Al final de esta seccion hay un ejercicio para el lector, el cual consiste en
hacer, teoricamente, la asignacion de probabilidades y justificar lo que se
hace abajo, a continuacion).
Sin embargo, no es necesario hacer la asignacion de probabilidades para estimar la media de X + Y . Despues de todo, la media o valor esperado de una
variable aleatoria, es en realidad una media pesada 8 :
X+Y =
M X
N
X
j=1 i=1
Pr(X = Xi , Y = Yj ) (Xi + Yj )
o sea
X+Y =
M X
N
X
j=1 i=1
Sij (Xi + Yj )
9.4
Sij = 1
j=1 i=1
146
Algunos resultados te
oricos.
X+Y =
M X
N
X
j=1 i=1
M X
N
X
Sij (Xi + Yj ) =
Sij Xi +
j=1 i=1
N
X
i=1
"
N
4.b) X
Xi
M X
N
X
M X
N
X
j=1 i=1
Sij Yj =
j=1 i=1
M
X
j=1
Xi pi +
i=1
Sij +
M
X
M
X
j=1
(Sij Xi + Sij Yj )
"M
N X
X
Sij Xi +
i=1 j=1
"
Yj
N
X
Sij
i=1
"N
M X
X
j=1 i=1
Sij Yj
def.
Yj qj = X + Y
j=1
COV(X, Y
) = covarianza de X e Y =
N X
M
X
i=1 j=1
5b*) XY = correlacion de X e Y =
COV(X, Y
X Y
Comentarios acerca de 5a* y 5b*: Debe observarse que 5b* es una traduccion
literal de la definicion de correlacion para datos en la correspondiente para
variables. Unicamente
la notacion se ha cambiado: en vez de SX y SY
aparecen, correspondientemente, X y Y , consistentemente con la notacion
ya anunciada, de utilizar letras griegas para medidas estadsticas de variables
aleatorias (o poblaciones).
La que merece mas comentarios es 5a*, la cual, a primera vista, no parece
una traduccion de la correspondiente formula para datos. Para empezar,
recordemos la definicion de covarianza para datos, ya antes vista, a saber
N
1 X
i Y )
COV(X, Y ) =
(Xi X)(Y
N i=1
147
Algunos resultados te
oricos.
Tal formula puede verse (interpretarse) como la Media de productos de
desviaciones de X e Y .
es la desviaci
Recuerde que Xi X
on de Xi ; y que el factor N1 lo que
hace es promediar (con la media aritmetica) tales productos de desviaciones.
Quiza lo que mas molesta en la formula 5b* es la aparicion de una doble
sumatoria o, mas concretamente, de productos cruzados: (Xi X )(Yj
Y ). En realidad, es una cuestion de notaci
on y no se trata de que 5b* sea
conceptualmente distinta a la formula correspondiente para datos. Esto lo
veremos de inmediato.
Cuando considerabamos datos, la notacion (Xi , Yi ) indica simplemente el
n
umero de dato (en ese caso, el iesimo). Tome en cuenta aqu que un dato
est
a formado por la lectura simultanea de los valores de X e Y en un mismo sujeto, objeto, o ensayo experimental. Tal notacion no sugiere que, por
ejemplo, los Xi sean distintos entre s. Esto es, la lista X1 , X2 , . . . , XN son
lecturas (experimentales o empricas) del valor ocurrido de X en distintos
sujetos u objetos. As que no tienen que ser distintos entre s y consecuentemente no estan representando todos los distintos valores posibles (o sea el
rango) de la variable X.
Lo mismo puede decirse de Y1 , Y2 , . . . , YM . Sin embargo, cuando consideramos a X y a Y como variables aleatorias, las parejas (Xi , Yj ) representan,
con i = 1, , . . . , N y j = 1 , . . . , M, todos los resultados teoricos posibles
de la pareja de variables, dado que X1 , X2 , . . . , XN s es aqu la lista completa de todos los valores posibles (luego, el rango) de X; lo mismo para
Y 1 , Y 2 , . . . , YM .
Los ndices en (Xi , Yj ) no sugieren de modo alguno alg
un orden. Dicho
de otro modo, (Xi , Yj ) con i = 1 , . . . , N (con i corriendo de 1 a N ) y
j = 1 , . . . , M, nos da la lista de todos los resultados simultaneos posibles.
As que (Xi X )(Yj Y ) con i = 1 , . . . , N y j = 1 , . . . , M genera la lista
completa de productos de desviaciones. Si multiplicamos estos productos por
su peso Sij = Pr(X = Xi , Y = Yj ) y sumamos, obtenemos la media de
tales productos. En resumen, la expresion
M X
N
X
j=1 i=1
Algunos resultados te
oricos.
Enunciamos dos relaciones que nos seran u
tiles.
2
6a) X+Y
= VAR(X) + VAR(Y ) + 2 COV(X, Y )
2
= X
+ Y2 + 2 COV(X, Y )
2
2
6b) X+Y
= X
+ Y2 + 2XY X Y
Prueba de 6a y 6b:
Observese que una vez establecida 6a, en virtud de la definicion 5b*, se tiene
que COV(X, Y ) = XY X Y ; luego, sustituyendo la u
ltima relacion en 6a
conclumos con 6b. Basta probar entonces la validez de 6a.
Por definicion (vease 2*) tenemos que
2
X+Y
=
M X
N
X
j=1 i=1
(en realidad, estamos empleando el hecho de que la media de una variable aleatoria es una media ponderada, en un sentido que se aclara en un
ejercicio al final de esta seccion).
Utilizando 4c:
2
X+Y =
M X
N
X
j=1 i=1
M X
N
X
j=1 i=1
M X
N
X
j=1 i=1
M X
N
X
j=1 i=1
2
Sij (Xi X )+(Yj Y )
Sij (Xi X )2 + 2(Xi X )(Yj Y ) + (Yj Y )2
Sij (Xi X ) +2
2
M X
N
X
j=1 i=1
M X
N
X
Sij (Xi X )(Yj Y ) +
Sij (Yj Y )2
j=1 i=1
N
M
M
N
X
X
X
X
2
2
=
(Xi X )
Sij + 2 COV(X, Y ) +
(Yj Y )
Sij
i=1
N
X
i=1
2
j=1
j=1
(Xi X )2 pi + 2 COV(X, Y ) +
2
= X + 2 COV(X, Y ) + Y
149
M
X
j=1
(Yj Y )2 qj
i=1
Algunos resultados te
oricos.
Las siguientes relaciones se prueban facilmente (su prueba se deja al lector):
2
2
7a) aX
= a2 X
(a constante arbitraria).
7b)
COV(aX
, bY ) = ab COV(X , Y ).
COV(X
, Y ) = 0,
8b) XY = 0 y
2
2
8c) X+Y
= X
+ Y2 .
)=
M X
N
X
j=1 i=1
M X
N
X
j=1 i=1
M
X
j=1
pi qj (Xi X )(Yj Y )
X
X
N
M
qj (Yj Y )
pi (Xi X ) =
qj (Yj Y ) X )
X
i=1
= X
M
X
j=1
j=1
4.a)
qj (Yj Y ) = (X )(Y ) = 0 0 = 0.
X
#
Ademas de las anteriores relaciones, emplearemos otras en la siguiente secci
on. Estas u
ltimas son consecuencias inmediatas de las probadas o enunciadas hasta ahora; o bien, son generalizaciones de las mismas. En todo caso,
apareceran en los ejercicios a continuacion.
150
Algunos resultados te
oricos.
Ejercicios y problemas.
(a constante arbitraria)
c) Si XY = 0 entonces
2
2
X+Y
= X
+ Y2 .
2. Sean X e Y variables aleatorias, cuyos rangos y probabilidades se denotan como en el desarrollo anterior, y con Sij la probabilidad conjunta
(de X = Xi e Y = Yj ).
El conjunto = {(Xi , Yj ) | i = 1, . . . , N; j = 1, . . . , M} consiste de
todos los posibles resultados conjuntos de las variables ( es llamado
el evento seguro). Definimos una relacion entre los elementos de :
la pareja (Xi , Yj ) esta relacionada con (X , Y` ) [denotado (Xi , Yj )
(X , Y` )] si se satisface Xi + Yj = X + Y` .
a) Muestre que la relacion es una relacion de equivalencia (i.e. es
reflexiva, simetrica y transitiva).
b) La propiedad del inciso anterior determina una particion de en
clases (ajenas). Muestre que si es un valor posible de X + Y (i.e.
si pertenece al rango de la variable suma), entonces X + Y =
determina un evento (es equivalente a un evento) de la particion, y
recprocamente, cada clase de la particion es un evento equivalente
al evento X + Y = para alg
un valor del rango de X + Y (ese
valor , es u
nico).
c) Una vez establecida una correspondencia biunvoca entre los eventos
que define X + Y (eventos elementales) y las clases de la particion,
enumere a estas u
ltimas (teoricamente) y asgneles probabilidades
a las mismas, luego a los eventos elementales que define X + Y.
d) Ahora que se tiene descrita matematicamente a X+Y como variable
aleatoria, por c, encuentre, utilizando estrictamente la definicion
1*, una expresion adecuada para X+Y y demuestre la validez de la
formula (media ponderada)
X+Y =
M X
N
X
j=1 i=1
151
Sij (Xi + Yj )
Algunos resultados te
oricos.
3. Sean X e Y variables aleatorias con la notacion acostumbrada.
2
a) Pruebe que X
= (X
)2
NOTA:
variable (aleatoria) ha sido definida en relacion al experimento, digamos X, de tal forma que toma los valores X1 , . . . , XN cuando
ocurren, respectivamente, R1 , . . . , RN . Siendo los Xi necesariamente numericos pero no necesariamente distintos (dos resultados
pueden dar origen al mismo valor de X). Muestre que la media de
X satisface:
X =
N
X
pi Xi
i=1
(Con esto se prueba que la media de una variable aleatoria es efectivamente una media ponderada).
En el inciso b, se entiende que X es una funcion de los
Ri . Mas concretamente, X(Ri ) = Xi As, el rango de valores de la
variable X se identifica con el rango de valores de X como funcion,
etc. , etc.
NOTA:
152
Confiabilidad en la medici
on.
a) Pruebe que
a.1)
M X
L
X
Sijk = pi ,
N X
L
X
Sijk = qj
N X
M
X
Sijk = rk .
j=1 k=1
a.2)
i=1 k=1
a.3)
i=1 j=1
COV(X, Z)
2
= P
n
v=1
X (v)
Concepto de confiabilidad.
Cuando medimos valiendonos de una cinta metrica el largo de una mesa, en
milmetros, muy probablemente ocurrira lo siguiente:
i) En repetidas mediciones de la mesa efectuadas en distintas ocasiones por
un mismo sujeto, o bien, realizadas por distintos sujetos, las mediciones
arrojaran resultados que variaran poco entre s.
ii) Los resultados que arrojan las mediciones expresaran seguramente el
largo de la mesa en las unidades propuestas; v.gr., en milmetros (siempre y cuando los espacios entre marca y marca de los milmetros sean
sensiblemente iguales entre s).
153
Confiabilidad en la medici
on.
La idea general es que existe un instrumento de medicion, en este caso una
cinta metrica, que garantice los resultados de i) y ii). La caracterstica en i),
de que en repetidas ocasiones los resultados de la medicion sean consistentes o
repetibles (o precisos) es referida como confiabilidad. Esto es, un instrumento
que se comporte como en i) se dice ser confiable. El aspecto mencionado en
ii), de que el instrumento mida lo que se supone medir (en ese caso el largo de
la mesa en milmetros), es referido como validez del instrumento de medicion.
Esto es, una cinta metrica con la caracterstica descrita en ii) se dice ser un
instrumento de medicion valido.
Estos dos aspectos de la medicion estan diferenciados: un instrumento puede
ser confiable pero no valido. Por ejemplo, si tenemos una cinta metrica con
una escala distorsionada, de tal modo que los espacios entre los supuestos
milmetros sean distintos entre s pero del orden de magnitud (por ejemplo,
algunos miden 1mm y otros 1.5mm en realidad), la medicion seguramente
retendra la caracteristica de i) pero ya no la de ii). En otras palabras, es
confiable pero no valido. Esto quiere decir que las mediciones son sensiblemente consistentes o repetibles, pero sus valores ya no expresaran el largo en
milmetros.
Nuestro interes es abordar en estas notas el primer aspecto de la medicion
mencionado, esto es, el de la confiabilidad. Solo que nuestro interes se refiere al de medir rasgos o caractersticas de seres humanos, como inteligencia,
aprovechamiento escolar, habilidades matematicas de cierto tipo, etc. Tpicamente, nuestros instrumentos de medicion son test o examenes escritos que
arrojan resultados como puntajes o calificaciones. Esto crea un panorama
muy distinto al de medir longitudes de objetos.
Cuando usamos, por ejemplo, una cinta metrica para medir repetidas veces la
longitud de una mesa, el largo de la mesa no variara sensiblemente de ocasion
en ocasion. En cambio, cuando aplicamos el mismo examen en distintas
ocasiones a un mismo sujeto, el sujeto puede variar significativamente en ese
lapso. Por ejemplo, en la primera ocasion estaba desvelado, cansado, tenso;
y en la segunda relajado, descansado, etc. Mas a
un, el sujeto se modifica
al aplicarle el examen mismo.
El individuo reacciona de muy diversas maneras al enfrentarse al examen la
primera vez. Una serie de procesos mentales tienen lugar, propiciados por
su intento de resolverlo, que pueden dar lugar a alg
un cambio potencial en
cuanto a la estrategia con que se enfrenta a cierta clase de problemas. En
otras palabras, el individuo aprende o modifica potenciales o habilidades al
enfrentarse al examen. Despues de todo, no es una maquina. De tal suerte
que, cuando se enfrenta por segunda vez, la situacion ha cambiado: es posible
154
Confiabilidad en la medici
on.
que retenga en la memoria las soluciones a las preguntas que pudo resolver,
de manera que atacara con mas tiempo y menos cansancio las que intento sin
exito la primera vez; ademas, quiza ahora con mas recursos que en aquella
ocasion.
Puede apreciarse pues, que estimar la confiabilidad de un test o examen por
aplicaciones sucesivas del mismo, tiene sus problemas. Una falta de acuerdo
(entre dos aplicaciones) en los puntajes no indica necesariamente una falla
del instrumento (esto es, que sea confiable), puede haber, en efecto, otras
explicaciones: cuando lo aplicamos por segunda vez el individuo ya no era
el mismo o las condiciones externas (ambientales, fsicas o squicas) haban
cambiado, etc. Al respecto, existen ademas otros problemas de orden tecnico.
En test o examen no se dise
na de modo que resulte confiable para un solo
individuo. Un test se dise
na para medir cierta poblacion de individuos (un
grupo o grupos de cierto nivel escolar, por ejemplo). Es relativamente facil
apreciar a ojo el acuerdo (o su ausencia) entre los puntajes obtenidos en
repetidas mediciones para un mismo individuo, pero necesitamos en realidad
tener una medida de la bondad del acuerdo entre grupos de puntajes en
dos aplicaciones. Esto es, el acuerdo entre dos series de puntajes que se
corresponden biunvocamente. Mas precisamente, dos aplicaciones de un
test arrojan parejas de puntajes; cada pareja representando los dos puntajes
obtenidos por un mismo individuo. Necesitamos pues juzgar globalmente el
acuerdo entre puntajes de una misma pareja.
Supongamos que tenemos numerados a los individuos con 1 , 2, , 3 , . . . y
que con (X1 , Y1 ) denotamos los puntajes obtenidos en la primera aplicacion
y la segunda, respectivamente, para el individuo 1. En general, (Xi , Yi )
representa la pareja de puntajes obtenidos por el individuo i. Hemos visto
que la correlacion nos mide, con cierto criterio, el grado de acuerdo entre los
puntajes Xi y los Yi . En realidad mide la bondad con que pueden aproximarse
a una ecuacion del tipo Y = aX + b con a y b fijos. La correlacion sera alta
cuando la recta ajuste bien a la pareja de datos. En particular, si las medidas
X e Y son muy parecidas; esto es, se cumpla aproximadamente X = Y , se
tendra una correlacion (positiva) grande (cercana a 1).
Como veremos mas adelante, se utiliza el coeficiente de correlacion como
una medida de la confiabilidad (en realidad, una medida normalizada de la
confiabilidad). Pero para evitar los efectos negativos (o inconvenientes), citados antes, cuando aplicamos el mismo test repetidamente suele utilizarse
la aplicacion de tests paralelos. En principio, dos tests son paralelos cuando
son equivalentes. Sus reactivos se corresponden en los dos tests biunvocamente, y se supone que reactivos correspondientes tienen el mismo grado de
155
Confiabilidad en la medici
on.
dificultad, se refieren o miden el mismo atributo, etc. Ademas, ambos son
aplicados al mismo tiempo. De hecho, el test que se les aplica consiste de los
dos tests paralelos juntos, con sus reactivos intercalados. Con esto se trata
de evitar que las condiciones externas o internas entre una aplicacion y otra
varen sensiblemente.
Teora Cl
asica de la confiabilidad en la medici
on.
Postulados:
1) El puntaje tj del individuo j, obtenido experimentalmente al medir,
tiene dos componentes aditivas, a saber, Tj que es el puntaje verdadero,
teorico e ideal y ej que es el error en la medicion; as
tj = Tj + ej
ej = tj Tj
156
Confiabilidad en la medici
on.
Seg
un el modelo de la teora clasica, t es una variable aleatoria obtenida
con la suma T (una constante9 ) y e (variable aleatoria). Deberamos en
realidad denotar al coeficiente de confiabilidad con tt0 (recuerde el uso de
letras griegas cuando se trata de medidas estadsticas en variables aleatorias
o en mediciones teoricas). Esto es, el coeficiente de confiabilidad se refiere a
la medicion teorica del coeficiente de correlacion. Cuando uno realiza un test
y lo prueba en un grupo dado midiendo rtt0 para los datos obtenidos, obtiene
un valor estimado de tt0 que correspondera a aplicar el test a todos los
posibles alumnos en todas las posibles circunstancias. Sin embargo, siguiendo
la notacion del texto Teora de los Tests10 , emplearemos rtt0 (de hecho,
ah se utiliza rtt ).
De acuerdo a los postulados de la teora clasica y aqu s concibiendo test
paralelo como enteramente equivalente (para facilitar los calculos) y no anticipar consecuencias de los cambios de escala (como se veran), se obtienen
las siguientes relaciones o conclusiones teoricas:
A) rtt0 es un n
umero entre 0 y 1 (nunca es el coeficiente de confiabilidad negativo, aunque en teora un coeficiente de correlacion puede ser negativo
entre 0 y 1).
B) Si un test se alarga n veces agregandole n 1 tests paralelos, se tiene
r(tt0 )n =
nrtt0
1 + (n 1)rtt0
tt0
ST2
; y
St2
Se2
=1 2 .
St
157
Confiabilidad en la medici
on.
Observe que a.3 se obtiene inmediatamente de a.1 y a.2. Ahora bien, la
relacion a.1 se verifica a partir de los postulados y de la formula
2
SX+Y
= SX2 + SY2 + 2rXY SX SY
9.5
COV(T, e)
2
See
0
Se2
Se20
ree0 Se Se0
entonces
St2 + St20 rtt0 St St0 = Se2 + Se20 ree0 Se Se0
9.6
pero ree0 = 0 (postulado 3); ademas, puesto que los tests son equivalentes,
las medidas teoricas St2 y St20 deben ser iguales (y por tanto, St = St0 ). Ahora
bien, por la relacion a.1 tenemos que
St2 = ST2 + Se2
Se2 = Se20
Confiabilidad en la medici
on.
y finalmente, despejando rtt0 obtenemos
rtt0 =
ST2
St2
9.7
N
X
2
SX
+
i
i=1
N
1
X
i=1
N
X
j=i+1
9.8
a>0
2
2
b.2) SaX
= a2 SX
2
SnT
= 2
S(t)n
9.9
2
Pero SnT
= n2 ST2 (por la igualdad b.2); y, por otra parte, por la formula
generalizada 9.8 aplicada a (t)n = nT + e1 + + en tenemos que
2
2
SnT
+e1+ +en = SnT +
11
n
X
Se2i + 2rnT,ei +
i=1
159
n1
X
i=1
n
X
j=i+1
Confiabilidad en la medici
on.
pero rnT,ei = rT,ei = 0 (b.1 y postulado 4) y rei ej = 0 (postulado 3),
entonces
n
n
X
X
2
2 2
2
2 2
S(t)
=
n
S
+
S
=
n
S
+
Se2
T
ei
T
n
i=1
i=1
Sustituyendo en 9.9:
r(tt0)n =
2
n2 ST2
n2 ST2
SnT
=
=
2
S(t)
n2 ST2 + nSe2
n(ST2 + Se2 ) + (n2 n)ST2
n
r(tt0 )n =
n2 ST2
nST2
=
nSt2 + n(n 1)ST2
St2 + (n 1)ST2
nST2
nST2
St2
St2
= 2
=
ST2
St + (n 1)ST2
1
+
(n
1)
St2
St2
donde, por el postulado 1, sabemos que rtt0 =
r(tt0 )n =
2
ST
St2
y por lo tanto
nrtt0
1 + (n 1)rtt0
160
Presentaci
on esquem
atica de la experimentaci
on.
CAPITULO 10:
ESQUEMATICA
PRESENTACION
DE
LA EXPERIMENTACION.
Introducci
on.
Presentamos en parte un resumen de los captulos 1 y 4 del libro Conducting
Educational Research 1 sin respetar propiamente el orden de los temas y
con algunas anotaciones propias.
Es conveniente advertir en primer termino que existen varios tipos de Investigaci
on Educativa, siendo la investigacion experimental, que es la que trata el
mencionado texto (y nuestro curso), una entre tantas posibilidades, aunque
muy importante. Posiblemente nadie en nuestros das objete la legitimidad de la investigacion experimental o la confiabilidad de sus conclusiones,
cuando esta se realiza en el contexto de las ciencias fsicas. Sin embargo,
en el terreno educativo la experimentacion ha sido cuestionada severamente
por investigadores en educaci
on de Matematicas de considerable reputacion.
M
as adelante, en su oportunidad, mencionaremos algunas objeciones. Por el
momento iniciaremos con el mencionado resumen.
Qu
e es investigaci
on?
La investigacion es un intento sistematico de dar respuesta a preguntas. De
acuerdo a la mayor o menor generalidad de las preguntas, se puede clasificar
(la investigacion) en: Basica y Aplicada.
Investigacion
particulares.
161
Presentaci
on esquem
atica de la experimentaci
on.
Qu
e es investigaci
on experimental?
Responder a tal pregunta nos va a tomar cierto tiempo pero podemos ir
adelantando algunas caractersticas.
En la investigacion experimental las preguntas son enunciadas o expresadas
en forma de hipotesis. Tal hipotesis conjetura, con mucha frecuencia, una
relacion de tal o cual tipo entre dos variables o entre dos grupos de variables.
Una de ellas llamada variable independiente y la otra variable dependiente. Mas precisamente, la hipotesis propone una relacion del tipo causa-efecto
entre la(s) variable(s) independiente(s) y la(s) variable(s) dependiente(s) respectivamente (ver figura 10.1)
ca u sa
.................................................
...........
........
........
......
......
.....
.
.
.
...
..
.
.
...
.
.
.
..
...
....
...
...............................................
...
...
.
...
.
.
.
...
.
.
.....
.....
......
.......
......
.........
.......
......................................................
variable(s)
independientes
tipo de
relaci
on
e f e c t o
variable(s)
dependientes
.............................................
...........
........
........
......
......
......
.
.
.
.
....
..
.
.
...
..
.
..
.
..
.
.
.
.
.
.
.
.
.
.
.
................................................ ..
...
...
...
.
...
.
.
...
.
..
.....
.....
......
......
........
........
...........
................................................
figura 10.1
Qu
e es variable?
En el contexto que nos ata
ne, aparte del significado matematico que el nombre variable sugiere, el Profr. James W. Popham, en su libro Educational
Statistics nos da la siguiente version:
Variable Educativa es cualquier caracterstica o rasgo humano por el cual
los individuos se distinguen unos de otros.
Con tan amplia definicion, las estaturas, los pesos, etc. de las personas son
variables educativas. Por triviales que puedan parecer (o irrelevantes al proceso educativo) tales variables, es en realidad difcil descartarlas. En edades
tempranas y en el ambiente escolar, los pesos y las estaturas de los escolares
pueden, sin duda, tener influencia (o cierta influencia) en el desempe
no de
los alumnos. Pueden crear sentimientos de inseguridad, de inferioridad o lo
contrario, e indudablemente tales condiciones psicologicas se reflejaran en su
escolaridad.
Por qu
e son llamadas variables independientes unas y variables
independientes otras?
El adjetivo independiente en este contexto se refiere a que el investigador
tiene posibilidad de manipular tal variable y de hecho verificar sus efectos
162
Presentaci
on esquem
atica de la experimentaci
on.
(seg
un lo estipula o al contrario) sobre la variable dependiente. Veamos un
ejemplo.
Un investigador cree que de dos textos programados, texto A y texto B, el
primero es mas eficiente que el segundo en cuanto a logros de aprendizaje.
Enuncia entonces la siguiente hipotesis:
El texto A consigue mejor aprovechamiento en los alumnos que el texto B.
El texto programado (A o B) corresponde a la variable independiente y el
aprovechamiento escolar corresponde a la variable dependiente. As, la variable independiente solo tiene dos valores posibles: A o B. El investigador
manipula esta variable en el sentido de que a un grupo de alumnos se les
hace seguir el texto A mientras que a otro grupo se les imparte el texto B.
Qu
e otros tipos de variables se consideran en la investigaci
on experimental?
Ademas de las variables independientes y dependientes el experimentador
tiene que dar cuenta de otras variables que pueden influir en la relacion entre
la variable independiente y la dependiente. Si esta influencia no interesa
estudiarla o falsea la posible relacion entre las variables independiente y
dependiente, tal variable es llamada
variable de control
El interes del investigador a este respecto es controlar tal variable en el sentido
de anular su variacion (fijando su valor) o reduciendo sus efectos sobre las
variables independiente o dependiente.
Otro tipo de variables cuya influencia en la relacion entre las variables independiente y dependiente es moderada, o en todo caso, sus efectos en tal
relacion tienen interes para el investigador, son llamadas
variables moderadoras
En tal caso, el experimentador bajo supervision permite variar a tal variable observando el efecto de tal cambio en la mencionada relacion variable
independiente-variable dependiente. Puede ser que su influencia sea simplemente matizar la aludida relacion, acentuandola o debilitandola.
Con respecto al ejemplo de los textos A y B, podemos ilustrar mejor el papel
de las variables de control y moderadoras. Veamos. Dada la hipotesis de
que con el texto programado A se consigue un mejor aprovechamiento en los
alumnos que con el texto programado B, podemos considerar las siguientes
variables
163
Presentaci
on esquem
atica de la experimentaci
on.
a) independiente: texto (A o B),
b) dependiente: aprovechamiento escolar,
c) de control: profesor y
d) moderadora: inteligencia (del alumno).
................................................................
..........
........
.......
......
......
.
...
.
.
...
..
.
.
.
.
..................
.......
.
.. ............ ..
.
............... . .......
.
.......
.
.
.
.
.
.
.
.
.
..
.
.
.......
...... .
......
.. ...............
.........
................................................. .
........
..............
......................................................
.....................
...........
............
.
.
.
.
.
.
.
.
.
.
.
.........
.
.
.
.
.
..............
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
........
.......
.... .
......
......
......
.....
.
......
.
.
.
.
.
.
.
....
.
...
..
..
.
.
..
.
.
..
..
..
.
.
.
.
....
.
..................................................................................................................
.
...
.
...
.
...
.
....
.
.
....
.
..
.
.
.
.
......
.
.
.
.
.
......
..
....
.......
........
.......
.......
..........
........... .
.....................................
..........
...................
..........
...................
..........
.................................................................
.......................................................
..........
.......
.
.
.
.
.
.
.
.
......
.
.
.
.
......
..
...
.......
....
.......
........ .......
.. ...........
.......... ...
........
..........
.
.
...
...
....
...
......
.....
.......
......
.
.........
.
.
.
.
.
.
.
.................
....
.........................................
(c)
profesor
(a)
texto
causa efecto
(b)
aprovechamiento
(d)
inteligencia
figura 10.2
En la hipotesis, el investigador desea probar que el texto A es superior al B
en cuanto a logros en el aprovechamiento, pero independientemente del profesor. Resultara poco serio un estudio que mostrara que el texto A auxiliado
por un excelente profesor resultara mas eficaz que el texto B auxiliado por
un pesimo profesor. Se trata de mostrar que los textos en s responden por
el mayor o menor aprovechamiento de los alumnos. El investigador debe por
tanto controlar la variable profesor, por ejemplo fijandola (con profesores comparativamente equivalentes para ambos textos) o bien anulandola
(utilizando varios profesores elegidos al azar para cada texto).
Por otra parte, si el investigador desea averiguar como la inteligencia del
alumno puede influir en el aprovechamiento para cada texto, (v. gr. a mayor
inteligencia la ventaja en el aprovechamiento debido al texto A sobre el B
se acent
ua o se debilita), entonces el experimentador ha elegido a la inteligencia como variable moderadora. Se supone entonces que el investigador
experimental tomara en cuenta a la inteligencia de los alumnos en funcion
de la relacion del aprovechamiento con los textos, por ejemplo, comparara la
ventaja del texto A sobre el B para alumnos de inteligencia inferior con la
misma ventaja (si la hay) para alumnos de inteligencia superior.
Conviene hacer notar aqu que en naturaleza las variables de control y las
moderadoras no difieren, es una cuestion de eleccion del investigador si se les
da una funcion o la otra. En el ejemplo precedente pudo haberse elegido que
la inteligencia del alumno fuese una variable de control, de tal forma que se
164
Presentaci
on esquem
atica de la experimentaci
on.
hubiesen tenido dos variables de control. O bien, la variable Profesor pudo
haber sido considerada moderadora, mientras que la inteligencia se trataba
como variable de control, etc.
Finalmente, existe un quinto tipo de variable que recibe el nombre de intermedia. En realidad tal variable es la autentica variable dependiente, la que
en todo caso responde del efecto de la aparente variable dependiente.
efecto
causa
.....................................................
..........
.......
.......
......
.....
....
.
.
...
..
.
..
....
.
...
...
....
...
.
.....
.
.
..
.
.......
.
.
.
.
.........
....
..................
.........
................................
Var.
independiente
.......................
.......
.....
.....
....
...
....
.
.
...
.
.
.
...
..
.
...
.
.
..
.
..
.
...
....
...
..
..
..
..
...
.
.
.
.
.
.. ...........................................................
.
......................................................... ...
..
.
...
...
..
.
.
...
.
.
...
..
...
...
...
..
...
..
.
.
...
..
...
..
....
...
....
.....
.
......
.
.
.
.
..........................
Var.
intermedia
.....................................................
..........
.......
.......
......
.....
....
.
.
...
..
.
..
....
.
...
...
....
...
.
.
.....
.
..
.
.......
.
.
.
.
.........
....
..................
.........
................................
Var.
dependiente
(efecto)
(causa)
figura 10.3
En el ejemplo precedente tendremos que la Variable Intermedia es el Aprendizaje (del alumno). Lo que ocurre es que, aunque lo que nos interesa acerca
de los textos, mejor dicho, de su efecto, es el aprendizaje por parte del alumno, no nos es posible averiguar directamente el aprendizaje de un alumno. No
sabemos, simplemente, que ocurre realmente en esa caja negra que tiene
el alumno dentro de su craneo. A lo que podemos aspirar seguramente es a
ver unos palidos reflejos de lo que ha quedado en su interior y que muchas
veces llamamos aprovechamiento escolar. En otras palabras, ponemos a
prueba al alumno de tal forma que queden de manifiesto algunos efectos o
consecuencias de lo que ha aprendido.
De d
onde surgen las hip
otesis?
Seguramente todo profesor se ha enfrentado a una serie de problemas en el
proceso de ense
nanza-aprendizaje. Con un poco de suerte, algunos profesores
incluso se han planteado una lista de preguntas acerca de ciertas dificultades
en la instruccion de ciertos temas o al aprendizaje de los mismos. Muchas
de estas preguntas son en realidad problemas de tipo muy general, como por
ejemplo: C
omo hacerle para que los alumnos dominen el lenguaje algebraico
y operen con el?
Tales cuestiones no admiten facil respuesta. Mas a
un, son planteamientos
casi filosoficos que no dan clara indicacion de la naturaleza del problema y
165
Presentaci
on esquem
atica de la experimentaci
on.
por lo tanto, no sugieren alguna posible estrategia para su solucion. Ni que
decir que no pueden ser formulados directamente en forma de hipotesis y
consecuentemente, que no son sujetos de experimentacion.
Algunos cientficos han expresado que estrictamente hablando no hay problemas irresolubles, sino mal planteados. Sin embargo, hacerse las preguntas
correctas es un arte difcil de dominar y su tecnica (si la hay) es practicamente desconocida. En cierto modo, la situacion puede parecer a
un peor
para las preguntas que pueden ser sujetos de experimentaci
on: no basta hacerse las preguntas correctas, estas tienen que ser formuladas en forma de
hip
otesis. Una pregunta puede estar bien planteada y sin embargo es posible
que no pueda ser expresada (directamente) en forma de hipotesis. Para que
esto u
ltimo ocurra, la pregunta tiene que tener la forma de una conjetura:
debe expresar alguna va de solucion. Un ejemplo de tal tipo de cuestion
relacionada con la pregunta general enunciada antes es la siguiente
Para que los alumnos dominen el lenguaje algebraico y operen con el se
requiere un buen manejo de la aritmetica y en general ciertos conocimientos de las reglas que rigen las operaciones y manipulacines aritmeticas?
En forma asociada podra tenerse la siguiente hipotesis:
Los alumnos que alcanzan buen dominio del lenguaje algebraico y que
operan satisfactoriamente con el, generalmente tambien tienen un buen
manejo de la aritmetica y de las leyes o reglas de manipulaci
on aritmetica.
La hipotesis trata de expresar que la manipulacion aritmetica adecuada es
condicion necesaria para la correspondiente version algebraica.
Llegado a este punto, el lector se preguntara en que contribuye entonces la
experimentacion educativa a la solucion de los problemas educativos si
1) Es necesario formular el problema en un buen planteamiento
2) El problema debe ademas sugerir una alternativa de solucion que permita ser expresado en forma de hipotesis.
En otras palabras, uno debe hacerse buenas preguntas y apuntar a su soluci
on, as que en que contribuye la experimentacion para resolver el problema?
Tratare de responder a la pregunta por etapas. Para empezar, evidentemente
contribuye a verificar si la solucion apuntada (en el nivel del inciso 2 lo es
o no. Por otra parte y yendose a otro extremo, no nos podramos ahorrar
nunca el paso establecido en el inciso 1 (plantear bien el problema), pues sin
166
Presentaci
on esquem
atica de la experimentaci
on.
tal buen planteamiento el problema jamas sera resuelto; as que sera mucho
pedirle a la experimentacion que nos ahorrara tal paso. Para ser justos, en
todo caso, el hacer una experimentacion del problema en cuestion, nos obliga a hacer un analisis previo, incluyendo mas trabajo que el estipulado en
el inciso 1, pero precisamente ah radica parte de su merito. Esta ulterior
precision del problema nos hace mas clara la naturaleza del mismo y de una
toma de conciencia de las variables relevantes en el caso. Recuerdese que
ademas de formular la hipotesis tenemos que elegir las variables de control y
las moderadoras. Puede decirse pues que las exigencias de una experimentaci
on nos obliga a ser mas sistematicos y mas analticos, con el consiguiente
beneficio.
Resumiendo lo dicho hasta ahora, las hipotesis surgen de plantear correctamente los problemas educativos y de hacer un analisis sistematico de los
mismos, identificando las variables mas relevantes y conjeturando relaciones
entre ellas.
Hablando formalmente, podramos hablar de tres fuentes en la deteccion,
correcta formulacion y analisis de los problemas:
i) Teora
ii) Experiencia y
iii) Filosofa.
La Teora puede ser una teora de aprendizaje (Piaget, Skinner, etc.) o una
correspondiente teora de la instruccion. La Experiencia puede ser la propia
u otra que hemos ledo o no han comunicado. La Filosofa puede ser la de
un filosofo o pensador, o bien, nuestra propia capacidad de discernimiento o
especulativa.
Qu
e tan v
alida es la experimentaci
on educativa?
Antes de hablar de la experimentacion educativa, en la investigacion experimental en general, se establecen dos tipos de validez:
a) Interna. Un estudio posee validez interna si los resultados del mismo
estan en funcion del esquema o acercamiento que ha sido programado
en vez de ser consecuencia de otras causas que no han sido consideradas
sistematicamente en el estudio.
b) Externa. Un estudio posee validez externa si los resultados obtenidos se
pueden aplicar a esquemas o acercamientos similares en la realidad.
167
Presentaci
on esquem
atica de la experimentaci
on.
Es de hacer notar que existe un cierto compromiso entre ambos tipos de
validez. Para conseguir buena validez interna es necesario considerar cuidadosamente las variables de control. La omision del control de ciertas variables
que fuesen especialmente relevantes en la cuestion tratada podra explicar los
resultados obtenidos como consecuencia de su variacion en vez de ser consecuencia (los resultados) de las variables (independientes) que ha manipulado
el investigador.
Por otra parte, si el investigador ejerce demasiados controles sobre muchas
variables, el experimento, con gran validez interna, se ha realizado en condiciones ideales que no seran reproducibles en la realidad (en el aula, por
ejemplo), con la consiguiente perdida de validez externa.
Aparte de este compromiso entre ambos tipos de validez, la experimentacion
en educacion ha sido atacada por algunos investigadores esgrimiendo como
argumento que en educacion intervienen tantsimas variables, muchas de ellas
desconocidas, que pretender ejercer alg
un control serio es practicamente ilusorio.
Ciertamente, la experimentacion educativa no es la panacea que nos librara
de todos nuestros problemas, pero indudablemente es un recurso mas, que
por una parte, para los profesionales en la educacion de las matematicas, tan
atiborrados de problemas educativos, sera practicamente un lujo despreciarla
o dejarla fuera de consideracion.
Y, por otra parte, para aquellos docentes que se han visto en la situacion de
decidir sobre un metodo u otro de instruccion (o una cuestion semejante),
eligiendo de acuerdo a los resultados obtenidos, guiandose muchas veces por
su impresion personal, o en todo caso, procediendo de un modo intuitivo,
que mejor que hacerlo de modo mas sistematico, utilizando el esquema de la
investigacion experimental, con la esperanza de tener mejores elementos de
juicio en su decision.
C
omo se decide acerca de la validez de las hip
otesis?
Responder a tal pregunta tiene que ver con el empleo de los metodos estadsticos y en particular de la Estadstica Inferencial que sera objeto de estudio
del siguiente captulo, pero podemos ir adelantando algunas consideraciones
al respecto.
Puesto que la verificacion de las hipotesis esta relacionada con otras partes
de la experimentacion, he considerado conveniente de una vez presentar un
esquema global de una experimentacion en la figura 10.4
168
Presentaci
on esquem
atica de la experimentaci
on.
..........................................
..............................
...........
.......
............
.......
.......
.....
....................................
.......
....
.....
....
........
.....
.
.
.
.
.
...
.
.
....
...
..
.
.
.....
....
...
..
...
.
.
...
.
.
.
.
...
.
.
...
.
.
......
.
.
.
.
.
.
.
.
.
.
.....
......
.
.
..
.
.
.
...........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
............ . ...........
........
.
.......................
..
.......................
.............
........
...
...
.......................................
...
...
...
...
.
.
...
.
.
.....
...
.
...
.
...
...
.......................................
.
.
.
.
...
.
.
.
.
.
.
.
...
........
...
.
.
.
...
.
.
.
.
.....
...
...
.
...
.
.
.
...
.
...
...
....................................................................................................
.................................................................................................. .....
.
. ....
.
...
.
.
.....
.
.
.
.......
...
......
..........
..............................................
...
...
.
.........
....
.
........................................................................................................................
....
...
..
...
.
................
...
...................
...
...
..
...
....
...
...
...
..
...
...
..
...
...
...
..
...
...
..
...
...
...
.
.
.............................................................................................................................................................
...
...
...
...
.......
.....
..........
. ........
.............
..............
.........................................
.
.
.
.
.
.
.
.
.
.
.
.
.
........................................................
.
.
.
.
..........
.....
.
.
...........
........
.
.
.
.
.
.
.
.
.
.
.
.
......
......
....
......
.....
.....
.....
.
.....
.
.
.
.
.
...
.
.
...
.
.
..
.
..
.
.
.
..
..
....
.. .................................................... ...
.
.
.
.
.
...
.
..
.
.
.
...
.
..
...
.
...
...
.
.
.
.
....
.
.
.
.....
.
.
.
.
.
.
......
.
.
.
.
......
....
.......
......
........
.......
..........
...........
........
.....................
..........
.......................................................
................................
...
...
..
..
...
..
........
........
....
....
.
.
.
.
.
.
.
.
.
.
.
.
.........................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.................
..........
................
................
.........
........
.........
.........
.......
.......
.......
......
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
....
....
..
.
...
.
.
...
.
.
...
..
..
..
....
.
.. .................................................... ...
..
..
....
. ..
.
.
.
.
...
.
.
.
...
.
...
...
.
.
...
.
.
.
.....
.
.
.
.
.....
.
.
.
.
.
.
......
.
.
.
.
.
.
.
.
.......
...
...
........
..........
..........
........
........
....
............................................................
...........
.. ..............................................
...
...
...
.
.
...
...
... .
................................................ ........
................
..................................
.
.
.
.
.
.
.
.
.
.......
.
.
.
.
......
......
....
.....
...
....
.
.
...
..
.
..
...
..
...
...
...
..
.
...
.
.....
...
......
.....
........
......
..........
........
.
.
.
.
.
.
.
.
................
.
.
...................................................
...
.
...........................
............
........
.
.
.
.
.
.
.
.......
..
.
.
.
.
.
.
.......
.....
......
......
.
.
........
.
.
.
.........
.
..............
.
.
...
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
..................................
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
............
......
.
................
.........
.
.
.
.
.
.
.
.
.
.......
.........
.......
...
.
.
.
.
.
.
.
.
.
.
.
.
.
.....
.....
.
.
...
.
.
.
.
.
.
...
.
.
...
.
.
.
.
...
.
.
.
..
....
..
..
.....
...
..
...
..
.
...
.
.
...
....
.
.
....
.
.
.
.
.
......
..
..
......
.
.
.
.
.
.
.
.
.
.
.
........
........
.
.
............
........
............
........
..............................................
...............................................
Experiencia
Teora
FUENTES:
Filosofa
Detecci
on de
Problema(s)
An
alisis del problema
ANALISIS:
DISENO:
Formulacion Formulacion
Operativa de
de
hipotesis
hipotesis
Dise
no del
Montaje de la
Experimentaci
on
Dise
no del
An
alisis
Estadstico
Preparaci
on
Preparaci
on de
los Instrumentos
de Medici
on
de los Materiales
y Recursos
Toma de Datos
y
Analisis Estadstico
PROCESAMIENTO:
DECISION:
Hip
otesis
(nuevas)
Conocimientos
(nuevos)
Presentaci
on esquem
atica de la experimentaci
on.
tal analisis debe permitir expresar tal hipotesis en forma operativa, esto es,
de una manera tal que las variables en ella explcitas sean susceptibles de
ser observadas y de hecho medidas. En otras palabras, la hipotesis debe ser
reformulada en terminos medibles.
El termino medicion esta referido aqu en la generalidad que se describe en
el captulo 1. Veamos un ejemplo de tal formulacion operativa de hipotesis.
Tenemos la hipotesis original:
El texto programado A consigue mayor (o mejor) aprendizaje del alumno
que el texto B.
la cual puede traducirse en la hipotesis operativa:
El aprovechamiento medio (seg
un el Test X) de los alumnos que siguen el
texto A es superior al aprovechamiento medio de los alumnos que siguen
el texto B.
donde con aprovechamiento medio se refiere a la media aritmetica de una
poblacion hipotetica en los puntajes de cierto Test X (que mide el aprovechamiento) que ha seguido uno de los textos.
M
as precisamente, ante la imposibilidad de medir el aprendizaje2 , se mide
un reflejo de este: el aprovechamiento. Este a su vez (para los efectos de
ser medido) se define operativamente como el puntaje del Test X que viene
a ser el instrumento (o uno de los instrumentos) de medicion que figura en
el diagrama (fig. 10.4). Ahora bien, la hipotesis original predice que este
puntaje es superior con el Texto A como tratamiento que con el B. Pero
que quiere decir esto u
ltimo, si el aprovechamiento es una variable? Esto
es, el aprovechamiento vara de sujeto a sujeto, luego se tienen dos variables
aleatorias XA y XB que son definidas, respectivamente, como el puntaje
obtenido despues de seguir el Texto A y el Texto B.
Falta ahora especificar el rango de las variables, mejor dicho, en cuales sujetos
se mide. Se supone que el texto A es mejor que el texto B para cierta
generalidad de alumnos, digamos los que estan en el nivel medio superior en
tal sistema escolar (o cierta Universidad). Tal conglomerado de alumnos se
llama Poblacion (en el contexto tratado). Sin embargo, nos referimos a ella
con el calificativo de hipotetica. Esto fue as puesto que es imposible que
tal Poblacion reciba por separado e independientemente los dos tratamientos
(si recibe el del texto A, determinamos la distribucion de la variable XA , pero
hemos nulificado la posibilidad de determinar la distribucion de probabilidad
de XB ). As que postulamos la existencia de la poblacion hipotetica que ha
2
Directamente.
170
Presentaci
on esquem
atica de la experimentaci
on.
recibido el texto A y por lo tanto la de la variable aleatoria XA y similarmente
la existencia de la distribucion de XB . Finalmente, queremos de alg
un modo
expresar nuestra prediccion de que XA es mayor que XB . Un modo posible
es decir que A > B .
En resumen, con todas las anotaciones precedentes, la hipotesis puede traducirse en terminos medibles (luego veremos por que s es medible) la hipotesis
operativa es
H1 : A > B
(H1 se lee hipotesis alterna o de investigacion n
umero 1). Por razones
tecnicas, que tendran que ser explicadas posteriormente, se introduce la
negacion de tal hipotesis de investigacion, la cual recibe el nombre de hipotesis
nula:
H0 : A B
En la practica, pocas veces la hipotesis nula es estrictamente la negacion de
H1 . En nuestro caso, la hipotesis nula de trabajo es
H00 : A = B
En realidad esta u
ltima deba expresarse con H0 en vez de H00 , lo cual se hizo
s
olo para fines de distinguirla de la anterior que era la negacion estricta.
Regresemos ahora al punto de la mesurabilidad de A y B , cuando solo
son medias de poblaciones hipoteticas. Precisamente aqu es donde entra la
Estadstica Inferencial, la cual a partir de dos muestras (en este caso, dos
grupos de alumnos), muestras que ahora s son reales, se determinan sus
A y X
B y si ocurre que X
A > X
B y la diferencia
medias X
A X
B
X
es positiva y significativamente grande, como para ser explicada por el azar,
se concluye (con un peque
no riesgo, cuyo valor maximo en terminos probabilsticos se llama nivel de significacion) que A > B y consiguientemente
que la hipotesis de investigacion es valida.
Por supuesto que hemos dejado de lado una gran multitud de detalles en lo
que hemos referido y en lo que no se ha mencionado del esquema de la figura
10.4.
171