You are on page 1of 27

UNIVERSIDAD DE CHILE

VICERRECTORA DE ASUNTOS ACADMICOS


DEPARTAMENTO DE EVALUACIN, MEDICIN Y REGISTRO EDUCACIONAL

NOCIONES BSICAS DE ESTADSTICA UTILIZADAS EN EDUCACIN

SANTIAGO, septiembre de 2008

NOCIONES BSICAS DE ESTADSTICA UTILIZADAS EN EDUCACIN

QU ES LA ESTADSTICA?

La estadstica es una disciplina que disea los procedimientos para la obtencin de los datos, como asimismo proporciona las herramientas que permiten extraer la informacin. Los mtodos estadsticos constituyen uno de los medios por los que el hombre trata de comprender la generalidad de la vida. Los mtodos objetivos y controlados que permiten abstraer grupos de tendencias de muchos individuos aislados, son llamados mtodos estadsticos. Estos son fundamentalmente los mismos, independientemente de que se apliquen en el anlisis de fenmenos fsicos, en el estudio de mediciones educacionales, en el estudio de datos provenientes de experimentos biolgicos, o del anlisis cuantitativo del material en economa Los ejemplos de estas nociones bsicas son tomados de aquellos usados en educacin y principalmente en la etapa de trmino de la Educacin Media y su postulacin a la Educacin Superior.

Estadstica descriptiva La estadstica descriptiva es un conjunto de procedimientos que tienen por objeto presentar masas de datos por medio de tablas, grficos y/o medidas de resumen. De acuerdo a lo anterior, la estadstica descriptiva es la primera etapa a desarrollar en un anlisis de informacin.

Tablas de Frecuencias: Una forma de presentar ordenadamente un grupo de observaciones, es a travs de tablas de distribucin de frecuencias. La estructura de estas tablas depende de la cantidad y tipo de variables que se estn analizando, siendo las ms simples las que se refieren a una variable.

EJEMPLO : Se tienen las notas de una prueba de matemtica para 1000 alumnos de enseanza media de un determinado colegio. Se resume la informacin en la siguiente tabla de frecuencia.

NOTA

FRECUENCIA

NOTA

FRECUENCIA

1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0

1 2 3 8 15 18 19 22 25 26 28 31 35 38 45

4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0 6,2 6,4 6,6 6,8 7,0

46 48 52 58 60 56 54 51 50 46 44 40 32 31 18

En una tabla se pueden distinguir los siguientes tipos de frecuencias:

Frecuencia Absoluta

Es el nmero de repeticiones que presenta una observacin. Se denota por ni Es la frecuencia absoluta dividida por el nmero total de datos. Se denota por fi Es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La ltima frecuencia absoluta acumulada es igual al nmero de casos. Se denota por Ni Es el resultado de dividir cada frecuencia absoluta acumulada por el nmero total de datos. Se denota por Fi

Frecuencia Relativa

Frecuencia Absoluta Acumulada

Frecuencia Relativa Acumulada

Para el ejemplo propuesto se determinaron las distintas frecuencias, las que se muestran en la siguiente tabla:

NOTA

FREC. ABSOLUTA

FREC. ABSOLUTA ACUMULADA

FREC. RELATIVA

FREC RELATIVA ACUMULADA

1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0 6,2 6,4 6,6 6,8 7,0
TOTAL

1 2 3 8 14 18 19 22 25 26 27 31 35 38 45 46 48 52 58 60 56 54 51 50 46 44 40 32 31 18
1000

1 3 6 14 28 46 65 87 112 138 165 196 231 269 314 360 408 460 518 578 634 688 739 789 835 879 919 951 982 1000

0,001 0,002 0,003 0,008 0,014 0,018 0,019 0,022 0,025 0,026 0,027 0,031 0,035 0,038 0,045 0,046 0,048 0,052 0,058 0,060 0,056 0,054 0,051 0,050 0,046 0,044 0,040 0,032 0,031 0,018

0,00 0,00 0,01 0,01 0,03 0,05 0,07 0,09 0,11 0,14 0,17 0,20 0,23 0,27 0,31 0,36 0,41 0,46 0,52 0,58 0,63 0,69 0,74 0,79 0,84 0,88 0,92 0,95 0,98 1

Nota: Si la frecuencia relativa y relativa acumulada la multiplicamos por 100, los valores obtenidos representan porcentajes, lo que facilita la interpretacin de los datos.

De esta tabla se pueden sacar conclusiones como: 45 alumnos obtuvieron nota 4,0 578 alumnos obtuvieron nota inferior o igual a 5,0 El 1,8 % de los alumnos obtuvo nota 7,0 El 31 % obtuvo nota 4.0 o inferior a sta, mientras que el 69% obtuvo una nota superior a 4,0

Esta informacin tambin puede ser representada en forma grfica como se muestra a continuacin:

HISTOGRAMA
70 60 FRECUENCIAS 50 40 30 20 10 0 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 NOTAS

En el histograma se observa grficamente la distribucin de las notas de la prueba, y que los puntos ms altos estn en las notas 4,8; 5,0 y 5,2 las que coinciden con las frecuencias ms altas de la tabla.

Otra forma de representar los datos es a travs de un polgono de frecuencias que es un grfico de puntos en el cual se muestra la distribucin dibujada punto por punto representando los valores especficos de la variable bajo estudio.

En el ejemplo se puede observar que se representan los 30 valores que toman las notas. La frecuencia ms alta de alumnos la alcanza la nota 5,0

POLIGONO DE FRECUENCIA
70 60 FRECUENCIA 50 40 30 20 10 0 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 NOTAS

La ojiva o polgono de frecuencia acumulada nos muestra justamente las frecuencias acumuladas. En nuestro ejemplo la Ojiva nos dice que hay alrededor de 800 alumnos que obtuvieron nota 6 o menos en la prueba de matemtica.

OJIVA O POLIGONO DE FRECUENCIA ACUMULADA


1200 1000 FRECUENCIA 800 600 400 200 0 1,2 1,4 1,6 1,8 2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,6 3,8 4 4,2 4,4 4,6 4,8 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 NOTAS

MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central son valores numricos que tienden a localizar la parte central de un conjunto de datos. Nos dan un centro de la distribucin de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. A continuacin se presentan los ms usados. La Media aritmtica: tambin denominada promedio, es la que se utiliza principalmente y se define como la suma de los valores de todas las observaciones divididas por el nmero total de datos. Se representa por x o por la letra segn se calcule en una muestra o en la poblacin, respectivamente.
NOTA FREC. ABSOLUTA FREC. ABSOLUTA ACUMULADA FREC. RELATIVA % FREC RELATIVA ACUMULADA % xi*ni

1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0 6,2 6,4 6,6 6,8 7,0
TOTAL

1 2 3 8 14 18 19 22 25 26 27 31 35 38 45 46 48 52 58 60 56 54 51 50 46 44 40 32 31 18
1000

1 3 6 14 28 46 65 87 112 138 165 196 231 269 314 360 408 460 518 578 634 688 739 789 835 879 919 951 982 1000

0,1 0,2 0,3 0,8 1,4 1,8 1,9 2,2 2,5 2,6 2,7 3,1 3,5 3,8 4,5 4,6 4,8 5,2 5,8 6,0 5,6 5,4 5,1 5,0 4,6 4,4 4,0 3,2 3,1 1,8

0,1 0,3 0,6 1,4 2,8 4,6 6,5 8,7 11,2 13,8 16,5 19,6 23,1 26,9 31,4 36,0 40,8 46,0 51,8 57,8 63,4 68,8 73,9 78,9 83,5 87,9 91,9 95,1 98,2 100,0

1,2 2,8 4,8 14,4 28,0 39,6 45,6 57,2 70,0 78,0 86,4 105,4 126,0 144,4 180,0 193,2 211,2 239,2 278,4 300,0 291,2 291,6 285,6 290,0 276,0 272,8 256,0 211,2 210,8 126,0
4717,0

La frmula para calcular el promedio es entonces:

x=

x
i =1

En el ejemplo dado que se tiene una distribucin de frecuencias el promedio se calcula por:

x= Donde: ni xi n

x n
i =1 i

: Representa la frecuencia absoluta de cada grupo. : Corresponde a la clase de cada grupo. : Cantidad total de datos.

Aplicando la frmula se obtiene:

x=

4717 = 4,717 1000

Por lo tanto, la media de notas de los alumnos en la prueba de matemtica es de 4,7

Propiedades de la media aritmtica: Puede ser calculada en distribuciones con escala relativa e intervalar. Todos los valores son incluidos en el clculo de la media. Una serie de datos solo tiene una media. Es una medida muy til para comparar dos o ms poblaciones. Es la nica medida de tendencia central donde la suma de las desviaciones de cada valor respecto a la media es igual a cero. Por lo tanto, podemos considerar a la media como el punto de balance de una serie de datos.

Desventajas de la media aritmtica Si alguno de los valores es extremadamente grande o extremadamente pequeo, la media no es el promedio apropiado para representar la serie de datos. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase abiertos.

Observaciones:

1.

A veces se interpreta errneamente a la media como aquel valor que es tpico, o que se esperara que la mayora de las personas tuvieran. Esta interpretacin puede ser bastante absurda en algunos casos, por ejemplo, cuando se calcula la media de hijos en un grupo de mujeres, se obtiene que es de 2.3 nios y, obviamente, no se puede esperar encontrar una madre con exactamente 2.3 nios. Todo lo que la cifra dice, es que si dividimos el nmero total de nios de las mujeres consideradas por el nmero de mujeres, el resultado es 2.3 nios por mujer. Esto puede ser un conocimiento til en la comparacin de tamao de familia, de dos o ms grupos, pero no sugiere que alguna mujer tenga 2.3 nios. Otras veces se piensa que la media aritmtica tiene la caracterstica que la mitad de las observaciones es menor o igual que la media. Este concepto es totalmente errado en algunos casos, por ejemplo, si la distribucin es asimtrica a la derecha, como puede ser la distribucin de salarios donde hay muchas personas que ganan poco y hay pocas personas que ganan mucho, la media aritmtica resultar mucho ms grande de lo que uno esperara encontrar, si se piensa que el valor central debe ser tal que la mitad de las personas tiene un salario inferior a l y la otra mitad un salario superior. Esto se debe a la presencia de unos pocos valores excesivamente grandes que al tener demasiada influencia en el valor de la media aritmtica hacen que ella se ubique en una posicin ms extrema a la esperada. En consecuencia debera pensarse en otras medidas para evaluar un valor central con esta caracterstica.

2.

Mediana:

Se define como el valor que deja igual nmero de observaciones a su izquierda que a su derecha, es decir, divide al conjunto de datos en dos partes iguales y se denota por Me. Si los datos no estn tabulados la mediana se determina, ordenando las observaciones de menor a mayor y determinando el valor central. Si la cantidad de datos es impar, la mediana se representa justamente por ese valor. En cambio, si la cantidad es par, la mediana es el promedio de los datos centrales. Si los datos estn agrupados la mediana se calcula observando los siguientes pasos: primero se debe determinar cuanto es n/2, luego se ver en cul intervalo estar contenido este valor. Una vez ubicado el intervalo que lo contiene se procede a reemplazar en la siguiente frmula:

n 2 ( N i )Me1 Me = Li + a (ni )Me

Donde: Li (Ni)Me-1 (ni)me ni a : : : : : Es el lmite inferior de la clase que contiene la mediana. Frecuencia absoluta acumulada de la clase que precede (antes) a la clase que contiene a la mediana. Nmero de observaciones en la clase que contiene a la mediana. Nmero de observaciones. Amplitud del intervalo seleccionado.

Reemplazando los valores del ejemplo en la frmula se obtiene: Para nuestro ejemplo
1000 2 460 Me = 4,8 + 0 = 4,8 518 En este caso los datos no estn agrupados en intervalo, por lo tanto a = 0 La mediana de los alumnos que rindieron la prueba de matemticas es de 4,8

Propiedades:

No le afectan las observaciones extremas. Es fcil de calcular. Es siempre un valor de la variable. La mediana divide el rea total del histograma en dos porciones iguales.
Moda:

Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. Puede haber ms de una moda en una distribucin. Se denota por Mo.

En la tabla de frecuencias del ejemplo, se observa claramente que la moda de los alumnos que rindieron la prueba de matemtica es 5.

MEDIDAS DE POSICIN

Las medidas de posicin dividen un conjunto ordenado de datos en grupo con la misma cantidad de individuos.
Percentiles:

Son 99 valores que dividen en cien porciones iguales el conjunto de datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85% Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante la frmula:

n k N i 1 100 Pk = Li + *a ni
con k= 1,2,3,... 99

Donde
Li n Ni-1 ni a

: Lmite real inferior de la clase del percentil k. : Cantidad total de datos. : Frecuencia acumulada de la clase que antecede a la clase del percentil k. : Frecuencia de la clase del percentil k. : Longitud del intervalo de la clase del percentil k.

Para el ejemplo calcularemos el percentil 87

P87

1000 87 835 100 * 0 = 6,2 = 6,2 + 44

El 87% de los alumnos obtuvieron una nota igual o inferior a 6,2 En la publicacin de los resultados de pruebas del examen de seleccin los puntajes se expresan en puntaje estndar asocindose al percentil correspondiente.
Deciles:

Son los nueve valores que dividen al conjunto de datos ordenados en diez porciones iguales, son tambin un caso particular de los percentiles, pues corresponden a los percentiles 10, 20, 30, 40, 50, 60, 70, 80 y 90. Para datos agrupados los deciles se calculan mediante la frmula.
n k N i 1 10 *a Dk = Li + ni

con k= 1,2,3,... 9

Donde: Li n Ni-1 ni a : Lmite real inferior de la clase del decil k. : Cantidad total de datos. : Frecuencia acumulada de la clase que antecede a la clase del decil k. : Frecuencia de la clase del decil k. : Longitud del intervalo de la clase del decil k.

Para el ejemplo calcularemos el decil 4


1000 4 360 10 D4 = 4,4 + * 0 = 4,4 48

El 40% de los alumnos obtuvieron una nota igual o inferior a 4,4


Cuartiles:

Son los tres valores que dividen al conjunto de datos ordenados en cuatro porciones iguales, son un caso particular de los percentiles, correspondiendo a los percentiles 25, 50 y 75. - El primer cuartil Q1 es el valor de la variable que deja a la izquierda el 25% de la distribucin. - El segundo cuartil Q2 (la mediana), es el valor de la variable que deja a la izquierda el 50% de la distribucin. - El tercer cuartil Q3 es el valor de la variable que deja a la izquierda el 75% de la distribucin. Para el ejemplo, se tienen los siguientes cuartiles Q 1:

n = 250 Primero N i n = 269 ; luego Q1 =3,8 4 4

El 25% de los alumnos obtuvieron una nota igual o inferior a 3,8 Q 2:

2n = 250 Primero N i 2n = 518 ; luego Q2 = 4,8 4 4

El 50% de los alumnos obtuvieron una nota igual o inferior a 4,8 Q 3:

3n = 250 Primero N i 3n = 789 ; luego Q3 = 5,8 4 4

El 75% de los alumnos obtuvieron una nota igual o inferior a 5,8, o bien, el 25% de los alumnos tuvieron nota superior a 5,8.

Quintiles

Son los cuatro valores que dividen al conjunto de datos ordenados en cinco porciones iguales, son un caso particular de los percentiles, correspondiendo a los percentiles 20, 40, 60, 80. El primer quintil es el valor de la variable que deja a la izquierda el 20% de la distribucin. El segundo quintil es el valor de la variable que deja a la izquierda el 40% de la distribucin. El tercer quintil es el valor de la variable que deja a la izquierda el 60% de la distribucin. El cuarto quintil es el valor de la variable que deja a la izquierda el 80% de la distribucin.
n k N i 1 5 K k = Li + *a ni

con k = 1, 2, 3, 4

Donde:

Li n Ni-1 ni a

: Lmite real inferior de la clase del quintil k. : Nmero de datos. : Frecuencia acumulada de la clase que antecede a la clase del quintil k. : Frecuencia de la clase del quintil k. : Longitud del intervalo de la clase del quintil k.

Para el ejemplo calcularemos el quintil 3


1000 3 578 5 K 3 = 5,2 + * 0 = 5,2 56

El 60% de los alumnos obtuvieron una nota igual o inferior a 5,2 o bien, el 40% de los alumnos tuvieron nota superior a 5,2

MEDIDAS DE DISPERSIN

Las medidas de dispersin indican la mayor o menor concentracin de los datos con respecto a las medidas de centralizacin
Desviacin estndar: tambin llamada desviacin tpica, es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores puntuales del promedio en una distribucin. Especficamente, la desviacin estndar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma, , segn se calcule en una muestra o en la poblacin.

Una desviacin estndar grande indica que los puntos estn lejos de la media, y una desviacin pequea indica que los datos estn agrupados cerca de la media.

La frmula para calcular la desviacin estndar es:

S=

(x x )
i =1

n 1

En el ejemplo dado que se tiene una distribucin de frecuencias, la desviacin se calcula por:
K ni x i K ni xi2 i =1 n i =1 n 1
FREC. RELATIVA %
2

S=
FREC. ABSOLUTA ACUMULADA

NOTA

FREC. ABSOLUTA

FREC RELATIVA ACUMULADA %

xi*ni

xi2*ni

1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0 6,2 6,4 6,6 6,8 7,0
TOTAL

1 2 3 8 14 18 19 22 25 26 27 31 35 38 45 46 48 52 58 60 56 54 51 50 46 44 40 32 31 18
1000

1 3 6 14 28 46 65 87 112 138 165 196 231 269 314 360 408 460 518 578 634 688 739 789 835 879 919 951 982 1000

0,1 0,2 0,3 0,8 1,4 1,8 1,9 2,2 2,5 2,6 2,7 3,1 3,5 3,8 4,5 4,6 4,8 5,2 5,8 6,0 5,6 5,4 5,1 5,0 4,6 4,4 4,0 3,2 3,1 1,8

0,1 0,3 0,6 1,4 2,8 4,6 6,5 8,7 11,2 13,8 16,5 19,6 23,1 26,9 31,4 36,0 40,8 46,0 51,8 57,8 63,4 68,8 73,9 78,9 83,5 87,9 91,9 95,1 98,2 100,0

1,2 2,8 4,8 14,4 28,0 39,6 45,6 57,2 70,0 78,0 86,4 105,4 126,0 144,4 180,0 193,2 211,2 239,2 278,4 300,0 291,2 291,6 285,6 290,0 276,0 272,8 256,0 211,2 210,8 126,0
4717,0

1,44 3,92 7,68 25,92 56,00 87,12 109,44 148,72 196,00 234,00 276,48 358,36 453,60 548,72 720,00 811,44 929,28 1100,32 1336,32 1500,00 1514,24 1574,64 1599,36 1682,00 1656,00 1691,36 1638,40 1393,92 1433,44 882,00
23970,12

Reemplazando en la frmula los valores del ejemplo se obtiene: 23970,12 999 4717 2 1000 = 1,72

S2 =

S = S 2 = 1,3114

La desviacin estndar en las notas de la prueba de matemtica es de 1,3.

MEDIDAS DE FORMA

Las distribuciones pueden tener diferentes formas, y una manera de caracterizar la forma es observar su simetra. Una distribucin de frecuencias puede ser simtrica o asimtrica. Para saber si es simtrica tenemos que tomar una referencia, es decir, ver respecto a qu es simtrica. El coeficiente de asimetra de Pearson, mide la desviacin de la simetra, expresando la diferencia entre la media y la mediana con respecto a la desviacin estndar del grupo de mediciones. Su frmula es:

As =

3( x Me) Sx

Si As = 0 diremos que la distribucin es simtrica, en ese caso las desviaciones a la derecha y a la izquierda de la media se compensan. Si As < 0 diremos que es asimtrica negativa ya que la mayora de las observaciones estn a la derecha de la proyeccin de la media. Si As > 0 diremos que es asimtrica positiva ya que la mayora de las observaciones estn a la izquierda de la proyeccin de la media.

Reemplazando en la frmula los valores del ejemplo se obtiene:

As =

3(4,717 4,8 ) = -0,1898 13114 ,

Por lo tanto, las notas de los alumnos tienen una distribucin ligeramente asimtrica negativa. En el siguiente histograma se pueden observar las medidas de tendencia central y posicin de nuestro ejemplo, adems, se puede ver fcilmente que la distribucin es asimtrica negativa.

DISTRIBUCIN NORMAL

La distribucin normal es una de las distribuciones ms usadas e importantes. Se ha desenvuelto como una herramienta indispensable en cualquier rama de la ciencia, la industria y el comercio.

Muchos eventos reales y naturales tienen una distribucin de frecuencias cuya forma es muy parecida a la distribucin normal, llamada tambin campana de Gauss por su forma acampanada. La forma de la campana de Gauss depende de los parmetros y . La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de S, ms se dispersarn los datos en torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin.

La distribucin de probabilidad normal y su curva tiene las siguientes caractersticas:

La curva normal tiene forma de campana. La media, la moda y la mediana de la distribucin son iguales y se localizan en el centro de la distribucin. La distribucin de probabilidad normal es simtrica alrededor de su media. Por lo tanto, la mitad del rea bajo la curva est antes del punto central y la otra mitad despus, es decir, la mitad de curva tiene un rea de 0,5. El rea total bajo la curva es igual a 1. La escala horizontal de la curva se mide en desviaciones estndar. La forma y la posicin de una distribucin normal dependen de los parmetros y , por lo que hay un nmero infinito de distribuciones normales.

REA BAJO LA CURVA EN UNA DISTRIBUCIN NORMAL

El rea bajo la curva, entre dos puntos, indica la probabilidad de que la frecuencia se encuentre entre dichos valores. As, por ejemplo, un puntaje en la PSU, que tiene una distribucin con media de 500, significa que bajo 500 puntos se encuentra el 50% de la poblacin. Esto se obtiene de ver la probabilidad entre 150 (menor valor en la prueba) y 500 puntos, que es justamente la mitad. Lo mismo ocurre hacia la derecha, dado que la curva normal es simtrica, por lo tanto el promedio es igual a la mediana y al modo.

NORMALIZACIN

Se asocia con la accin de transformar una distribucin cualquiera a una distribucin normal. Corresponde ajustar los datos de la distribucin inicial a una distribucin normal. En este caso se cambia la forma de la distribucin original manteniendo la proporcin de casos entre valores contiguos.

EJEMPLO: NORMALIZACIN DE LAS PRUEBAS (PSU)

Los puntajes de las PSU se normalizan desde el Proceso de Admisin 2005, con una media de 500 puntos y desviacin estndar de 110 puntos, truncando los extremos en 150 y 850 puntos. El 99% central de los puntajes se normalizan con un promedio de 500 y desviacin estndar 110; el 0,5% de cada extremo se ajusta interpolando linealmente. En el caso de la prueba de Ciencias, se normalizar luego de estimar la equivalencia de puntajes entre sus tres versiones, empleando el mdulo comn como base para establecer dicha equivalencia.

Ejemplo: Si en la PSU de Lenguaje y Comunicacin, rendida en la Admisin 2007 por 212.723 postulantes, el 15,87 % de stos tienen 610 o ms puntos, esto significa que 33.759 de ellos sacaron 610 o ms puntos y el resto obtuvo puntajes menores.

Nota:

Por normalizacin se entiende una transformacin de la distribucin de los puntajes corregidos, manteniendo el orden. Para ello se calculan los percentiles asociados a cada puntaje corregido, y luego se identifica su equivalente en puntaje estandarizado en la distribucin normal (puntaje Z). Este puntaje Z es finalmente convertido a la escala que se desee, en este caso, con promedio 500 y desviacin estndar 110, obtenindose el puntaje final PS, haciendo PS=110*Z+500.

ANEXO

MEDIA ARITMTICA PONDERADA: En ocasiones no todos los valores de la variable tienen el mismo peso. Esta importancia que asignamos a cada variable, es independiente de la frecuencia absoluta que tenga. Ser como un aumento del valor de esa variable, en tantas veces como consideremos su peso.

Por lo tanto la media aritmtica ponderada se utiliza cuando a cada valor de la variable (xi) se le otorga una ponderacin o peso distinto de la frecuencia o repeticin. Para poder calcularla se tendr que tener en cuenta las ponderaciones de cada uno de los valores que tenga la variable Se la suele representar como:

Xw =

x w n w n
i i i

i i

Siendo wi la ponderacin de la variable xi y ponderaciones.

la suma de todas las

Un ejemplo es la obtencin de la media ponderada de los puntajes segn las distintas ponderaciones dadas por las universidades para alguna carrera especfica: Ponderacin o peso = NEM LyC MAT CS = = = = 20% 25% 25% 30%

Puntajes

= NEM LyC MAT CS

= = = =

600 680 620 650

x=

20% 600 + 25% 680 + 25% 620 + 30% 650 20% + 25% + 25% + 30% 12.000 + 17.000 + 15.500 + 19.500 100% 64.000 = 640 ptos. 100%

x=

x=

Esta misma frmula se emplea para calcular el promedio de un grupo a partir del conocimiento del promedio y de la cantidad de casos que hay en cada subgrupo de l. Un ejemplo de este caso es el clculo del promedio de notas en Educacin Media a partir de los promedios de 1, 2, 3 y 4 ao medio. Normalmente los postulantes suman los promedios de sus notas de enseanza media y lo dividen por 4, ignorando la ponderacin de cada promedio por cuanto el nmero de asignaturas de cada curso es distinto. A continuacin, se describen otros conceptos de media de escasa utilizacin en educacin.

LA MEDIA GEOMTRICA: en una cantidad finita de nmeros (digamos 'n' nmeros) es la raz n-sima del producto de todos los nmeros.

Se calcula con la siguiente frmula

Por ejemplo, la media geomtrica de 2 y 18 es

Otro ejemplo, la media de 1, 3 y 9 sera

Slo es relevante la media geomtrica si todos los nmeros son positivos. Si uno de ellos es 0, entonces el resultado es 0. Si hay un nmero negativo (o una cantidad impar de ellos) entonces la media geomtrica es, o bien negativa o bien inexistente en los nmeros reales. En muchas ocasiones se utiliza su trasformacin en el manejo estadstico de variables con distribucin no normal. La media geomtrica es relevante cuando varias cantidades son multiplicadas para producir un total.
MEDIA ARMNICA: Es la inversa de la media aritmtica de los inversos de los valores de la variable, se representa por H, y responde a la siguiente expresin:
H= n n xii

Esta media no es aconsejable en distribuciones de variables con valores pequeos. Se suele utilizar para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc. Ventajas e inconvenientes: En su clculo intervienen todos los valores de la distribucin. Su clculo no tiene sentido cuando algn valor de la variable toma valor cero. Es nica. Como ejemplo se muestra el caso de las edades de las tres personas 80, 55 y 30 aos.

H=

3 3 3 132000 3 = = = 1 +1 +1 1650 + 2400 + 4400 8450 8450 80 55 30 132000 132000

396000 = 46,86 aos 8450

You might also like