You are on page 1of 153

DISEO

0



2012
ESTADSTICA
APLICADA A LA
EDUCACIN


UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
Lic. Martn Pablo Moreano Vilca.
Lic. Jessica Graciela Zavaleta Morales.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

1

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE EDUCACIN
PROGRAMA DE LICENCIATURA PARA PROFESORES SIN TITULO PEDAGGICO
EN LENGUA EXTRANJERA

DECANO : Dr. Elas Meja Meja
DIRECTOR ACADMICO :
DIRECTOR ADMINISTRATIVO :
DIRECTORA DEL PROGRAMA : Mg. Mara Escalante Lpez
COORDINADOR ACADMICO :














Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

2







NDICE

INTRODUCCIN 03
UNIDAD 1:
Conceptos bsicos de Estadstica descriptiva Organizacin de datos. 04
UNIDAD 2:
Medidas de Tendencia Central, Dispersin y Forma.
UNIDAD 3:
Probabilidades.
UNIDAD 4:
Regresin y Correlacin.
Solucionario
Bibliografa.




Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

3
Introduccin.

El presente texto tiene como finalidad proporcionar informacin terica y prctica de
algunos aspectos bsicos de Estadstica y su aplicacin en el campo educativo.
El contenido del libro est dirigido a los participantes del Programa de Licenciatura para
Profesores sin Ttulo Pedaggico en Lengua Extranjera de la Universidad Nacional
Mayor de San Marcos, quienes encontrarn en ste texto una herramienta de lectura y
de apoyo para el desarrollo del curso de Estadstica Aplicada a la Educacin.
El libro est organizado en cuatro unidades. La primera unidad corresponde a la
introduccin al campo de la Estadstica, conceptos bsicos, la organizacin de datos y
sus representaciones bsicas. La segunda unidad hace referencia a las medidas de
tendencia central, de dispersin y forma, indicando su aplicacin e interpretacin en el
campo educacional.
En la tercera unidad, trabajaremos algunas nociones bsicas del clculo de
probabilidades, sus aplicaciones con el propsito de valorar su importancia en la vida
cotidiana.
Finalmente, en la cuarta unidad veremos los conceptos de regresin y correlacin, las
cuales son tcnicas muy tiles para analizar la relacin entre dos variables.
Cada uno de estos captulos, presenta aspectos tericos con una serie de ejercicios
resueltos, ejercicios propuestos y un cuestionario de autoevaluacin que les servir
para reflexionar sobre los aprendizajes logrados.
Asimismo, queremos expresar nuestro sincero agradecimiento al profesor Vctor Ochoa
Grados y a todos aquellos que contribuyeron a la elaboracin de ste texto y en
particular a la Mg. Mara Escalante Directora del Programa de Licenciatura para
profesores sin Ttulo en Lenguas Extranjeras, quien nos brinda la posibilidad de
compartir nuestros conocimientos con ustedes. Esperamos que ste texto se convierta
en una herramienta til para su formacin profesional y una invitacin a la
investigacin educativa.

LOS AUTORES.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

4



Introduccin.
La palabra estadstica nos trae a la mente una serie de ideas como son: nmeros
apilados en tablas, cifras relativas a nacimientos, muertes, etc. La Estadstica es mucho
ms que slo nmeros, es una rama de las matemticas con origen remoto y en
continua evolucin y desarrollo. El trmino estadstica tiene su raz en la palabra
Estado y aparece cuando se hace necesario cuantificar conceptos. En la mayora de
los casos esta cuantificacin se realiz con fines econmicos o militares.
Actualmente, la Estadstica es una ciencia que nos proporciona un conjunto de
mtodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el
comportamiento de los datos con respecto a una caracterstica materia de estudio o
investigacin y resulta una herramienta de suma utilidad para la toma de decisiones en
cualquier campo de la ciencia.

Capacidades a desarrollar.
- Analizar los conceptos esenciales sobre estadstica.
- Elaborar e interpretar tablas de frecuencias simple y con
intervalos.
- Elaborar e interpretar grficos estadsticos

Unidad 1: Conceptos Bsicos de Estadstica
Descriptiva Organizacin de Datos

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

5
1.1 Breve Historia de la Estadstica.
Ruiz, D. (2011) nos ofrece una aproximacin histrica a esta ciencia, la cual seala que
sus orgenes radican en el antiguo Egipto, pues los antiguos faraones lograron
recopilar, hacia el ao 3050 A.C, datos relativos a la poblacin y la riqueza del pas. De
acuerdo al historiador griego Herodoto, dicho registro facilit la construccin de las
pirmides. Asimismo, Ramss II realiz un censo de las tierras con el objeto de verificar
un nuevo reparto.
La Biblia tambin nos proporciona informacin sobre un anlisis estadstico en el libro
de los Nmeros, adems recordemos que el rey David orden a su general del ejrcito
a hacer un censo de Israel con el objeto de conocer el nmero de la poblacin.
Sin embargo, fueron los romanos quienes mejor supieron emplear los recursos de la
estadstica. Es sabido que el emperador Cesar Augusto decret que todo el imperio
fuera sometido al pago de impuestos, para lo cual previamente debera conducirse un
censo de las personas. Para el nacimiento de Jess se produjo uno de estos clebres
empadronamientos bajo la autoridad del imperio. No obstante, durante la cada del
Imperio Romano se realizaron muy pocas operaciones Estadsticas, salvo las que
posteriormente fueron compiladas por Pipino el Breve en 758 y por Carlomagno en
762 DC.
Asimismo, es sabido que nuestros antepasados, los incas fueron buenos en la
recoleccin de datos para la administracin del estado, para ello hicieron uso del quipu
el cual es considerado uno de los instrumentos ms sofisticados para la contabilizacin
del estado.
En Inglaterra, Guillermo el Conquistador orden que se hiciera un registro de todos los
bienes que existan en Inglaterra, para fines tributarios y militares, descritos en el
Domesday Book o libro del Gran Catastro (1086), es una obra que est considerada
como el primer compendio estadstico de Inglaterra.
En 1660 surgi la Aritmtica Poltica, destinada a la descripcin de los sucesos
polticos. Esta ciencia, que naci en la universidad alemana de Haltustadt y se extendi
por distintas universidades alemanas y suizas, fue ya denominada Estadstica por el
alemn Schmeitzel.
En el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos
importantes para la teora Estadstica; la teora de los errores de observacin, aportada
por Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace,
Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido
por Correlacin, que tena por objeto medir la influencia relativa de los factores sobre
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

6
las variables. De aqu parti el desarrollo del coeficiente de correlacin creado por Karl
Pearson y otros cultivadores de la ciencia biomtrica como J. Pease Norton, R. H.
Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las
relaciones.
Posteriormente, la Estadstica se vincula al anlisis matemtico a travs del clculo de
probabilidades, gracias a Bernoulli, Leibnitz, Bayes, Laplace, Chebychev, Kolmogorov y
Markov. Asimismo, a partir de la aparicin del computador, que revoluciona la
metodologa estadstica y se abren enormes posibilidades para la construccin de
modelos ms complejos que hoy en da son de gran utilidad para todas las disciplinas.

1.2 Importancia de la Estadstica en el campo educativo.
La Estadstica al igual que la Matemtica son dos disciplinas esenciales para
desenvolvernos en la vida cotidiana. Algunas tcnicas estadsticas se aplican en
mercadotecnia, contabilidad, estudios de consumidores y en otras actividades. Por
ejemplo: los ingenieros de control de calidad recopilan datos sobre la fiabilidad de
partes y productos fabricados, calidad de procesos, etc. para mejoramiento del
producto. En poltica, los funcionarios que ocupan cargos directivos hacen uso de la
estadstica para definir que quieren sus votantes.
En educacin, la Estadstica es considerada como la base de la planificacin, ya que
para planificar y obtener resultados vlidos hay que disponer de estadsticas.
Usualmente, el docente, los directivos hacen uso de la estadstica para organizar datos
sobre la cantidad de estudiantes en la escuela, el rango de edad en que se encuentran
sus estudiantes, sus calificaciones, el nmero de aulas, cuntos maestros/as hay en la
escuela clasificados por gnero, aos de servicio, etc.
Por otra parte, la mayora de investigaciones especializadas contienen resultados
basados en el anlisis estadstico, las cuales sirven para dimensionar el
comportamiento de ciertos hechos de una determinada poblacin, realizar estimaciones
y proyecciones.
Asimismo, la estadstica est ntimamente ligada con el mtodo cientfico, pues apoya a
la investigacin en la recoleccin y el anlisis de datos para verificar o formular nuevas
hiptesis y la toma de decisiones. Es decir, la Estadstica no es tan solo un conjunto
de frmulas y/o procedimientos matemticos, la Estadstica permite la organizacin de
datos en toda investigacin cientfica.
En todo trabajo de investigacin cientfica, luego de haber establecido el problema es
necesario elaborar un plan de anlisis estadstico, que facilite la solucin del problema,
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

7
este nos permitir analizar las caractersticas de la poblacin y dichos resultados nos
orientan a la toma de decisiones. Si uno deja de lado el anlisis estadstico podran
existir ciertas dificultades para disear un plan de investigacin y por ende se nos har
ms complejo conocer una determinada realidad.
1.3 Estadstica.
Rincn, G. (2011), afirma que la estadstica es una ciencia que estudia situaciones
prcticas que se manifiestan bajo incertidumbre. Asimismo, esta ciencia se divide en
dos grandes ramas, el cual podemos observar en este esquema:
Esquema: Ramas de la Estadstica.


Fuente: Elaboracin propia.

1.3.1 Estadstica Descriptiva.
Es una de las ramas de la Estadstica que se encarga analizar los mtodos que
implican la recoleccin, presentacin y caracterizacin de un conjunto de datos
(mediante grficos o de forma analtica) con el objetivo de describir un conjunto de
datos, sus caractersticas y resaltar las propiedades de los elementos bajo estudio.
1.3.2 Estadstica Inferencial.
Esta rama de la Estadstica se encarga de obtener conclusiones sobre el
comportamiento total de un fenmeno basndose nicamente en la informacin
recolectada sobre una parte de ese mismo fenmeno. Estas conclusiones se obtienen
bajo incertidumbre. Igualmente, permite estimar el comportamiento futuro de un
fenmeno.

Estadstica
Estadstica
Descriptiva
Estadstica
Inferencial
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

8

1.4 Conceptos estadsticos.

1.4.1 Poblacin.
Es el colectivo finito o infinito de elementos que interesan a un estudio, adems poseen
alguna caracterstica comn observable. En trminos de investigacin, es el conjunto
sobre el que recae la investigacin y de cuyos elementos obtendremos datos de sus
caractersticas o atributos.

Toda poblacin debe delimitarse temporal y espacialmente, de modo que ante la
presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no
de la poblacin bajo estudio. Por lo tanto, al definir una poblacin, se debe cuidar que
el conjunto de elementos que la integran se encuentre perfectamente delimitado.

De acuerdo a Rincn, G. (2011) para delimitar una poblacin se debe ordenar de
acuerdo a la siguiente sintaxis:




Significa que una definicin de poblacin debe empezar por la palabra Todos o
Todas seguida de una descripcin del elemento que se est observando ms una
restriccin al alcance de la palabra Todos(as)

Por ejemplo: En un estudio del nivel salarial de los docentes de la UGEL 03 Lima en
el ao 2012, una definicin de poblacin podra ser la siguiente:

Todos los docentes de la UGEL 03 de la ciudad de Lima, ao 2012.

Asimismo, las poblaciones se dividen en dos clases:

Poblaciones finitas
Poblaciones infinitas.

Las poblaciones finitas son las poblaciones a las cuales se les pueden determinar
fcilmente el nmero de elementos que la componen. Por ejemplo:
TODOS(AS) + DESCRIPCION DEL ELEMENTO + CONDICION RESTRICTIVA
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

9
Situacin o fenmeno: La edad de los estudiantes de la Facultad de Educacin de
la UNMSM en el ao 2012.
Poblacin: Todos los estudiantes de la Facultad de Educacin de la
UNMSM en el ao 2012.
Tipo de poblacin: Finita, porque fcilmente se pueden contabilizar sus
elementos acudiendo a la oficina de la institucin que
registra estos datos.

Las poblaciones infinitas son las poblaciones que fsicamente es imposible
numerarlas o determinar su por razones econmicas o de tiempo. Por ejemplo:
Situacin o fenmeno: Accidentes por da en un cruce de calles del distrito de San
Miguel
Poblacin: Todas los das mientras exista este cruce
Tipo de poblacin: Infinita. Es imposible determinar cuntos elementos tiene
esta poblacin


1.4.2 Muestra.
Es un subconjunto de anlisis de la poblacin dada y est constituida por elementos
seleccionados de una manera deliberada con el objeto de investigar las propiedades de
la poblacin.

Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la
poblacin que se defina tenga tamao infinito, y en consecuencia, no fuera posible
observar a todos sus elementos. En otras ocasiones, el costo de la observacin
exhaustiva puede ser muy elevado, el tiempo de recoleccin de la informacin resulte
ser muy extenso. Sin embargo, debemos de tener en consideracin que la muestra
debe ser representativa de la poblacin y esto significa que debe ser de tamao
adecuado y que tenga las mismas propiedades de la poblacin.

1.4.3 Variables.
Representan y sintetizan conceptualmente las propiedades o caractersticas de las
unidades de anlisis, a las cuales se les pueden adjudicar distintos valores numricos.
Es decir, es una caracterstica observable que puede tomar diferentes valores, las
cuales se pueden expresar en varias categoras.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

10
De all que, todas las variables tienen una escala de registro y pueden ser una
caracterstica medible como: peso, ingreso, coeficiente de inteligencia, etc. o una
cualidad no medible como: estado civil, nacionalidad, sexo, etc.

La variable se denota por una letra mayscula X. A su vez cada una de estas variables
puede tomar distintos valores, colocando un subndice x
1
, x
2
, x
3
,., x
k
.

1.4.3.1 Clasificacin de las variables.
De acuerdo a la naturaleza de las variables, estas pueden ser:
- Variables cualitativas o categricas.
Es cuando expresan una cualidad, caracterstica o atributo y sus datos se expresan
mediante una palabra y no con una cantidad numrica.
Por ejemplo: El estado civil, el lugar de nacimiento, las profesiones, etc.
- Variables cuantitativas.
Es cuando el valor de la variable se expresa mediante una cantidad; es decir, es de
carcter numrico. As tenemos: el nmero de hijos en una familia, los ingresos, el
nmero de alumnos por aula, etc. Estas variables se clasifican en: discretas y
continuas.
- Variable cuantitativa discreta.
El resultado de este tipo de variable resulta del conteo y su valor est representado en
correspondencia biunvoca con los nmeros naturales.
Por ejemplo: el nmero de accidentes por da, los trabajadores de una empresa, el
nmero de habitaciones de una casa, etc.
- Variable cuantitativa continua.
El resultado de este tipo de variable resulta de la medicin o comparacin con una
unidad o patrn de medida. Las variables cuantitativas continuas pueden tener
cualquier valor dentro de un rango o recorrido, por lo tanto se expresa mediante un
nmero real.
Por ejemplo: los ingresos de una familia, la estatura, el peso, la temperatura de una
persona, etc.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

11
1.4.4 Unidad elemental o estadstica.
Es el objeto o elemento indivisible que ser estudiado en una poblacin, sobre la cual
se va a obtener datos. Tambin se le llama unidad de observacin si los datos han sido
recolectados mediante la observacin y se le llama unidad experimental si los datos
han sido recolectados a travs de la experimentacin.
Por ejemplo:

Variables Tipo de variable Unidad estadstica
Ejemplo de
observaciones
X: Grado de
instruccin de los
padres de familia
Cualitativa Cada padre de
familia
x
1
: Primaria
x
2
: Secundaria
x
3
: Superior
Y: Peso de los
alumnos del 3
ao de secundaria
Cuantitativa
continua
Cada alumno y
1
: 34 kg.
y
2
: 38kg
y
3
: 40 kg.
Fuente: Adaptado de Fernndez, J. (2005)
1.4.5 Dato.
Es el valor o respuesta que adquiere la variable en cada unidad de anlisis y es el
resultado de las observaciones o recopilacin en general.

Un dato est constituido por 3 elementos: La unidad de observacin, la variable y el
valor.

Ejemplo:

Si se aplica un cuestionario de encuesta a un alumno X de una muestra de 400
alumnos de la UGEL 02 y su respuesta a una pregunta sobre su edad en aos
cumplidos es 16 aos. Sus elementos de este dato son:

- La Unidad de Observacin : El alumno X
- La Variable : Edad
- El valor : 16 aos.





Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

12
Asimismo, dicha recoleccin de datos implica tres actividades:


a) Seleccionar o desarrollar un instrumento de medicin.
b) Aplicar ese instrumento de medicin (obtener las mediciones y observaciones de las
variables de inters)
c) Preparar las mediciones obtenidas para que puedan analizarse correctamente.


1.4.6 Parmetro.
Es un valor obtenido para describir en forma resumida las caractersticas ms
resaltantes de la poblacin; es decir, son las medidas de resumen de la poblacin.

Ejemplos: La media, la diferencia de promedios, la varianza, la desviacin estndar,
etc.

1.5 Medidas y escalas de medicin.
Para realizar un correcto anlisis de los datos es fundamental conocer de antemano el
tipo de medida de la variable, ya que para cada una de ellas se utiliza diferentes
estadsticos. La clasificacin ms convencional de las escalas de medida las divide en
cuatro grupos denominados: Escala nominal, escala ordinal, escala intervalar y
escala de razn.
1.5.1 Escala nominal.
La escala nominal se establece mediante la distincin de elementos en diversas
categoras, basndose en sus atributos, sin implicar algn orden entre ellas.
Ejemplos:
- Sexo (masculino, femenino).
- Estado civil (soltero, casado, viudo, divorciado).
- Principal fuente de energa para cocinar (electricidad, gas, kerosene, lea, ninguna,
otros).
- Material predominante en las paredes exteriores de la vivienda (Ladrillo, adobe,
esteras, otros).

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

13
1.5.2 Escala ordinal.
La escala ordinal est referida a un orden o jerarqua; es decir, las caractersticas
expresan una posicin de orden.

Ejemplos:
- Nivel de satisfaccin del curso (Muy de Acuerdo, Acuerdo, Poco de Acuerdo, en
Desacuerdo, Muy en desacuerdo).
- Nivel Socio-Econmico (Alto, Medio, Bajo).
- Opinin sobre las condiciones de salubridad de un distrito (Muy Bueno, Bueno,
Malo, Muy Malo, otro).
- Grado de instruccin (Inicial, Primaria, Secundaria, Superior).

1.5.3 Escala intervalar.
La escala intervalar supone orden y a su vez grados de distancia entre las diversas
categoras, pero no tienen un origen natural sino convencional. Parten del cero relativo,
el cual no representa vaco.
Ejemplos:
- Coeficiente de inteligencia.
- Temperatura.
- Puntuacin obtenida en una escuela.
- Presin arterial.
- Rendimiento escolar.

1.5.4 Escala de razn.
La escala de razn comprende los casos anteriores, distincin, orden, distancia y
origen nico natural, el valor se representa con un nmero real y tiene un cero absoluto
el cual representa la ausencia de la caracterstica estudiada.

Ejemplos:
- Edad.
- Peso.
- Ingresos.
- Nmero de hijos.
- Accidentes de trnsito.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

14

1.6 Organizacin y clasificacin de datos.
Los datos constituyen una informacin bsica para iniciar un estudio, conocer y analizar
las caractersticas de los elementos de una poblacin. En Estadstica, los datos deben
ser clasificados, ordenados y presentados de tal manera que facilite la comprensin,
descripcin y anlisis del fenmeno estudiado para extraer conclusiones vlidas para la
toma de decisiones.
El primer paso para organizar los datos consiste en identificar el tipo de datos que se
tienen, los cuales pueden ser cualitativos o cuantitativos
Asimismo, estos datos se pueden organizar en:

- Datos no agrupados
- Datos agrupados

A continuacin explicaremos cada una de ellas.

1.6.1 Datos no agrupados.
Los datos no agrupados son los datos sin procesar y usualmente el punto de inicio de
los anlisis.
Ejemplo: Si tenemos doce elementos en la muestra y estos datos son analizados sin
necesidad de formar clases con ellos, los llamamos datos no agrupados.
1.6.2 Datos agrupados.
Los datos agrupados se refieren al hecho de que estn ordenados, clasificados,
contados y significan que hay menos datos con los cuales trabajar. Estos pueden
presentarse con intervalos y sin intervalos.
1.7 Tipos de frecuencia.
En el siguiente esquema podemos apreciar los diferentes tipos de frecuencia:

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

15
Esquema: Tipos de frecuencia.



Fuente: Adaptacin propia.
Seguidamente, desarrollaremos cada una de ellas.
1.7.1 Frecuencia absoluta simple (f
i
)
La frecuencia absoluta simple nos indica el nmero de veces que se repite un valor
en un conjunto de datos. Adems, la suma de todas las frecuencias absolutas es
igual al total de la poblacin.

1.7.2 Frecuencia absoluta acumulada (F
i
)
La frecuencia absoluta acumulada resulta de la suma de las frecuencias absolutas
simples correspondientes a los datos menores e iguales al dato en referencia.

La ltima frecuencia absoluta acumulada es igual al tamao de la muestra n. As
tenemos:

F
1
= f
1

F
2
= f
1
+ f
2
F
n
= f
1
+ f
2
+ . . . . . . + f
n-1
+ f
n
=n

Frecuencia absoluta simple. f
i
Frecuencia absoluta acumulada. F
i
Frecuencia relativa simple. h
i

Frecuencia relativa acumulada. H
i

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

16
1.7.3 Frecuencia relativa simple. (hi)
La frecuencia relativa de un valor, es el cociente de su frecuencia absoluta entre el
tamao de la muestra.






La suma de todas las frecuencias relativas es 1
1.7.4 Frecuencia relativa acumulada (H
i
)
La frecuencia relativa acumulada de un dato, es el cociente de su frecuencia absoluta
acumulada entre el tamao de la muestra.






Para interpretar h
i
y H
i
se suele emplear su valor expresado en porcentaje, el cual se
obtiene al multiplicar por 100 cada uno de estos valores.

1.8 Elaboracin de tablas y distribucin de frecuencias.
Una vez que se ha extrado una muestra de la poblacin, el siguiente paso es organizar
los datos con el objetivo de poder analizarlos con comodidad. Para ello, haremos uso
de las tablas de frecuencias.
Una tabla de frecuencias presenta en forma ordenada los distintos valores de una
variable y sus correspondientes frecuencias, la cual permite percibir con claridad
determinadas caractersticas de la masa de datos que se investiga.
La distribucin de frecuencias es la representacin estructurada de la informacin
que se ha recogido sobre la variable en estudio, esta distribucin puede realizarse de
acuerdo a la agrupacin de los datos.
Las tablas de frecuencias deben explicarse por s mismas; es decir, deben ser fciles
de entender por cualquier persona que las lee.
H
i
=

h
i
=

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

17
Toda tabla de frecuencia contiene lo siguiente:
a) El ttulo, el cual nos muestra brevemente el contenido de la informacin, debe
ser claro y preciso.
b) El encabezamiento, se encuentra en la primera fila y nos indica la naturaleza de
contenido de cada columna.
c) El cuerpo, est formado por un conjunto de filas y columnas y nos presenta la
informacin de la investigacin
d) La fuente, est ubicado al final de la tabla y nos indica a la entidad responsable
donde se obtuvieron los datos.

Seguidamente, mostramos un grfico en el cual veremos las partes de la tabla de
frecuencia.

Grfico: Partes de una Tabla de Frecuencia
Titulo
Encabezado
Cuerpo








Fuente:
Fuente: Adaptado de Fernndez, J (2005)
La distribucin de frecuencia se puede organizar de la siguiente manera:
- Distribucin de frecuencia para datos no Agrupados.
- Distribucin de frecuencia de clase o de datos Agrupados

1.8.1 Distribucin de frecuencia para datos no Agrupados.
Es la distribucin que indica las frecuencias con que aparecen los datos estadsticos,
desde el menor de ellos hasta el mayor sin que se haya hecho ninguna modificacin al
tamao de las unidades originales. En estas distribuciones los valores de cada variable
han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas
frecuencias.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

18
Por ejemplo: En la siguiente tabla f
i
es la frecuencia absoluta, F
i
frecuencia acumulada,
h
i
frecuencia relativa y H
i
frecuencia relativa acumulada de la i-sima categora (clase),
respectivamente.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple (f
i
) Acumulada (F
i
) Simple (h
i
) Acumulada (H
i
)
X
1
f
1
F
1
= f
1
h
1
= f
1
/ n H
1
= h
1

X
2
f
2
F
2
= F
1
+ f
2
h
2
= f
2
/ n H
2
= H
1
+ h
2

... ... ... ... ...
X
k
f
k
F
k
= n h
k
= f
k
/ n H
k
= 1
Total n

1


Por ejemplo, al medir la altura de los nios de una clase, se obtienen los siguientes
resultados (en metros)
Alumno Estatura Alumno Estatura Alumno Estatura
Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21
Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29
Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26
Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22
Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28
Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27
Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26
Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23
Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22
Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21
Fuente: Extrado de: http://www.aulafacil.com/CursoEstadistica/Lecc-2-est.htm
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

19
A partir de estos datos, podemos construir nuestra tabla de frecuencias:
Distribucin de alturas de alumnos de una clase
(Valor) f
i
F
i
h
i
H
i

1,20 1 1 0,03 0,03
1,21 4 5 0,13 0,16
1,22 4 9 0,13 0,29
1,23 2 11 0,07 0,36
1,24 1 12 0,03 0,39
1,25 2 14 0,07 0,46
1,26 3 17 0,10 0,56
1,27 3 20 0,10 0,66
1,28 4 24 0,13 0,79
1,29 3 27 0,10 0,89
1,30 3 30 0,10 1,00
n = 30

~ 1

Observacin:




Interpretacin:
- f
1
= 1, significa que 1 alumno mide 1,20 cm.
- F
4
= 11, significa que 11 alumnos a lo ms miden 1,23 cm
- h
3
= 0,13, significa que el 13 % de los alumnos miden 1,22 cm.
- H
7
= 0,56, significa que el 56% de los alumnos tienen a lo ms 1,26 cm.

1.8.2 Distribucin de frecuencias de clases o de datos Agrupados
La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un nmero grande de valores o la variable es continua o cuando los
datos son discretos pero muy numerosos. Tambin se utilizar este tipo de distribucin
cuando se requiera elaborar grficos lineales como el histograma o el polgono de
frecuencia.
La suma de todas las frecuencias relativas simples debe de ser 1, pero como
en nuestro ejemplo debido a las aproximaciones realizadas, es posible que la
suma no resulte 1.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

20
1.8.2.1 Construccin de una tabla de datos agrupados.
Estas tablas se usan comnmente para resumir grandes cantidades de datos
continuos.
Fernndez (2005) seala que cualquier tabla de frecuencia con datos agrupados en
intervalos debe presentar las siguientes caractersticas:
a) Uniformidad, pues cada clase debe tener la misma amplitud.
b) Unicidad, ya que dos clases no se superponen.
c) Completitud, puesto que cada uno de los datos pertenece a alguna clase.

A continuacin, veamos cmo se construye una tabla de datos agrupados a travs del
siguiente ejemplo:
Ejemplo: Durante el mes de julio, se realiz una investigacin en la I.E. Miguel Grau
sobre el nmero de horas que los estudiantes usan el Internet durante una semana, de
la cual se obtuvo los siguientes datos:
10 19 25 19 26 23 22 17 12 20 18 25 21
16 19 27 27 25 15 21 23 26 14 23 24

Para ello, es necesario tener en cuenta los siguientes conceptos:
Concepto Definicin De acuerdo al ejemplo
anterior
Rango o
amplitud
Es la diferencia entre el mayor y el menor
dato.
R = 27 10 = 17
Intervalo de
clase
Es una clasificacin de los datos en
subgrupos.
[16,19) es un posible
intervalo de clase
donde se debe
considerar a los nios
que usan Internet
desde 16 horas hasta
menos de 19 horas
semanales.
Lmites de
clase
Son los valores extremos del intervalo de
clase; es decir, [L
i
, L
s
), donde L
i
es el
lmite inferior y L
s
es el lmite superior.
L
i
= 16
L
s
= 19
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

21
Concepto Definicin De acuerdo al ejemplo
anterior
Ancho de clase
o amplitud del
intervalo (W)
Es la diferencia entre el lmite superior e
inferior de cada intervalo.
Si tenemos el intervalo [L
i
, L
s
), el ancho o
amplitud de clase es:
W = L
s
- L
i

W= 19 16 = 3
Marca de clase
(X)
Es el punto medio de cada intervalo; es
decir, la semisuma de los lmites de cada
intervalo.



Otras consideraciones:
- La regla de Sturges.
Es una de las ms usadas en Estadstica Descriptiva. Es sabido que no existen reglas
fijas para determinar el nmero de clases (K), el cual si es muy pequeo significara la
prdida de informacin y si es muy grande producira irregularidades. De all que es
necesario, obtener el valor aproximado del nmero de clases (K) y para ello usamos la
regla de Sturges, la cual es:

Donde: n = Tamao de la muestra o nmero de datos.
Del ejemplo anterior: ()
Como hemos obtenido un valor decimal, es necesario redondearlo a cantidades
enteras y para ello diremos que K = 6, en este sentido estamos garantizando que los
valores mayores se encuentren en el ltimo intervalo.
- Ancho de clase comn.
Para ello, haremos uso de la siguiente ecuacin:




Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

22
Del ejemplo anterior:


= 2,83; no obstante es necesario redondearlo a W=3,
ya que la informacin de horas semanales de uso del Internet esta expresado en
nmeros enteros.
Para el clculo de la amplitud de clase es necesario considerar algunos criterios de
redondeo de decimales, tal es el caso que si trabajamos con una cifra decimal,
entonces el TIC deber estar expresado con una cifra decimal y si trabajamos con dos
cifras decimales, la amplitud de clase deber tener dos cifras decimales.
En resumen, si queremos elaborar una tabla de frecuencia para datos agrupados (con
intervalos), realizamos lo siguientes pasos:
Paso 1: Hallamos el rango: R= 27 10 = 17.
Paso 2: Hallamos el nmero de clases (usamos la regla de Sturges)
() Redondeamos K = 6
Paso 3: Hallamos el ancho de clase comn.




= 2,83 redondeamos W = 3
Paso 4: Elaboramos la tabla de frecuencia.
Tabla: Distribucin de nmero de horas semanales de uso de Internet.
K Intervalos X f
i
F
i
h
i
H
i

1 [10,13) 11,5 2 2 0,08 0,08
2 [13,16) 14,5 2 4 0,08 0,16
3 [16,19) 17,5 3 7 0,12 0,28
4 [19,22) 20,5 6 13 0,24 0,52
5 [22,25) 23,5 5 18 0,20 0,72
6 [25,28) 26,5 7 25 0,28 1,00
25 1,00
Fuente: Adaptado de Fernndez (2005)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

23

Interpretacin:
- f
2
= 2; es decir, 2 estudiantes usan Internet entre 13 y 16 horas, inclusive 13.
- F
4
= 13; es decir, 13 estudiantes usan Internet menos de 22 horas.
- h
5
= 0,20; es decir, el 20 % de los estudiantes usan Internet entre 22 y 25 horas,
inclusive 22.
- H
3
= 0,28; es decir, el 28 % de los estudiantes usan Internet menos de 19 horas.

1.9 Grficos Estadsticos.
Aunque una tabla estadstica encierra la informacin disponible sobre el carcter en
estudio, es necesario traducirla a un grfico para realizar una sntesis visual.
Un grfico es la expresin arbitraria de datos reales, los cuales permiten visualizar, al
golpe de vista, hechos, cantidades y comportamientos de las variables. Moya, R.
(2010) seala que el grafico tiene mayor ventaja sobre el cuadro ya que permite
apreciar rpidamente los datos y abarcar todo su conjunto. No obstante, posee
limitaciones pues no puede presentar tantos grupos de datos como una tabla y muchas
veces se hace uso de valores aproximados.

Al igual que las tablas de frecuencia, los grficos estadsticos deben estar compuestos
de lo siguiente:

- El ttulo, es una descripcin resumida referida al contenido del grfico; debe indicar
claramente la naturaleza del fenmeno representado.
- El cuerpo, es el grfico en s, que representa la informacin referida en el ttulo.
- La leyenda, es la informacin complementaria del grfico. En algunos casos es
opcional, dependiendo de la determinacin del investigador.
- La fuente, indica el origen de los datos que estn representados en el grfico (slo
cuando la informacin ha sido proporcionada por alguna persona o institucin).


Seguidamente, mostramos un grfico que ilustre las partes de un grfico estadstico.


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

24

Grfico: Partes de un grfico estadstico

Fuente: Elaboracin propia
1.9.2 Principales tipos de grficas.

1.9.2.1 Para datos correspondientes a variables cualitativas.
La representacin grfica de este tipo de datos est basada en la proporcionalidad de
las reas a las frecuencias absolutas o relativas. As tenemos:
- Diagrama de sectores.
Se le llama tambin grfico de pastel y es bastante til para representar proporciones
o porcentajes. Est representacin grfica consiste en dividir un crculo en tantos
sectores circulares como modalidades presente el carcter cualitativo, asignando un
ngulo central a cada sector circular proporcional a la frecuencia absoluta (fi),
consiguiendo de esta manera un sector con rea proporcional tambin a fi.
Su uso ms frecuente es con fines comparativos, cuando se quiere mostrar las
diversas componentes de una serie de valores de la variable comparada con el total.
Veamos a travs de un ejemplo cmo elaborar un diagrama de sectores.
Ejemplo: Se someti a una encuesta a un grupo estudiantes del Segundo grado de
educacin secundaria de la I.E 2023 acerca de sus preferencias musicales, en la cual
37%
9%
6%
29%
11%
8%
Ttulo del grfico
Luz
Agua
Telfono
Cable
Internet
Celular
Cuerpo
Leyenda
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

25
se obtuvieron los siguientes datos:
Solucin:
1 Para ello, calculamos la amplitud de cada sector; es decir dividimos 360/ 40 = 9
2 Luego, multiplicamos la amplitud de cada sector por la fi.
Tipos de msica Nmero de casos ngulo(grados) %
Reggeton 26 9(26) = 234 65
Rock 3 9(3) = 27 7
Salsa 10 9(10) = 90 25
Baladas 1 9(1) = 9 3
Total 40


3 Su representacin en un diagrama de sectores ser:



Fuente: Elaboracin propia.



65%
7%
25%
3%
Preferencias musicales
Reggeton
Rock
Salsa
Baladas
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

26
1.9.1 Para datos sin agrupar correspondientes a variables cualitativo y/o
cuantitativas discretas.
Estudiaremos dos tipos de representaciones grficas, correspondientes a distribuciones
de frecuencias de variables cualitativo y/o cuantitativa discreta
- Diagramas de barras.
Un diagrama de barras est formado por barras de altura proporcional a la frecuencia
de cada valor y se representan en el eje de ordenadas (X) las modalidades, y en
abscisas (Y) las frecuencias absolutas o relativas. Se utiliza con datos cualitativos o
cuantitativos discretos.
Moya, R. (2010) nos da algunas recomendaciones para su construccin.
- Todas las barras deben de ser del mismo grosor.
- El espacio entre las barras debe ser de la misma magnitud.
- La escala de la frecuencia debe empezar de cero.
- No se deben recargar las barras tratando de expresar muchos productos en cada
una de ellas.
- Si el grfico tiene muchas barras es preferible hacer uso de un diagrama lineal.
Ejemplo: Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar
su grupo sanguneo ha dado el siguiente resultado:

Fuente: Elaboracin propia
6
4
1
9
0
1
2
3
4
5
6
7
8
9
10
A B AB O
Grupo Sanguineo
Grupo
sanguneo
f
i

A 6
B 4
AB 1
0 9
20
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

27
- Polgonos de frecuencia.
Un polgono de frecuencias o lineal es una representacin que se realiza uniendo con
una lnea poligonal los extremos superiores de las barras en un diagrama de barras. Se
utiliza con datos cualitativos y cuantitativos discretos.
Ejemplo: Un estudio hecho a un conjunto de estudiantes sobre el nmero de libros que
leen en el mes arroj lo siguiente:

Fuente: Elaboracin propia
1.9.2 Para datos agrupados en intervalos correspondientes a un carcter
cuantitativo.

- Histograma.
El histograma se utiliza para representar una tabla de frecuencias de intervalos de
clase, donde se muestra una representacin por reas, en el cual hay que distinguir si
los intervalos en los que aparecen agrupados los datos son de igual amplitud o no.
El grfico consiste en un conjunto de rectngulos adyacentes cuya base representa un
intervalo de clase y cuya altura representa la frecuencia del intervalo. El rea que hay
bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5
f
r
e
c
u
e
n
c
i
a

Libros ledos al mes
Libros ledos al mes
Libros ledos
al mes
f
i

0 4
1 12
2 14
3 8
4 2
Total 40
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

28
frecuencia) de individuos en el intervalo.
Pueden construirse para distribuciones de frecuencias de datos no agrupados (sin
intervalos) y para datos agrupados (con intervalos)
Ejemplo: En un grupo de 30 personas hemos medido la estatura, en centmetros, de
cada una de ellas, obteniendo los siguientes resultados:
160 163 165 164 162 168 175 167 159 160
161 164 167 168 154 163 164 167 164 165
166 168 165 167 169 164 150 166 147 170
Solucin:
Por una parte, la variable que estamos estudiando es continua (la estatura). Adems,
entre los datos que tenemos hay una gran variedad. Por tanto, debemos agrupar los
datos en intervalos.




Fuente: Elaboracin propia
Intervalo Frecuencia
146,5 151,5 2
151,5 156,5 1
156,5 161,5 4
161,5 166,5 13
166,5 171,5 9
171,5 176,5 1
Distribucin de estatura de un grupo de personas
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

29
Ejercicios resueltos.

1) Identifica en cada uno de los siguientes casos los conceptos estadsticos:
poblacin, muestra, unidad estadstica, variable, tipo de variable y la escala de
medicin:
Caso N 01
Un equipo de especialistas en temas educativos realiza una investigacin sobre el
grado de desnutricin de los estudiantes de la I.E. Jos Mara Arguedas del
Distrito de Comas. Para realizar el estudio elige al azar a 33 estudiantes para
determinar si el grado de desnutricin influye en su desarrollo acadmico.
Solucin:
Leemos detenidamente el enunciado y extraemos los conceptos estadsticos.
Poblacin
Estudiantes de la I.E. Jos Mara Arguedas del Distrito
de Comas
Muestra 33 estudiantes
Unidad estadstica Cada estudiante
Variable Grado de desnutricin
Tipo de variable Cualitativa
Escala de medicin Ordinal

Caso N 02
Se necesita conocer cierta informacin para abastecer la demanda educativa en
la I.E. Miguel Grau ubicada en la Provincia de Cora Cora, Dpto. de Ayacucho.
Para ello se realiza un estudio sobre el nmero de hermanos menores de 24
estudiantes de la I.E. Miguel Grau.
Solucin:
Leemos detenidamente el enunciado y extraemos los conceptos estadsticos.
Poblacin Estudiantes de la I.E. Miguel Grau.
Muestra 24 estudiantes
Unidad estadstica Cada estudiante
Variable Nmero de hermanos menores
Tipo de variable Cuantitativa discreta
Escala de medicin De razn
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

30

2) El Programa de Lenguas Extranjeras desea implementar la biblioteca con libros
actuales y especializados, para lo cual realiza una encuesta a 50 alumnos del
PROLEX sobre el nmero de libros ledos durante el mes de enero del 2012.
Los datos obtenidos son los siguientes:
2 1 4 1 2 0 2 3 2 1
4 2 3 3 2 1 0 4 2 4
1 2 0 1 1 2 4 2 1 2
2 3 2 1 3 1 1 2 0 3
0 2 1 2 2 0 1 3 2 1

a) Elabora una tabla de frecuencias.
b) Interpreta f
3
, F
2
, h
4
y H
3
.
c) Representa grficamente los datos obtenidos.
Solucin:
a) Realizamos el conteo de los datos y completamos la tabla, tenemos que indicar
que en la mayora de los casos trabajaremos con las frecuencias relativas
porcentuales:
x
i
f
i
F
i
h
i
(%) H
i
(%)
0 6 6 12% 12%
1 14 20 28% 40%
2 18 38 36% 76%
3 7 45 14% 90%
4 5 50 10% 100%
Total n=50 100%

b) Interpretamos:
f
3 :
18 alumnos del PROLEX han ledo 2 libros durante el mes de enero del 2012.
F
2 :
20 alumnos del PROLEX han ledo a lo ms un libro durante el mes de
enero del 2012.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

31
h
4
: El 14% de los alumnos del PROLEX han ledo 3 libros durante el mes de
enero del 2012.
H
3 :
El 76% de los alumnos del PROLEX han ledo a lo ms 2 libros durante el
mes de enero del 2012.
c) Elaboramos el grfico respectivo con los datos obtenidos.


Fuente: Elaboracin propia.
3) Se ha medido la estatura, en centmetros, de 40 alumnos del 5
to
ao de secundaria
de la IE Alfonso Ugarte de la UGEL 03, para escoger al batalln que representar
al colegio en el desfile escolar.
Los datos obtenidos se muestran a continuacin:
162 156 161 160 156 167 162 164
174 161 177 155 159 171 163 162
163 179 162 173 156 161 158 160
178 169 173 157 182 174 176 155
169 165 158 159 170 160 171 166
LIBROS
0
2
4
6
8
10
12
14
16
18
20
0 1 2 3 4
A
L
U
M
N
O
S

NMERO DE LIBROS LEDOS DURANTE EL MES DE ENERO 2012
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

32
a) Elabora una tabla de frecuencias con intervalos.
b) Interpreta f
4
, F
2
, h
6
y H
3
.
c) Representa grficamente los datos obtenidos.
Solucin:
a) Para elaborar nuestra tabla de frecuencias con intervalos seguiremos el
siguiente orden:

- Determinacin del rango (R)
Es la diferencia entre el valor mximo y el valor mnimo.
R = X
mx
- X
mn

En nuestro ejemplo:
R = 182 155
R = 27

- Nmero de intervalos (K)
Consiste en dividir el rango en un nmero conveniente de intervalos de clase,
por lo general del mismo tamao. Existen varias formas para calcular el nmero
de intervalos, nosotros usaremos la frmula de Sturges:

K = 1 + 3.3log(n)
En nuestro ejemplo:

K = 1 + 3.3log(40)

K = 6,28 ~ 7

- Amplitud del intervalo (C)
Es conveniente que los intervalos de clase tengan el mismo tamao.


En nuestro ejemplo:

= 3.85 ~ 4


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

33
- Determinacin de los lmites de clases
Se recomienda que el lmite inferior del intervalo de la primera clase sea el
menor de los datos, despus se agrega el valor de la amplitud C para obtener el
lmite superior de dicha clase.
En nuestro ejemplo, el intervalo semiabierto de la primera clase es [155 159 )
- Marca de clase X'
Es el punto medio del intervalo de clase.


En nuestro ejemplo:


Ahora si podemos elaborar nuestra tabla:

[Li Ls ) X' f
i
F
i
h
i
(%) H
i
(%)
[155 159 ) 157 8 8 20% 20%
[159 163 ) 161 12 20 30% 50%
[163 167 ) 165 5 25 12.5% 62.5%
[167 171 ) 169 4 29 10% 72.5%
[171 175 ) 173 6 35 15% 87,5%
[175 179 ) 177 3 38 7.5% 95.5%
[179 183 ) 181 2 40 5% 100%
Total n = 40 100%

b) Interpretamos:
f
4
: 4 alumnos del 5
to.
ao de secundaria de la IE Alfonso Ugarte miden entre 167
cm y 171 cm, incluso 167 cm.

F
2
:

20 alumnos del 5
to
ao de secundaria de la IE Alfonso Ugarte miden menos
de 163 cm.

h
6
: El 7,5% de los alumnos del 5
to
ao de secundaria de la IE Alfonso Ugarte
miden entre 175 cm y 179 cm, incluso175 cm.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

34
H
3
:

El 62.5% de los alumnos del 5
to
ao de secundaria de la IE Alfonso Ugarte
miden menos de 167 cm.

c) Elaboramos el grfico respectivo con los datos obtenidos.


Fuente: Elaboracin propia.

4) La siguiente tabla corresponde al nmero de palabras en ingls que aprenden a la
semana los alumnas del 3
ero
secundaria de la IE Teresa Gonzales de Fanning
Nmero de
palabras
f
i

6 5
7 11
9 6
10 4
12 3
13 1
Total n=30
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

35

a) Completa la tabla de frecuencias.
b) Interpreta: f
5
, h
6
, F
3
, H
2

c) Elabora un grfico de barras
Solucin:
a) Completamos la tabla:
Nmero de
palabras
f
i
F
i
h
i
(%) H
i
(%)
6 5 5 16,67% 16,67%
7 11 16 36,67% 53,33%
9 6 22 20% 73,33%
10 4 26 13,33% 86,67%
12 3 29 10% 96,67%
13 1 30 3,33% 100%
Total n=30 100%

Nota: Los valores de las frecuencias relativas hi y Hi, las presentamos en
trminos porcentuales, para lo cual hemos multiplicado cada valor por cien.

b) Interpretamos de acuerdo a la tabla de frecuencias:

f
5
: 3 alumnas del 3
ero
secundaria de la IE Teresa Gonzales de Fanning
aprenden a la semana 12 palabras en ingls.

h
6
: El 3,33% de las alumnas del 3
ero
secundaria de la IE Teresa Gonzales
de Fanning aprenden a la semana 13 palabras en ingls.

F
3
: 22 alumnas del 3
ero
secundaria de la IE Teresa Gonzales de Fanning
aprenden a la semana a lo ms 9 palabras en ingls.

H
2
: El 53,33% de las alumnas del 3
ero
secundaria de la IE Teresa Gonzales
de Fanning aprenden a la semana a lo ms 7 palabras en ingls.


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

36

c) Elaboramos el grfico de barras respectivo

Fuente: Elaboracin propia.
5) El siguiente cuadro nos muestra a los alumnos del IV ciclo del Programa de
Licenciatura en Lenguas Extranjeras, segn el estado civil.
Estado civil f
i

Solteros 128
Casados 26
Divorciados 19
Viudos 4
Convivientes 13

a) Elabore la tabla de frecuencias respectiva.
b) Elabore un grfico de sectores.
Solucin:
a) Completamos la frecuencia relativa porcentual ya que se trata de una variable
0
2
4
6
8
10
12
6 7 9 10 12 13
A
l
u
m
n
a
s


Palabras en Ingls
Distribucin del nmero de palabras en ingls que aprenden a la
semana los alumnas del 3

de secundaria de la IE Teresa Gonzales


de Fanning
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

37
cualitativa o categrica.

Estado civil f
i
h
i
(%)
Solteros 128 60,95 %
Casados 26 12,38 %
Divorciados 19 9,05 %
Viudos 4 1,90 %
convivientes 33 15,71%
Total 210

b) Para elaborar nuestro grfico de sectores necesitamos los ngulos
correspondientes, para lo cual multiplicamos 360, correspondiente al total de la
medida angular de la circunferencia, por el porcentaje correspondiente dividido
entre 100.
Estado civil f
i
h
i
(%) operacin ngulo
Solteros 128 60,95 % (360x60,95)100 219,42
Casados 26 12,38 % (360x12,38)100 44,57
Divorciados 19 9,05 % (360x9,05)100 32,58
Viudos 4 1,90 % (360x1,90)100 6,84
convivientes 33 15,71% (360x15,71)100 56,56
Total 210


Fuente: Elaboracin propia.
Soltero
61%
Casado
12%
Divorciados
9%
Viudos
2%
Convivientes
16%
Estado civil
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

38
Ejercicios propuestos

1) En los siguientes enunciados, indicar si se trata de una muestra (M) o una poblacin
(P), colocando un aspa:

Enunciado P M
a) Nmero de enfermos con diabetes, observados durante un ao
en la Clnica San Marcos.

b) Nmero de estudiantes egresados de una institucin educativa en
el ao 2011.

c) Estudio del 42% de estudiantes egresados de una institucin
educativa en el ao 2011.

d) Nmero de personas con proceso judicial por pensin de
alimentos en el ao 2011.

e) Anlisis de precios de productos de primera necesidad en 10
mercados de Lima Metropolitana.
f) Estudio de los precios de todos los productos farmacuticos
importados por el Per en el ao 2011.
g) Se aplica una encuesta a 90 profesores de secundaria de la
UGEL 05 para averiguar a la especialidad que pertenecen.
h) Se desea conocer la estatura promedio de los alumnos de la
Institucin Educativa Melitn Carvajal, para lo que se
seleccionan 200 alumnos

i) En la UGEL 01 de 1350 docentes, se selecciona un grupo
representativo de 300 para conocer el estado civil al que
pertenecen.

j) Se realiza una encuesta en un distrito a 150 familias, para
averiguar el nmero de habitaciones que tienen sus respectivas
viviendas.



Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

39
2) Completa el tipo de variable y la escala o nivel de medicin de las siguientes
variables.
VARIABLE
CLASIFICACIN DE
LA VARIABLE
ESCALA O NIVEL
DE MEDICIN
a) Nmero de nios nacidos en
diferentes horas del da en la
maternidad de Lima.

b) Edad en aos cumplidos de los
profesores del PROLEX.



c) Nivel de instruccin de los
profesores.

d) Nmero de menores abandonados
en los hospitales en el ao 2011.

e) Tipo de diabetes.
f) Ingreso per cpita.



g) Horas de prcticas profesionales.



h) Categora docente.



i) Nmero de hogares con servicio
elctrico en Jicamarca.

j) Lugar de nacimiento de los alumnos
PROLEX.

k) Grado de desnutricin.



l) Nmero de hermanos menores
m) Profesiones de los socios del club
Los toribianitos"

n) Notas obtenida en el curso de
Estadstica

o) Nmero de asignaturas aprobadas
en un ao de estudios

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

40
3) A continuacin lee los siguientes casos y completa las tablas con la informacin
correcta.

Caso N 01: Se realiz una encuesta telefnica a 142 estudiantes del Programa de
Lenguas Extranjeras de las UNMSM, con la finalidad de conocer el grado de
satisfaccin de los servicios acadmicos ofrecidos por el Programa, considerndose las
siguientes categoras: Mala, Buena, Muy buena, Excelente.
Solucin:
Poblacin
Muestra
Unidad estadstica
Variable
Tipo de variable
Escala de medicin


Caso N 02: En el distrito de Jess Mara se desea conocer las preferencias de sus
vecinos por las razas caninas, por tal motivo se realiza una encuesta con la pregunta
si tuviera la oportunidad de obtener un can como mascota de qu raza le gustara que
fuera? Se aplica dicha encuesta a 128 vecinos al azar.
Solucin:
Poblacin
Muestra
Unidad estadstica
Variable
Tipo de variable
Escala de medicin


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

41
Caso N 03: Un postor desea concursar en una licitacin pblica para cubrir la
administracin del kiosco de ventas de golosinas de la I.E. Mercedes Indacochea de
Barranco, para lo cual decide aplicar una encuesta entre un grupo de 86 alumnas de
diferentes turnos para conocer la cantidad de dinero que gastan a la semana en
golosinas.

Solucin:
Poblacin
Muestra
Unidad estadstica
Variable
Tipo de variable
Escala de medicin

4) Se ha preguntado a 45 alumnos del segundo ao de secundaria de la I. E.
Bartolom Herrera la edad (en aos) que tienen, y se han obtenido los siguientes
datos:
12, 13, 12, 14, 13, 15, 13, 12, 14, 15, 13, 12, 14, 15, 13, 12, 14, 15, 13, 14, 15, 12,
16, 12, 14, 15, 13, 15, 13, 15, 14, 15, 13, 14, 15, 15, 13, 14, 15, 13, 13, 13, 13, 16,
14.
a) Elabora una tabla de frecuencias.
b) Elabora el grfico correspondiente.

5) La profesora Carmen Daz del curso de Ingls ha realizado una encuesta a los 52
alumnos del primero de secundaria de la I. E. Pedro Ruz Gallo de Trujillo sobre la
estacin del ao en la que han nacido y de este modo poder festejar sus
cumpleaos al inicio de cada estacin.
Para el recuento, le asignamos letras a cada categora: Primavera = P, Verano = V,
Otoo = O e Invierno = I, obtenindose los siguientes resultados.
P, I, V, I, O, P, V, O, V, O, I, V, I, O, P, V, O, V, O, I, V, P, P, I, I, O, I, P, P, V, V, O,
O, I, P, P, V, V, O, I, P, V, O, I, I, P, V, O, V, O, I, P
a) Construye una tabla de frecuencias.
b) Elabora el grfico respectivo.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

42
Autoevaluacin de la unidad 1

CASO 1: Se hizo un estudio descriptivo, con una muestra de 300 estudiantes de
Educacin especialidad Idioma Ingls, de la Universidad Nacional Mayor de San
Marcos matriculados en el presente semestre acadmico, para determinar la relacin
existente entre la motivacin interna y el rendimiento acadmico. La recoleccin de los
datos se hizo a travs de un cuestionario elaborado por el equipo de investigadores
para averiguar las actitudes motivacionales ms comunes hacia el aprendizaje del
ingls y las caractersticas demogrficas de la muestra. Por ejemplo se recolectaron
datos de las siguientes variables:
Variable Categoras/Niveles o valores
Sexo Masculino, Femenino
Estrato socioeconmico Muy Alto, Alto, Medio, Bajo, Muy Bajo
Edad (aos cumplido) De 18 a 30 aos
Tiempo de permanencia en la
universidad (en aos)
Ms de un ao

Marcar la alternativa correcta para cada tem:
1) La poblacin est conformada por:
a) 300 estudiantes de Educacin especialidad Idioma Ingls, de la Universidad
Nacional Mayor de San Marcos matriculados en el presente semestre
acadmico.
b) Estudiantes de Educacin especialidad Idioma Ingls, de la Universidad Nacional
Mayor de San Marcos matriculados en el presente semestre acadmico.
c) 300 estudiantes de Educacin de la Universidad Nacional Mayor de San Marcos
matriculados en el presente semestre acadmico.
d) Estudiantes de la Universidad Nacional Mayor de San Marcos matriculados en el
presente semestre acadmico.


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

43
2) La unidad estadstica es:
a) Un alumno de la EAP de Educacin especialidad Idioma Ingls.
b) Un alumno de la Universidad Nacional Mayor de San Marcos.
c) Un alumno de la EAP de Educacin especialidad Idioma Ingls, de la
Universidad Nacional Mayor de San Marcos matriculado en el presente semestre
acadmico.
d) Un alumno de la facultad de educacin de la Universidad nacional Mayor de San
Marcos.

3) La variable Edad (aos cumplidos) est medida bajo escala:
a) Nominal.
b) Ordinal.
c) Intervalar.
d) De Razn.

4) La variable Estrato socioeconmico es de tipo:
a) Cuantitativa discreta.
b) Categrica.
c) Cuantitativa contina.
d) Nominal.

5) La variable sexo est medida bajo la escala:
a) Nominal.
b) Ordinal.
c) Intervalar.
d) De razn.



Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

44
CASO 2: En la colonia austro alemana de Pozuzo se ha recolectado los datos
correspondientes a las estaturas, expresados en metros, de 80 alumnos de la IE
Alexander Von Humboldt, siendo los resultados:
1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88 1,92 1,75
1,84 1,86 1,73 1,84 1,87 1,83 1,81 1,77 1,73 1,75
1,78 1,77 1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93
1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80 1,79 1,84
1,86 1,80 1,77 1,80 1,76 1,88 1,75 1,79 1,87 1,79
1,77 1,67 1,74 1,75 1,78 1,77 1,74 1,73 1,83 1,76
1,83 1,77 1,75 1,77 1,77 1,84 1,83 1,79 1,82 1,76
1,76 1,76 1,79 1,88 1,66 1,80 1,72 1,75 1,79 1,77

Elabora una tabla de frecuencias con 6 intervalos de amplitud igual a 5 y responde las
siguientes preguntas:
6) Cuntos alumnos miden menos de 1.85 m?
a) 20
b) 22
c) 70
d) 78

7) Cul es la frecuencia absoluta de los alumnos que miden entre 1.75 m y 1.80 m
incluso 1.75 m?
a) 30
b) 48
c) 8
d) 78


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

45
8) Cul es la frecuencia relativa acumulada de los alumnos cuya estatura es menor
de 1.80 m?
a) 15 %
b) 87.5 %
c) 37.5 %
d) 60 %

CASO 5: El siguiente grfico nos muestra la variacin del precio de un televisor durante
seis meses observado en la tienda de artefactos El Huequito
VARIACIN DEL PRECIOS DE UN TELEVISOR DURANTE SEIS MESES

9) En qu perodo mensual el aumento en el precio fue mayor?
a) mayo - junio
b) junio - julio
c) julio - agosto
d) agosto setiembre
10) Cul fue el precio promedio en el perodo mayo agosto?
a) 400
b) 420
c) 1600
d) 800
0
100
200
300
400
500
600
700
800
Abril Mayo Junio Julio agosto setiembre
P
r
e
c
i
o
s

e
n

s
o
l
e
s

Meses
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

46
LECTURA 1
La estadstica, una ciencia en la controversia

Osvaldo Ferreiro P.
Pedro Fernndez de la R.
REVISTA UNIVERSITARIA NO 25,1988

En nuestros das se habla mucho de la estadstica, de sus usos y
abusos. Por ello y porque no siempre se conoce su significado real es
que ha surgido la idea de hacerle frente a este tema. Los autores nos
entregan adems de una resea histrica, conceptos sobre la
estadstica como ciencia y la controversia que se deriva de que su
aplicacin siempre est referida a fenmenos reales sobre los que
todos tenemos percepciones distintas.
Pedro Fernndez de la Reguera es Doctor en Estadstica por la
Universidad de Oxford (1983) y profesor del Departamento de
Probabilidad y Estadstica de la Universidad Catlica. Previamente
fue profesor y pro-decano de la Facultad de Ciencias Fsico-
Matemticas de la Universidad Austral. Osvaldo Ferreiro se titul de
Ingeniero Matemtico de la Universidad de Chile (1976) y PhD. en
Estadstica en la Universidad de Wisconsin (1985). Es Director del
Departamento de Probabilidad y Estadstica de la Facultad de
Matemtica y Presidente de la Sociedad Chilena de Estadstica.
E. F. Schumacher, en su libro Small is Beautiful, presenta el campo de la estadstica en forma
ingeniosa, diciendo: Cuando Dios cre el mundo y la gente -una empresa que, de acuerdo a la ciencia
moderna, tom un largo tiempo - razon as: Si hago todo anticipable, los seres humanos, a quienes he
dotado de buenos cerebros, aprendern a predecir todo y no tendrn motivos para trabajar, pues se
darn cuenta que el futuro est totalmente predeterminado y que no puede ser influido por acciones
humanas. Por el contrario, si hago todo impredecible, descubrirn gradualmente que no hay bases
racionales para las decisiones y, como en el primer caso, no tendrn motivos para trabajar. Ninguno de
los dos esquemas tiene sentido. Debo crear una mezcla de ambos. Sean algunas cosas predecibles y
otras impredecibles. Ellos tendrn as, entre otras muchas cosas, la tarea de descubrir cul es cul.

La estadstica nos permite, pues, explicar las condiciones regulares en los fenmenos de tipo aleatorio,
que componen buena parte de nuestro mundo.

Algunos de los padres de la estadstica:

1. R. A. Fisher (1890-1962)
2. Karl Pearson (1857-1936)
3. Jerzy Neyman (1894-1981)





2 3
1
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

47
Algo de historia
En reuniones sociales una persona puede decir que es mdico y los concurrentes empiezan con dolores
y tratan de obtener una consulta gratuita. Si dice que es matemtico, ah!, por qu estudiaste algo tan
difcil?, y lo miran con esa mezcla de admiracin, horror y respeto con que se mira a un brujo tribal. Si
dice que es estadstico, sigue a sus palabras un silencio profundo. El motivo de este silencio puede
deberse a muchas razones: ignorancia, IPC, u otras.
El quehacer estadstico es muy antiguo. Parece iniciarse con la invencin del dado, hace unos 7.000
aos. Antes fueron astrgalos, pequeos huesitos del taln de animales, con los cuales an nuestros
abuelos jugaron. Se usaban como elementos de juego, adivinaciones, comunicaciones con dioses o
quizs como dinero.

Estos huesitos no son simtricos como los dados y se pens que los distintos resultados posibles eran
controlados por los dioses. As, Cicern plantea esta idea cuando pone en boca de Quintus las
frases: ..."Dices que son fortuitas? Vamos!, realmente piensas eso? ... Cuando los cuatro (dados)
producen un Venus puedes hablar de accidente, pero si Venus aparece 100 veces en 100 lanzamientos,
llamaras a eso accidental?..."

Problemas de notacin matemtica (no resueltos hasta el 1500), problemas religiosos y muchas otras
especulaciones impidieron el desarrollo de las probabilidades hasta que Cardano (1525) publicara su
Liber de Ludo Aleae. Fue el primer tratado famoso, pues haba otros anteriores en el tema, luego de
miles de aos de juegos de azar.

El adjetivo statisticus se puso en boga en el siglo XVII. Posiblemente se origin del italiano statista, para
referirse a la persona ocupada con los asuntos del Estado (ragione di Stato). As surgi una disciplina
hbrida, la del Estado, aglomeracin de historias constitucionales, algo de economa poltica y
descripcin de las constituciones de los pases. Fue Gotfried A. Achenwall, en 1752, el que us la
palabra estadstica para esta rama del conocimiento. Fund la Escuela de Gttingen, y es conocido por
los alemanes como el padre de la estadstica, reconocimiento que Achenwall atribuye a Hermann Conrig
(1606-1681).

En Londres exista la Escuela de Aritmtica-Poltica, que haca estudios demogrficos, actuariales y
llevaba datos oficiales. Ya sea por su nombre u otro motivo, no era muy cotizada. Un da, Sir John
Sinclair, un escocs, rob a los germanos las palabras "estadsticas" y "estadstica", robo que reconoce
pblicamente por escrito, por ser palabras que "pegaban". Se arm un lo tremendo y los aritmtico-
polticos saltaron al primer plano internacional. Las agrias discusiones y duros ataques entre Londres y
Gttingen terminaron con la Escuela de Gttingen. Esta se disolvi, y as surgi la estadstica como
disciplina aceptada. Luego, Galton dara las directrices para que pasara a ser una ciencia.
Abraham de Moivre (1667-1754), francs de origen y nacimiento,
expulsado de Francia por protestante, aptrida, radicado en Inglaterra, premio
de la Academia de Ciencias de Pars (como "extranjero"), sent las
bases de la estadstica demogrfica, del Estado y otras que ms tarde
pondran a Francia a la cabeza del tema y cuya herencia la tenemos en los
modernos institutos nacionales de estadstica existentes en todos los pases. En
particular, el INE chileno lleva estadsticas sociales; demogrficas; de
seguridad social, justicia y polica; econmicas (Cuenta Nacional, agrcolas,
pecuarias, manufactureras, servicios esenciales, transporte, turismo, gasto
social, etc.), adems de la contaminacin ambiental, energa, incendios
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

48
forestales, meteorolgicas y, por supuesto, el IPC.
La revolucin industrial trae las estadsticas del caso a fin de controlar la calidad de la produccin , y,
ms tarde, la planificacin de experimentos para obtener productos nuevos, mejores y ms baratos.

Investigadores como Karl y Egon Pearson, Gossett, Neyman y, especialmente, Ronald Fisher, colaboran
notablemente al desarrollo de la estadstica. Este ltimo, un destacado cientfico, incursiona en campos
como la gentica, la biologa y la agronoma, siendo considerado por muchos el padre de la estadstica
moderna. Los aspectos cientficos siguen el trabajo aparecido en 1933, en alemn, del ruso A. N.
Kolmogorov, considerando el punto de vista probabilstico y matemtico para el desarrollo de mtodos
nuevos y ms confiables

Adems de la probabilidad, un aspecto de la mayor importancia es la muestra. Cuando se desea obtener
datos, considerar una poblacin completa es complicado, caro e impreciso. La muestra es preferible,
siempre que se la tome con los confiables mtodos estadsticos. Cuando la muestra se ha extrado
adecuadamente y los datos son suficientemente precisos, la teora estadstica nos permite, por ejemplo,
estimar la proporcin de la poblacin que tiene una determinada caracterstica y juzgar qu tan confiable
es esta estimacin.

Los estadsticos profesionales trabajan, por lo comn, en equipos mixtos. Lo hacen en investigacin
cientfica estadstica, biologa, negocios, demografa, economa, educacin, ingeniera, salud,
seguros, investigaciones de mercado y del consumidor, medicina, operaciones y administracin,
sicologa, sicometra, ciencias espaciales y muchas otras. La mayora de las personas procuran planificar
para el futuro y necesitan de los estadsticos. La estadstica pretende descubrir las caractersticas
esenciales del pasado y, apoyndose en ellas, predecir el futuro.
La estadstica como disciplina cientfica

Desde un primer punto de vista, la estadstica es una ciencia que tiene un desarrollo por s misma. Como
toda ciencia ha desarrollado teoras, teniendo gran cantidad de investigacin en lneas propias. Est en
pleno progreso siendo frecuente la creacin de nuevas metodologas.

Son numerosas las revistas internacionales que constituyen un importante canal de comunicacin entre
los estadsticos. La revista de la Sociedad Chilena de Estadstica cumple dicho papel en nuestro pas.

Por otro lado, el campo de sus aplicaciones es tan amplio que existe una tendencia a incluirla
parcialmente dentro de otras disciplinas. Adems, las diferentes definiciones de ella la ponen en
contextos desde el propio al utilitario, pasando por el matemtico y social: para el mencionado Karl
Pearson trata de las aplicaciones de la teora matemtica a la interpretacin de observaciones masivas;
Jerzy Neyman la incluye dentro del clculo de probabilidades; Harald Cramr dice que investiga la
posibilidad de extraer de datos estadsticos inferencias vlidas elaborando los mtodos mediante los
cuales se pueden obtener dichas inferencias. El ejemplo final es de Alexander Mood, para quien la
estadstica no es otra cosa que la tecnologa del mtodo cientfico.

Las discusiones sobre lo que realmente es la estadstica son actuales, incluso en su taxonoma: Qu
clase de ciencia es sta? La UNESCO la clasifica dentro de las ciencias sociales, pero FONDECYT la
incluye dentro de la matemtica y a sta en las ciencias exactas y naturales.

Como sea, estamos hablando de la ciencia de la recoleccin y anlisis de datos para la toma de
decisiones. Transforma datos en informacin. En su mtodo comienza presentando tcnicas de diseo y
recoleccin de datos respecto a un fenmeno. Luego, mediante la estadstica descriptiva se resume lo
medular de la informacin. La inferencia estadstica extiende las conclusiones obtenidas de la muestra a
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

49
la poblacin de la que ella es parte, adems de postular modelos que se ajusten a los datos. Entre estas
tcnicas de modelamiento se puede mencionar la regresin lineal y no-lineal, modelos para series de
tiempo, modelos para variables categricas.
La estadstica est muy relacionada con el mtodo
cientfico. Apoya la investigacin en todas las otras
disciplinas, especialmente en la recoleccin y el anlisis
de datos para verificar o formular nuevas hiptesis. A
su vez, los procesos comerciales, administrativos y
tecnolgicos necesitan estos mtodos para tomar
decisiones y hacer predicciones de valores futuros.
Obtener indicaciones y conclusiones con rigurosidad,
pasando por un proceso de establecimiento y
verificacin de hiptesis, trabajando en base a modelos
(expresiones matemticas) que potencialmente siguen
las variables en estudio y que se comprueban utilizando
los datos recogidos, es el quid del asunto.


Usos y abusos

Veamos algunos ejemplos de aplicaciones estadsticas en otras reas. En medicina permite determinar
el mejor efecto de una droga nueva, probada en una muestra de pacientes. En sicologa ayuda a la
calibracin de tests. En geografa colabora en la confeccin de mapas y estudios de migraciones. En
educacin permite formular modelos de respuesta en temes, a fin de estudiar efectos demogrficos y
evaluar pruebas con respecto a su discriminacin. En letras, tiene su aporte en estudios
sociolingsticos. Los economistas conocen bien la aplicacin de la estadstica en econometra,
determinando parmetros de modelos econmicos y evaluando su adecuacin a la realidad. Los
agrnomos, los ingenieros forestales, los bilogos, adems de los mdicos, hacen uso de la biometra.
La ingeniera tiene un uso cada vez mayor de ella, en especial con la cada vez ms importante rea de
la estadstica conocida como mejoramiento de la calidad y de la productividad.

Uno de los usos ms conocidos de la estadstica se observa en la realizacin de encuestas de
investigacin de mercados, de preferencias de consumo, de opiniones polticas, etc. Una encuesta
pretende reflejar, mediante entrevistas a un grupo de personas, las opiniones y/o preferencias de toda
una poblacin.
La muestra debe escogerse al azar, y de acuerdo a criterios muy precisos predeterminados que
dependen del tipo de poblacin y de los objetivos del estudio. Al basarse en una muestra, los resultados
tendrn cierto grado de incerteza que debe ser evaluado. De all la necesidad de medir el error de las
estimaciones. Un adecuado esquema de muestreo y la construccin correcta de sus detalles tcnicos (el
diseo de la muestra) es crucial para la validez de los resultados. Las preguntas del cuestionario deben
ser elegidas y redactadas cuidadosamente de modo que apunten al objetivo de la investigacin, sean
comprendidas adecuadamente por el encuestado y carezcan de frases u otros distractores que sesguen
la respuesta que se va a obtener.

El trabajo de terreno, la toma de la encuesta, es usualmente difcil, particularmente en el acceso real a
las personas que resultaron seleccionadas. El anlisis requiere procedimientos estadsticos, en particular
para evaluar la confiabilidad de las estimaciones.


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

50

Para ingresar al club de los estadsticos no basta una fuerte vocacin. Hay que pasar bien todas las
pruebas de ingreso. Al aplicar estadstica hay dos peligros: no saber extraer toda la informacin til
existente en los datos y dejar de realizar un modelamiento correcto, lo que conduce a conclusiones no
avaladas por ellos.
La insuficiente capacitacin de expertos en otras
materias, para enfrentar problemas estadsticos
complejos, la proliferacin de programas
computacionales y las crecientes necesidades de
tener los resultados "para ayer", hacen de la
estadstica una herramienta fcilmente usable, aun
por los ms profanos en la materia. Aqu se inician
muchas de las controversias.
El abuso ms corriente de la estadstica, al menos
para el hombre de la calle, est en la presentacin de
los resultados y en la confiabilidad de las
estimaciones. Por motivos llamados tcnicos o de
dramatizacin se distorsionan grficos, se podan
tablas y se entra, si no con intencin, de hecho, en
prcticas reidas con cualquier tica estadstica.
Por fortuna, ste no es siempre el caso. La utilizacin correcta de tcnicas estadsticas es cada vez ms
frecuente. El lenguaje estadstico se incorpora crecientemente a nuestra vida diaria. El pblico es cada
vez ms crtico con respecto a los resultados que se le presentan y hay un mayor inters en hacer
mejores aplicaciones. H. G. Wells, autor de The War of the Worlds y The Time Machine, deca que el
pensamiento estadstico ser algn da tan necesario para el buen ciudadano como la habilidad para leer
y escribir.










Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

51









Introduccin.
En la anterior unidad hemos visto la utilidad de las tablas de distribucin de frecuencia
y los grficos estadsticos, los cuales nos facilitan el procesamiento e interpretacin de
los datos. Sin embargo, es necesario hacer uso de tcnicas ms precisas para el
anlisis de datos y para ello emplearemos las medidas de tendencia central, las
medidas de dispersin y las medidas de forma. El clculo de cada una de estas
medidas est definido, usualmente mediante una frmula aritmtica obtenida a partir de
datos de la poblacin.
Capacidades a desarrollar.
- Calcular e interpretar las medidas de tendencia central.
- Calcular e interpretar las medidas de dispersin.
- Calcular e interpretar las medidas de forma.
Unidad 2: Medidas de Tendencia Central,
Dispersin y Forma

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

52
2.1 Medidas de Tendencia Central o Posicin.
Las medidas de tendencia central nos indican en torno a qu valor (centro) se
distribuyen los datos. Las principales medidas de tendencia central son: la media
aritmtica, la mediana y la moda.
2.1.1 Media aritmtica ( )
Es tambin conocido como promedio o solamente como media. La media aritmtica es
el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de
datos.
Media Aritmtica =




Siendo el smbolo de la media aritmtica, as tenemos:



Donde n es el tamao de la muestra y x son todos los valores que toma la muestra.
A la media aritmtica se la denomina tambin centro de gravedad de la distribucin.
2.1.1.1 Caractersticas de la media aritmtica
Es el estadgrafo de posicin ms importante.
La media aritmtica viene expresada en las mismas unidades que la variable.
En su clculo intervienen todos los valores de la distribucin.
Es el centro de gravedad de toda la distribucin, representando a todos los valores
observados.
Es nica y su significado es de fcil entendimiento.
Su principal inconveniente es que se ve afectada por los valores extremadamente
grandes o pequeos de la distribucin.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

53
2.1.1.2 Clculo de la media aritmtica.
- Para datos sin agrupar.




Ejemplo 1: Los pesos de seis profesores del Programa de Licenciatura de Lenguas
Extranjeras son: 84, 91, 72, 68, 87 y 78 kg. Hallar la media aritmtica de los pesos e
interpretar.
Solucin:

= 80

Interpretacin: El peso promedio de seis profesores de Lenguas Extranjeras es 80kg.
Ejemplo 2: Los puntajes obtenidos en 5 exmenes de estadstica de una clase son:
x
1
= 13; x
2
= 10; x
3
= 14; x
4
= 11; x
5
= 10. Halla el promedio de notas e
interpreta.
Solucin:



Interpretacin: El puntaje promedio de la clase en el curso de estadstica es 11.6 ptos.
- Para datos agrupados sin intervalos




Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

54
Ejemplo 1: Los pesos de diez docentes expresados en kg se expresan en la siguiente
tabla. Hallar su media aritmtica e interpretar.
x
i
f
i
x
i
f
i

54 2 108
59 3 177
63 4 252
64 1 64
10 601



Interpretacin: El peso promedio de diez docentes es de 60,1 kg.
- Para datos agrupados con intervalos
x marca de clase



Si los datos estn agrupados en una tabla de frecuencia de variable continua, se
trabaja de la misma forma, pero haciendo uso del valor de la variable y el valor de la
marca de clase.
Ejemplo 1: La siguiente tabla muestran las notas obtenidas en el examen parcial de
Estadstica de un grupo de estudiantes del segundo ciclo de la Facultad de Educacin
de la UNMSM.




1 , 60
10
601
= = =

n
f x
X
i i
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

55
[L
i
L
s
) X f
i

00,0 03,5 01,75 6 10,50
03,5 - 07,0 05,25 13 68,25
07,0 10,5 08,75 14 122,50
10,5 14,0 12,25 12 147,00
14,0 17,5 15,75 7 110,25
n = 52 458,50
Solucin:
La media aritmtica ser:


Interpretacin: La nota promedio del grupo es de 08,82 puntos.

2.1.2 Mediana (Me).
Es el valor que divide a la distribucin en dos partes iguales; es decir, en un 50%
inferior y un 50% superior, cuando stos estn ordenados en forma ascendente o
descendente. Sin embargo, se recomienda ordenar los datos en forma ascendente.
La mediana se representa por Me y puede hallarse slo para variables cuantitativas.
2.1.2.1 Caractersticas de la mediana


- Como estadgrafo de posicin, le sigue en importancia y uso a la media.
Es fcil de calcular y es nica.
En la mediana solo influyen los valores centrales y es insensible a los valores
extremos u outliers.
En su determinacin no intervienen todos los valores de la variable.
La mediana no necesariamente ser un valor de los datos de la lista original.


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

56

2.1.2.2 Clculo de la mediana.
Para datos sin agrupar.
Para calcular la mediana para datos sin agrupar, consideramos lo siguiente:
a) Ordenamos los datos de menor a mayor.
b) Cuando n es impar, hay un trmino central, que ser el valor de la mediana; es
decir, la mediana es la puntuacin central de la misma.

()



Si tenemos los valores: 2, 3, 4, 4, 5, 5, 5, 6, 6, entonces la Me= 5
c) Cuando n es par, hay dos trminos centrales

la mediana ser el
promedio de estos dos valores.




Si tenemos los valores: 7, 8, 9, 10, 11, 12, entonces la Me= 9.5, la cual es la semisuma
de 9 y 10, los cuales son los valores centrales.
Ejemplo 1: Dado las edades de 7 profesores 27, 30, 26, 24, 35, 25, 50 aos. Halla la
mediana e interpreta.
Solucin:
1 Ordenamos los datos en forma ascendente: 24, 25, 26, 27, 30, 35, 50.
2 Ubicamos el valor central: Me = 27
Interpretacin: El 50% inferior de los profesores tiene edades iguales o menores que 27
aos y el otro 50% superior tiene edades iguales o mayores a 27 aos.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

57

Ejemplo 2: Los siguientes datos corresponden a las calificaciones obtenidas por Peter
en el ciclo 2009-1 del curso de Gramtica: 12 13 08 10 10 14 14 18 11
19.
Solucin:
1. Ordenamos los datos: 08 10 10 11 12 13 14 14 18 19.

2. Como el nmero de datos es par, realizamos la semisuma de los valores centrales



Interpretacin: El 50% inferior de las calificaciones obtenidas por Peter en el curso de
Gramtica son menores o iguales a 12,5 puntos y el otro 50% superior de las
calificaciones son mayores o iguales a 12,5 puntos.
Para datos agrupados sin intervalos.
Si los datos estn agrupados en una tabla de frecuencias se procede de la siguiente
manera.
Ejemplo 1: De la tabla a continuacin, donde se muestran las edades de un grupo de
estudiantes del ltimo ciclo de la Facultad de Educacin de la UNMSM.

X
i
f
i
F
i

23 3 3
24 6 9
25 9 18
26 5 23
27 2 25
Total 25
Solucin
1 Se calcula la columna de frecuencias absolutas acumuladas. (F
i
)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

58
2 Luego, se encuentra la mitad del nmero total de datos, es decir se calcula

= 12,5

3 Se ubica F
j
que sea mayor o igual que

(debe de ser el menor de todos)


X
i
f
i
F
i

23 3 3
24 6 9
25 9 18
26 5 23
27 2 25
Total n= 25

4 La mediana ser el valor de la variable asociada a dicha frecuencia.
En nuestro ejemplo, la mediana es el valor de la clase asociada a F
j
. Me=25
Interpretacin: El 50% de los profesores tienen edades menores o iguales a 25 aos y
el otro 50% tienen edades mayores o iguales a 25 aos.
Ejemplo2: De la tabla a continuacin, se muestran las edades de un grupo de
estudiantes del ltimo ciclo de la Facultad de Educacin de la UNMSM.
X
i
f
i
F
i

23 3 3
24 6 9
25 9 18
26 10 28
27 8 36
Total n= 36
F
j

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

59
Solucin:
1 Se calcula la columna de frecuencias absolutas acumuladas. (F
i
)
2 Calculamos la mitad del nmero total de datos, es decir se calcula

= 18
3 Se ubica F
j
que sea mayor o igual que

(debe de ser el menor de todos)


X
i
f
i
F
i

23 3 3
24 6 9
25 9 18
26 10 28
27 8 36
Total n = 36

4 La mediana ser la semisuma de los valores 25 y 26, ya que F
j
=


Interpretacin: El 50% de las edades son menores o iguales a 25 aos y el otro 50%
son mayores o iguales a 26 aos
Para datos agrupados con intervalos.
Esto se logra utilizando la siguiente frmula:


F
j

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

60
Donde:
- L
ij
: Lmite real inferior de la clase de la mediana
- n : Nmero total de observaciones.
- F
j-1
: Suma de todas las frecuencias simples que preceden a la clase de la mediana.
- f
j
: Frecuencia de la clase de la mediana
- C
j
: Amplitud de la clase de la mediana.

Veamos el siguiente ejemplo:
Ejemplo: Los datos siguientes corresponden a la consulta psicolgica de un grupo de
trabajadores de la EAP de Educacin de la UNMSM, clasificada segn edad.
GRUPO DE EDAD
(aos)
CASOS
f
i

F
i

15 25
25 35
35 45
45 55
55 65
65 y +
77
167
123
100
44
33
77
244
367
467
511
544
TOTAL 544

Solucin
1 Se calcula la frecuencia acumulada ( F
i
).
2 Se halla el valor de

= 272
3 A continuacin, se busca la F
j
inmediatamente superior a 272. En este caso dicha
frecuencia toma el valor de 367, lo cual nos indica que la mediana se encuentra en este
intervalo.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

61
4 Finalmente, se aplica la frmula:
Me = 35 + 10 272 244 = 35 + 2,3 = 37,3 aos
123
Interpretacin: El 50% inferior de las edades de los trabajadores son menores o iguales
a 37,3 aos y el otro 50% superior son mayores o iguales a 37,3 aos.

2.1.3 Moda (Mo)
La moda es el valor de la variable que ms veces se repite, y en consecuencia, en una
distribucin de frecuencias, es el valor de la variable que viene afectada por la mxima
frecuencia de la distribucin.
No obstante, la moda no siempre es nica, si hay dos se dice que se tiene una
distribucin bimodal, si hay dos o ms modas se dice que es multimodal. Pero
tambin puede suceder que la distribucin no tenga moda, en este caso se dice que la
distribucin es amodal.
2.1.3.1 Caractersticas de la Moda.

Su clculo es sencillo y no necesariamente es nica
Es de fcil interpretacin
Le sigue en importancia a la media y la mediana.
Es un estadgrafo muy til cuando los datos son de tipo cualitativos.
El clculo de la moda es independiente del valor de los datos.
La moda no se puede operar matemticamente.

2.1.3.2 Calculo de la Moda.
Para datos no agrupados
En las distribuciones sin agrupar, la obtencin de la moda es inmediata.
Ejemplo 1: Una muestra de las edades de la ltima promocin de graduados se
presenta en la siguiente tabla:
26 20 25 21 22 26 25 20 22 28
30 22 23 22 24 28 24 26 24 22
20 22 21 26 21 22 22 31 28 26
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

62
A simple vista, el valor que ms se repite es 22 aos por lo que ste es el valor modal,
es decir, 22 aos.
En este caso hay un solo valor modal.
Ejemplo 2: Los puntajes alcanzados en un instituto de idiomas, en una escala de 100
puntos, en exmenes finales se presentan en la siguiente tabla:
71 68 70 55 57 57 85 68 45 68
36 51 57 68 40 76 49 39 57 25
Aqu observamos que los puntajes que ms se repiten son el 57 y el 68, con una
frecuencia de 4 puntajes, por lo que el conjunto de datos tiene 2 modas, es decir: 57
puntos y 68 puntos.
Cuando un conjunto de datos tiene dos modas, como en este caso, se llama bimodal.
Para datos agrupados
Primer caso: Datos de variable discreta agrupados sin intervalos.
En este caso la moda corresponde al valor de la variable que tiene la frecuencia ms
alta
Ejemplo1: Una muestra del nmero de libros de ingls que vende por semana un
distribuidor se presenta en la siguiente tabla:
N de Libros Semana
0 1
1 3
2 5
3 12
4 19
5 16
6 10
Ms de 6 4


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

63
La ms alta frecuencia corresponde a la quinta clase, por lo tanto la moda es 4, lo que
quiere decir, que la distribucin es unimodal, pues presenta una sola moda.
Interpretacin: El volumen de venta ms frecuente es de 4 libros por semana

Segundo caso: Datos de variable cualitativa.
Ejemplo 1: Se pregunt a un grupo de docentes de un instituto de idiomas, escogidos al
azar, por la marca de celular que utilizan y el resultado se presenta en la siguiente
tabla:
Marca de
Celular
N de docentes
BlackBerry 20
Motorola 12
L. G. 14
Nokia 27
iPhone 10
Samsung 23

La ms alta frecuencia corresponde a la marca Nokia, por lo tanto, esta es la moda.
Interpretacin: La marca de celular ms frecuente que utilizan el grupo de docentes del
instituto de idiomas, es Nokia
Tercer caso: Datos de variable discreta o continua agrupados con intervalos.
Se utiliza la siguiente expresin:

)

Donde: d
1
= |

| d
2
= |

|
j : Nmero de la clase que tiene la mayor frecuencia (f
j
).
L
ij
: Lmite inferior de la clase modal.
C
j
: Amplitud del intervalo de clase.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

64
Ejemplo: Se muestra en la siguiente tabla, los salarios mensuales del personal
administrativo de la I.E Virgen del Carmen
K Sueldo: [LI
i
Ls
i
) f
i

1 [400 500) 2
2 [500 600) 8
3 [600 700) 4
4 [700 800) 10
5 [800 900] 6
Solucin:

)
Donde: d
1
= |

| d
2
= |

|
j = 4 [700 800) L
ij
= 700 C
j
= 100

= f
4
= 10 ;

= f
3
= 4 ;

f
5
= 6
d
1
= | | = 6 d
2
= | | = 4
Luego: (


)
Interpretacin: La mayor parte de trabajadores administrativos de la I.E Virgen del
Carmen tiene un sueldo mensual de 760 nuevos soles aproximadamente.
2.2 Medidas de posicin no central ( Cuantiles )
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor,
dividen a la distribucin en partes iguales, de tal manera que cada una de ellas
contiene el mismo nmero de frecuencias.
Los cuantiles ms conocidos son: cuartiles, deciles y percentiles.
2.2.1 Cuartiles (Q
k
)
Son valores de la variable que dividen a la distribucin en cuatro partes iguales, cada
una de las cuales engloba el 25 % de las mismas.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

65
Estos valores corresponden a:
- Primer cuartil o Q
1
: Es el valor por debajo del cual se encuentran la cuarta parte de
los datos o 25% de los datos cuando estn ordenados de menor a mayor.
- Segundo cuartil o Q
2
: Es el valor por debajo del cual se encuentran la mitad de los
datos o 50% de los datos cuando estn ordenados de menor a mayor, es decir, es
el mismo valor que la mediana. (Q
2
= Me)
- Tercer cuartil o Q
3
: Es el valor por debajo del cual se encuentran las tres cuartas
partes de los datos o 75% de los datos cuando estn ordenados de menor a mayor



Clculo de cuartiles
Para datos no agrupados
Cuando los datos no estn agrupados la posicin de cualquier cuartil, cuando los datos
estn ordenados de menor a mayor, se calcula con la siguiente expresin:


()


Esto significa la posicin que ocupa el cuartil cuando los datos estn ordenados de
menor a mayor, de tal manera que Q
i
corresponde a Q
1
= 25, Q
2
= 50, o Q
3
= 75.
Ejemplo: La tabla a continuacin muestra la cantidad de casos atendidos por mesa de
partes en la I.E. Julio C. Tello
Febrero Marzo Abril Mayo Junio Julio Agosto Setiembre Octubre Noviembre Diciembre
15 5 20 10 23 8 3 13 18 28 32

Mediana
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

66
Solucin:
1 Ordenamos de menor a mayor.
3 5 8 10 13 15 18 20 23 28 32


Q
1



Q
2



Q
3





2 Como se puede observar los nmeros 8, 15 y 23 dividen el conjunto en cuatro partes
iguales. Estos valores reciben, respectivamente, los nombres de Primer Cuartil,
Segundo Cuartil y Tercer Cuartil.
Interpretacin: En la distribucin anterior, el cuartil Q
2
= 15 representa el 50% de los
casos atendidos por mesa de partes.

2.2.2 Deciles (D
k
)
Son los valores de la variable que dividen a la distribucin en diez partes iguales, cada
una de las cuales engloba el 10 % de los datos. En total habr nueve deciles. (Q
2
= D
5

= Me)


2.2.3 Percentiles (P
k
)
Son los valores que dividen a la distribucin en cien partes iguales, cada una de las
cuales engloba el 1 % de las observaciones. En total habr noventa y nueve
percentiles. (Q
2
= D
5
= Me = P
50
)


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

67

Clculo de cuantiles.
Para calcular los cuartiles, deciles y percentiles se sugiere seguir los siguientes pasos:
Para datos No Agrupados:
Paso 1:
Primero se ordenan de menor a mayor los n datos.
Calcular el valor:


Si A es entero, entonces el percentil k corresponde al valor medio de las observaciones
ubicadas en las posiciones A y A+1.
Si A no es un entero, el percentil k corresponde a la observacin ubicada en la posicin
entera siguiente, es decir, [A+1]
Ejemplo: Determinar los percentiles 25 y 60 de los siguientes datos: 3, 5, 5, 8, 12, 15,
21, 23, 25, 26, 29, 35
Solucin
Para P
25
: A=
()()

= 3
Aqu, resulta un entero, por tanto el P
25
corresponde al promedio de las observaciones
en las posiciones 3 y 4, es decir, P
25
=
()

= 6,5
Para P
60
: A =
()()

= 7,2
En este caso A no es un entero, nos movemos al entero siguiente, es decir, a la octava
posicin, por lo tanto el percentil 60 ser el valor asociado a dicha posicin.
P
60
= 23 (observacin en la 8 posicin).

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

68
2.3 Medidas de Dispersin.
Las medidas de dispersin tratan de medir el grado de dispersin que tiene una
variable estadstica en torno a una medida de posicin o de tendencia central,
indicndonos lo representativa que es la medida de posicin. A mayor dispersin
menor representatividad de la medida de posicin y viceversa.
2.3.1 Medidas de Dispersin Absoluta.
Son aquellas que se expresan en unidades de la variable, siendo las ms usadas:
Rango o Amplitud, Varianza, Desviacin Estndar llamada tambin Desviacin Tpica,
y Rango Intercuartlico.
2.3.1.1 Rango o amplitud.
Se define como la diferencia entre el mximo y el mnimo valor de la variable:

R = Valor mximo Valor mnimo


2.3.1.1.1 Caractersticas del rango.
- Es fcil de entender, calcular y sus unidades son las mismas que las de la
variable
- No utiliza todas las observaciones (slo dos de ellas);
- Se puede ver muy afectada por alguna observacin extrema;
- No se puede calcular con distribuciones de frecuencia que tienen clases de
extremo abierto.
Ejemplo 1: En la siguiente tabla se muestran liquidaciones recibidas por cuatro
docentes en dos institutos de idiomas A y B
A 100 120 350 370
B 225 230 240 245

R
(A)
= 370 100= 270
R
(B)
= 245 225= 20: Distribucin menos dispersa
Interpretacin: El instituto de idiomas B muestra una amplitud menos dispersa en
relacin al instituto A.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

69
Ejemplo 2: El ingreso mensual de 4 profesores de estadstica, contratados en un
colegio particular son 424 nuevos soles, 424.50 nuevos soles, 424 nuevos soles y
423.50 nuevos soles.
Solucin:
R = 424.50 423.50 = 1
Interpretacin: Los datos tienen un rango o amplitud igual a 1. Es decir es una
muestra homognea.
2.3.1.2 Varianza (S
2
)
La varianza mide la mayor o menor dispersin de los valores de la variable respecto a
la media aritmtica. Cuanto mayor sea la varianza mayor dispersin existir y por tanto
menor representatividad tendr la media aritmtica.
La varianza se expresa en las mismas unidades que la variable analizada, pero
elevadas al cuadrado.
La varianza se representa por S
2
.

)

=



Caractersticas de la varianza
- La varianza siempre es un valor no negativo, que puede ser igual o distinta de 0.
- La varianza es la medida de dispersin cuadrtica ptima.
Ejemplo 1: Los datos corresponden a la estatura de 5 profesores 1.70, 1.64, 1.60, 1.62,
1.64. Halla la varianza e interpreta.
Solucin:
1 Necesitamos el valor de la media aritmtica.


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

70


Luego, la varianza estar dado por:

( )

( )

( )

( )

( )

()

()

()

()

()


Interpretacin: Las estaturas de los profesores se dispersan en promedio 0.00112 m
2
,
con respecto al valor central.

2.3.1.3 Desviacin estndar (S)
Conocida tambin como desviacin tpica, se define como la raz cuadrada con signo
positivo de la varianza.



Ejemplo 1: El tiempo que utilizan 6 nios de igual edad para desarrollar la misma tarea
es 16, 12, 15, 18, 13, 14 minutos. Halla la desviacin estndar o tpica.
Solucin:
1


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

71
2 Hallamos

( )

( )

( )

( )

( )

( )

()

()

()

()

()

()



Interpretacin: El tiempo utilizado por los nios para desarrollar las tareas se dispersa
en promedio 1.97 minutos con respecto al valor central.
Ejemplo 2: En la tabla se muestra el nmero de nios por familia en un grupo de veinte
familias. El nmero promedio de hijos por familia es 2,9. Encontrar la desviacin
estndar e interpretarla.
Nmero de nios
por familia (x
i
)
f
i
x
i
2
f
i

1 3 3
2 4 16
3 8 72
4 2 32
5 3 75

Solucin:
Calculamos la desviacin estndar de acuerdo a la siguiente frmula:



Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

72

()


S= 1,22
Interpretacin: El promedio de hijos por familia se dispersa en 1,22 con respecto al
valor central.
2.3.1.4 Rango Intercuartlico (IQR)
Resulta de la diferencia que existe entre los cuartiles Q
3
y Q
1
, por lo tanto es el
intervalo que contiene el 50% central de los datos.
IQR = Q
3
Q
1

Se usa como medida de dispersin cuando se ha empleado la mediana como medida
de posicin.

Ejemplo 1: El curso de Gramtica se dicta en 2 grupos, se desea determinar la
dispersin del rendimiento en este curso a partir de la siguiente informacin:
TURNO Q
1
Q
3

Maana 12.3 22.7
Tarde 15.6 21.6

Calcula el rango intercuartlico para ambos turnos e interpreta.
Solucin:
Turno Maana:
1 IQR
M
= Q
3
Q
1

2 IQR
M
= 22.7 12.3
3 IQR
M
= 10.4
Turno Tarde:
1 IQR
T
= Q
3
Q
1

2 IQR
T
= 21.6 15.6
3 IQR
T
= 6
Interpretacin: El grupo que tiene rendimiento ms homogneo con respecto a la
mediana es el turno de la noche por tener menor rango intercuartlico.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

73
2.3.2 Medidas de Dispersin Relativa.
Son aquellas que no se expresan en unidades de la variable, siendo la ms usada, el
Coeficiente de Variacin.
2.3.2.1 Coeficiente de variacin.
Resulta del cociente entre la desviacin tpica y la media aritmtica, es decir:

CV
x
=



Este coeficiente se suele multiplicar por cien para expresarlo en porcentaje. Cuanto
mayor sea el coeficiente de variacin, mayor ser la dispersin de los datos.
Caractersticas del coeficiente de variacin
- Cuando CVx < CVy significa que X es ms representativa que Y, o que la
media de X representa mejor a su distribucin, que la media de Y a la suya.
- Se considera que la dispersin es ptima si CVx es igual o menor que 0,3.
- Se puede expresar sin considerar la unidad de la variable.
- Compara la dispersin de datos de variables diferentes.
- No es recomendable calcular cuando la media tiende al valor cero o variables
con valores negativos.
Ejemplo: En la siguiente tabla, se recogen los puntos conseguidos por dos jugadores
de baloncesto en los ltimos siete partidos. Calcula el coeficiente de variacin y analiza
la dispersin de los puntos.
Jugador A 20 22 30 21 20 24 22
Jugador B 32 28 34 28 20 10 12

Jugador A
= 21,29
S = 1,39
CV
A
= 0,07 = 7%
Jugador B
= 23,43
S = 8,86
CV
B
= 0,38 = 38%
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

74
Interpretacin:
El jugador B tiene una media superior al jugador A, pero es mucho ms irregular.
El jugador B tiene un CV
x
de 38%, mientras que el A lo tiene del 7%

Ejemplo 2: En un grupo, A, de personas, la estatura media es 165 cm, con una
desviacin tpica de 10,5 cm. En otro grupo, B, la estatura media es 140 cm y su
desviacin tpica, 8,4 cm. Calcula el coeficiente de variacin en los dos casos y
compara la dispersin de ambos grupos.
Solucin:
Grupo A
= 165 cm
S = 10,5 cm
CV
A
= 0,0636 = 6,36 %
Grupo B
= 140 cm
S = 8,4 cm
CV
B
= 0,06 = 6 %
Interpretacin: La dispersin es mayor en el grupo A.
2.4 Medidas de Forma.
Hasta ahora, hemos estado analizando y estudiando la dispersin de una
distribucin, pero parece evidente que necesitamos conocer ms sobre el
comportamiento de una distribucin. En esta parte, analizaremos las medidas de
forma, las cuales nos permiten comprobar si una distribucin de frecuencias tiene
determinadas caractersticas especiales, el nivel de concentracin de datos, etc.
Asimismo, las medidas de forma son indicadores estadsticos que permiten
identificar si una distribucin de frecuencias presenta uniformidad.
2.4.1 Coeficiente de Asimetras o Sesgo de Pearson.
El objetivo de la medida de la asimetra es, sin necesidad de dibujar la distribucin
de frecuencias, estudiar la deformacin horizontal de los valores de la variable
respecto al valor central de la media. Estas medidas de forma pretenden estudiar
la concentracin de la variable hacia uno de sus extremos.
Una distribucin es simtrica si a la derecha y a la izquierda de la media existe el
mismo nmero de valores, equidistantes dos a dos de la media, y adems con la
misma frecuencia. Asimismo, para hacer uso del coeficiente de asimetra la
distribucin debe ser unimodal.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

75
Una distribucin es Simtrica si = Me = Mo
En caso contrario, decimos que la distribucin es Asimtrica, y entonces puede
ser de dos tipos:
Asimtrica a la izquierda. Es el caso en que Mo Me x

Curva Asimtrica a la izquierda o Asimetra negativa.

Asimtrica a la derecha. Es el caso en que Mo Me x

Curva Asimtrica a la derecha o Asimetra Positiva.
- Calculo del Coeficiente de asimetra de Pearson
La medida obtenida depende de las unidades que en cada caso se usen, por lo
que, para comparar la asimetra de dos o ms curvas, es necesario estandarizar
los sesgos, obtenindose la siguiente frmula:
- Primer coeficiente de asimetra:



Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

76
Si A
1
> 0, la asimetra de la distribucin de frecuencias es positiva.
Si A
1
= 0, la distribucin de frecuencias es simtrica.
Si A
1
< 0, a asimetra de la distribucin de frecuencias es negativa
En distribuciones que no son muy asimtricas se cumple la siguiente relacin:
Moda = 3(media mediana)

- Segundo coeficiente de asimetra



Si A
2
> 0, la asimetra de la distribucin de frecuencias es positiva
Si A
2
= 0, la distribucin de frecuencias es simtrica.
Si A
2
< 0, la asimetra de la distribucin de frecuencias es negativa.
- Tercer coeficiente de asimetria



Si A
3
> 0, la asimetra de la distribucin de frecuencias es positiva
Si A
3
= 0, la distribucin de frecuencias es simtrica.
Si A
3
< 0, la asimetra de la distribucin de frecuencias es negativa.

Ejemplo: Para la variable edad de los estudiantes del Programa de Lenguas
Extranjeras, se obtuvieron los valores de las siguientes medidas: =40,1; Me
=38,75; Mo =37,4 y S =9,915. Calcular el coeficiente de asimetra

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

77
Solucin:
Haciendo uso del segundo coeficiente de asimetra:

=
()

0,4085
Interpretacin: La distribucin de las edades presenta una moderada asimtrica
positiva.
2.4.2 Diagrama de caja.
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una
presentacin visual que describe varias caractersticas importantes, al mismo
tiempo, tales como la dispersin y simetra. Para su realizacin se representan los
tres cuartiles y los valores mnimo y mximo de los datos, sobre un rectngulo,
alineado horizontal o verticalmente.
- Construccin del diagrama de caja.
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms
largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relacin con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mnimo y mximo de la variable. Las lneas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que
cualquier dato o caso que no se encuentre dentro de este rango es marcado e
identificado individualmente.
Por ejemplo: En la siguiente tabla mostramos las edades de un grupo de 20
docentes:
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Solucin
1 Ordenamos la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

78
2 Calculamos los cuartiles
Q
1
, el cuartil Primero es el valor mayor que el 25% de los valores de la
distribucin. Como n = 20 resulta que n/4 = 5; el primer cuartil es la semisuma de
dicho valor y el siguiente:
Q
1
=

= 24,5
Q
2
, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor
de la variable que ocupa el lugar central en un conjunto de datos ordenados.
Como

=10; la mediana es la media aritmtica de dicho valor y el siguiente:


M
e
= Q
2
=

= 33,5
Q
3
, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la
distribucin. En nuestro caso, como

= 15, resulta
Q
2
=

= 39
3 Dibujamos la grfica

El bigote de la izquierda representa al colectivo de edades ( X
mn
, Q
1
)
La primera parte de la caja a (Q
1
, Q
2
),
La segunda parte de la caja a (Q
2
, Q
3
)
El bigote de la derecha viene dado por (Q
3
, X
mx
).
Interpretacin:
- La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir
que las edades comprendidas entre el 25% y el 50% de la poblacin est ms
dispersa que entre el 50% y el 75%.
- El bigote de la izquierda (Xmm, Q
1
) es ms corto que el de la derecha; por ello
el 25% de los ms jvenes estn ms concentrados que el 25% de los
mayores.
- El rango intercuartlico = Q
3
- Q
1
= 14,5; es decir, representa el 50% central de
los datos.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

79
Ejercicios resueltos.
1) La profesora Jessica decide comparar las notas obtenidas en el examen final
del curso de ingls entre dos grupos de estudiantes, obtenindose los
siguientes datos:
Grupo A 16 11 08 12 15 16 18 16
Grupo B 14 17 16 18 08 08 12 19

a) Halla el promedio de cada grupo e interpreta.
b) Calcula la mediana de cada grupo e interpreta.
c) Halla la moda de cada grupo e interpreta.
d) De acuerdo a los estadgrafos estimados cul sera tus conclusiones.
Fundamenta tu respuesta.
Solucin:
a) El promedio del grupo A.


Interpretacin: El promedio de las notas obtenidas en el examen final del
curso de ingls por el grupo A es de 14 puntos.
El promedio del grupo B

=

Interpretacin: El promedio de las notas obtenidas en el examen final del
curso de ingls por el grupo B es de 14 puntos.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

80
b) Para calcular la mediana de ambos grupos ordenamos los datos en forma
ascendente.
Como el nmero de datos es par, la mediana es el resultado de la
semisuma de los valores centrales.

Mediana para el grupo A:
Me
A
= 8 11 12 15 16 16 16 18
Me
A
= 15,5
Interpretacin: El 50% inferior de los estudiantes del grupo A obtuvieron
notas iguales o menores a 15,5 puntos y el otro 50% superior obtuvieron
notas iguales o mayores a 15,5 puntos en el examen final del curso de
ingls.
Mediana para el grupo B:
Me
B
= 8 8 12 14 16 17 18 19
Me
B

Interpretacin: El 50% inferior de los estudiantes del grupo B obtuvieron
notas iguales o menores a 15 puntos y el otro 50% superior obtuvieron
notas iguales o mayores a 15 puntos en el examen final del curso de ingls.
c) La moda es el valor que se repite con mayor frecuencia:
Grupo A:

= 16
Interpretacin: La nota ms frecuente en el grupo A es 16 puntos en el
examen final del curso de ingls.
Grupo B:

= 08
Interpretacin: La nota ms frecuente en el grupo B es 08 puntos en el
examen final del curso de ingls.
2) Se ha realizado un estudio sobre el nmero de veces que un grupo de alumnos
del PROLEX han asistido a la biblioteca durante el mes de enero del 2012,
obtenindose los siguientes datos:
x
i

0 1 2 3 4 5
f
i

4 12 10 18 9 7
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

81
a) Calcula la media aritmtica e interpreta el resultado
b) Halla la mediana e interpreta el resultado.
c) Determina la moda e interpreta el resultado.
Solucin:
a) Hallamos la media aritmtica






Interpretacin: Los alumnos de PROLEX han asistido en promedio 2,62
veces a la biblioteca durante el mes de enero del 2012.
b) Hallamos la mediana, para lo cual procedemos de la siguiente manera:

- Completar


- Calcular


- Ubicamos un f
i

en nuestro caso la
4ta clase.
- La mediana es el valor asociado a f
i

.

Interpretacin: El 50% inferior de los estudiantes asisti a la biblioteca 3 o
menos veces a la biblioteca y el otro 50% superior asisti 3 o ms veces a
la biblioteca.


0 4 0
1 12 12
2 10 20
3 18 54
4 9 36
5 7 35
Total 60 157


0 4 4
1 12 16
2 10 26
3 18 44
4 9 53
5 7 60
n=60
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

82
c) La moda es el valor asociado a la ms alta frecuencia
En nuestro caso
Interpretacin: La mayora de los alumnos del PROLEX han asistido tres
veces a la biblioteca durante el mes de enero del 2012.

3) En familia del profesor Gmez, el salario mensual del padre es de S/. 800 y el
salario de la madre es de S/. 1500. En la familia del profesor Prez, el padre
gana S/. 1860 y la madre S/. 540. Cul es el rango en cada familia? En cul
de ellas es mayor la dispersin?

Solucin:

R
Gmez
= 1500 900= 600
R
Prez
= 1860 540 = 1320

Hay mayor dispersin en la familia del profesor Prez, tambin se puede
decir, que la familia Gmez presenta mayor homogeneidad en los salarios.

4) El profesor de Educacin Fsica de la I.E. Mara de Los ngeles duda entre
seleccionar a Elena o Mara para el equipo de bsquet. El puntaje conseguido
por cada una, en una semana de entrenamiento, fueron los siguientes:

Elena 18 23 22 24 19 25 16
Mara 18 26 18 28 22 17 18

Calcula la desviacin estndar y analiza cul de las dos es ms regular.

Solucin

a) Para Elena

Elena
=

= 21


Elena
=

= 3,11

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

83
b) Para Mara


Mara
=

= 21


Mara
=

= 4,105

Es ms regular Elena porque la dispersin de datos es menor.

5) Segn los datos de una encuesta realizada entre estudiantes de Lenguas
Extranjeras de la UNMSM, la estatura media de dichos estudiantes es de
167,67 cm con una desviacin de 8,49 cm y el peso medio es de 61,61 kg. con
una desviacin de 11,27 kg. Cul de las dos variables presenta mayor
dispersin en torno a su media?

= 0,0506 x 100 = 5,06%


= 0,1829 x 100 = 18,29 %



La estatura presenta un 5,06% de variacin respecto a su media y el peso
un 18,29%, por lo que se concluye que el peso est ms disperso en relacin a
su media.









Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

84
Ejercicios propuestos.
1) Los siguientes datos corresponden al tiempo en minutos que utilizan un grupo
de alumnos del PROLEX en trasladarse desde sus hogares a la universidad
los das sbados:
48 53 45 52 45 58 62
48 51 60 48 51 51 56
a) Halla el promedio e interpreta el resultado.
b) Calcula la mediana e interpreta el resultado.
c) Hallar la moda e interpreta.

2) La coordinacin acadmica del Programa de Lenguas Extranjeras est
interesada en conocer la cantidad de libros que leyeron sus estudiantes
durante los meses de enero, febrero y marzo del 2012. Para tal efecto realiza
una encuesta dirigido a dos grupos, uno de la promocin 2010 y el otro de la
promocin 2011, obtenindose los siguientes datos:
Promocin
2010
2 0 5 4 5 1 0 2 4
1 2 3 1 4 3 3 3 5

Promocin
2011
5 4 2 0 0 5 3 2 6
1 3 3 4 2 3 1 3 1
a) Halla el promedio de cada grupo e interpreta.
b) Calcula la mediana de cada grupo e interpreta.
c) Halla la moda de cada grupo e interpreta.
d) De acuerdo a los estadgrafos estimados, cules seran tus conclusiones.

3) Los siguientes datos corresponden a las edades de un grupo de estudiantes
de la Facultad de Educacin de la UNMSM, las cuales son: 20, 25, 20, 22, 21.
Calcular la desviacin estndar y la varianza e intrprete.

4) Los gastos mensuales de la facultad de Educacin de la UNMSM tiene una
media de S/ 60 000 y una desviacin estndar de S/ 7500. En la facultad de
Letras, la media es de S/ 9 000 y la desviacin estndar es de S/. 1500.
Calcula mediante el coeficiente de variacin, cul de las dos tiene ms
variacin relativa.

5) Los tiempos que un grupo de estudiantes de la Facultad de Educacin de la
UNMSM han empleado en hacer un examen de estadstica se distribuyen entre
0 y 50 minutos. Construye el diagrama de caja sabiendo que Q
1
= 23, Me=34 y
Q
3
= 39.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

85
Autoevaluacin de la unidad 2.
1) Cuando una muestra es asimtrica, el mejor estadstico de centralizacin que
puede emplearse es la:
a) Media aritmtica.
b) Moda.
c) Mediana.
d) Media geomtrica.
e) Media armnica.

2) Es un estadstico de dispersin:
a) Moda.
b) Rango.
c) Mediana.
d) Media armnica.
e) Media geomtrica.

3) Para comparar correctamente, desde un punto de vista descriptivo, la
dispersin de dos o ms variables, debe utilizarse:
a) La desviacin tpica.
b) La amplitud.
c) El coeficiente de variacin.
d) La covarianza.
e) La desviacin media.

4) Cul de los siguientes estadsticos descriptivos es de posicin?
a) Media geomtrica.
b) Media ponderada.
c) Varianza.
d) Percentil.
e) Covarianza.

5) El coeficiente de asimetra de una distribucin de frecuencias simtrica es:
a) 0
b) 1
c) 1,96
d) 1
e) 1,96
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

86

6) Indquese cul de las siguientes frases define el concepto estadstico de rango:
a) Diferencia existente entre dos medias.
b) Relacin entre la desviacin tpica y el valor real de la magnitud medida.
c) Diferencia entre los lmites de confianza superior e inferior.
d) Diferencia entre los lmites de tolerancia superior e inferior.
e) Diferencia entre el valor ms alto y el ms bajo de una serie de medidas.

7) La desviacin tpica de un conjunto de datos es:
a) El cuadrado de la varianza.
b) La desviacin ms grande.
c) La raz cuadrada positiva de la varianza.
d) El cuadrado de la media armnica.
e) La diferencia entre la media y la moda.

8) El diagrama de caja:
a) Se construye con medidas basadas en momentos.
b) Conserva los datos originales.
c) Permite localizar valores extremos de la distribucin.
d) Slo es til para distribuciones simtricas.
e) Permite localizar la media aritmtica.

9) La diferencia entre el valor correspondiente al tercer cuartil y el valor
correspondiente al primer cuartil indica
a) Cunto vale la mediana.
b) Cunto vale la media.
c) Cunto vale la desviacin tpica.
d) Cunto vale el rango intercuartlico.
e) Cunto vale la varianza.

10) En un colegio el 80 % de los estudiantes obtienen una puntuacin en el
examen de ingls igual a 14. Qu representa el valor 14 de esta distribucin?
a) La media.
b) El percentil 80.
c) La moda.
d) El decil 2.
e) El coeficiente de variacin.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

87
Lectura 2

LA ESTADSTICA, UN PILAR BSICO EN LA EDUCACIN

Manuel Molina Fernndez
Catedrtico de Estadstica
Universidad de Extremadura

La Estadstica se ha consolidado en el siglo XX como una ciencia moderna de gran utilidad en la
investigacin experimental. Estudia procedimientos para la recogida de conjuntos de datos, para la
organizacin, representacin grfica, resumen y anlisis de la informacin recogida y para la
obtencin de conclusiones cientficas sobre las poblaciones en las que han sido seleccionados los
datos. Es una disciplina de obligada consulta para los investigadores que realizan su actividad en
ciencias de la salud, ciencias humanas o ciencias sociales. La metodologa estadstica interviene
en la etapa inicial de identificacin y formulacin de los problemas, en la planificacin y el diseo
de la investigacin, en la recogida de la informacin, en su anlisis, en la elaboracin de resultados
y conclusiones, en su presentacin y en la propuesta de acciones futuras.

La Estadstica es una ciencia en continua evolucin que tiene cada vez ms influencia en la
sociedad. En los medios de comunicacin aparecen diariamente resultados estadsticos sobre
economa, salud, opinin poltica, etc. Cuando estn basados en datos ciertos proporcionan una
informacin muy valiosa. En un pas estadsticamente avanzado, la mayora de sus decisiones
sociales y econmicas estn apoyadas en estadsticas relevantes, sus medios de comunicacin
proporcionan informacin veraz basada en informes estadsticos rigurosos y existe un buen
sistema de enseanza de la Estadstica en sus diferentes niveles educativos.

LA ESTADSTICA EN LOS NIVELES EDUCATIVOS NO UNIVERSITARIOS

La Estadstica es una parte de la educacin general deseable para los futuros ciudadanos que
necesitarn adquirir la capacidad de saber interpretar la gran cantidad de informacin, que en
forma de tablas y grficos estadsticos, aparece constantemente en los medios de comunicacin
sobre temas muy variados. El inters por la enseanza de la Estadstica se ha visto impulsado
notablemente por las enormes potencialidades que ofrecen hoy da los ordenadores que han
facilitado el uso de los procedimientos estadsticos a un nmero creciente de personas. Todo ello
ha motivado la necesidad de una formacin bsica en Estadstica que, en los niveles educativos no
universitarios, ha sido encomendada a los profesores de matemticas. Su finalidad principal es que
los alumnos comprendan y aprecien el papel de la Estadstica en la sociedad, que conozcan sus
diferentes campos de aplicacin y que valoren la importancia de los mtodos estadsticos.

Si se pretende que el alumno aprecie la importancia de la Probabilidad y la Estadstica, los
ejemplos desarrollados en las clases deben incluir aplicaciones de su mundo biolgico, fsico,
social y poltico. En este sentido, son de gran inters metodolgico la realizacin de trabajos
aplicados que permiten a los alumnos elegir un tema de su inters en el que tendrn que precisar
unos objetivos, proceder a la recogida de datos, seleccionar las muestras necesarias y analizar e
interpretar la informacin recogida para proporcionar una adecuada respuesta a los objetivos
planteados. Tales trabajos, adems de introducir a los alumnos en la investigacin, hacen que se
interesen por la Estadstica y que la valoren como una herramienta de gran utilidad para solucionar
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

88
problemas de la vida real.

En la Comunidad Autnoma de Extremadura, los currculos de educacin primaria y secundaria
incluyen recomendaciones sobre la enseanza de la Estadstica y, en el Decreto 115/2008 de 6 de
junio de 2008, por el que se establece el currculo del bachillerato, en las Matemticas I (Modalidad
de Ciencias y Tecnologa) se incluye un bloque de Estadstica y Probabilidad, con contenidos
bsicos de estadstica descriptiva bidimensional, correlacin y regresin lineal, probabilidad y
distribuciones binomial y normal.

Lamentablemente, dicho bloque no tiene continuidad en las Matemticas II, donde no se incluye
ningn contenido de Estadstica. En consecuencia, muy condicionados por las Pruebas de Acceso
a la Universidad, son pocos los profesores que imparten los contenidos de Estadstica y en otros
casos se tratan muy brevemente. En las Matemticas Aplicadas a las Ciencias Sociales I y II
(Modalidad de Humanidades y Ciencias Sociales) s se incluyen bloques de Probabilidad y
Estadstica, con contenidos sobre estadstica descriptiva (unidimensional y bidimensional),
correlacin y regresin lineal, probabilidad, distribuciones de probabilidad binomial y normal,
implicaciones prcticas de algunos resultados lmite y una introduccin bsica al muestreo
estadstico y a la inferencia estadstica.

LA ESTADSTICA EN LOS NIVELES EDUCATIVOS UNIVERSITARIOS

La rpida evolucin que experimentaron las tecnologas de la informacin y de la comunicacin en
los pases avanzados, permitiendo almacenar, recuperar y manejar grandes cantidades de datos,
contribuyeron muy significativamente a la demanda de profesionales capacitados para resolver las
necesidades de empresas e instituciones. Profesionales que deban poseer capacidad para el
pensamiento analtico y habilidad para el tratamiento e interpretacin de diversa informacin, de
manera que cuando se tuvieran que enfrentar a situaciones definidas de manera imprecisa fuesen
capaces de crear o identificar el modelo adecuado, trabajar con los datos disponibles, realizar el
anlisis apropiado de ventajas e inconvenientes y saber presentar unas conclusiones a los
responsables de la toma de decisiones. Para la formacin de tales profesionales se hizo necesario
disponer de alguna titulacin especfica de Estadstica.

En Espaa, fue en el ltimo cuarto del siglo XX cuando dentro de un contexto de crecimi ento de la
universidad espaola result factible la creacin de nuevas titulaciones de Estadstica y se empez
a perfilar la formacin de un profesional de la Estadstica equiparable en conocimientos y
habilidades a cualquiera de los pases ms avanzados. Con fecha 20 de noviembre de 1990 se
cre el ttulo de Diplomado en Estadstica y con fecha 6 de diciembre de 1994 el ttulo (de slo
segundo ciclo) de Licenciado en Ciencias y Tcnicas Estadsticas. La necesaria adaptacin de los
estudios universitarios al nuevo escenario del Espacio Europeo de Educacin Superior, ha
originado la creacin de un ttulo de Grado en Estadstica, que viene a reemplazar a los ttulos
anteriores de Diplomado en Estadstica y de Licenciado en Ciencias y Tcnicas Estadsticas.

El Grado en Estadstica, fruto del acuerdo de los 17 centros de las 15 universidades pblicas en los
que se vena impartiendo alguno de los dos ttulos oficiales de Estadstica, ha surgido con el
objetivo de formar unos profesionales capacitados para la aplicacin de los mtodos y modelos de
la Estadstica y la Investigacin Operativa, as como para la realizacin de tareas especficas que
acompaan a cualquier proceso de anlisis de datos. Es un ttulo que cubre una demanda
especfica de estadsticos profesionales y es homologable con ttulos similares de los pases ms
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

89
avanzados de nuestro entorno socioeconmico. En la actualidad se imparte, bajo diversas
denominaciones, en 13 universidades pblicas. En la Universidad de Extremadura, bajo la
denominacin de Grado en Estadstica, se viene impartiendo desde el curso acadmico 2010-2011
en la Facultad de Ciencias.

A partir de los estudios sobre insercin laboral realizados se han obtenido como conclusiones que
los titulados en Estadstica son unos profesionales polivalentes muy solicitados en diversos
sectores laborales. Sus perfiles profesionales se centran principalmente en actividades
relacionadas con las administraciones pblicas, el campo de la salud y de las ciencias naturales, la
economa y las finanzas, la industria y servicios, la docencia y la investigacin. A partir de la
informacin recogida en encuestas realizadas a los empleadores, se desprende que existe una
creciente demanda de titulados en Estadstica y que los conocimientos especficos de Estadstica
se encuentran entre los ms valorados en el sector empresarial.

ALGUNOS ORGANISMOS RELACIONADOS CON LA DIFUSIN DE LA ESTADSTICA
Instituto Internacional de Estadstica (http://www.isi-web.org/ )

Fundado en 1885, el International Statistical Institute (ISI) tiene entre sus objetivos fundamentales
favorecer la educacin estadstica. Colabora en la produccin y difusin de ayudas para la
enseanza (libros de texto, bibliografas especficas y diccionarios de trminos estadsticos), trata
de impulsar la introduccin de la Estadstica en las escuelas y promueve la celebracin de
conferencias y reuniones sobre la educacin estadstica, entre las que cabe mencionar las
Conferencias Internacionales sobre la Enseanza de la Estadstica que desde su primera edicin
en 1982 se vienen celebrando cada cuatro aos. Con la finalidad de promover, desarrollar y
mejorar la educacin estadstica en el mbito internacional, el ISI cre la International Association
for Statistical Education:
(http://www.stat.auckland.ac.nz/~iase/).

Instituto de Estadstica de la Organizacin de las Naciones Unidas para la Educacin, la
Ciencia y la Cultura (UNESCO).

Es el depositario de la Organizacin de Naciones Unidas en materia de estadsticas mundiales en
la educacin, la ciencia, la tecnologa, la cultura y la comunicacin. Se cre en 1999 con el fin de
mejorar el programa de estadstica de la UNESCO as como para desarrollar y suministrar
estadsticas exactas, oportunas y polticamente relevantes, requeridas en un contexto actual cada
vez ms complejo y rpidamente cambiante. Entre las publicaciones que edita, cabe mencionar el
Compendio Mundial de la Educacin 2010 donde se proporciona una exhaustiva comparacin de
las estadsticas relativas a educacin en el mundo, vase la pgina web:
http://unesdoc.unesco.org/images/0019/001912/191218s.pdf

Instituto Nacional de Estadstica
(http://www.ine.es)
El Instituto Nacional de Estadstica (INE) se cre en 1945 con la misin de elaborar y perfeccionar
las estadsticas demogrficas, econmicas y sociales existentes en nuestro pas, crear otras
nuevas y coordinar los servicios estadsticos de las diversas reas provinciales y municipales. En la
pgina web: http://www.ine.es/inebmenu/mnu_educa.htm se proporciona informacin sobre las
operaciones estadsticas elaboradas por el INE en materia educativa. En este sentido, cabe
tambin resear la pgina web: http://www.educacion.gob.es/horizontales/estadisticas.html
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

90
elaborada por el Ministerio de Educacin, Cultura y Deporte, en la que se muestra informacin
sobre estadsticas de educacin y enlaces de inters a informacin estadstica nacional e
internacional relevante para el sector educativo.

Sociedad de Estadstica e Investigacin Operativa (http://www.seio.es)
Es una organizacin autnoma, creada en 1962 con el objetivo de desarrollar, mejorar y promover
los mtodos y aplicaciones de la Estadstica y de la Investigacin Operativa, en su sentido ms
amplio. Con dicha finalidad, organiza congresos ordinarios y reuniones monogrficas, edita
revistas profesionales y boletines de informacin, potencia intercambios nacionales e
internacionales, promociona actividades de consulta en los sectores pblico y privado, estimula la
investigacin y, de la sociedad.

Instituto de Estadstica de Extremadura
(http://www.estadisticaextremadura.com/index.php)
Creado en 2009, es un organismo autnomo adscrito a la Consejera competente en materia de
Economa de la Junta de Extremadura, al que se confiere la responsabilidad de la actividad
estadstica de inters para Extremadura.

NOTA BIOGRFICA
Manuel Molina Fernndez, naci en Granada. Es Doctor en Ciencias Matemticas por la
Universidad de Granada. Desarrolla su actividad docente como Catedrtico de Estadstica en la
Universidad de Extremadura, donde se le ha concedido recientemente el premio a la excelencia
docente. Coordina los estudios de Estadstica en la Facultad de Ciencias de la Universidad de
Extremadura. Ha formado parte de la Comisin Nacional encargada de la elaboracin del libro
blanco del ttulo de Grado en Estadstica. Es miembro de la Conferencia Interuniversitaria de
Estudios de Estadstica, del Consejo Ejecutivo de la Sociedad de Estadstica e Investigacin
Operativa y del Consejo Superior de Estadstica de Extremadura. Su investigacin se desarrolla en
el campo de la Probabilidad y la Estadstica. Ha realizado informes cientficos para diversas
instituciones y organismos internacionales y nacionales, ha participado en varios proyectos de
investigacin nacionales, y es autor de numerosos artculos cientficos publicados en revistas
internacionales de gran prestigio.













Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

91










Introduccin.

Frecuentemente se usa el trmino probabilidad para sugerir que existe duda o
incertidumbre sobre lo que ocurri, lo que ocurre u ocurrir. La experiencia
humana demuestra que existe una serie de hechos, acontecimientos,
experimentos cuyos resultados no se pueden determinar anticipadamente, pero
Capacidades a desarrollar.
- Interpretar espacios muestrales y sucesos de un
experimento aleatorio dado.
- Calcular e interpretar probabilidades de eventos simples y
compuestos.
Unidad 3: Probabilidades


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

92
que sin embargo si es posible definir, estimar o predecir el probable resultado.
Podemos conocer el pasado, pero nunca el futuro, pero existe un permanente
inters por despejar las incertidumbres.
Es as como nace el concepto de probabilidad, nace con el deseo del hombre de
conocer con certeza los eventos venideros. Es por ello que el estudio de las
probabilidades surge como una herramienta utilizada por los nobles para ganar en
los juegos y pasatiempos de la poca. El desarrollo de estas herramientas fue
asignado a los matemticos de la corte.
Con el tiempo estas tcnicas matemticas se perfeccionaron y utilizaron en otras
actividades muy diferentes para las que fueron creadas. Actualmente con avance
de la computacin se han desarrollado programas para el estudio de las
probabilidades disminuyendo considerablemente el margen de error en el clculo.
La probabilidad permite cuantificar la posibilidad de que ocurra un evento.
3.1 Nociones de probabilidad.
En el campo de las probabilidades se hacen uso de algunos trminos especiales,
por lo que se hace necesario conocer cada uno de ellos.
3.1.1 Experimentos Aleatorios.
Los experimentos aleatorios son aquellos cuyo resultado depende del azar:
(lanzar de un dado, una moneda, extraer una bola, una carta, etc.)
En condiciones iniciales no se permite predecir un resultado a pesar de que se
conocen todos los resultados posibles.
Experimentos aleatorios
- Se lanza un dado y se anota el nmero que sale en la cara superior.
- De un grupo de 30 estudiantes, se cuentan cuntos conocen el Can del Colca.
- En una carrera en la que participan 10 caballos enumerados del 1 al 10, se
indica quin va a ganar.


Sin embargo, hay experimentos en que s se pueden predecir el resultado, estos
se llaman experimentos deterministas (o no aleatorios); se podr repetir el
experimento varias veces y el resultado ser siempre el mismo.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

93
3.1.2 Espacio Muestral (O)
El espacio muestral es el conjunto de todos los resultados posibles de un
experimento aleatorio. Generalmente se le representa por O (omega).
Ejemplos:
Cul es el espacio muestral al
lanzar un dado?
Al arrojar un dado los resultados
posibles son: 1, 2, 3, 4, 5, 6.
Luego: O { } 6 , 5 , 4 , 3 , 2 , 1 = .

Cul es el espacio muestral al
lanzar una moneda?
O { } S C, =

Cul es el espacio muestral de elegir una persona de diferente sexo de un
grupo de personas?
O = {hombre, mujer}

3.1.3 Suceso o evento.
Es un subconjunto (una parte) del espacio muestral. Generalmente se le
representa por una letra mayscula.
Ejemplos
Luego de lanzar un dado, cuyo espacio muestral es, O = { 1, 2, 3, 4, 5, 6 },
- El evento de obtener un nmero menor que 3 es, A = {1, 2}
- El evento de obtener un nmero primo es, B = {2, 3, 5}
- El evento de obtener un nmero mayor que 6 es, C = { }
- El evento de obtener un nmero menor que 7 es, D = { 1, 2, 3, 4, 5, 6}


3.1.4 Probabilidad de un suceso
La probabilidad de un suceso A, se define como un cociente entre la cantidad de
elementos que tiene dicho suceso (casos favorables) y el nmero de elementos
del espacio muestral (casos posibles).

()



P(A) = Se lee Probabilidad del suceso A
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

94

Ejemplos
Con los resultados del ejemplo anterior, calcula la probabilidad de ocurrencia para
cada suceso:

- P (obtener un nmero menor que 3)

()





- El evento de obtener un nmero primo es, B = {2, 3, 5}

()





- El evento de obtener un nmero mayor que 6 es, C = { }

()





- El evento de obtener un nmero menor que 7 es, D = { 1, 2, 3, 4, 5, 6}

()






3.1.5 Propiedades de las probabilidades
Las propiedades fundamentales de las probabilidades son tres:
a) La probabilidad es un nmero positivo menor o igual a uno.
0 s P(A) s 1
Adems:
P(A) = 0 , si A = { } Probabilidad nula
P(A) = 1, si A = O Probabilidad segura

b) La probabilidad que no ocurra un evento es igual a uno menos la probabilidad
que si ocurra el evento.
P(no A ) = 1 P(A)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

95
c) La probabilidad que ocurra al menos unos de dos eventos, es igual a la suma
de las probabilidades de esos eventos, menos la probabilidad que si ocurran
los dos eventos a la vez.
( ) ( ) ( ) ( ) B A P B P A P B A P + =


Ejemplo 1: En una bolsa hay 3 bolas verdes y cuatro amarillas. Cul es la
probabilidad de sacar una bola azul?
Solucin:

()




No hay ninguna probabilidad de sacar una bola azul. A esto lo llamaremos:
Probabilidad imposible o nula.
Ejemplo 2: En una bolsa hay 15 bolas verdes Cul es la probabilidad de sacar
una verde?
Solucin:

()




En este caso existe cien por ciento de certeza que el suceso ocurra. Es una
Probabilidad segura.

Ejemplo 3: Una carta es escogida al azar desde un paquete ordinario de cartas.
Hallar la probabilidad de no obtener un siete.
Solucin:
Sea el suceso A = obtener un siete, entonces:
P (obtener un siete) = P (A) =


Nos piden: P (no obtener un siete) = P (A), aplicando la propiedad
P (A) = 1 P

(A) =


Interpretacin: Existe un 92% de probabilidades de no obtener un siete.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

96
Ejemplo 4: La probabilidad de que un alumno apruebe matemtica es de 0,6, de
que apruebe comunicacin es 0,5 y de que apruebe las dos asignaturas es 0,3.
Se elige un alumno al azar, calcule la probabilidad de que apruebe al menos una
asignatura.
Solucin:
Definimos los eventos y las probabilidades correspondientes:
A = Aprobar matemtica P (A) = 0,6
B = Aprobar comunicacin P (B) = 0,5
A

B = Aprobar matemticas y aprobar comunicacin P (A

B) =
0,3
A

B = Aprobar matemtica o comunicacin (al menos una)


P(A

B) = P(A) + P (B) P(A

B), deducimos que


P(A

B) = 0,6 + 0,5 0,3 = 0,8


Luego, la probabilidad de que un alumno apruebe al menos una materia es 0,8
80%.

Ejemplo 5: En un concurso entre dos personas la probabilidad de que Juan gane
es de 0,3 y la de que Mario gane 0,4. Si no puede haber empate. Cul es la
probabilidad de que Juan o Mario ganen?
Solucin:
Definimos los sucesos y sus probabilidades respectivas:
J = Juan gane el concurso P (J) = 0,3
M = Mario gane el concurso P (M) = 0,4
J

M = Ambos ganen el concurso


Por la condicin de que no hay empate, se infiere que no se puede dar el caso de
que ambos ganen el concurso.
P (J

M) = 0
Cuando esto sucede, se dice que estos eventos son mutuamente excluyentes,
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

97
es decir, que ambos eventos no pueden ocurrir al mismo tiempo.
Nos estn pidiendo: J

M = Juan o Mario ganen el concurso.


P(J

M) = P(J) + P (M) P(J

M)
P(J

M) = 0,3 + 0,4 0 = 0,7


Por lo tanto, la probabilidad de que Juan o Mario ganen es de 0,7 70%.

3.2 Probabilidad condicional.
Es la probabilidad que ocurra un evento, sabiendo que ha ocurrido antes otro. Es
decir si se tienen dos sucesos A y B, donde P(B) > 0 ,se denota la probabilidad de
A sabiendo que ocurri B como: P(A/B) y se calcula de la siguiente manera:

( )
( )
( ) B P
B A P
B / A P

=


Ejemplo 1: En un aula que tiene 40 alumnos, se ha detectado que 18 de ellos
tienen problemas de comprensin lectora, 24 presentan dificultades numricas y 8
ambas deficiencias. Se elige un alumno al azar:
a) Cul es la probabilidad de que el alumno tenga problemas de comprensin
lectora, si se sabe que presenta dificultades numricas?
b) Si se conoce que el alumno tiene problemas de comprensin lectora Cul es
la probabilidad de que presente dificultades numricas?
Solucin:
Definimos los eventos y calculamos sus probabilidades:
A = tiene problemas de comprensin lectora
( ) 45 , 0
40
18
A P = =

B = presenta dificultades numricas
( ) 60 , 0
40
24
B P = =

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

98
A

B = muestra ambas deficiencias


( ) 20 , 0
40
8
B A P = =


a) Se conoce que el alumno presenta dificultades numricas (evento que ya
ocurri), nos piden la probabilidad de que el alumno tenga problemas de
comprensin lectora, (suceso que depende o est condicionada por el evento
anterior), entonces tenemos que calcular P(A/B):
( )
( )
( )
33 , 0
60 , 0
20 , 0
B P
B A P
B / A P = = =


Interpretacin: Existe un 33,33% de probabilidades que un alumno que presenta
dificultades numricas tenga tambin problemas de comprensin.
b) De la misma manera se sabe de antemano que el alumno tiene problemas de
comprensin lectora (evento que ya sucedi), nos piden la probabilidad de que
el alumno presente dificultades numricas, (suceso que est condicionada por
el evento ya ocurrido), entonces tenemos que hallar P(B/A):
( )
( )
( )
44 , 0
45 , 0
20 , 0
A P
B A P
A / B P = = =


Interpretacin: Existe un 44,44% de probabilidades que un alumno que presenta
problemas de comprensin tenga tambin dificultades numricas.

Ejemplo 2: En una encuesta realizada entre 170 alumnos del Programa de
Licenciatura de Lenguas Extranjeras de la U.N.M.S.M. se obtuvo los siguientes
datos acerca del gnero y el sector donde laboran:
Sector
Gnero
Estatal Privado
Hombre 40 60
Mujer 20 50

Si se elige un alumno al azar:
a) Cul es la probabilidad de que el alumno trabaje en el sector estatal, si se
sabe que es hombre?
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

99
b) Sabiendo que el alumno labora en el sector privado, cul es la probabilidad
de que sea mujer?
c) Determina la probabilidad de que el alumno trabaje en el sector estatal, si se
trata de una mujer.
Solucin:
Llenamos la tabla y simbolizamos los eventos
Sector
Gnero
Estatal
(E)
Privado
(P)
Total
Hombre (H) 40 60 100
Mujer (M) 20 50 70
Total 60 110 170

a) Nos piden calcular la P(EH), por lo tanto, aplicamos la probabilidad
condicional:
P(EH) =
P(E H)
P(H)

Debemos ubicar estos valores en el cuadro:
Sector
Gnero
Estatal
(E)
Privado
(P)
Total
Hombre (H) 40 60 100
Mujer (M) 20 50 70
Total 60 110 170
Reemplazando los valores respectivos:
P(EH) =
P(E H)
P(H)
=
40
170
100
170
= 0,40
Interpretacin: La probabilidad de que un alumno trabaje en el sector estatal, si se
sabe que es hombre, es del 0.40 40%.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

100

b) En este caso se debe calcular la P(MP) es decir:
P(MP) =
P(M P)
P(P)

Ubicamos estos valores en el cuadro:
Sector
Gnero
Estatal
(E)
Privado
(P)
Total
Hombre (H) 40 60 100
Mujer (M) 20 50 70
Total 60 110 170

Luego: P(MP) =
P(M P)
P(P)
=
50
170
110
170
= 0,45
Interpretacin: la probabilidad de que sabiendo que un alumno labora en el sector
privado, sea mujer, es de 0.45 45%.

c) Ahora nos piden P(EM), entonces:
P(EM) =
P(E M)
P(M)

Observamos el cuadro:
Sector
Gnero
Estatal
(E)
Privado
(P)
Total
Hombre (H) 40 60 100
Mujer (M) 20 50 70
Total 60 110 170

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

101
Por lo tanto:
P(EM) =
P(E M)
P(M)
=
0
170
70
170
= 0,
Interpretacin: La probabilidad de que un alumno trabaje en el sector estatal si se
trata de una mujer, es 0.29 29%.
3.3 Probabilidad Conjunta.
De la definicin de probabilidad condicional y haciendo uso de propiedades de
conjuntos se obtiene la siguiente expresin llamada multiplicacin de sucesos.
( ) ( ) ( ) A / B P A P B A P =


Esta frmula nos proporciona la probabilidad de que dos eventos ocurran a la vez.
Esto es igual a multiplicar la probabilidad de que ocurra el primer evento, por la
probabilidad de que ocurra el segundo evento sabiendo que el primero ya sucedi.

Ejemplo 1: En una urna se tiene 6 bolas azules y 9 bolas blancas. Si se extraen al
azar y sucesivamente dos bolas sin devolucin o reemplazo, calcula la
probabilidad de que:
a) La primera bola sea azul y la segunda blanca.
b) La primera bola sea blanca y la segunda azul.
c) Ambas sean blancas.
Solucin:
Simbolizamos los sucesos:
A = extraer bola azul
B = extraer bola blanca
a) De acuerdo al enunciado nos piden calcular
( ) B A P
, es decir:
( ) ( ) ( ) A / B P A P B A P =

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

102
La primera bola debe ser azul
( )
15
6
A P =

Por lo tanto, nos quedan 14 bolas en total, ya que la primera (que fue azul) se
extrae sin devolverlo a la urna.
La segunda debe ser blanca, sabiendo que la primera fue azul.

( )
14
9
A / B P =

Sustituyendo los valores respectivos, tenemos:
( ) ( ) ( ) 26 , 0
14
9
15
6
A / B P A P B A P = = =

Interpretacin: La probabilidad de extraer primero una bola azul y luego una
blanca es de 0.26 26%.
b) Ahora nos piden hallar
( ) A B P
, en consecuencia:
( ) ( ) ( ) B / A P B P A B P =

De acuerdo a los criterios aplicados en el ejercicio anterior, podemos obtener:
( )
15
9
B P =

( )
14
6
A / B P =

Por lo tanto:
( ) ( ) ( ) 26 , 0
14
6
15
9
B / A P B P A B P = = =

Interpretacin: La probabilidad de extraer primero una bola azul y luego una
blanca es de 0.26 26%.
c) Si ambas son blancas, tenemos que determinar
( ) B B P
, por consiguiente:
( ) ( ) ( ) B / B P B P B B P =

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

103
La primera bola debe ser blanca
( )
15
9
B P =

Luego nos quedan en total 14 bolas y 8 bolas blancas
La segunda debe ser blanca, sabiendo que la primera fue tambin blanca

( )
14
8
B / B P =

Sustituyendo los valores respectivos, tenemos:
( ) ( ) ( ) 26 , 0
14
8
15
9
B / B P B P B B P = = =

Interpretacin: La probabilidad de extraer primero una bola blanca y luego otra
blanca es de 0.26 26%.

3.4 Sucesos independientes.
Se dice que los sucesos A y B son independientes, cuando la ocurrencia de uno
de ellos no afecta la probabilidad de que el otro ocurra. Luego, debe cumplirse
que:
( ) ( ) A P B / A P =

( ) ( ) B P A / B P =


Como consecuencia de esta propiedad, la probabilidad conjunta para sucesos
independientes ser:
( ) ( ) ( ) B P A P B A P =

Si los eventos A y B no cumplen los dos primeros criterios, se dicen que son
eventos dependientes, es decir la ocurrencia de uno de ellos cambia la
probabilidad de ocurrencia del otro
Ejemplo 1: Del ejemplo anterior, si se extraen al azar y sucesivamente dos bolas
con devolucin o remplazo, halla la probabilidad de que:
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

104

a) La primera bola sea azul y la segunda blanca.
b) La primera bola sea blanca y la segunda azul.
c) Ambas sean blancas.
Solucin:
a) De acuerdo al enunciado nos piden calcular
( ) B A P
:
( ) ( ) ( ) A / B P A P B A P =

Hacemos un anlisis previo: al sacar la primera bola (que debe ser azul), en la
urna quedara 14 bolas en total, la cual afectara la probabilidad del suceso
siguiente (que la bola sea blanca). Pero de acuerdo al enunciado la primera bola
se repone o se devuelve a la urna, por consiguiente este evento no afecta la
probabilidad del suceso siguiente. Entonces podemos concluir que A y B son
eventos independientes, luego:
( ) ( ) ( ) B P A P B A P =

24 , 0
15
9
15
6
= =

b) Ya que A y B son independientes, entonces:
( ) ( ) ( ) A P B P A B P =

24 , 0
15
6
15
9
= =

c) Debemos calcular
( ) B B P
, ambos eventos son independientes, puesto que
las bolas se restituyen o devuelven a la urna, por consiguiente:
( ) ( ) ( ) B P B P B B P =

( ) 36 , 0
15
9
15
9
B B P = =


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

105
Ejercicios resueltos.
1) Un estudiante responde al azar dos preguntas de verdadero (V) o falso (F).
a) Escriba el espacio muestral de este experimento aleatorio.
b) Describe los elementos de los siguientes sucesos y su probabilidad de
ocurrencia:
- A = Responde falso a una sola pregunta.
- B = Contesta verdadero al menos una pregunta.
Solucin:
a) Para este experimento aleatorio el espacio muestral ser:
O = {(V,V),(V,F),(F,V),(F,F)}
Un estudiante puede responder en total de 4 maneras.
b) El suceso A tendr los siguientes elementos:
A = {(V,F),(F,V)}
Existen 2 maneras de contestar
Entonces:
( ) 50 , 0
4
2
A P = =

- El suceso B estar conformado por:
B = {(V,V),(V,F),(F,V)}
Se presentan 3 formas de contestar
Entonces:
( ) 75 , 0
4
3
B P = =

2) En un colegio privado, para el viaje de promocin, se han propuesto dos
lugares: Cuzco y Paracas. Se elige a tres alumnos al azar para conocer su
preferencia:
a) Determina el espacio muestral.
b) Describe los elementos de los siguientes eventos y su probabilidad de
ocurrencia:
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

106
- A: Todos prefieren viajar a Cuzco.
- D: Solamente uno elige Paracas.
- F: Por lo menos dos escogen Cuzco.
c) Realiza las siguientes operaciones y sus respectivas probabilidades:
- (AD).
- (DF)
Solucin:
Para este experimento aleatorio simbolizamos las posibles respuestas de un
alumno:
Viajar a Cuzco: C
Viajar a Paracas: P

a) El espacio muestral ser:
O = {(C,C,C),(C,C,P),(C,P,C),(C,P,P),(P,C,C),(P,C,P),(P,P,C),(P,P,P)}
Los tres alumnos pueden elegir de 8 formas.

b) Encontramos los elementos de cada uno de los tres eventos
A = {(C,C,C)}
Entonces: P(A) =
1

= 0,15 = 12,5%
D = {(CC,P),(C,P,C),(P,C,C)}
Entonces: P(D) =
3

= 0,375= 37,5%
F = {(CC,C),(C,C,P),(C,P,C),(P,C,C)}
Entonces: P(F) =
4

= 0,50 = 50

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

107
c) Realizamos las operaciones respectivas
(AD) = {(C,C,C),(C,C,P),(C,P,C),(P,C,C)}
Entonces: P(AD) =
4

= 0,50 = 50%
(DF) = {(C,C,P),(C,P,C),(P,C,C)}
Entonces: P(DF) =
3

= 0,375 = 37,5%
3) En un grupo del Programa de Lenguas Extranjeras de la UNMSM hay 10
alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un da
asisten 45 alumnos, encontrar la probabilidad de que un alumno:
a) Sea hombre.
b) Sea mujer morena.
c) Sea hombre o mujer.

Solucin:
a) Sea hombre.
()



b) Sea mujer morena.
()

= 0,8 = 80 %

c) Sea hombre o mujer.
() = 100 %

4) Un estudio realizado en una institucin educativa sobre problemas visuales,
detect que el 14% de los alumnos tena miopa, el 18% presentaba
astigmatismo y el 5% ambos problemas. Si se escoge un alumno al azar,
calcula la probabilidad de que:
a) Tenga miopa o astigmatismo o ambos problemas.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

108
b) No sufra de astigmatismo.
c) Padezca solamente miopa.
d) No tenga estas enfermedades.
e) Presente miopa, sabiendo que sufre. astigmatismo
Solucin:
Definimos los eventos:
A: Alumno con miopa.
B: Alumno con astigmatismo.
Las probabilidades dados en el problema son:
P(A) = 0,14
P(B) = 0,1
P(AB) = 0,05
a) Nos estn pidiendo P(AB), aplicamos la siguiente propiedad:
P(AB) = P(A) P(B) P(AB)
Sustituyendo los valores:
P(AB) = 0,14 0,1 0,05 = 0,7
Por lo tanto la probabilidad de tener miopa o astigmatismo o ambos problemas es
del 27%.
b) Nos piden P(B), empleamos la propiedad del evento complementario:
P(B) = 1 P(B)
Remplazando valores:
P(B) = 1 0,1 = 0,
En consecuencia la probabilidad de no tener astigmatismo es del 82%
c) Debemos calcular la P(A - B), usamos la propiedad del evento diferencia:
P(A B) = P(A) P(AB)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

109
Sustituyendo los valores:
P(A B) = 0,14 0,05 = 0,0
Luego la probabilidad de padecer nicamente miopa es del 9%
d) De manera similar al ejercicio b, pero para la unin de eventos, realizamos lo
siguiente:
P(AB) = 1 P(AB)
Sustituyendo los valores: P(AB) = 1 - 0,7 = 0,73
Entonces la probabilidad de no sufrir estos problemas es del 73%
e) Ahora nos piden la P(AB), utilizando probabilidad condicional:
( )
( )
( )
28 , 0
18 , 0
05 , 0
/ = = =
B P
B A P
B A P


Luego, la probabilidad de padecer miopa sabiendo que se tiene astigmatismo es
del 28%.
5) En una encuesta realizada entre alumnos del Programa de Licenciatura de
Lenguas Extranjeras de la U.N.M.S.M. se obtuvo los siguientes datos acerca
del motivo de su eleccin de la Universidad para estudiar dicha profesin:
Prestigio Costo Otros
Hombres 420 395 75
Mujeres 400 530 50

Si se elige un alumno al azar:
a) Cul es la probabilidad de que sea mujer?
b) Determina la probabilidad de que el motivo de su eleccin haya sido por el
prestigio.
c) Cul es la probabilidad de que sea hombre y el motivo el costo?
d) Si el alumno es mujer, cul es la probabilidad de que el prestigio de la
Universidad sea el motivo de su eleccin?
e) Cul es la probabilidad de que el alumno sea hombre, si se sabe que el
motivo de su eleccin fue el costo?
f) Calcula la probabilidad de que sea mujer o que otros fueron los motivos de su
eleccin.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

110
Solucin:
Colocamos los totales en la tabla:





a) Tenemos que hallar la P(mujer):
P(mujer) =
0
170
= 0,541 = 5,41
b) Nos piden calcular la P(prestigio):
P(prestigio) =
0
170
= 0,435 = 43,5
c) Se pide la P(hombre costo):
P(hombre costo) =
35
170
= 0,11 = 1,1
d) Debemos calcular la P(prestigiomujer), aplicamos la probabilidad condicional:
P(prestigiomujer) =
P(prestigio mujer)
P(mujer)
=
400
170
0
170
= 0,40 = 40,
e) Igual que el ejercicio anterior se debe encontrar la P(hombrecosto):
P(hombrecosto) =
P(hombre costo)
P(costo)
=
35
170
5
170
= 0,470 = 4,70
f) Ahora nos piden la P(mujer otros), utilizamos la propiedad de unin de
eventos:
P(mujer otros) = P(mujer) P(otros) P(mujer otros)
=
0
170

15
170

50
170
=
1055
170
= 0,564 = 56,4
Prestigio Costo Otros Total
Hombres 420 395 75 890
Mujeres 400 530 50 980
Total 820 925 125 1870
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

111
Ejercicios propuestos.
1) En un grupo de 30 estudiantes del Programa de Lenguas Extranjeras de la
UNMSM estudian al menos de una de las siguientes materias: Lgica o
Estadstica: 20 asisten a Lgica, 21 a Estadstica. Encontrar la probabilidad de
que un estudiante escogido al azar estudie ambos cursos.

2) Se quiere seleccionar por sorteo a un comit conformado por 4 miembros para
elaborar las actividades extraescolares en la institucin educativa San Mateo
Apstol entre los 10 profesores y los 5 alumnos. Halla la probabilidad de que
dicho comit incluya:
a) Dos profesores y dos alumnos
b) Un alumno.

3) Un estudiante de la Facultad de Educacin hace dos pruebas en un mismo da.
La probabilidad de que supere la primera es de un 60%, la de que supere la
segunda, de un 80% y la de que supere las dos, de un 50%. Calcula:
a) La probabilidad de que supere, al menos, una de las pruebas.
b) La probabilidad de que no supere ninguna prueba.

4) En una reunin hay 50 ex alumnos, de los cuales 20 hablan francs y 40
ingls.
a) Cul es la probabilidad de que eligiendo a un conferenciante al azar slo
hable ingls?
b) Y la de que hable francs?
c) Y la de que hable ingls y alemn?
d) Cul es la probabilidad de que dos miembros elegidos al azar no puedan
entenderse?

5) Un grupo de alumnos del PROLEX est formada por 10 hombres y 10 mujeres,
la mitad de las mujeres y la mitad de los hombres han elegido francs como
asignatura optativa.
a) Cul es la probabilidad de que una persona elegida al azar sea hombre o
estudie francs?
b) Y la probabilidad de que sea mujer y no estudie francs?


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

112
Autoevaluacin de la unidad 3.
1) La probabilidad de un evento seguro toma valor igual a:
a) 1,00
b) 0,344
c) 0,00
d) 0,75
e) 0,10

2) La probabilidad de un evento puede tomar valor igual a:
a) 2,478
b) 0,344
c) 5,44
d) 10,25
e) 1,01

3) Un estudio realizado a docentes de la especialidad de ingls del nivel
secundario de la UGEL 05 reporta que el 20 % prefiere radio Oxigeno y un
30 % prefiere radio Miraflores y un 40% escucha Oxigeno o Miraflores. Si se
elige al azar un docente de la poblacin, cul es la probabilidad de escuche
ambas radios.

a) 12%
b) 10%
c) 16%
d) 18 %
e) 40%

4) A un congreso internacional de Educacin asisten 40 mujeres, de las que 10
hablan francs, y 30 hombres de los que 4 hablan francs. Se elige un
congresista al azar, calcula la probabilidad de que sea mujer o hable francs.

a) 0,68
b) 0,40
c) 0,63
d) 0,60
e) 0,50

5) Las probabilidades de que un hombre y una mujer de 40 aos vivan hasta los
75 son 0,49 y 0,53, respectivamente. Halla la probabilidad de que ninguno
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

113
llegue a los 75 aos.
a) 0,30
b) 0,20
c) 0,26
d) 0,24
e) 0,10

6) En una institucin educativa, 22 de cada 100 chicas y 5 de cada 10 chicos
llevan lentes. Si el nmero de chicas es tres veces superior al de los chicos,
hallar la probabilidad de que un estudiante elegido al azar sea chica, sabiendo
que lleva lentes.
a) 0,57%
b) 0,50%
c) 0,60%
d) 0,54%
e) 0,55%

7) El departamento de seleccin de personal de la Facultad de Educacin
entrevista a 65 docentes para el dictado del curso de Estadstica Aplicada a la
Educacin en el Programa de Lenguas Extranjeras, de los cuales 35 de ellos
poseen experiencia laboral previa y 40 disponen de un ttulo universitario.
Cul es la probabilidad de que se elija a un docente que tenga experiencia
laboral y un ttulo universitario?
a) 15,38%
b) 18,53%
c) 16,23%
d) 23,18%
e) 14,92%
8) Las estadsticas deportivas en vley entre los equipos de la UNMSM y la UNI
son las siguientes: el 25% de las veces ha ganado el equipo de la UNMSM; el
45% de las veces ha ganado la UNI, y el 30% han empatado. En el prximo
torneo van a enfrentarse en tres ocasiones. Cul es la probabilidad de que el
equipo de la UNMSM gane los tres partidos?
a) 2,56%
b) 3,56%
c) 4,24%
d) 1,56%
e) 2,32%
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

114

9) En un aula con 24 estudiantes de 1 de secundaria, los profesores de
Matemticas, Comunicacin e Ingls piden cada da al azar los cuadernos a
algunos alumnos para revisarlos. El de Matemtica a 4 alumnos, el de Lengua
a 6, y el de Ingls a 8. Halla la probabilidad de que a un alumno concreto, en
un da, le pidan 2 cuadernos.
a) 16.08%
b) 13,82%
c) 15.21%
d) 17.46%
e) 18.06%
10) Completa la siguiente tabla de contingencia que muestra la distribucin de
tres secciones del 4 ao de una Institucin Educativa.
Alumnos Alumnas
A 30
B 60 100
C 78
100 232

Cul es la probabilidad de que, sabiendo que es alumna, corresponda a la
seccin C?
a) 32,32%
b) 36.36%
c) 35.64%
d) 34.21%
e) 33.42%




Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

115
Lectura N 3


PRIMERAS DEFINICIONES Y TEOREMAS BSICOS.

Laplace, Pierre-Simon, Ensayo filosfico sobre las probabilidades
Traduccin de Pilar Castillo, Alianza editorial, 1985

El primero en dar la definicin clsica de probabilidad fue Jacob Bernoulli (16541705), matemtico
suizo que trabaj en la universidad de Basilea en 167, en su obra Ars conjectandi (El arte de la
conjetura) que fue publicada algunos aos despus de la muerte del autor. En esta obra
encontramos entre otras cosas la importante proposicin conocida como el Teorema de Bernoulli
mediante el cual la teora de la probabilidad fue elevada por primera vez del nivel elemental de
conjunto de soluciones de problemas particulares a un resultado de importancia general. Bernoulli
siempre detac la importancia de que los fenmenos aleatorios dejaran de enfocarse como casos
particulares y se intentara ver los conceptos generales que habas detrs de ellos, slo as se
avanzara y profundizara en el entendimiento de esta materia.
Ms adelante, el matemtico francs exiliado en Inglaterra Abraham De Moivre (16671754)
acept la definicin dada por Bernoulli y la reformul en trminos ms modernos para la poca:
una fraccin en la que el numerador es igual al nmero de apariciones del suceso y el
denominador es igual al nmero total de casos en los que es suceso pueda o no pueda ocurrir. Tal
fraccin expresa la probabilidad de que ocurra el suceso.
La definicin clsica de la probabilidad, en su forma actual, est basada en el concepto de
equiprobabilidad de los resultados, basado a su vez en la simetra. Se supone que un experimento
se puede descomponer en n sucesos equiprobables y mutuamente excluyentes B
1
,.,B
n

llamados sucesos bsicos o elementales. As, la probabilidad de suceso A es el nmero del
intervalo [0,1] que expresa el cociente entre los m sucesos elementales que componen A y el
nmero total n de posibles sucesos elementales. La traba fundamental que encuentra esta
interpretacin de la probabilidad es la dificultad de descomponer un suceso en sucesos
elementales equiprobables lo que es fcil para problemas sencillos ( cartas, dados, etc), pero
es de gran dificultad en problemas ms complicados.
Adems otro de los descubrimientos importantes de Bernoulli fue el saber obtener la probabilidad
de ocurrencia de un suceso sin necesidad de contar los casos favorables (bien por omisin de
datos o bien por la imposibilidad de contarlos). Para ello invent la probabilidad a posteriori, es
decir: mediante la observacin mltiple de los resultados de pruebas similares De esta manera,
introdujo el concepto de probabilidad estadstica: asignar como probabilidad de un suceso el
resultado que se obtendra si el proceso se repitiera en condiciones similares un nmero grande de
veces. Sin embargo, estas condiciones no eran muy concretas y con ellas no se poda dar lugar a
una definicin seria y rigurosa de todos los conceptos q manejaba Bernoulli. En primer lugar, se
habla de un nmero grande de veces, pero no se da ninguna indicacin sobre cul es ese nmero
o lo suficientemente grande que debe ser, no se especifica tampoco que significa condiciones
similares y tampoco se establece cul es el error admitido respecto al resultado terico.
Precisamente, fueron la necesidad de precisar con exactitud qu se entiende por un nmero
grande de repeticiones y de calcular el error del resultado obtenido respecto del resultado terico,
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

116
lo que llevaron a Jacob Bernoulli a idear, en su forma ms intuitiva y bsica, la Ley de los Grandes
Nmeros.
A continuacin expondremos los tres teoremas ms importantes de la probabilidad clsica. Estos
teoremas los idearon Bernoulli (Teorema de la suma, formalizado por Bayes) , De Moivre (Teorema
de la multiplicacin) y Bayes (Teorema de la probabilidad condicionada), aunque todos los
conceptos que se manejan en estos teoremas aparecen ya de forma implcita y muy frecuente en
los diferentes trabajos de Pascal, Fermat y Huygens.
Teorema de la Suma
Pascal dio a entender implcitamente que saba cmo calcular los casos favorables de un suceso A
si conoca los casos favorables de unos A
j
disjuntos cuya unin es A (es decir, si los A
j
son una
particin de A). Jacob Bernoulli tambin fue consciente de ello, y fue ms lejos al darse cuenta de
que la probabilidad de la unin no es la suma de las probabilidades si los sucesos no son disjuntos,
aunque no supo dar la razn. No fue ninguno de ellos quien formul finalmente el teorema de la
suma de las probabilidades, sino el reverendo ingls Thomas Bayes (17021761), cuyo trabajo fue
ledo pstumamente, en 1763. En esta obra, Bayes da la primera definicin rigurosa y explcita de
sucesos disjuntos y enunci la frmula ahora conocida:

() () ( )

Teorema de la Multiplicacin
Al igual que el teorema anterior, el teorema de la multiplicacin de probabilidades era conocido por
casi todos los matemticos anteriores a travs de resultados particulares. No obstante, fue
Abraham De Moivre el primero que lo enunci rigurosamente. De Moivre fue un hugonote francs
que debido a su religin se ausent de Francia y vivi como refugiado en Inglaterra. All public su
obra The doctrine of chances (Doctrina de las Probabilidades) en 1711. De Moivre present el
importante concepto de independencia de sucesos aleatorios as, escribi: Diremos que dos
sucesos son independientes, si el primero de ellos no tiene ninguna relacin con el otro y procedi
a definir los sucesos dependientes: Dos sucesos son dependientes si estn ligados el uno al otro y
la probabilidad de ocurrencia de uno de ellos influye en la probabilidad de ocurrencia del otro. Una
vez hecho esto, De Moivre lo aplic al clculo de probabilidades: la probabili dad de ocurrencia de
dos sucesos dependientes es igual a la probabilidad de ocurrencia de uno de ellos dividida por la
probabilidad de que el otro ocurra si el primero ya ha ocurrido. Esta regla puede generalizarse para
varios sucesos . El caso de varios sucesos lo describa as: Se necesita elegir uno de ellos como
el primero, otro como el segundo, y as. Luego, la ocurrencia del primero debe considerarse
independiente de todas las dems; el segundo debe considerarse con la condicin de que el
primero ha ocurrido: el tercero con la condicin de que tanto el primero como el segundo han
ocurrido, y as. De aqu, la probabilidad de las ocurrencias de todos los sucesos es igual al
producto de todas las probabilidades Esto es:

(

) (

)(

) (

)


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

117
La obra de De Moivre cont con tres ediciones, lo que da una idea del gran inters que despert
esta materia en aquella poca. En las dos ltimas ediciones de l a obra el autor tambin da las
primeras indicaciones acerca de la distribucin normal de las probabilidades, que ms tarde
desarrollara un papel sumamente importante en el desarrollo la teora de la probabilidad.
Teorema de Bayes:
El trabajo de De Moivre fue seguido y difundido en la mayora de los crculos cientficos
importantes de Europa y fue el britnico Thomas Bayes, probablemente alumno de De Moivre en
Londres, quien extendi el trabajo del francs y expres la probabilidad condicional en funci n de
la probabilidad de la interseccin:
()
()()
()


Adems, el teorema que lleva su nombre no es slo suyo, ya que Bayes no estaba en condiciones
de formular con probabilidades totales. Fue PierreSimon Laplace (17491827) quien mejor y
desarroll la mayor parte del teorema de Bayes en su Thorie analytique des probabilits
(Experiencia en la Filosofa de la Teora de la Probabilidad) en 1812.
Sea A un suceso que ocurre en conjuncin con uno y slo uno de los n sucesos disjuntos B
1
B
n
.
Si se sabe que el suceso A ha ocurrido, cul es la probabilidad de que el suceso B
J
tambin?
Laplace respondi de la siguiente manera: La probabilidad de existencia de una de esas causas
es igual a una fraccin con un numerador igual a la probabilidad del suceso que se sigue de esta
causa y un denominador que es la suma de las probabilidades relativas a todas las posibles
causas. Si estas diferentes causas a priori no son equiprobables, entonces en lugar de tomar la
probabilidad del suceso que sigue a cada causa, se toma el producto de esta probabilidad por
tantas veces la probabilidad de la causa. Esta frmula se escribe en notacin ms actual de la
siguiente manera:

(

)
(

)(|

)
(|

=
(

)


Aparte de esta revisin importantsima del teorema de Bayes, Laplace incluye en su obra una
exposicin sistemtica muy completa de la teora matemtica de los juegos de azar con
aplicaciones a una gran variedad de cuestiones cientficas y prcticas. En su libro citado
anteriormente dedica una extensa introduccin escrita para los lectores no matemticos a explicar
sus puntos de vista generales sobre todas las cuestiones y apreciaciones de los resultados
alcanzados con la ayuda de la teora de la probabilidad.
El estudio de esta introduccin es muy famoso y se recomienda a todos los interesados en la
historia de la ciencia.


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

118













Introduccin.
En muchas situaciones de la actividad cotidiana se presentan circunstancias en
las que parecen estar relacionadas dos o ms variables. Por ejemplo:
- El gasto de una familia y el ingreso familiar.
- Las horas de prctica del curso de Estadstica y el nmero de estudiantes
que lo reprueban.
Capacidades a desarrollar.
- Determinar la relacin de dependencia entre dos
variables.
- Calcular e interpretar los coeficiente de correlacin .
Unidad 4: Regresin y Correlacin

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

119
- El tiempo efectivo de servicio de los trabajadores y la edad.
- La produccin y ventas de una fbrica.
Existe una tcnica para establecer matemticamente la relacin que puede existir
entre variables como las sealadas anteriormente. Esta tcnica es el anlisis de
regresin.
4.1 Conceptos bsicos.

4.1.1 Regresin
La regresin es un mtodo de clculo para establecer una relacin matemtica
entre dos o ms variables. Este mtodo aplicado a la Estadstica permite predecir
matemticamente el comportamiento de una variable a partir del comportamiento
conocido de otra u otras variables. Esta relacin entre las variables se establece a
travs de una ecuacin que se llama Ecuacin de Regresin
Al establecer la relacin entre dos variables encontramos una variable
independiente, la cual en el plano cartesiano se sita en el eje x y la otra
dependiente, la cual se sita en el eje y
Ejemplo:
El gasto de una familia y el ingreso
familiar.

- El ingreso familiar: independiente
- El gasto de una familia: dependiente.
Esta relacin podemos representarla mediante un grfico de dispersin, el cual es
la representacin grfica en el plano cartesiano, de los valores que toma la
variable independiente (x) y la variable dependiente (y).
Veamos:
Al analizar la edad y el tiempo de servicio de los trabajadores se consider lo
siguiente:
Edad x 48 40 30 42 27 34 40 32
Tiempo de servicio y 24 18 9 22 4 10 16 8

La representacin grfica de los valores de esta tabla en el plano cartesiano,
recibe el nombre de Grfico de Dispersin, as tenemos
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

120

4.1.2 Tipos de relacin entre las variables
Como ya sabemos, la relacin entre dos o ms variables recibe el nombre de
regresin, cuya clasificacin la podemos apreciar en el siguiente esquema:
Esquema: Tipos de Regresin

Fuente: Adaptado de Rincn, G. (2011)

0
5
10
15
20
25
30
0 10 20 30 40 50 60
T
i
e
m


d
e

s
e
r
v
i
c
i
o
s

(
a

o
s
)

Edad (aos)
Diagrama de Dispersin de la Edad y el
Tiempo de Servicio
Tipos de relacin
entre variables
1. Cantidad de
variables
a. Regresin
Univariada
b. Regresin
Multivariada
2. Representacin
grfica de la
ecuacin
a. Regresin Lineal
Directa
Inversa
b. Regresin
Curvilnea
Directa
Inversa
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

121
Es as como los tipos de relacin entre variables van de acuerdo:
1. A la cantidad de variables que se relacionan y pueden ser: Regresin
Univariada o Multivariada.
a) Regresin Univariada, solo interviene una variable independiente.
b) Regresin Multivariada, interviene ms de una variable independiente.

2. A la representacin grfica de la ecuacin de regresin y pueden ser:
Regresin Lineal o Curvilnea.
a) Regresin Lineal, cuando la representacin grfica de la ecuacin de
regresin es una lnea recta. Al mismo tiempo, sta Regresin Lineal puede
ser: directa e inversa.

- Regresin Lineal Directa
Sucede cuando al aumentar el valor de la variable independiente aumenta en
forma proporcional, el valor de la variable dependiente. Por lo tanto, una recta
parece describir de manera apropiada la relacin entre estas variables.
Grficamente, podemos apreciar lo siguiente:


- Regresin Lineal Inversa.

Sucede cuando al aumentar el valor de la variable independiente disminuye el
valor de la variable dependiente en una proporcin similar. A continuacin,
veamos su representacin grfica:
0
1
2
3
4
5
6
7
8
9
10
0 5 10 15 20 25 30
V
a
r
i
a
b
l
e

y

Variable x
x y
8 5
13 4
6 3
24 9
18 7
20 5
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

122


b) Regresin Curvilnea, cuando la representacin grfica de la ecuacin de
regresin es una lnea curva. sta regresin tambin puede ser directa e
inversa.

- Regresin Curvilnea Directa.
Es cuando al aumentar de valor la variable independiente, la variable
dependiente aumenta ms que proporcionalmente.
La representacin grfica de una Regresin Curvilnea Directa viene a ser de
la siguiente manera:

0
5
10
15
20
25
30
0 5 10 15 20 25 30
V
a
r
i
a
b
l
e

y

Variable x
0
5
10
15
20
25
0 5 10 15 20
V
a
r
i
a
b
l
e

y

Variable x
x y
19 9
3 24
16 11
24 6
8 24
x y
16 12
18 21
8 6
12 7
17 17
10 8
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

123
- Regresin Curvilnea Inversa.
Es cuando al aumentar de valor la variable independiente, la variable
dependiente disminuye ms que proporcionalmente.
La representacin grfica de una Regresin Curvilnea Indirecta viene a ser
de la siguiente manera:


4.2 La Regresin Lineal.
Cuando los puntos del grfico de dispersin se pueden relacionar mediante una
lnea recta que pase muy cercana de todos los puntos.
Esta recta tiene por ecuacin:



Donde:
y = variable dependiente
x = variable independiente.
0
2
4
6
8
10
12
14
16
18
20
0 5 10 15 20 25
V
a
r
i
a
b
l
e

y

Variable x
x y
14 2
5 9
10 7
2 18
20 2
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

124
4.2.1 La recta de regresin.
Si deseamos ajustar la nube de puntos haremos uso de la recta de regresin.
La recta de regresin pasa por el punto (

) llamado centro de gravedad.


a) Recta de regresin de y sobre x
La recta de regresin de y sobre x se utiliza para estimar los valores de la variable
y a partir de los valores de la variable x.
La pendiente de la recta se calcula a partir del cociente entre la covarianza y la
varianza de la variable x.

( )

b) Recta de regresin de x sobre y
La recta de regresin de x sobre y se utiliza para estimar los valores de la
variable x a partir de los valores de la variable y.
La pendiente de la recta se calcula a partir del cociente entre la covarianza y la
varianza de la variable y.

( )

Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre
s, y sus ecuaciones son:
y = x =

Antes de resolver algunos ejemplos sobre regresin lineal y correlacin, es bueno
tener presente las frmulas que nos van ayudar a encontrar tanto las rectas de
regresin como el coeficiente de correlacin tambin llamado correlacin de
Pearson.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

125
Media aritmtica


Varianzas


Desviaciones tpicas o estndares


Covarianza


Recta de regresin y sobre x Recta de regresin x sobre y

( )

( )

Veamos a continuacin el siguiente ejemplo:
Las participaciones de doce alumnos de la I.E Sto. Toms de Aquino en la
clase de Matemtica y Fsica son las siguientes:

Matemtica 2 3 4 4 5 6 6 7 7 8 10 10
Fsica 1 3 2 4 4 4 6 4 6 7 9 10

Solucin:
Hallando las rectas de regresin
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

126
x
i
y
i
x
i
y
i
x
i
2
y
i
2

2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
=72 =60 =431 =504 =380

1 Hallamos las medias aritmticas.

= 5
2 Calculamos la covarianza.


()
3 Calculamos las varianzas.


4 Recta de regresin de y sobre x.
y 5 =

(x 6)
y = 0,986x 0,916
5 Recta de regresin de x sobre y.
x 6 =

(y 5)
x = 0,888y + 1,56
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

127
4.3 Correlacin lineal.
La correlacin es la forma numrica en que evala la relacin de dos o ms
variables; por lo tanto, mide la dependencia de una variable con respecto de otra
variable independiente. El coeficiente de correlacin lineal resulta de dividir la
covarianza entre el producto de las desviaciones tpicas de ambas variables.
El coeficiente de correlacin lineal se expresa mediante la letra r y se calcula
mediante la siguiente ecuacin


4.3.1 Propiedades del coeficiente de correlacin
- El coeficiente de correlacin no vara al hacerlo la escala de medicin, es decir,
si expresamos la altura en metros o en centmetros el coeficiente de
correlacin no vara.
- El signo del coeficiente de correlacin es el mismo que el de la covarianza.
- Si la covarianza es positiva, la correlacin es directa, si la covarianza es
negativa, la correlacin es inversa y si la covarianza es nula, no existe
correlacin.
- El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y
1.
1 r 1
- Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
- Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
- Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin
es dbil.
- Si r = 1 1, los puntos de la nube estn sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.
Veamos el siguiente ejemplo:
Las participaciones de doce alumnos de una clase en Matemticas y Fsica son
las siguientes:
Matemtica 2 3 4 4 5 6 6 7 7 8 10 10
Fsica 1 3 2 4 4 4 6 4 6 7 9 10
Hallar el coeficiente de correlacin de la distribucin e interpretarlo.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

128
Solucin:
x
i
y
i
x
i
. y
i
x
i
2
y
i
2

2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
=72 =60 =431 =504 =380

1 Hallamos las medias aritmticas

= 5
2 Calculamos la covarianza.

6(5) = 5,917
3 Calculamos las desviaciones tpicas.

= 2,449

= 2,582
4 Aplicamos la frmula del coeficiente de correlacin lineal.

()()

Interpretacin: Al ser el coeficiente de correlacin positivo, la correlacin es
directa y como est muy prximo a 1, la correlacin es muy fuerte.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

129
Ejercicios resueltos.
1) En la I.E. Juana Alarco se realiza una investigacin con cinco nios de los
niveles de inicial y primaria de 2, 3, 5, 7 y 8 aos de edad y que pesan,
respectivamente, 14, 20, 32, 42 y 44 kilos.
a) Hallar la ecuacin de la recta de regresin de la edad sobre el peso y
viceversa.
b) Cul sera el peso aproximado de un nio de seis aos?
Solucin:
Elaboramos la siguiente tabla:
Edad
x
i

Peso
y
i

x
i
2
y
i
2
x
i
. y
i

2 14 4 196 28
3 20 9 400 60
5 32 25 1 024 160
7 42 49 1 764 294
8 44 64 1 936 352
=25 =152 =151 =5 320 =894

Luego:
a) Hallamos las medias:

= 30,4
Hallamos las varianzas:


Hallamos la Covarianza:


()
La recta de regresin edad sobre peso:
x 5 = 0,192 (y 30)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

130
x = 0,192y 0,76
La recta de regresin peso sobre edad:
y 30,4 = 5,154(x 5)
y = 5,15x + 4,65
b) y = 5,15 (6) + 4,65
y = 35,57Kg.

2. Las notas obtenidas por cinco alumnos de la I.E. Miguel Grau en Francs e
Ingls son:
Francs 06 04 08 05 03.5
Ingls 06.5 04.5 07 05 04

Determinar las rectas de regresin y calcular la nota esperada en ingls para un
alumno que tiene 7.5 en francs.

Solucin:
Francs
x
i

Ingls
y
i

x
i
2
y
i
2
x
i
. y
i

6 6,5 36 42,25 39
4 4,5 16 20,25 18
8 7 64 49 56
5 5 25 25 25
3,5 4 12,25 16 14
=26,50 =27 =153,25 =152,50 =152

Determinando las rectas de regresin.
a) Hallamos las medias:

= 5,40
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

131

Hallamos las varianzas:


Hallamos la Covarianza:


()
Hallamos la recta de regresin de y sobre x
y 5,4 =

(x 5,3)
y = 0,695x 1,715
Hallamos la recta de regresin de x sobre y
x 5,3 =

(y 5,4)
x = 1,328y 1,873
Calculando la nota esperada.
y = 0,695(7,5) + 1,715
y = 6,928

3) En la tabla siguiente se indica la edad (en aos) y la conducta agresiva
(medida en una escala de cero a 10) de 10 nios.
Edad 6 6,4 6,7 7 7,4 7,9 8 8,2 8,5 8,9
Conducta agresiva 9 6 7 8 7 4 2 3 3 1

Calcular
a) Obtener la recta de regresin de la conducta agresiva en funcin de la edad.
b) A partir de dicha recta, obtener el valor de la conducta agresiva que
correspondera a un nio de 7,2 aos.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

132
Solucin:
Edad
x
i

Conducta
agresiva
y
i

x
i
2
y
i
2
x
i
. y
i

6 9 36 81 54
6,4 6 40,96 36 38,4
6,.7 7 44,89 49 46,9
7 8 49 64 56
7,4 7 54,76 49 51,8
7,9 4 62,41 16 31,6
8 2 64 4 16
8,2 3 67.24 9 24,6
8,5 2 72,25 4 17
8,9 1 79,21 1 8,9
=75 =49 =570,72 =313 =345,2

a) Hallamos las medias:

= 4,9
Hallamos las varianzas:


Hallamos la Covarianza:


()
Hallamos la recta de regresin de y sobre x:
y 4,9 = -2,713 (x 7,5)
y = -2,713x + 25,248.
b) y = -2,713 (7,2) + 25,248
y = 5,714
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

133
4) El nmero de horas dedicadas al estudio de una asignatura y la calificacin
obtenida en el examen correspondiente, de ocho personas es:

Horas (X) 20 16 34 23 27 32 18 22
Calificacin (Y) 6,5 6 8,5 7 9 9,5 7,5 8

Calcular:
a) La recta de regresin de y sobre x.
b) Calificacin estimada para una persona que hubiese estudiado 28 horas.

Solucin:
Horas
x
i

Calificacin
x
i

x
i
2
y
i
2
x
i
. y
i

16 6 256 36 96
18 7,5 324 56,25 135
20 6,5 400 42,25 130
22 8 484 64 176
23 7 529 49 161
27 9 729 81 243
32 9,5 1 024 90,25 304
34 8,5 1156 72,25 289
=192 =62 =4 902 =491 =1 534

a) Hallamos las medias:

= 7,75
Hallamos la varianza:

()
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

134
Hallamos la recta de regresin de y sobre x:
y 7,75 =

( )
y = 0,156x + 4,006
b) y = 0,156(28) + 4,006
y = 8,4

5) Las estaturas y pesos de diez jugadores del equipo de basquetbol de la
UNMSM son las siguientes:
Estatura (x)
186 189 190 192 193 193 198 201 203 205
Peso (y)
85 85 86 90 87 91 93 103 100 101

Calcular:
a) La recta de regresin de y sobre x.
b) El coeficiente de correlacin.
c) El peso estimado de un jugador que mide 208 cm.
Solucin:
x
i
y
i
x
i
2
y
i
2
x
i
y
i

186 85 34 596 7 225 15 810
189 85 35 721 7 225 16 065
190 86 36 100 7 396 16 340
192 90 36 864 8 100 17 280
193 87 37 249 7 569 16 791
193 91 37 249 8 281 17563
198 93 39 204 8 649 18 414
201 103 40 401 10 609 20 703
203 100 41 209 10 000 20 300
205 101 42 025 10 201 20 705
1 950 921 380 618 85 255 179 971
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

135
a) Hallamos las medias:

= 92,10
Hallamos las varianzas:


Hallamos las desviaciones tpicas o estndar:

= 6,07

= 6,56
Hallamos la recta de regresin de y sobre x.
y 92,10 = 1,02 (x 195)
y= 1,02x 106,80
b) r =

() ()

Correlacin positiva muy fuerte.
c) y = 1,02(208) 106,80
y = 105,36 Kg.










Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

136
Ejercicios propuestos.
1) Un investigador cree que la inteligencia de los nios, medida a travs del
coeficiente intelectual (CI en puntos), depende del nmero de hermanos. Toma
una muestra aleatoria de 15 nios y ajusta una regresin lineal simple. Los
resultados aparecen en la salida adjunta.

CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90
Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6

Calcular:
a) La recta de regresin de y sobre x.
b) El coeficiente de correlacin.

2) Hay inters en conocer qu tipo de relacin existe entre el nmero de horas
diarias dedicadas al estudio por 10 alumnos universitarios y la nota que
obtienen al final del curso. La informacin obtenida fue la siguiente:

N horas de estudio 3 4 3 5 6 7 5 8 8 10
Nota final 12 13 13 16 17 17 16 17 18 18

Calcular:
a) La recta de regresin de y sobre x.
b) El coeficiente de correlacin.

3) La informacin siguiente corresponde a puntajes obtenidos por 8 estudiantes
en su examen final del curso de Estadstica y su nota promedio del campus
virtual.
a) Determinar la ecuacin de regresin lineal de y sobre x.
b) Calcular el coeficiente de correlacin lineal.
Examen Final 10 16 15 14 12 11 17 14
Promedio de Campus Virtual 11 15 14 12 12 12 16 15
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

137

4) Se ha realizado una encuesta a un grupo de docentes, preguntndoles por el
nmero de personas que habitan su hogar y el nmero de habitaciones que
tiene la casa. La tabla siguiente recoge la informacin obtenida:

N de personas 3 5 4 6 5 4
N de habitaciones 2 3 4 4 3 3

Halla el coeficiente de correlacin. Cmo es la relacin entre las dos
variables?

5) La estatura, en centmetros, de seis chicos de la misma edad y la de sus
padres viene recogida en la siguiente tabla:

X: Hijo 160 150 160 170 180 170
Y: Padre 180 170 175 185 180 175

a) Halla las dos rectas de regresin.
b) Observando el grado de proximidad entre las dos rectas, cmo crees que
ser la correlacin entre las dos variables?















Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

138
Autoevaluacin de la unidad 4.
Del siguiente estudio, responde las preguntas 1 y 2.

Se ha preguntado a los alumnas de la Institucin Educativa Repblica de Chile el
nmero de horas de estudio diario, X, y el nmero de asignaturas aprobadas al
final del ao escolar, Y. A la nube de puntos resultado de la encuesta se ha
ajustado la recta de regresin y = 3,8x + 0,2.

1. Para aprobar 4 asignaturas, cunto tiempo de estudio deberan emplear?
a) 30 minutos.
b) 1 hora.
c) 1 hora y media.
d) 2 horas.
e) 2 horas y media.

2. Y para superar las 11 asignaturas, es decir, todas, cul sera la
recomendacin de horas de estudio?

a) 1,84 horas.
b) 1,96 horas.
c) 2,54 horas
d) 2,76 horas.
e) 2,84 horas.

De acuerdo a los siguientes datos, responde las preguntas 3, 4 y 5.
La media de los pesos de un grupo de alumnos del PROLEX es de 72 kilogramos,
y la de sus estaturas, 173 centmetros. Las desviaciones tpicas son 4 kilogramos
y 9 centmetros, y la covarianza es 35.
3. Cul es el coeficiente de correlacin?

a) 0,6922
b) 0,7211
c) 0,8355
d) 0,9722
e) 0,9988


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

139
4. Calcula la recta de regresin del peso respecto a la estatura.

a) y = 0,1675x + 16,5
b) y = 1,3875x + 15,5
c) y = 2,1875x + 15,5
d) y = 2,7275x + 14,5
e) y = 2,1641x + 13,5

5. Cul es el peso estimado para un individuo de 182 centmetros?

a) 76,1143 kg
b) 72,3012 kg
c) 78,4628 kg
d) 68,4311 kg
e) 69,2865 kg

























Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

140
Lectura N 4

LA ESTADSTICA EN LA INVESTIGACIN EDUCATIVA
Javier Gil Flores
Extracto de la Revista de Investigacin Educativa, 2003
Vol. 21, n. 1, pgs. 231-248

Pocas objeciones pueden hacerse a la idea de que la Estadstica es una herramienta fundamental
para la investigacin cientfica, y consideramos que esta afirmacin es igualmente vlida en el caso
de la investigacin educativa. De ah, que muchas titulaciones universitarias, y en particular las del
mbito de las Ciencias de la Educacin, incluyan en sus planes de estudios asignaturas de
contenido estadstico, que frecuentemente encuentran una continuidad en la formacin
investigadora dispensada a travs de los programas de Tercer Ciclo. Sin embargo, la Estadstica
trasciende el contexto acadmico y est presente en distintos mbitos de la actividad humana. Si
examinamos el sentido que popularmente se da a la Estadstica, encontramos que la opinin
pblica est ms familiarizada con el trmino estadsticas, en plural. Con frecuencia aparecen en
los medios de comunicacin informaciones acerca de acontecimientos de las esferas poltica,
econmica o social, que vienen expresadas en forma de o acompaadas de estadsticas. As,
podemos referirnos a las estadsticas sobre los resultados de unos comicios, la evolucin del IPC
en las distintas comunidades autnomas, la superficie forestal devastada por los incendios en la
ltima dcada,... En definitiva, la idea de estadsticas en el hombre de la calle quedara asociada a
la de una informacin numrica, a veces apoyada mediante la representacin grfica, con la que
se pretende expresar la importancia cuantitativa o magnitud de algunos fenmenos, sucesos,
realidades o se muestra comparativamente su modificacin al variar las coordenadas espacio-
tiempo.

Las estadsticas, desde esta percepcin, se traducen en un conjunto de datos numricos recogidos
sobre una realidad o a los productos de su procesamiento a travs de la aplicacin de un mtodo
sistemtico de trabajo. Los procedimientos para llegar a esos resultados, consistentes en la
recopilacin, ordenacin y presentacin constituiran la estadstica (esta vez en singular). El
estadstico, por tanto, aparece como alguien que recopila grandes cantidades de informacin
cuantitativa y despus consigue obtener valores numricos representativos de esa informacin, los
cuales permitirn tal vez fundamentar la adopcin de medidas de tipo poltico, econmico,
administrativo... Sin embargo, la recopilacin y descripcin de conjuntos de datos numricos es
slo una de las tareas de la Estadstica.

Esta idea de la Estadstica asociada a conjuntos de informaciones expresadas numricamente ha
estado presente desde sus orgenes, pero el concepto de estadstica ha evolucionado
histricamente. Las definiciones iniciales que limitaban la Estadstica a los mtodos de recopilacin
y ordenacin de datos, clasificados y corregidos, acerca de aspectos de inters para la
administracin de los Estados, dieron paso en una etapa posterior a otras que caracterizan la
Estadstica como una verdadera ciencia, estrechamente conectada a la teora de las
probabilidades. Tras fusionarse en el siglo XIX con la corriente de estudios sobre el clculo de
probabilidades, se constituy en una rama de la matemtica aplicada, entendiendo sta como el
uso de los principios y modelos matemticos en diversos mbitos de la ciencia o la tcnica. Dentro
de la propia Estadstica, a su vez, podemos diferenciar dos vertientes: una que ha sido
denominada con los calificativos de formal, terica, matemtica o pura, y otra que conocemos
como Estadstica aplicada. Esta ltima juega un papel clave en muchos mbitos cientficos, al
servicio de la investigacin y el anlisis de la realidad.

Alcanzar una definicin nica de la ciencia estadstica resulta una tarea difcil. De acuerdo con los
datos aportados por Piatier (1967), ya en 1870 el nmero de definiciones se elevaba a 63 y, en
1935, Willcox presentaba hasta un total de 115 definiciones en su artculo Definitions of statistics,
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

141
aparecido en el nmero tres de la Revue de lInstitut International de Statistique. En este sentido,
cabe tambin mencionar la conocida afirmacin que realizara sir M.G. Kendall en 1945, sealando
que entre los temas respecto a los que los estadsticos no estn de acuerdo, se encuentra
precisamente la definicin de su propia ciencia. Y llegaramos a la conclusin de que esta idea
posiblemente conserva cierta vigencia, si examinramos la variedad de definiciones que muchos
manuales dedicados a esta materia incluyen en prefacios, introducciones o captulos iniciales que
tratan de concretar el campo de estudio en el que se centrar la obra. Desde nuestro punto de
vista, en una definicin de Estadstica resultaran caractersticos rasgos como los que sintetizamos
a continuacin:

- La Estadstica es una ciencia que tiene por objeto el estudio de mtodos y tcnicas para el
tratamiento de conjuntos de datos numricos.
- Las tcnicas estadsticas permiten la descripcin de conjuntos de datos y la inferenci a
sobre conjuntos ms amplios.
- Los mtodos desarrollados por la Estadstica pueden ser aplicados en distintos campos del
saber, constituyendo un importante instrumento para el estudio cientfico.

Centrando la atencin sobre la Estadstica aplicada al campo de la investigacin educativa, la
Estadstica habr de ser vista como un conjunto de mtodos, tcnicas y procedimientos para el
manejo de datos, su ordenacin, presentacin, descripcin, anlisis e interpretacin, que
contribuyen al estudio cientfico de los problemas planteados en el mbito de la educacin y a la
adquisicin de conocimiento sobre las realidades educativas, a la toma de decisiones y a la mejora
de la prctica desarrollada por los profesionales de la educacin.

Volviendo a la imagen popular de la Estadstica, entre las personas que no se cuentan entre sus
estudiosos o aplicadores ha sido a veces objeto de definiciones o mejor, calificaciones que
encierran una cierta crtica, tratando de cuestionar los mtodos del conocimiento estadstico y en
consecuencia los resultados derivados de la aplicacin de los mismos. Lgicamente se trata de
definiciones que desde el punto de vista epistemolgico no tienen mayor inters, pero que apuntan
hacia concepciones que podran encontrarse entre las ideas previas del ciudadano comn y
tambin del profano que inicia el estudio sistemtico de esta disciplina. As, la caricaturizacin de la
Estadstica queda reflejada en afirmaciones de tono humorstico como: la estadstica es la ciencia
que explica cmo si t te comes dospollos y yo ninguno, nos hemos comido uno cada uno por
trmino medio (Pea, 1987:19-20) o la frase de Bernard Shaw si un hombre tiene la cabeza en
un horno y los pies en la nevera, su cuerpo est a una temperatura media ideal. La Estadstica,
desde este punto de vista, sera la ciencia que permite ocultar las diferencias individuales a travs
de los valores promedio. Esta creencia de que puede servir, ms que para revelar, para ocultar
informacin ha dado lugar a que la Estadstica haya podido ser considerada un instrumento al
servicio del engao o la manipulacin. El estadstico, segn Glass y Stanley (1980), ha sido
tachado de mentiroso y se le ha acusado del delito de ejercer el arte de mentir con estadsticas,
manteniendo una apariencia de objetividad y veracidad. Macauley (citado en Piatier, 1967)
afirmaba que las cifras dicen siempre lo que un hombre inteligente quiere que digan, y se
atribuye a Benjamin Disraeli, poltico conservador britnico que lleg a ser primer ministro de la
Reina Victoria, la frase hay tres clases de mentiras: la mentira ordinaria, la mentira mal
intencionada y la estadstica.

Contrarrestar estas opiniones, que dibujan una imagen de la Estadstica apoyada en actitudes de
temor, recelo o desprecio, exige que hagamos hincapi en un correcto uso de los mtodos
estadsticos, para lo cual resulta imprescindible un buen conocimiento de los mismos, de las
condiciones en que pueden ser aplicados y del significado de los resultados obtenidos. En realidad,
las mentiras de la Estadstica derivan no de sta en s misma, sino de la eventual falta de
conocimientos o sentido comn por parte de quienes la aplican y del uso interesado de la misma.
Sobre estas consideraciones acerca del uso abusivo de la Estadstica, volveremos ms adelante,
cuando abordemos los riesgos que entraa la utilizacin de la Estadstica en el estudio de la
realidad educativa.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

142

LA ESTADSTICA EN EL PROCESO DE INVESTIGACIN
Habitualmente se acepta que la Estadstica resulta una herramienta de trabajo til en la
investigacin educativa en la medida en que ofrece tcnicas y procedimientos que pueden ser
aplicados en la etapa de anlisis de datos. Aceptando que sta es la aplicacin de mayor peso en
el contexto de la investigacin educativa, a travs de los prrafos que siguen trataremos de
atenuar el valor de lo que podran suponer concepciones reduccionistas, ocupndonos del papel
que la Estadstica tambin desempea en momentos del proceso de investigacin diferentes a la
fase de anlisis de datos.

a) Planteamiento del problema y formulacin de hiptesis

La Estadstica est presente en la formulacin del problema de investigacin. El proceso de
investigacin constituye un todo interrelacionado en el que las decisiones sobre cualquiera de los
elementos suponen condicionantes de cara a los restantes elementos del proceso. Desde esta
perspectiva, la formulacin del problema determinar en buena medida el tipo de datos que es
necesario recoger, las tcnicas de recogida adecuadas para ello y los procedimientos estadsticos
que se utilizarn en el anlisis. Por otra parte, entre las caractersticas que debe poseer cualquier
problema de investigacin se encuentra su resolubilidad, aspecto que a veces slo queda
garantizado si contamos con tcnicas estadsticas adecuadas, capaces de abordar los
interrogantes de partida. Por ejemplo, el planteamiento de problemas que supongan
comparaciones entre mltiples grupos no podra hacerse sin contar con tcnicas como el anlisis
de la varianza; un gran nmero de problemas de investigacin en los que se incluyen mltiples
dimensiones o variables simultneamente de hecho no han llegado a ser estudiados hasta contar
con tcnicas de anlisis multivariante que permiten abordarlos.

El mismo argumento podra utilizarse para justificar la presencia de la Estadstica en la formulacin
de hiptesis. La formulacin de hiptesis no puede hacerse de espaldas a consideraciones acerca
de las tcnicas estadsticas que permitirn su contrastacin.

Como afirman Arnal, Del Rincn y Latorre (1992), el investigador se ve en la necesidad de
salvaguardar la coherencia entre la teora, la hiptesis y el posterior anlisis estadstico que le
permitir aceptarla o rechazarla. En el marco de los programas de investigacin positivistas la
hiptesis cientfica, para ser contrastada, suele ser expresada en trminos estadsticos, dando
paso a la aplicacin de tcnicas para el contraste de hiptesis.

En el planteamiento del problema y la posterior formulacin de hiptesis han de tenerse en cuenta
tanto el marco terico como los trabajos previos realizados sobre el mismo tema, a cuya revisin
podran contribuir tcnicas de metaanlisis, aplicadas a la sntesis e interpretacin tanto de los
resultados obtenidos en la investigacin como de los mtodos utilizados para ello (Gmez Benito,
1987; Snchez y Ato, 1989). Los resultados a los que nos conduce el metaanlisis son sntesis de
los obtenidos en las diferentes investigaciones realizadas sobre un tema, nos informan sobre el
rigor de la misma, los mtodos empleados, la representatividad de las muestras, la fiabilidad y
validez de los estudios. Una va para determinar las tendencias dominantes en el modo de abordar
el estudio de un tema, los aspectos del mismo que son objeto de mayor atencin por parte de la
comunidad cientfica, o los autores que por encontrarse entre los ms citados gozan de mayor
autoridad, la constituye la utilizacin de revisiones bibliomtricas, en las que a travs de estudios
estadsticos se pueden poner de manifiesto las tendencias que se dibujan en publicaciones o
investigaciones sobre un tema. Las bases documentales informatizadas permiten con facilidad
realizar estadsticas acerca del nmero de registros relativos a diferentes tpicos, lo cual nos
aporta cierta aproximacin a la importancia y relevancia de distintos objetos de investigacin o
modos de abordarlos a lo largo de una determinada poca.

Todo este tipo de resultados estadsticos en ningn modo sustituyen a la revisin exhaustiva de la
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

143
literatura y el estudio del marco terico-conceptual en el que se inscribe el trabajo de investigacin,
pero constituyen una informacin complementaria en manos del investigador a la hora de concretar
el objeto de inters y fundamentar su estudio. Por otra parte, a veces la formulacin del problema
no se apoya slo en resultados de investigaciones anteriores, sino que el investigador recurre a
trabajos descriptivos previos o estudios pilotos, en los que el empleo de la Estadstica puede
contribuir a clarificar el problema en estudio. Los resultados de una descripcin estadstica acerca
de determinadas variables implicadas en algn fenmeno educativo, podran dar pie a que se
formularan hiptesis en las que se contemple la relacin entre variables; y estudios basados en la
obtencin de medidas estadsticas de correlacin entre variables facilitaran el planteamiento de
problemas y la formulacin de hiptesis que suponen relaciones de causalidad. Tatsuoka y
Tiedeman (1963), en su trabajo sobre la Estadstica en el mtodo cientfico, insisten en esta
posibilidad, afirmando el papel de las tcnicas estadsticas en el desarrollo de constructos tericos
e hiptesis acerca de las relaciones entre ellos. De este modo, la Estadstica est presente en la
fase inductiva del mtodo cientfico, contribuyendo a la creacin de modelos tericos a partir de los
cuales se deducirn hiptesis contrastables que relacionan variables observables.

b) Diseo de investigacin

La Estadstica forma parte de los diseos de investigacin experimentales. Como es sabido, en el
concepto de diseo es posible contemplar de un lado la organizacin de los aspectos que
constituyen el experimento y, de otro, el procedimiento estadstico que har posible la
interpretacin de los resultados (Fisher, 1953). Para Kerlinger (1981:214), el principio estadstico
en el que descansa el diseo es maximizar la varianza sistemtica, regular la varianza sistemtica
extraa y minimizar la varianza de error. Las tcnicas estadsticas constituyen una parte
contemplada en el diseo del experimento en la medida en que facilitarn el anlisis de los datos y
posibilitarn el control de la varianza debida a variables extraas. Si dentro del diseo del
experimento se consideran grupos experimentales y grupos control, que antes de la aplicacin de
los tratamientos han de ser equivalentes, el investigador necesitar recurrir a tcnicas estadsticas
para el contraste de hiptesis acerca de la existencia de diferencias entre los grupos y comprobar
de ese modo la equivalencia pretendida. Adems, la Estadstica est presente cuando el diseo
incluye la seleccin de sujetos.

La teora de muestras proporcionar tanto los procedimientos de seleccin como la determinacin
del tamao muestral necesario para mantener el error y la confianza dentro de lmites aceptables.
La recogida de datos es una tarea en la que aparentemente no parecen jugar un papel las tcnicas
estadsticas. Sin embargo, la Estadstica est de manera implcita presente si consideramos el
modo en que se elaboran los instrumentos utilizados para la recogida de datos (tests,
cuestionarios, protocolos de observacin, etc.). A esta disciplina corresponde un papel crucial en la
construccin de tales instrumentos, dado que las tcnicas estadsticas estn en la base de los
procedimientos por los cuales se analizan sus caractersticas tcnicas. Por citar algunos ejemplos,
la determinacin de la fiabilidad y validez de algunos instrumentos se apoya directamente en
coeficientes de correlacin; la aplicacin de tcnicas de anlisis de componentes principales o
anlisis factorial permite explorar o confirmar la dimensionalidad de los instrumentos; los mtodos
para el anlisis de items, en la teora clsica de los tests o en la teora de respuesta al tem, se
basan en correlaciones y en la estimacin de parmetros recurriendo a diferentes procedimientos
estadsticos, tales como los mtodos de mxima verosimilitud o los mtodos de inferencia
bayesiana; tests como el de chi-cuadrado permiten valorar el grado de ajuste de las respuestas a
los items a modelos logsticos de uno, dos o tres parmetros. Al margen de todo el aparato
estadstico que se esconde tras la elaboracin o el anlisis de los instrumentos de recogida de
datos, la Estadstica puede participar indirectamente en la operacin de recogida proporcionando
primeras elaboraciones de los datos en el momento mismo de su registro. Por ejemplo, cuando tras
aplicar un test se registran los resultados en forma de percentiles o eneatipos, resultantes de la
comparacin de la puntuacin del sujeto con un grupo normativo.


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

144
c) Anlisis de datos

Ya hemos destacado la importancia de las tcnicas estadsticas en la fase de anlisis de datos.
Traigamos aqu, para insistir en esta idea, las palabras de De la Orden (1985:XXI), cuando afirma
que la forma ms adecuada de razonar sobre la base del gran nmero de observaciones exigidas
para el estudio experimental de la educacin, con pretensin generalizante, es la Estadstica. De
acuerdo con el concepto de Estadstica que hemos apuntado, a la Estadstica corresponden tareas
de organizacin, descripcin, anlisis y presentacin de datos acerca de las muestras estudiadas,
y tambin de generalizacin de los resultados a las poblaciones de donde las muestras fueron
extradas. El anlisis estadstico de los datos supone una descripcin de stos, el descubrimiento
de regularidades y la inferencia de caractersticas relativas a conjuntos ms amplios que los
directamente estudiados.


d) Obtencin de conclusiones y redaccin del informe

Recordando las palabras de Siegel (1991:20), la estadstica nos proporciona herramientas que
formalizan y uniforman nuestros procedimientos para sacar conclusiones . De alguna forma, las
conclusiones estn predeterminadas por el tipo de tcnicas estadsticas que utilicemos. Un anlisis
de regresin, por ejemplo, nos permitir obtener conclusiones acerca de la posibilidad de que
determinadas variables independientes puedan predecir el valor observado en una variable
dependiente; un anlisis de conglomerados nos llevar a concluir sobre formas de agrupamiento
entre los individuos u objetos que estudiamos; un anlisis simple de la varianza supondr llegar a
conclusiones acerca de las diferencias significativas entre las medias de diferentes grupos; etc. En
cualquier caso, la Estadstica estar presente a la hora de elaborar las conclusiones, aportando las
claves para la interpretacin de los resultados del anlisis.

La presentacin de las conclusiones, as como de todo el proceso de investigacin, debe contar
con la inclusin de resultados estadsticos. Aunque no se trata de una aplicacin de tcnicas
estadsticas en el momento de redactar el informe, s que la Estadstica est de algn modo
presente a la hora de mostrar los resultados. Las conclusiones de un estudio se vern
convenientemente ilustradas mediante la presentacin de tablas, cuadros, etc. recogiendo medias,
porcentajes, coordenadas, correlaciones, o cualquier otro tipo de estadsticos. La inclusin de los
pesos factoriales de las variables consideradas en un anlisis factorial, por ejemplo, es
imprescindible si queremos ilustrar el modo en que cada factor se ve saturado por las variables
observadas. Otro tanto podemos decir acerca de los resultados estadsticos expresados
grficamente.

La utilizacin de determinadas tcnicas estadsticas y la intencin posterior de comunicar los
resultados obtenidos requieren incluir representaciones estrechamente vinculadas a aqullas en
los informes de investigacin. Tcnicas como el anlisis de conglomerados, el path-analysis o el
anlisis de correspondencias, son indisociables de formas de representacin grfica como
dendogramas, diagramas de flujos o grficos factoriales, respectivamente.

En cuanto a la calidad de las investigaciones, la Estadstica aporta sus procedimientos para
garantizar la validez interna y la validez externa en los experimentos. Procedimientos de muestreo
aleatorio y tcnicas estadsticas como el anlisis de la covarianza, para controlar el efecto de
variables intervinientes que pudieran enmascarar el efecto de las variables independientes,
resultan recursos tiles en este sentido.



Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

145
Solucionario de los ejercicios propuestos.
UNIDAD 1
1. a) Poblacin.
b) Poblacin.
c) Muestra.
d) Poblacin.
e) Muestra.
f) Poblacin.
g) Muestra.
h) Muestra.
i) Muestra.
j) Muestra.

2. Clasificacin de la variable Escala de medicin
a) Cuantitativa discreta Razn
b) Cuantitativa discreta Razn
c) Cualitativa o categrica Ordinal
d) Cuantitativa discreta Razn
e) Cualitativa o categrica Nominal
f) Cuantitativa continua Intervalar
g) Cuantitativa discreta Intervalarr
h) Cualitativa o categrica Ordinal
i) Cuantitativa discreta Razn
j) Cualitativa o categrica Nominal
k) Cualitativa o categrica Ordinal
l) Cuantitativa discreta Razn
m) Cualitativa o categrica Nominal
n) Cuantitativa discreta Intervalar
o) Cuantitativa discreta Intervalar
3. Caso 1
Poblacin
Alumnos del Programa de Lenguas Extranjeras de la
UNMSM.
Muestra
142 alumnos del Programa de Lenguas Extranjeras de la
UNMSM.
Unidad estadstica
Un alumno del Programa de Lenguas Extranjeras de la
UNMSM.
Variable Grado de satisfaccin.
Tipo de variable Cualitativa o Categrica.
Escala de medicin Ordinal
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

146
Caso 2
Poblacin Vecinos del distrito de Jess Mara.
Muestra 128 vecinos del distrito de Jess Mara.
Unidad estadstica Un vecino del distrito de Jess Mara.
Variable Razas caninas.
Tipo de variable Cualitativa o Categrica.
Escala de medicin Nominal.


Caso 3
Poblacin Alumnas de la I.E. Mercedes Indacochea de Barranco.
Muestra
6 alumnas de la I.E. Mercedes Indacochea de
Barranco.
Unidad estadstica
Una alumna de la I.E. Mercedes Indacochea de
Barranco.
Variable Gastos en golosinas.
Tipo de variable Cuantitativa continua.
Escala de medicin Intervalar.

4. a) La tabla queda de la siguiente manera:
x
i
f
i
F
i
h
i
(%) H
i
(%)
12 7 7 15.56 15.56
13 14 21 31.11 46.67
14 10 31 22.22 68.89
15 12 43 26.67 95.56
16 2 45 4.44 100.0
n = 45 100.0

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

147

5. a) La tabla queda de la siguiente manera, recuerda que es una variable
cualitativa, por lo tanto, solo representamos f
i
y h
i
, as como su ngulo central.
x
i
f
i
h
i
(%) Operacin ngulo
Primavera 12 23.08 (360x23.08)100 83.09
Verano 14 26,92 (360x26.92)100 96.91
Otoo 13 25.00 (360x25.00)100 90
Invierno 13 25.00 (360x25.00)100 90
n = 52 100.0
b)

0
2
4
6
8
10
12
14
16
12 13 14 15 16
A
l
u
m
n
o
s

Edades
Edad de los alumnos de la I.E. "Bartolom
Herrera"
Primaver
a
23%
Verano
27%
Otoo
25%
Invierno
25%
Nacimiento por estacin del ao de los
alumnos del primer ao de la I.E. "Pedro Ruz
gallo" de Trujillo.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

148
UNIDAD 2
1. a) = 52
Interpretacin:
Los alumnos del PROLEX utilizan en promedio 52 minutos para trasladarse
desde sus hogares hasta la universidad los das sbados.
b) Me = 51
Interpretacin:
El 50% inferior de los alumnos del PROLEX utilizan 52 minutos o menos y el otro
50% superior utiliza 52 o ms minutos para trasladarse desde sus hogares hasta
la universidad los das sbados.
c) La distribucin presenta dos modas: Mo
1
= 48 y Mo
2
= 51 ( es bimodal)
Interpretacin:
El tiempo ms utilizado por los alumnos de PROLEX, para trasladarse desde sus
hogares hasta la universidad los das sbados es de 48 y 51 minutos..
2. Promocin 2010
a)
2010
= 2.67
Interpretacin:
Los estudiantes del PROLEX leyeron en promedio 2.67 libros durante los
meses de enero, febrero y marzo del 2012.
b) Me
2010
= 3
Interpretacin:
El 50% inferior de los alumnos del PROLEX leyeron 3 o menos libros y el otro
50% superior leyeron 3 o ms libros durante los meses de enero, febrero y
marzo del 2012.
c) Mo
2010
= 3
Interpretacin:
La mayora de los alumnos del PROLEX leyeron 3 libros durante los meses
de enero, febrero y marzo del 2012.

Promocin 2011
a)
2011
= 2.67

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

149
Interpretacin:
Los estudiantes del PROLEX leyeron en promedio 2.67 libros durante los
meses de enero, febrero y marzo del 2012.
b) Me
2011
= 3
Interpretacin:
El 50% inferior de los alumnos del PROLEX leyeron 3 o menos libros y el otro
50% superior leyeron 3 o ms libros durante los meses de enero, febrero y
marzo del 2012.
c) Mo
2011
= 3
Interpretacin:
La mayora de los alumnos del PROLEX leyeron 3 libros durante los meses
de enero, febrero y marzo del 2012.
Conclusin: Ambos conjuntos de datos presentan igual promedio, mediana y
moda.
3. Desviacin estndar:

Interpretacin:
Las edades de un grupo de estudiantes de la Facultad de Educacin se dispersa
en promedio 1.85 aos con respecto a su valor central.

Varianza:


Interpretacin:
Las edades de un grupo de estudiantes de la Facultad de Educacin se dispersa
en promedio 1.85 aos
2
con respecto a su valor central.

4. CV(
E
)= 0,125 = 12,5% CV(
L
) = 0,1667 = 16,67%
De los resultados podemos afirmar que los gastos mensuales de la Facultad de
Letras presentan mayor variacin que la facultad de Educacin.

5. El grfico se representa:


Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

150
UNIDAD 3
1. La probabilidad del que el estudiante estudie ambos cursos es de 0.3667 o
36,67%.

2. a) 450
b) 600

3. a) 90%
b) 10%

4. a)


b)


c)


d)


5. a) 0,75
b) 0,75
UNIDAD 4
1) a) y = - 0.172x + 20.798
b) r = - 0.902

2) a) y = 0.853x + 10.667
b) r = 0.898

3) a) y = 0.672x + 4,219
x = 1.178x 2.131
b) r = 0.631

4) r = 0.631
La relacin entre las dos variables presenta una correlacin significativa.

5) a) y = 0.318x + 125.03
x = 1.273y 60,958
b) La correlacin entre las dos variables es significativa.

Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

151
Claves de respuesta de las autoevaluaciones.

Unidad 1 Unidad 2 Unidad 3
Unidad 4
1 B 1 C 1 A 1
B
2 C 2 B 2 B 2
E
3 D 3 C 3 B 3
D
4 B 4 D 4 A 4
C
5 A 5 A 5 D 5
A
6 C 6 E 6 A


7 A 7 C 7 A
8 D 8 C 8 D
9 C 9 D 9 E
10 A 10 C 10 B












Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera

Estadstica aplicada a la Educacin

152
Bibliografa.

ANGELES, C. y LA HOZ, A. Estadstica aplicada a la Educacin. Facultad de
Educacin. UNMSM. Per. 1997.
ARON, A. y ARON, E. Estadstica para Psicologa. Ed. Pearson. Sao Paulo. 2001.
AVILA, R. Estadstica elemental. Estudios y Ediciones RA. Per. 2010.
FERNANDEZ, J. Estadstica descriptiva: Una invitacin a la investigacin. Fondo
Editorial del Pedaggico San Marcos. Per. 2005.
FERREIRO, O. y FERNNDEZ, P. La estadstica, una ciencia de la controversia,
Artculo publicado en la Revista Universitaria N 25 del Instituto de Matemticas y
Fsica .Universidad de Talca. Chile. 1988.
MENDENHALL, W; BEAVER, R. y BEAVER, B. Introduccin a la Psicologa y
Estadstica. Ed. Language Learning. Mxico. 2008.
MOYA, R. Estadstica descriptiva. Ed. San Marcos. Per. 2010.
RINCN, G. Apuntes docentes: Estadstica. Unidades Tecnolgicas de Santander.
Colombia. 2011.
RUIZ, D. Manual de Estadstica. Editado por eumednet. Universidad de Mlaga.
2004.

You might also like