Professional Documents
Culture Documents
0
2012
ESTADSTICA
APLICADA A LA
EDUCACIN
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
Lic. Martn Pablo Moreano Vilca.
Lic. Jessica Graciela Zavaleta Morales.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
1
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE EDUCACIN
PROGRAMA DE LICENCIATURA PARA PROFESORES SIN TITULO PEDAGGICO
EN LENGUA EXTRANJERA
DECANO : Dr. Elas Meja Meja
DIRECTOR ACADMICO :
DIRECTOR ADMINISTRATIVO :
DIRECTORA DEL PROGRAMA : Mg. Mara Escalante Lpez
COORDINADOR ACADMICO :
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
2
NDICE
INTRODUCCIN 03
UNIDAD 1:
Conceptos bsicos de Estadstica descriptiva Organizacin de datos. 04
UNIDAD 2:
Medidas de Tendencia Central, Dispersin y Forma.
UNIDAD 3:
Probabilidades.
UNIDAD 4:
Regresin y Correlacin.
Solucionario
Bibliografa.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
3
Introduccin.
El presente texto tiene como finalidad proporcionar informacin terica y prctica de
algunos aspectos bsicos de Estadstica y su aplicacin en el campo educativo.
El contenido del libro est dirigido a los participantes del Programa de Licenciatura para
Profesores sin Ttulo Pedaggico en Lengua Extranjera de la Universidad Nacional
Mayor de San Marcos, quienes encontrarn en ste texto una herramienta de lectura y
de apoyo para el desarrollo del curso de Estadstica Aplicada a la Educacin.
El libro est organizado en cuatro unidades. La primera unidad corresponde a la
introduccin al campo de la Estadstica, conceptos bsicos, la organizacin de datos y
sus representaciones bsicas. La segunda unidad hace referencia a las medidas de
tendencia central, de dispersin y forma, indicando su aplicacin e interpretacin en el
campo educacional.
En la tercera unidad, trabajaremos algunas nociones bsicas del clculo de
probabilidades, sus aplicaciones con el propsito de valorar su importancia en la vida
cotidiana.
Finalmente, en la cuarta unidad veremos los conceptos de regresin y correlacin, las
cuales son tcnicas muy tiles para analizar la relacin entre dos variables.
Cada uno de estos captulos, presenta aspectos tericos con una serie de ejercicios
resueltos, ejercicios propuestos y un cuestionario de autoevaluacin que les servir
para reflexionar sobre los aprendizajes logrados.
Asimismo, queremos expresar nuestro sincero agradecimiento al profesor Vctor Ochoa
Grados y a todos aquellos que contribuyeron a la elaboracin de ste texto y en
particular a la Mg. Mara Escalante Directora del Programa de Licenciatura para
profesores sin Ttulo en Lenguas Extranjeras, quien nos brinda la posibilidad de
compartir nuestros conocimientos con ustedes. Esperamos que ste texto se convierta
en una herramienta til para su formacin profesional y una invitacin a la
investigacin educativa.
LOS AUTORES.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
4
Introduccin.
La palabra estadstica nos trae a la mente una serie de ideas como son: nmeros
apilados en tablas, cifras relativas a nacimientos, muertes, etc. La Estadstica es mucho
ms que slo nmeros, es una rama de las matemticas con origen remoto y en
continua evolucin y desarrollo. El trmino estadstica tiene su raz en la palabra
Estado y aparece cuando se hace necesario cuantificar conceptos. En la mayora de
los casos esta cuantificacin se realiz con fines econmicos o militares.
Actualmente, la Estadstica es una ciencia que nos proporciona un conjunto de
mtodos que se utilizan para recolectar, resumir, clasificar, analizar e interpretar el
comportamiento de los datos con respecto a una caracterstica materia de estudio o
investigacin y resulta una herramienta de suma utilidad para la toma de decisiones en
cualquier campo de la ciencia.
Capacidades a desarrollar.
- Analizar los conceptos esenciales sobre estadstica.
- Elaborar e interpretar tablas de frecuencias simple y con
intervalos.
- Elaborar e interpretar grficos estadsticos
Unidad 1: Conceptos Bsicos de Estadstica
Descriptiva Organizacin de Datos
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
5
1.1 Breve Historia de la Estadstica.
Ruiz, D. (2011) nos ofrece una aproximacin histrica a esta ciencia, la cual seala que
sus orgenes radican en el antiguo Egipto, pues los antiguos faraones lograron
recopilar, hacia el ao 3050 A.C, datos relativos a la poblacin y la riqueza del pas. De
acuerdo al historiador griego Herodoto, dicho registro facilit la construccin de las
pirmides. Asimismo, Ramss II realiz un censo de las tierras con el objeto de verificar
un nuevo reparto.
La Biblia tambin nos proporciona informacin sobre un anlisis estadstico en el libro
de los Nmeros, adems recordemos que el rey David orden a su general del ejrcito
a hacer un censo de Israel con el objeto de conocer el nmero de la poblacin.
Sin embargo, fueron los romanos quienes mejor supieron emplear los recursos de la
estadstica. Es sabido que el emperador Cesar Augusto decret que todo el imperio
fuera sometido al pago de impuestos, para lo cual previamente debera conducirse un
censo de las personas. Para el nacimiento de Jess se produjo uno de estos clebres
empadronamientos bajo la autoridad del imperio. No obstante, durante la cada del
Imperio Romano se realizaron muy pocas operaciones Estadsticas, salvo las que
posteriormente fueron compiladas por Pipino el Breve en 758 y por Carlomagno en
762 DC.
Asimismo, es sabido que nuestros antepasados, los incas fueron buenos en la
recoleccin de datos para la administracin del estado, para ello hicieron uso del quipu
el cual es considerado uno de los instrumentos ms sofisticados para la contabilizacin
del estado.
En Inglaterra, Guillermo el Conquistador orden que se hiciera un registro de todos los
bienes que existan en Inglaterra, para fines tributarios y militares, descritos en el
Domesday Book o libro del Gran Catastro (1086), es una obra que est considerada
como el primer compendio estadstico de Inglaterra.
En 1660 surgi la Aritmtica Poltica, destinada a la descripcin de los sucesos
polticos. Esta ciencia, que naci en la universidad alemana de Haltustadt y se extendi
por distintas universidades alemanas y suizas, fue ya denominada Estadstica por el
alemn Schmeitzel.
En el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos
importantes para la teora Estadstica; la teora de los errores de observacin, aportada
por Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace,
Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido
por Correlacin, que tena por objeto medir la influencia relativa de los factores sobre
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
6
las variables. De aqu parti el desarrollo del coeficiente de correlacin creado por Karl
Pearson y otros cultivadores de la ciencia biomtrica como J. Pease Norton, R. H.
Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las
relaciones.
Posteriormente, la Estadstica se vincula al anlisis matemtico a travs del clculo de
probabilidades, gracias a Bernoulli, Leibnitz, Bayes, Laplace, Chebychev, Kolmogorov y
Markov. Asimismo, a partir de la aparicin del computador, que revoluciona la
metodologa estadstica y se abren enormes posibilidades para la construccin de
modelos ms complejos que hoy en da son de gran utilidad para todas las disciplinas.
1.2 Importancia de la Estadstica en el campo educativo.
La Estadstica al igual que la Matemtica son dos disciplinas esenciales para
desenvolvernos en la vida cotidiana. Algunas tcnicas estadsticas se aplican en
mercadotecnia, contabilidad, estudios de consumidores y en otras actividades. Por
ejemplo: los ingenieros de control de calidad recopilan datos sobre la fiabilidad de
partes y productos fabricados, calidad de procesos, etc. para mejoramiento del
producto. En poltica, los funcionarios que ocupan cargos directivos hacen uso de la
estadstica para definir que quieren sus votantes.
En educacin, la Estadstica es considerada como la base de la planificacin, ya que
para planificar y obtener resultados vlidos hay que disponer de estadsticas.
Usualmente, el docente, los directivos hacen uso de la estadstica para organizar datos
sobre la cantidad de estudiantes en la escuela, el rango de edad en que se encuentran
sus estudiantes, sus calificaciones, el nmero de aulas, cuntos maestros/as hay en la
escuela clasificados por gnero, aos de servicio, etc.
Por otra parte, la mayora de investigaciones especializadas contienen resultados
basados en el anlisis estadstico, las cuales sirven para dimensionar el
comportamiento de ciertos hechos de una determinada poblacin, realizar estimaciones
y proyecciones.
Asimismo, la estadstica est ntimamente ligada con el mtodo cientfico, pues apoya a
la investigacin en la recoleccin y el anlisis de datos para verificar o formular nuevas
hiptesis y la toma de decisiones. Es decir, la Estadstica no es tan solo un conjunto
de frmulas y/o procedimientos matemticos, la Estadstica permite la organizacin de
datos en toda investigacin cientfica.
En todo trabajo de investigacin cientfica, luego de haber establecido el problema es
necesario elaborar un plan de anlisis estadstico, que facilite la solucin del problema,
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
7
este nos permitir analizar las caractersticas de la poblacin y dichos resultados nos
orientan a la toma de decisiones. Si uno deja de lado el anlisis estadstico podran
existir ciertas dificultades para disear un plan de investigacin y por ende se nos har
ms complejo conocer una determinada realidad.
1.3 Estadstica.
Rincn, G. (2011), afirma que la estadstica es una ciencia que estudia situaciones
prcticas que se manifiestan bajo incertidumbre. Asimismo, esta ciencia se divide en
dos grandes ramas, el cual podemos observar en este esquema:
Esquema: Ramas de la Estadstica.
Fuente: Elaboracin propia.
1.3.1 Estadstica Descriptiva.
Es una de las ramas de la Estadstica que se encarga analizar los mtodos que
implican la recoleccin, presentacin y caracterizacin de un conjunto de datos
(mediante grficos o de forma analtica) con el objetivo de describir un conjunto de
datos, sus caractersticas y resaltar las propiedades de los elementos bajo estudio.
1.3.2 Estadstica Inferencial.
Esta rama de la Estadstica se encarga de obtener conclusiones sobre el
comportamiento total de un fenmeno basndose nicamente en la informacin
recolectada sobre una parte de ese mismo fenmeno. Estas conclusiones se obtienen
bajo incertidumbre. Igualmente, permite estimar el comportamiento futuro de un
fenmeno.
Estadstica
Estadstica
Descriptiva
Estadstica
Inferencial
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
8
1.4 Conceptos estadsticos.
1.4.1 Poblacin.
Es el colectivo finito o infinito de elementos que interesan a un estudio, adems poseen
alguna caracterstica comn observable. En trminos de investigacin, es el conjunto
sobre el que recae la investigacin y de cuyos elementos obtendremos datos de sus
caractersticas o atributos.
Toda poblacin debe delimitarse temporal y espacialmente, de modo que ante la
presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no
de la poblacin bajo estudio. Por lo tanto, al definir una poblacin, se debe cuidar que
el conjunto de elementos que la integran se encuentre perfectamente delimitado.
De acuerdo a Rincn, G. (2011) para delimitar una poblacin se debe ordenar de
acuerdo a la siguiente sintaxis:
Significa que una definicin de poblacin debe empezar por la palabra Todos o
Todas seguida de una descripcin del elemento que se est observando ms una
restriccin al alcance de la palabra Todos(as)
Por ejemplo: En un estudio del nivel salarial de los docentes de la UGEL 03 Lima en
el ao 2012, una definicin de poblacin podra ser la siguiente:
Todos los docentes de la UGEL 03 de la ciudad de Lima, ao 2012.
Asimismo, las poblaciones se dividen en dos clases:
Poblaciones finitas
Poblaciones infinitas.
Las poblaciones finitas son las poblaciones a las cuales se les pueden determinar
fcilmente el nmero de elementos que la componen. Por ejemplo:
TODOS(AS) + DESCRIPCION DEL ELEMENTO + CONDICION RESTRICTIVA
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
9
Situacin o fenmeno: La edad de los estudiantes de la Facultad de Educacin de
la UNMSM en el ao 2012.
Poblacin: Todos los estudiantes de la Facultad de Educacin de la
UNMSM en el ao 2012.
Tipo de poblacin: Finita, porque fcilmente se pueden contabilizar sus
elementos acudiendo a la oficina de la institucin que
registra estos datos.
Las poblaciones infinitas son las poblaciones que fsicamente es imposible
numerarlas o determinar su por razones econmicas o de tiempo. Por ejemplo:
Situacin o fenmeno: Accidentes por da en un cruce de calles del distrito de San
Miguel
Poblacin: Todas los das mientras exista este cruce
Tipo de poblacin: Infinita. Es imposible determinar cuntos elementos tiene
esta poblacin
1.4.2 Muestra.
Es un subconjunto de anlisis de la poblacin dada y est constituida por elementos
seleccionados de una manera deliberada con el objeto de investigar las propiedades de
la poblacin.
Las causas por la cual se seleccionan muestras son muchas. Puede ocurrir que la
poblacin que se defina tenga tamao infinito, y en consecuencia, no fuera posible
observar a todos sus elementos. En otras ocasiones, el costo de la observacin
exhaustiva puede ser muy elevado, el tiempo de recoleccin de la informacin resulte
ser muy extenso. Sin embargo, debemos de tener en consideracin que la muestra
debe ser representativa de la poblacin y esto significa que debe ser de tamao
adecuado y que tenga las mismas propiedades de la poblacin.
1.4.3 Variables.
Representan y sintetizan conceptualmente las propiedades o caractersticas de las
unidades de anlisis, a las cuales se les pueden adjudicar distintos valores numricos.
Es decir, es una caracterstica observable que puede tomar diferentes valores, las
cuales se pueden expresar en varias categoras.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
10
De all que, todas las variables tienen una escala de registro y pueden ser una
caracterstica medible como: peso, ingreso, coeficiente de inteligencia, etc. o una
cualidad no medible como: estado civil, nacionalidad, sexo, etc.
La variable se denota por una letra mayscula X. A su vez cada una de estas variables
puede tomar distintos valores, colocando un subndice x
1
, x
2
, x
3
,., x
k
.
1.4.3.1 Clasificacin de las variables.
De acuerdo a la naturaleza de las variables, estas pueden ser:
- Variables cualitativas o categricas.
Es cuando expresan una cualidad, caracterstica o atributo y sus datos se expresan
mediante una palabra y no con una cantidad numrica.
Por ejemplo: El estado civil, el lugar de nacimiento, las profesiones, etc.
- Variables cuantitativas.
Es cuando el valor de la variable se expresa mediante una cantidad; es decir, es de
carcter numrico. As tenemos: el nmero de hijos en una familia, los ingresos, el
nmero de alumnos por aula, etc. Estas variables se clasifican en: discretas y
continuas.
- Variable cuantitativa discreta.
El resultado de este tipo de variable resulta del conteo y su valor est representado en
correspondencia biunvoca con los nmeros naturales.
Por ejemplo: el nmero de accidentes por da, los trabajadores de una empresa, el
nmero de habitaciones de una casa, etc.
- Variable cuantitativa continua.
El resultado de este tipo de variable resulta de la medicin o comparacin con una
unidad o patrn de medida. Las variables cuantitativas continuas pueden tener
cualquier valor dentro de un rango o recorrido, por lo tanto se expresa mediante un
nmero real.
Por ejemplo: los ingresos de una familia, la estatura, el peso, la temperatura de una
persona, etc.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
11
1.4.4 Unidad elemental o estadstica.
Es el objeto o elemento indivisible que ser estudiado en una poblacin, sobre la cual
se va a obtener datos. Tambin se le llama unidad de observacin si los datos han sido
recolectados mediante la observacin y se le llama unidad experimental si los datos
han sido recolectados a travs de la experimentacin.
Por ejemplo:
Variables Tipo de variable Unidad estadstica
Ejemplo de
observaciones
X: Grado de
instruccin de los
padres de familia
Cualitativa Cada padre de
familia
x
1
: Primaria
x
2
: Secundaria
x
3
: Superior
Y: Peso de los
alumnos del 3
ao de secundaria
Cuantitativa
continua
Cada alumno y
1
: 34 kg.
y
2
: 38kg
y
3
: 40 kg.
Fuente: Adaptado de Fernndez, J. (2005)
1.4.5 Dato.
Es el valor o respuesta que adquiere la variable en cada unidad de anlisis y es el
resultado de las observaciones o recopilacin en general.
Un dato est constituido por 3 elementos: La unidad de observacin, la variable y el
valor.
Ejemplo:
Si se aplica un cuestionario de encuesta a un alumno X de una muestra de 400
alumnos de la UGEL 02 y su respuesta a una pregunta sobre su edad en aos
cumplidos es 16 aos. Sus elementos de este dato son:
- La Unidad de Observacin : El alumno X
- La Variable : Edad
- El valor : 16 aos.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
12
Asimismo, dicha recoleccin de datos implica tres actividades:
a) Seleccionar o desarrollar un instrumento de medicin.
b) Aplicar ese instrumento de medicin (obtener las mediciones y observaciones de las
variables de inters)
c) Preparar las mediciones obtenidas para que puedan analizarse correctamente.
1.4.6 Parmetro.
Es un valor obtenido para describir en forma resumida las caractersticas ms
resaltantes de la poblacin; es decir, son las medidas de resumen de la poblacin.
Ejemplos: La media, la diferencia de promedios, la varianza, la desviacin estndar,
etc.
1.5 Medidas y escalas de medicin.
Para realizar un correcto anlisis de los datos es fundamental conocer de antemano el
tipo de medida de la variable, ya que para cada una de ellas se utiliza diferentes
estadsticos. La clasificacin ms convencional de las escalas de medida las divide en
cuatro grupos denominados: Escala nominal, escala ordinal, escala intervalar y
escala de razn.
1.5.1 Escala nominal.
La escala nominal se establece mediante la distincin de elementos en diversas
categoras, basndose en sus atributos, sin implicar algn orden entre ellas.
Ejemplos:
- Sexo (masculino, femenino).
- Estado civil (soltero, casado, viudo, divorciado).
- Principal fuente de energa para cocinar (electricidad, gas, kerosene, lea, ninguna,
otros).
- Material predominante en las paredes exteriores de la vivienda (Ladrillo, adobe,
esteras, otros).
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
13
1.5.2 Escala ordinal.
La escala ordinal est referida a un orden o jerarqua; es decir, las caractersticas
expresan una posicin de orden.
Ejemplos:
- Nivel de satisfaccin del curso (Muy de Acuerdo, Acuerdo, Poco de Acuerdo, en
Desacuerdo, Muy en desacuerdo).
- Nivel Socio-Econmico (Alto, Medio, Bajo).
- Opinin sobre las condiciones de salubridad de un distrito (Muy Bueno, Bueno,
Malo, Muy Malo, otro).
- Grado de instruccin (Inicial, Primaria, Secundaria, Superior).
1.5.3 Escala intervalar.
La escala intervalar supone orden y a su vez grados de distancia entre las diversas
categoras, pero no tienen un origen natural sino convencional. Parten del cero relativo,
el cual no representa vaco.
Ejemplos:
- Coeficiente de inteligencia.
- Temperatura.
- Puntuacin obtenida en una escuela.
- Presin arterial.
- Rendimiento escolar.
1.5.4 Escala de razn.
La escala de razn comprende los casos anteriores, distincin, orden, distancia y
origen nico natural, el valor se representa con un nmero real y tiene un cero absoluto
el cual representa la ausencia de la caracterstica estudiada.
Ejemplos:
- Edad.
- Peso.
- Ingresos.
- Nmero de hijos.
- Accidentes de trnsito.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
14
1.6 Organizacin y clasificacin de datos.
Los datos constituyen una informacin bsica para iniciar un estudio, conocer y analizar
las caractersticas de los elementos de una poblacin. En Estadstica, los datos deben
ser clasificados, ordenados y presentados de tal manera que facilite la comprensin,
descripcin y anlisis del fenmeno estudiado para extraer conclusiones vlidas para la
toma de decisiones.
El primer paso para organizar los datos consiste en identificar el tipo de datos que se
tienen, los cuales pueden ser cualitativos o cuantitativos
Asimismo, estos datos se pueden organizar en:
- Datos no agrupados
- Datos agrupados
A continuacin explicaremos cada una de ellas.
1.6.1 Datos no agrupados.
Los datos no agrupados son los datos sin procesar y usualmente el punto de inicio de
los anlisis.
Ejemplo: Si tenemos doce elementos en la muestra y estos datos son analizados sin
necesidad de formar clases con ellos, los llamamos datos no agrupados.
1.6.2 Datos agrupados.
Los datos agrupados se refieren al hecho de que estn ordenados, clasificados,
contados y significan que hay menos datos con los cuales trabajar. Estos pueden
presentarse con intervalos y sin intervalos.
1.7 Tipos de frecuencia.
En el siguiente esquema podemos apreciar los diferentes tipos de frecuencia:
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
15
Esquema: Tipos de frecuencia.
Fuente: Adaptacin propia.
Seguidamente, desarrollaremos cada una de ellas.
1.7.1 Frecuencia absoluta simple (f
i
)
La frecuencia absoluta simple nos indica el nmero de veces que se repite un valor
en un conjunto de datos. Adems, la suma de todas las frecuencias absolutas es
igual al total de la poblacin.
1.7.2 Frecuencia absoluta acumulada (F
i
)
La frecuencia absoluta acumulada resulta de la suma de las frecuencias absolutas
simples correspondientes a los datos menores e iguales al dato en referencia.
La ltima frecuencia absoluta acumulada es igual al tamao de la muestra n. As
tenemos:
F
1
= f
1
F
2
= f
1
+ f
2
F
n
= f
1
+ f
2
+ . . . . . . + f
n-1
+ f
n
=n
Frecuencia absoluta simple. f
i
Frecuencia absoluta acumulada. F
i
Frecuencia relativa simple. h
i
Frecuencia relativa acumulada. H
i
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
16
1.7.3 Frecuencia relativa simple. (hi)
La frecuencia relativa de un valor, es el cociente de su frecuencia absoluta entre el
tamao de la muestra.
La suma de todas las frecuencias relativas es 1
1.7.4 Frecuencia relativa acumulada (H
i
)
La frecuencia relativa acumulada de un dato, es el cociente de su frecuencia absoluta
acumulada entre el tamao de la muestra.
Para interpretar h
i
y H
i
se suele emplear su valor expresado en porcentaje, el cual se
obtiene al multiplicar por 100 cada uno de estos valores.
1.8 Elaboracin de tablas y distribucin de frecuencias.
Una vez que se ha extrado una muestra de la poblacin, el siguiente paso es organizar
los datos con el objetivo de poder analizarlos con comodidad. Para ello, haremos uso
de las tablas de frecuencias.
Una tabla de frecuencias presenta en forma ordenada los distintos valores de una
variable y sus correspondientes frecuencias, la cual permite percibir con claridad
determinadas caractersticas de la masa de datos que se investiga.
La distribucin de frecuencias es la representacin estructurada de la informacin
que se ha recogido sobre la variable en estudio, esta distribucin puede realizarse de
acuerdo a la agrupacin de los datos.
Las tablas de frecuencias deben explicarse por s mismas; es decir, deben ser fciles
de entender por cualquier persona que las lee.
H
i
=
h
i
=
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
17
Toda tabla de frecuencia contiene lo siguiente:
a) El ttulo, el cual nos muestra brevemente el contenido de la informacin, debe
ser claro y preciso.
b) El encabezamiento, se encuentra en la primera fila y nos indica la naturaleza de
contenido de cada columna.
c) El cuerpo, est formado por un conjunto de filas y columnas y nos presenta la
informacin de la investigacin
d) La fuente, est ubicado al final de la tabla y nos indica a la entidad responsable
donde se obtuvieron los datos.
Seguidamente, mostramos un grfico en el cual veremos las partes de la tabla de
frecuencia.
Grfico: Partes de una Tabla de Frecuencia
Titulo
Encabezado
Cuerpo
Fuente:
Fuente: Adaptado de Fernndez, J (2005)
La distribucin de frecuencia se puede organizar de la siguiente manera:
- Distribucin de frecuencia para datos no Agrupados.
- Distribucin de frecuencia de clase o de datos Agrupados
1.8.1 Distribucin de frecuencia para datos no Agrupados.
Es la distribucin que indica las frecuencias con que aparecen los datos estadsticos,
desde el menor de ellos hasta el mayor sin que se haya hecho ninguna modificacin al
tamao de las unidades originales. En estas distribuciones los valores de cada variable
han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas
frecuencias.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
18
Por ejemplo: En la siguiente tabla f
i
es la frecuencia absoluta, F
i
frecuencia acumulada,
h
i
frecuencia relativa y H
i
frecuencia relativa acumulada de la i-sima categora (clase),
respectivamente.
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple (f
i
) Acumulada (F
i
) Simple (h
i
) Acumulada (H
i
)
X
1
f
1
F
1
= f
1
h
1
= f
1
/ n H
1
= h
1
X
2
f
2
F
2
= F
1
+ f
2
h
2
= f
2
/ n H
2
= H
1
+ h
2
... ... ... ... ...
X
k
f
k
F
k
= n h
k
= f
k
/ n H
k
= 1
Total n
1
Por ejemplo, al medir la altura de los nios de una clase, se obtienen los siguientes
resultados (en metros)
Alumno Estatura Alumno Estatura Alumno Estatura
Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21
Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29
Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26
Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22
Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28
Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27
Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26
Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23
Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22
Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21
Fuente: Extrado de: http://www.aulafacil.com/CursoEstadistica/Lecc-2-est.htm
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
19
A partir de estos datos, podemos construir nuestra tabla de frecuencias:
Distribucin de alturas de alumnos de una clase
(Valor) f
i
F
i
h
i
H
i
1,20 1 1 0,03 0,03
1,21 4 5 0,13 0,16
1,22 4 9 0,13 0,29
1,23 2 11 0,07 0,36
1,24 1 12 0,03 0,39
1,25 2 14 0,07 0,46
1,26 3 17 0,10 0,56
1,27 3 20 0,10 0,66
1,28 4 24 0,13 0,79
1,29 3 27 0,10 0,89
1,30 3 30 0,10 1,00
n = 30
~ 1
Observacin:
Interpretacin:
- f
1
= 1, significa que 1 alumno mide 1,20 cm.
- F
4
= 11, significa que 11 alumnos a lo ms miden 1,23 cm
- h
3
= 0,13, significa que el 13 % de los alumnos miden 1,22 cm.
- H
7
= 0,56, significa que el 56% de los alumnos tienen a lo ms 1,26 cm.
1.8.2 Distribucin de frecuencias de clases o de datos Agrupados
La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un nmero grande de valores o la variable es continua o cuando los
datos son discretos pero muy numerosos. Tambin se utilizar este tipo de distribucin
cuando se requiera elaborar grficos lineales como el histograma o el polgono de
frecuencia.
La suma de todas las frecuencias relativas simples debe de ser 1, pero como
en nuestro ejemplo debido a las aproximaciones realizadas, es posible que la
suma no resulte 1.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
20
1.8.2.1 Construccin de una tabla de datos agrupados.
Estas tablas se usan comnmente para resumir grandes cantidades de datos
continuos.
Fernndez (2005) seala que cualquier tabla de frecuencia con datos agrupados en
intervalos debe presentar las siguientes caractersticas:
a) Uniformidad, pues cada clase debe tener la misma amplitud.
b) Unicidad, ya que dos clases no se superponen.
c) Completitud, puesto que cada uno de los datos pertenece a alguna clase.
A continuacin, veamos cmo se construye una tabla de datos agrupados a travs del
siguiente ejemplo:
Ejemplo: Durante el mes de julio, se realiz una investigacin en la I.E. Miguel Grau
sobre el nmero de horas que los estudiantes usan el Internet durante una semana, de
la cual se obtuvo los siguientes datos:
10 19 25 19 26 23 22 17 12 20 18 25 21
16 19 27 27 25 15 21 23 26 14 23 24
Para ello, es necesario tener en cuenta los siguientes conceptos:
Concepto Definicin De acuerdo al ejemplo
anterior
Rango o
amplitud
Es la diferencia entre el mayor y el menor
dato.
R = 27 10 = 17
Intervalo de
clase
Es una clasificacin de los datos en
subgrupos.
[16,19) es un posible
intervalo de clase
donde se debe
considerar a los nios
que usan Internet
desde 16 horas hasta
menos de 19 horas
semanales.
Lmites de
clase
Son los valores extremos del intervalo de
clase; es decir, [L
i
, L
s
), donde L
i
es el
lmite inferior y L
s
es el lmite superior.
L
i
= 16
L
s
= 19
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
21
Concepto Definicin De acuerdo al ejemplo
anterior
Ancho de clase
o amplitud del
intervalo (W)
Es la diferencia entre el lmite superior e
inferior de cada intervalo.
Si tenemos el intervalo [L
i
, L
s
), el ancho o
amplitud de clase es:
W = L
s
- L
i
W= 19 16 = 3
Marca de clase
(X)
Es el punto medio de cada intervalo; es
decir, la semisuma de los lmites de cada
intervalo.
Otras consideraciones:
- La regla de Sturges.
Es una de las ms usadas en Estadstica Descriptiva. Es sabido que no existen reglas
fijas para determinar el nmero de clases (K), el cual si es muy pequeo significara la
prdida de informacin y si es muy grande producira irregularidades. De all que es
necesario, obtener el valor aproximado del nmero de clases (K) y para ello usamos la
regla de Sturges, la cual es:
Donde: n = Tamao de la muestra o nmero de datos.
Del ejemplo anterior: ()
Como hemos obtenido un valor decimal, es necesario redondearlo a cantidades
enteras y para ello diremos que K = 6, en este sentido estamos garantizando que los
valores mayores se encuentren en el ltimo intervalo.
- Ancho de clase comn.
Para ello, haremos uso de la siguiente ecuacin:
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
22
Del ejemplo anterior:
= 2,83; no obstante es necesario redondearlo a W=3,
ya que la informacin de horas semanales de uso del Internet esta expresado en
nmeros enteros.
Para el clculo de la amplitud de clase es necesario considerar algunos criterios de
redondeo de decimales, tal es el caso que si trabajamos con una cifra decimal,
entonces el TIC deber estar expresado con una cifra decimal y si trabajamos con dos
cifras decimales, la amplitud de clase deber tener dos cifras decimales.
En resumen, si queremos elaborar una tabla de frecuencia para datos agrupados (con
intervalos), realizamos lo siguientes pasos:
Paso 1: Hallamos el rango: R= 27 10 = 17.
Paso 2: Hallamos el nmero de clases (usamos la regla de Sturges)
() Redondeamos K = 6
Paso 3: Hallamos el ancho de clase comn.
= 2,83 redondeamos W = 3
Paso 4: Elaboramos la tabla de frecuencia.
Tabla: Distribucin de nmero de horas semanales de uso de Internet.
K Intervalos X f
i
F
i
h
i
H
i
1 [10,13) 11,5 2 2 0,08 0,08
2 [13,16) 14,5 2 4 0,08 0,16
3 [16,19) 17,5 3 7 0,12 0,28
4 [19,22) 20,5 6 13 0,24 0,52
5 [22,25) 23,5 5 18 0,20 0,72
6 [25,28) 26,5 7 25 0,28 1,00
25 1,00
Fuente: Adaptado de Fernndez (2005)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
23
Interpretacin:
- f
2
= 2; es decir, 2 estudiantes usan Internet entre 13 y 16 horas, inclusive 13.
- F
4
= 13; es decir, 13 estudiantes usan Internet menos de 22 horas.
- h
5
= 0,20; es decir, el 20 % de los estudiantes usan Internet entre 22 y 25 horas,
inclusive 22.
- H
3
= 0,28; es decir, el 28 % de los estudiantes usan Internet menos de 19 horas.
1.9 Grficos Estadsticos.
Aunque una tabla estadstica encierra la informacin disponible sobre el carcter en
estudio, es necesario traducirla a un grfico para realizar una sntesis visual.
Un grfico es la expresin arbitraria de datos reales, los cuales permiten visualizar, al
golpe de vista, hechos, cantidades y comportamientos de las variables. Moya, R.
(2010) seala que el grafico tiene mayor ventaja sobre el cuadro ya que permite
apreciar rpidamente los datos y abarcar todo su conjunto. No obstante, posee
limitaciones pues no puede presentar tantos grupos de datos como una tabla y muchas
veces se hace uso de valores aproximados.
Al igual que las tablas de frecuencia, los grficos estadsticos deben estar compuestos
de lo siguiente:
- El ttulo, es una descripcin resumida referida al contenido del grfico; debe indicar
claramente la naturaleza del fenmeno representado.
- El cuerpo, es el grfico en s, que representa la informacin referida en el ttulo.
- La leyenda, es la informacin complementaria del grfico. En algunos casos es
opcional, dependiendo de la determinacin del investigador.
- La fuente, indica el origen de los datos que estn representados en el grfico (slo
cuando la informacin ha sido proporcionada por alguna persona o institucin).
Seguidamente, mostramos un grfico que ilustre las partes de un grfico estadstico.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
24
Grfico: Partes de un grfico estadstico
Fuente: Elaboracin propia
1.9.2 Principales tipos de grficas.
1.9.2.1 Para datos correspondientes a variables cualitativas.
La representacin grfica de este tipo de datos est basada en la proporcionalidad de
las reas a las frecuencias absolutas o relativas. As tenemos:
- Diagrama de sectores.
Se le llama tambin grfico de pastel y es bastante til para representar proporciones
o porcentajes. Est representacin grfica consiste en dividir un crculo en tantos
sectores circulares como modalidades presente el carcter cualitativo, asignando un
ngulo central a cada sector circular proporcional a la frecuencia absoluta (fi),
consiguiendo de esta manera un sector con rea proporcional tambin a fi.
Su uso ms frecuente es con fines comparativos, cuando se quiere mostrar las
diversas componentes de una serie de valores de la variable comparada con el total.
Veamos a travs de un ejemplo cmo elaborar un diagrama de sectores.
Ejemplo: Se someti a una encuesta a un grupo estudiantes del Segundo grado de
educacin secundaria de la I.E 2023 acerca de sus preferencias musicales, en la cual
37%
9%
6%
29%
11%
8%
Ttulo del grfico
Luz
Agua
Telfono
Cable
Internet
Celular
Cuerpo
Leyenda
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
25
se obtuvieron los siguientes datos:
Solucin:
1 Para ello, calculamos la amplitud de cada sector; es decir dividimos 360/ 40 = 9
2 Luego, multiplicamos la amplitud de cada sector por la fi.
Tipos de msica Nmero de casos ngulo(grados) %
Reggeton 26 9(26) = 234 65
Rock 3 9(3) = 27 7
Salsa 10 9(10) = 90 25
Baladas 1 9(1) = 9 3
Total 40
3 Su representacin en un diagrama de sectores ser:
Fuente: Elaboracin propia.
65%
7%
25%
3%
Preferencias musicales
Reggeton
Rock
Salsa
Baladas
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
26
1.9.1 Para datos sin agrupar correspondientes a variables cualitativo y/o
cuantitativas discretas.
Estudiaremos dos tipos de representaciones grficas, correspondientes a distribuciones
de frecuencias de variables cualitativo y/o cuantitativa discreta
- Diagramas de barras.
Un diagrama de barras est formado por barras de altura proporcional a la frecuencia
de cada valor y se representan en el eje de ordenadas (X) las modalidades, y en
abscisas (Y) las frecuencias absolutas o relativas. Se utiliza con datos cualitativos o
cuantitativos discretos.
Moya, R. (2010) nos da algunas recomendaciones para su construccin.
- Todas las barras deben de ser del mismo grosor.
- El espacio entre las barras debe ser de la misma magnitud.
- La escala de la frecuencia debe empezar de cero.
- No se deben recargar las barras tratando de expresar muchos productos en cada
una de ellas.
- Si el grfico tiene muchas barras es preferible hacer uso de un diagrama lineal.
Ejemplo: Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar
su grupo sanguneo ha dado el siguiente resultado:
Fuente: Elaboracin propia
6
4
1
9
0
1
2
3
4
5
6
7
8
9
10
A B AB O
Grupo Sanguineo
Grupo
sanguneo
f
i
A 6
B 4
AB 1
0 9
20
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
27
- Polgonos de frecuencia.
Un polgono de frecuencias o lineal es una representacin que se realiza uniendo con
una lnea poligonal los extremos superiores de las barras en un diagrama de barras. Se
utiliza con datos cualitativos y cuantitativos discretos.
Ejemplo: Un estudio hecho a un conjunto de estudiantes sobre el nmero de libros que
leen en el mes arroj lo siguiente:
Fuente: Elaboracin propia
1.9.2 Para datos agrupados en intervalos correspondientes a un carcter
cuantitativo.
- Histograma.
El histograma se utiliza para representar una tabla de frecuencias de intervalos de
clase, donde se muestra una representacin por reas, en el cual hay que distinguir si
los intervalos en los que aparecen agrupados los datos son de igual amplitud o no.
El grfico consiste en un conjunto de rectngulos adyacentes cuya base representa un
intervalo de clase y cuya altura representa la frecuencia del intervalo. El rea que hay
bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5
f
r
e
c
u
e
n
c
i
a
Libros ledos al mes
Libros ledos al mes
Libros ledos
al mes
f
i
0 4
1 12
2 14
3 8
4 2
Total 40
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
28
frecuencia) de individuos en el intervalo.
Pueden construirse para distribuciones de frecuencias de datos no agrupados (sin
intervalos) y para datos agrupados (con intervalos)
Ejemplo: En un grupo de 30 personas hemos medido la estatura, en centmetros, de
cada una de ellas, obteniendo los siguientes resultados:
160 163 165 164 162 168 175 167 159 160
161 164 167 168 154 163 164 167 164 165
166 168 165 167 169 164 150 166 147 170
Solucin:
Por una parte, la variable que estamos estudiando es continua (la estatura). Adems,
entre los datos que tenemos hay una gran variedad. Por tanto, debemos agrupar los
datos en intervalos.
Fuente: Elaboracin propia
Intervalo Frecuencia
146,5 151,5 2
151,5 156,5 1
156,5 161,5 4
161,5 166,5 13
166,5 171,5 9
171,5 176,5 1
Distribucin de estatura de un grupo de personas
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
29
Ejercicios resueltos.
1) Identifica en cada uno de los siguientes casos los conceptos estadsticos:
poblacin, muestra, unidad estadstica, variable, tipo de variable y la escala de
medicin:
Caso N 01
Un equipo de especialistas en temas educativos realiza una investigacin sobre el
grado de desnutricin de los estudiantes de la I.E. Jos Mara Arguedas del
Distrito de Comas. Para realizar el estudio elige al azar a 33 estudiantes para
determinar si el grado de desnutricin influye en su desarrollo acadmico.
Solucin:
Leemos detenidamente el enunciado y extraemos los conceptos estadsticos.
Poblacin
Estudiantes de la I.E. Jos Mara Arguedas del Distrito
de Comas
Muestra 33 estudiantes
Unidad estadstica Cada estudiante
Variable Grado de desnutricin
Tipo de variable Cualitativa
Escala de medicin Ordinal
Caso N 02
Se necesita conocer cierta informacin para abastecer la demanda educativa en
la I.E. Miguel Grau ubicada en la Provincia de Cora Cora, Dpto. de Ayacucho.
Para ello se realiza un estudio sobre el nmero de hermanos menores de 24
estudiantes de la I.E. Miguel Grau.
Solucin:
Leemos detenidamente el enunciado y extraemos los conceptos estadsticos.
Poblacin Estudiantes de la I.E. Miguel Grau.
Muestra 24 estudiantes
Unidad estadstica Cada estudiante
Variable Nmero de hermanos menores
Tipo de variable Cuantitativa discreta
Escala de medicin De razn
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
30
2) El Programa de Lenguas Extranjeras desea implementar la biblioteca con libros
actuales y especializados, para lo cual realiza una encuesta a 50 alumnos del
PROLEX sobre el nmero de libros ledos durante el mes de enero del 2012.
Los datos obtenidos son los siguientes:
2 1 4 1 2 0 2 3 2 1
4 2 3 3 2 1 0 4 2 4
1 2 0 1 1 2 4 2 1 2
2 3 2 1 3 1 1 2 0 3
0 2 1 2 2 0 1 3 2 1
a) Elabora una tabla de frecuencias.
b) Interpreta f
3
, F
2
, h
4
y H
3
.
c) Representa grficamente los datos obtenidos.
Solucin:
a) Realizamos el conteo de los datos y completamos la tabla, tenemos que indicar
que en la mayora de los casos trabajaremos con las frecuencias relativas
porcentuales:
x
i
f
i
F
i
h
i
(%) H
i
(%)
0 6 6 12% 12%
1 14 20 28% 40%
2 18 38 36% 76%
3 7 45 14% 90%
4 5 50 10% 100%
Total n=50 100%
b) Interpretamos:
f
3 :
18 alumnos del PROLEX han ledo 2 libros durante el mes de enero del 2012.
F
2 :
20 alumnos del PROLEX han ledo a lo ms un libro durante el mes de
enero del 2012.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
31
h
4
: El 14% de los alumnos del PROLEX han ledo 3 libros durante el mes de
enero del 2012.
H
3 :
El 76% de los alumnos del PROLEX han ledo a lo ms 2 libros durante el
mes de enero del 2012.
c) Elaboramos el grfico respectivo con los datos obtenidos.
Fuente: Elaboracin propia.
3) Se ha medido la estatura, en centmetros, de 40 alumnos del 5
to
ao de secundaria
de la IE Alfonso Ugarte de la UGEL 03, para escoger al batalln que representar
al colegio en el desfile escolar.
Los datos obtenidos se muestran a continuacin:
162 156 161 160 156 167 162 164
174 161 177 155 159 171 163 162
163 179 162 173 156 161 158 160
178 169 173 157 182 174 176 155
169 165 158 159 170 160 171 166
LIBROS
0
2
4
6
8
10
12
14
16
18
20
0 1 2 3 4
A
L
U
M
N
O
S
NMERO DE LIBROS LEDOS DURANTE EL MES DE ENERO 2012
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
32
a) Elabora una tabla de frecuencias con intervalos.
b) Interpreta f
4
, F
2
, h
6
y H
3
.
c) Representa grficamente los datos obtenidos.
Solucin:
a) Para elaborar nuestra tabla de frecuencias con intervalos seguiremos el
siguiente orden:
- Determinacin del rango (R)
Es la diferencia entre el valor mximo y el valor mnimo.
R = X
mx
- X
mn
En nuestro ejemplo:
R = 182 155
R = 27
- Nmero de intervalos (K)
Consiste en dividir el rango en un nmero conveniente de intervalos de clase,
por lo general del mismo tamao. Existen varias formas para calcular el nmero
de intervalos, nosotros usaremos la frmula de Sturges:
K = 1 + 3.3log(n)
En nuestro ejemplo:
K = 1 + 3.3log(40)
K = 6,28 ~ 7
- Amplitud del intervalo (C)
Es conveniente que los intervalos de clase tengan el mismo tamao.
En nuestro ejemplo:
= 3.85 ~ 4
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
33
- Determinacin de los lmites de clases
Se recomienda que el lmite inferior del intervalo de la primera clase sea el
menor de los datos, despus se agrega el valor de la amplitud C para obtener el
lmite superior de dicha clase.
En nuestro ejemplo, el intervalo semiabierto de la primera clase es [155 159 )
- Marca de clase X'
Es el punto medio del intervalo de clase.
En nuestro ejemplo:
Ahora si podemos elaborar nuestra tabla:
[Li Ls ) X' f
i
F
i
h
i
(%) H
i
(%)
[155 159 ) 157 8 8 20% 20%
[159 163 ) 161 12 20 30% 50%
[163 167 ) 165 5 25 12.5% 62.5%
[167 171 ) 169 4 29 10% 72.5%
[171 175 ) 173 6 35 15% 87,5%
[175 179 ) 177 3 38 7.5% 95.5%
[179 183 ) 181 2 40 5% 100%
Total n = 40 100%
b) Interpretamos:
f
4
: 4 alumnos del 5
to.
ao de secundaria de la IE Alfonso Ugarte miden entre 167
cm y 171 cm, incluso 167 cm.
F
2
:
20 alumnos del 5
to
ao de secundaria de la IE Alfonso Ugarte miden menos
de 163 cm.
h
6
: El 7,5% de los alumnos del 5
to
ao de secundaria de la IE Alfonso Ugarte
miden entre 175 cm y 179 cm, incluso175 cm.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
34
H
3
:
El 62.5% de los alumnos del 5
to
ao de secundaria de la IE Alfonso Ugarte
miden menos de 167 cm.
c) Elaboramos el grfico respectivo con los datos obtenidos.
Fuente: Elaboracin propia.
4) La siguiente tabla corresponde al nmero de palabras en ingls que aprenden a la
semana los alumnas del 3
ero
secundaria de la IE Teresa Gonzales de Fanning
Nmero de
palabras
f
i
6 5
7 11
9 6
10 4
12 3
13 1
Total n=30
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
35
a) Completa la tabla de frecuencias.
b) Interpreta: f
5
, h
6
, F
3
, H
2
c) Elabora un grfico de barras
Solucin:
a) Completamos la tabla:
Nmero de
palabras
f
i
F
i
h
i
(%) H
i
(%)
6 5 5 16,67% 16,67%
7 11 16 36,67% 53,33%
9 6 22 20% 73,33%
10 4 26 13,33% 86,67%
12 3 29 10% 96,67%
13 1 30 3,33% 100%
Total n=30 100%
Nota: Los valores de las frecuencias relativas hi y Hi, las presentamos en
trminos porcentuales, para lo cual hemos multiplicado cada valor por cien.
b) Interpretamos de acuerdo a la tabla de frecuencias:
f
5
: 3 alumnas del 3
ero
secundaria de la IE Teresa Gonzales de Fanning
aprenden a la semana 12 palabras en ingls.
h
6
: El 3,33% de las alumnas del 3
ero
secundaria de la IE Teresa Gonzales
de Fanning aprenden a la semana 13 palabras en ingls.
F
3
: 22 alumnas del 3
ero
secundaria de la IE Teresa Gonzales de Fanning
aprenden a la semana a lo ms 9 palabras en ingls.
H
2
: El 53,33% de las alumnas del 3
ero
secundaria de la IE Teresa Gonzales
de Fanning aprenden a la semana a lo ms 7 palabras en ingls.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
36
c) Elaboramos el grfico de barras respectivo
Fuente: Elaboracin propia.
5) El siguiente cuadro nos muestra a los alumnos del IV ciclo del Programa de
Licenciatura en Lenguas Extranjeras, segn el estado civil.
Estado civil f
i
Solteros 128
Casados 26
Divorciados 19
Viudos 4
Convivientes 13
a) Elabore la tabla de frecuencias respectiva.
b) Elabore un grfico de sectores.
Solucin:
a) Completamos la frecuencia relativa porcentual ya que se trata de una variable
0
2
4
6
8
10
12
6 7 9 10 12 13
A
l
u
m
n
a
s
Palabras en Ingls
Distribucin del nmero de palabras en ingls que aprenden a la
semana los alumnas del 3
Donde n es el tamao de la muestra y x son todos los valores que toma la muestra.
A la media aritmtica se la denomina tambin centro de gravedad de la distribucin.
2.1.1.1 Caractersticas de la media aritmtica
Es el estadgrafo de posicin ms importante.
La media aritmtica viene expresada en las mismas unidades que la variable.
En su clculo intervienen todos los valores de la distribucin.
Es el centro de gravedad de toda la distribucin, representando a todos los valores
observados.
Es nica y su significado es de fcil entendimiento.
Su principal inconveniente es que se ve afectada por los valores extremadamente
grandes o pequeos de la distribucin.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
53
2.1.1.2 Clculo de la media aritmtica.
- Para datos sin agrupar.
Ejemplo 1: Los pesos de seis profesores del Programa de Licenciatura de Lenguas
Extranjeras son: 84, 91, 72, 68, 87 y 78 kg. Hallar la media aritmtica de los pesos e
interpretar.
Solucin:
= 80
Interpretacin: El peso promedio de seis profesores de Lenguas Extranjeras es 80kg.
Ejemplo 2: Los puntajes obtenidos en 5 exmenes de estadstica de una clase son:
x
1
= 13; x
2
= 10; x
3
= 14; x
4
= 11; x
5
= 10. Halla el promedio de notas e
interpreta.
Solucin:
Interpretacin: El puntaje promedio de la clase en el curso de estadstica es 11.6 ptos.
- Para datos agrupados sin intervalos
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
54
Ejemplo 1: Los pesos de diez docentes expresados en kg se expresan en la siguiente
tabla. Hallar su media aritmtica e interpretar.
x
i
f
i
x
i
f
i
54 2 108
59 3 177
63 4 252
64 1 64
10 601
Interpretacin: El peso promedio de diez docentes es de 60,1 kg.
- Para datos agrupados con intervalos
x marca de clase
Si los datos estn agrupados en una tabla de frecuencia de variable continua, se
trabaja de la misma forma, pero haciendo uso del valor de la variable y el valor de la
marca de clase.
Ejemplo 1: La siguiente tabla muestran las notas obtenidas en el examen parcial de
Estadstica de un grupo de estudiantes del segundo ciclo de la Facultad de Educacin
de la UNMSM.
1 , 60
10
601
= = =
n
f x
X
i i
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
55
[L
i
L
s
) X f
i
00,0 03,5 01,75 6 10,50
03,5 - 07,0 05,25 13 68,25
07,0 10,5 08,75 14 122,50
10,5 14,0 12,25 12 147,00
14,0 17,5 15,75 7 110,25
n = 52 458,50
Solucin:
La media aritmtica ser:
Interpretacin: La nota promedio del grupo es de 08,82 puntos.
2.1.2 Mediana (Me).
Es el valor que divide a la distribucin en dos partes iguales; es decir, en un 50%
inferior y un 50% superior, cuando stos estn ordenados en forma ascendente o
descendente. Sin embargo, se recomienda ordenar los datos en forma ascendente.
La mediana se representa por Me y puede hallarse slo para variables cuantitativas.
2.1.2.1 Caractersticas de la mediana
- Como estadgrafo de posicin, le sigue en importancia y uso a la media.
Es fcil de calcular y es nica.
En la mediana solo influyen los valores centrales y es insensible a los valores
extremos u outliers.
En su determinacin no intervienen todos los valores de la variable.
La mediana no necesariamente ser un valor de los datos de la lista original.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
56
2.1.2.2 Clculo de la mediana.
Para datos sin agrupar.
Para calcular la mediana para datos sin agrupar, consideramos lo siguiente:
a) Ordenamos los datos de menor a mayor.
b) Cuando n es impar, hay un trmino central, que ser el valor de la mediana; es
decir, la mediana es la puntuacin central de la misma.
()
Si tenemos los valores: 2, 3, 4, 4, 5, 5, 5, 6, 6, entonces la Me= 5
c) Cuando n es par, hay dos trminos centrales
la mediana ser el
promedio de estos dos valores.
Si tenemos los valores: 7, 8, 9, 10, 11, 12, entonces la Me= 9.5, la cual es la semisuma
de 9 y 10, los cuales son los valores centrales.
Ejemplo 1: Dado las edades de 7 profesores 27, 30, 26, 24, 35, 25, 50 aos. Halla la
mediana e interpreta.
Solucin:
1 Ordenamos los datos en forma ascendente: 24, 25, 26, 27, 30, 35, 50.
2 Ubicamos el valor central: Me = 27
Interpretacin: El 50% inferior de los profesores tiene edades iguales o menores que 27
aos y el otro 50% superior tiene edades iguales o mayores a 27 aos.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
57
Ejemplo 2: Los siguientes datos corresponden a las calificaciones obtenidas por Peter
en el ciclo 2009-1 del curso de Gramtica: 12 13 08 10 10 14 14 18 11
19.
Solucin:
1. Ordenamos los datos: 08 10 10 11 12 13 14 14 18 19.
2. Como el nmero de datos es par, realizamos la semisuma de los valores centrales
Interpretacin: El 50% inferior de las calificaciones obtenidas por Peter en el curso de
Gramtica son menores o iguales a 12,5 puntos y el otro 50% superior de las
calificaciones son mayores o iguales a 12,5 puntos.
Para datos agrupados sin intervalos.
Si los datos estn agrupados en una tabla de frecuencias se procede de la siguiente
manera.
Ejemplo 1: De la tabla a continuacin, donde se muestran las edades de un grupo de
estudiantes del ltimo ciclo de la Facultad de Educacin de la UNMSM.
X
i
f
i
F
i
23 3 3
24 6 9
25 9 18
26 5 23
27 2 25
Total 25
Solucin
1 Se calcula la columna de frecuencias absolutas acumuladas. (F
i
)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
58
2 Luego, se encuentra la mitad del nmero total de datos, es decir se calcula
= 12,5
3 Se ubica F
j
que sea mayor o igual que
= 18
3 Se ubica F
j
que sea mayor o igual que
Interpretacin: El 50% de las edades son menores o iguales a 25 aos y el otro 50%
son mayores o iguales a 26 aos
Para datos agrupados con intervalos.
Esto se logra utilizando la siguiente frmula:
F
j
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
60
Donde:
- L
ij
: Lmite real inferior de la clase de la mediana
- n : Nmero total de observaciones.
- F
j-1
: Suma de todas las frecuencias simples que preceden a la clase de la mediana.
- f
j
: Frecuencia de la clase de la mediana
- C
j
: Amplitud de la clase de la mediana.
Veamos el siguiente ejemplo:
Ejemplo: Los datos siguientes corresponden a la consulta psicolgica de un grupo de
trabajadores de la EAP de Educacin de la UNMSM, clasificada segn edad.
GRUPO DE EDAD
(aos)
CASOS
f
i
F
i
15 25
25 35
35 45
45 55
55 65
65 y +
77
167
123
100
44
33
77
244
367
467
511
544
TOTAL 544
Solucin
1 Se calcula la frecuencia acumulada ( F
i
).
2 Se halla el valor de
= 272
3 A continuacin, se busca la F
j
inmediatamente superior a 272. En este caso dicha
frecuencia toma el valor de 367, lo cual nos indica que la mediana se encuentra en este
intervalo.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
61
4 Finalmente, se aplica la frmula:
Me = 35 + 10 272 244 = 35 + 2,3 = 37,3 aos
123
Interpretacin: El 50% inferior de las edades de los trabajadores son menores o iguales
a 37,3 aos y el otro 50% superior son mayores o iguales a 37,3 aos.
2.1.3 Moda (Mo)
La moda es el valor de la variable que ms veces se repite, y en consecuencia, en una
distribucin de frecuencias, es el valor de la variable que viene afectada por la mxima
frecuencia de la distribucin.
No obstante, la moda no siempre es nica, si hay dos se dice que se tiene una
distribucin bimodal, si hay dos o ms modas se dice que es multimodal. Pero
tambin puede suceder que la distribucin no tenga moda, en este caso se dice que la
distribucin es amodal.
2.1.3.1 Caractersticas de la Moda.
Su clculo es sencillo y no necesariamente es nica
Es de fcil interpretacin
Le sigue en importancia a la media y la mediana.
Es un estadgrafo muy til cuando los datos son de tipo cualitativos.
El clculo de la moda es independiente del valor de los datos.
La moda no se puede operar matemticamente.
2.1.3.2 Calculo de la Moda.
Para datos no agrupados
En las distribuciones sin agrupar, la obtencin de la moda es inmediata.
Ejemplo 1: Una muestra de las edades de la ltima promocin de graduados se
presenta en la siguiente tabla:
26 20 25 21 22 26 25 20 22 28
30 22 23 22 24 28 24 26 24 22
20 22 21 26 21 22 22 31 28 26
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
62
A simple vista, el valor que ms se repite es 22 aos por lo que ste es el valor modal,
es decir, 22 aos.
En este caso hay un solo valor modal.
Ejemplo 2: Los puntajes alcanzados en un instituto de idiomas, en una escala de 100
puntos, en exmenes finales se presentan en la siguiente tabla:
71 68 70 55 57 57 85 68 45 68
36 51 57 68 40 76 49 39 57 25
Aqu observamos que los puntajes que ms se repiten son el 57 y el 68, con una
frecuencia de 4 puntajes, por lo que el conjunto de datos tiene 2 modas, es decir: 57
puntos y 68 puntos.
Cuando un conjunto de datos tiene dos modas, como en este caso, se llama bimodal.
Para datos agrupados
Primer caso: Datos de variable discreta agrupados sin intervalos.
En este caso la moda corresponde al valor de la variable que tiene la frecuencia ms
alta
Ejemplo1: Una muestra del nmero de libros de ingls que vende por semana un
distribuidor se presenta en la siguiente tabla:
N de Libros Semana
0 1
1 3
2 5
3 12
4 19
5 16
6 10
Ms de 6 4
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
63
La ms alta frecuencia corresponde a la quinta clase, por lo tanto la moda es 4, lo que
quiere decir, que la distribucin es unimodal, pues presenta una sola moda.
Interpretacin: El volumen de venta ms frecuente es de 4 libros por semana
Segundo caso: Datos de variable cualitativa.
Ejemplo 1: Se pregunt a un grupo de docentes de un instituto de idiomas, escogidos al
azar, por la marca de celular que utilizan y el resultado se presenta en la siguiente
tabla:
Marca de
Celular
N de docentes
BlackBerry 20
Motorola 12
L. G. 14
Nokia 27
iPhone 10
Samsung 23
La ms alta frecuencia corresponde a la marca Nokia, por lo tanto, esta es la moda.
Interpretacin: La marca de celular ms frecuente que utilizan el grupo de docentes del
instituto de idiomas, es Nokia
Tercer caso: Datos de variable discreta o continua agrupados con intervalos.
Se utiliza la siguiente expresin:
)
Donde: d
1
= |
| d
2
= |
|
j : Nmero de la clase que tiene la mayor frecuencia (f
j
).
L
ij
: Lmite inferior de la clase modal.
C
j
: Amplitud del intervalo de clase.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
64
Ejemplo: Se muestra en la siguiente tabla, los salarios mensuales del personal
administrativo de la I.E Virgen del Carmen
K Sueldo: [LI
i
Ls
i
) f
i
1 [400 500) 2
2 [500 600) 8
3 [600 700) 4
4 [700 800) 10
5 [800 900] 6
Solucin:
)
Donde: d
1
= |
| d
2
= |
|
j = 4 [700 800) L
ij
= 700 C
j
= 100
= f
4
= 10 ;
= f
3
= 4 ;
f
5
= 6
d
1
= | | = 6 d
2
= | | = 4
Luego: (
)
Interpretacin: La mayor parte de trabajadores administrativos de la I.E Virgen del
Carmen tiene un sueldo mensual de 760 nuevos soles aproximadamente.
2.2 Medidas de posicin no central ( Cuantiles )
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor,
dividen a la distribucin en partes iguales, de tal manera que cada una de ellas
contiene el mismo nmero de frecuencias.
Los cuantiles ms conocidos son: cuartiles, deciles y percentiles.
2.2.1 Cuartiles (Q
k
)
Son valores de la variable que dividen a la distribucin en cuatro partes iguales, cada
una de las cuales engloba el 25 % de las mismas.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
65
Estos valores corresponden a:
- Primer cuartil o Q
1
: Es el valor por debajo del cual se encuentran la cuarta parte de
los datos o 25% de los datos cuando estn ordenados de menor a mayor.
- Segundo cuartil o Q
2
: Es el valor por debajo del cual se encuentran la mitad de los
datos o 50% de los datos cuando estn ordenados de menor a mayor, es decir, es
el mismo valor que la mediana. (Q
2
= Me)
- Tercer cuartil o Q
3
: Es el valor por debajo del cual se encuentran las tres cuartas
partes de los datos o 75% de los datos cuando estn ordenados de menor a mayor
Clculo de cuartiles
Para datos no agrupados
Cuando los datos no estn agrupados la posicin de cualquier cuartil, cuando los datos
estn ordenados de menor a mayor, se calcula con la siguiente expresin:
()
Esto significa la posicin que ocupa el cuartil cuando los datos estn ordenados de
menor a mayor, de tal manera que Q
i
corresponde a Q
1
= 25, Q
2
= 50, o Q
3
= 75.
Ejemplo: La tabla a continuacin muestra la cantidad de casos atendidos por mesa de
partes en la I.E. Julio C. Tello
Febrero Marzo Abril Mayo Junio Julio Agosto Setiembre Octubre Noviembre Diciembre
15 5 20 10 23 8 3 13 18 28 32
Mediana
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
66
Solucin:
1 Ordenamos de menor a mayor.
3 5 8 10 13 15 18 20 23 28 32
Q
1
Q
2
Q
3
2 Como se puede observar los nmeros 8, 15 y 23 dividen el conjunto en cuatro partes
iguales. Estos valores reciben, respectivamente, los nombres de Primer Cuartil,
Segundo Cuartil y Tercer Cuartil.
Interpretacin: En la distribucin anterior, el cuartil Q
2
= 15 representa el 50% de los
casos atendidos por mesa de partes.
2.2.2 Deciles (D
k
)
Son los valores de la variable que dividen a la distribucin en diez partes iguales, cada
una de las cuales engloba el 10 % de los datos. En total habr nueve deciles. (Q
2
= D
5
= Me)
2.2.3 Percentiles (P
k
)
Son los valores que dividen a la distribucin en cien partes iguales, cada una de las
cuales engloba el 1 % de las observaciones. En total habr noventa y nueve
percentiles. (Q
2
= D
5
= Me = P
50
)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
67
Clculo de cuantiles.
Para calcular los cuartiles, deciles y percentiles se sugiere seguir los siguientes pasos:
Para datos No Agrupados:
Paso 1:
Primero se ordenan de menor a mayor los n datos.
Calcular el valor:
Si A es entero, entonces el percentil k corresponde al valor medio de las observaciones
ubicadas en las posiciones A y A+1.
Si A no es un entero, el percentil k corresponde a la observacin ubicada en la posicin
entera siguiente, es decir, [A+1]
Ejemplo: Determinar los percentiles 25 y 60 de los siguientes datos: 3, 5, 5, 8, 12, 15,
21, 23, 25, 26, 29, 35
Solucin
Para P
25
: A=
()()
= 3
Aqu, resulta un entero, por tanto el P
25
corresponde al promedio de las observaciones
en las posiciones 3 y 4, es decir, P
25
=
()
= 6,5
Para P
60
: A =
()()
= 7,2
En este caso A no es un entero, nos movemos al entero siguiente, es decir, a la octava
posicin, por lo tanto el percentil 60 ser el valor asociado a dicha posicin.
P
60
= 23 (observacin en la 8 posicin).
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
68
2.3 Medidas de Dispersin.
Las medidas de dispersin tratan de medir el grado de dispersin que tiene una
variable estadstica en torno a una medida de posicin o de tendencia central,
indicndonos lo representativa que es la medida de posicin. A mayor dispersin
menor representatividad de la medida de posicin y viceversa.
2.3.1 Medidas de Dispersin Absoluta.
Son aquellas que se expresan en unidades de la variable, siendo las ms usadas:
Rango o Amplitud, Varianza, Desviacin Estndar llamada tambin Desviacin Tpica,
y Rango Intercuartlico.
2.3.1.1 Rango o amplitud.
Se define como la diferencia entre el mximo y el mnimo valor de la variable:
R = Valor mximo Valor mnimo
2.3.1.1.1 Caractersticas del rango.
- Es fcil de entender, calcular y sus unidades son las mismas que las de la
variable
- No utiliza todas las observaciones (slo dos de ellas);
- Se puede ver muy afectada por alguna observacin extrema;
- No se puede calcular con distribuciones de frecuencia que tienen clases de
extremo abierto.
Ejemplo 1: En la siguiente tabla se muestran liquidaciones recibidas por cuatro
docentes en dos institutos de idiomas A y B
A 100 120 350 370
B 225 230 240 245
R
(A)
= 370 100= 270
R
(B)
= 245 225= 20: Distribucin menos dispersa
Interpretacin: El instituto de idiomas B muestra una amplitud menos dispersa en
relacin al instituto A.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
69
Ejemplo 2: El ingreso mensual de 4 profesores de estadstica, contratados en un
colegio particular son 424 nuevos soles, 424.50 nuevos soles, 424 nuevos soles y
423.50 nuevos soles.
Solucin:
R = 424.50 423.50 = 1
Interpretacin: Los datos tienen un rango o amplitud igual a 1. Es decir es una
muestra homognea.
2.3.1.2 Varianza (S
2
)
La varianza mide la mayor o menor dispersin de los valores de la variable respecto a
la media aritmtica. Cuanto mayor sea la varianza mayor dispersin existir y por tanto
menor representatividad tendr la media aritmtica.
La varianza se expresa en las mismas unidades que la variable analizada, pero
elevadas al cuadrado.
La varianza se representa por S
2
.
)
=
Caractersticas de la varianza
- La varianza siempre es un valor no negativo, que puede ser igual o distinta de 0.
- La varianza es la medida de dispersin cuadrtica ptima.
Ejemplo 1: Los datos corresponden a la estatura de 5 profesores 1.70, 1.64, 1.60, 1.62,
1.64. Halla la varianza e interpreta.
Solucin:
1 Necesitamos el valor de la media aritmtica.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
70
Luego, la varianza estar dado por:
( )
( )
( )
( )
( )
()
()
()
()
()
Interpretacin: Las estaturas de los profesores se dispersan en promedio 0.00112 m
2
,
con respecto al valor central.
2.3.1.3 Desviacin estndar (S)
Conocida tambin como desviacin tpica, se define como la raz cuadrada con signo
positivo de la varianza.
Ejemplo 1: El tiempo que utilizan 6 nios de igual edad para desarrollar la misma tarea
es 16, 12, 15, 18, 13, 14 minutos. Halla la desviacin estndar o tpica.
Solucin:
1
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
71
2 Hallamos
( )
( )
( )
( )
( )
( )
()
()
()
()
()
()
Interpretacin: El tiempo utilizado por los nios para desarrollar las tareas se dispersa
en promedio 1.97 minutos con respecto al valor central.
Ejemplo 2: En la tabla se muestra el nmero de nios por familia en un grupo de veinte
familias. El nmero promedio de hijos por familia es 2,9. Encontrar la desviacin
estndar e interpretarla.
Nmero de nios
por familia (x
i
)
f
i
x
i
2
f
i
1 3 3
2 4 16
3 8 72
4 2 32
5 3 75
Solucin:
Calculamos la desviacin estndar de acuerdo a la siguiente frmula:
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
72
()
S= 1,22
Interpretacin: El promedio de hijos por familia se dispersa en 1,22 con respecto al
valor central.
2.3.1.4 Rango Intercuartlico (IQR)
Resulta de la diferencia que existe entre los cuartiles Q
3
y Q
1
, por lo tanto es el
intervalo que contiene el 50% central de los datos.
IQR = Q
3
Q
1
Se usa como medida de dispersin cuando se ha empleado la mediana como medida
de posicin.
Ejemplo 1: El curso de Gramtica se dicta en 2 grupos, se desea determinar la
dispersin del rendimiento en este curso a partir de la siguiente informacin:
TURNO Q
1
Q
3
Maana 12.3 22.7
Tarde 15.6 21.6
Calcula el rango intercuartlico para ambos turnos e interpreta.
Solucin:
Turno Maana:
1 IQR
M
= Q
3
Q
1
2 IQR
M
= 22.7 12.3
3 IQR
M
= 10.4
Turno Tarde:
1 IQR
T
= Q
3
Q
1
2 IQR
T
= 21.6 15.6
3 IQR
T
= 6
Interpretacin: El grupo que tiene rendimiento ms homogneo con respecto a la
mediana es el turno de la noche por tener menor rango intercuartlico.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
73
2.3.2 Medidas de Dispersin Relativa.
Son aquellas que no se expresan en unidades de la variable, siendo la ms usada, el
Coeficiente de Variacin.
2.3.2.1 Coeficiente de variacin.
Resulta del cociente entre la desviacin tpica y la media aritmtica, es decir:
CV
x
=
Este coeficiente se suele multiplicar por cien para expresarlo en porcentaje. Cuanto
mayor sea el coeficiente de variacin, mayor ser la dispersin de los datos.
Caractersticas del coeficiente de variacin
- Cuando CVx < CVy significa que X es ms representativa que Y, o que la
media de X representa mejor a su distribucin, que la media de Y a la suya.
- Se considera que la dispersin es ptima si CVx es igual o menor que 0,3.
- Se puede expresar sin considerar la unidad de la variable.
- Compara la dispersin de datos de variables diferentes.
- No es recomendable calcular cuando la media tiende al valor cero o variables
con valores negativos.
Ejemplo: En la siguiente tabla, se recogen los puntos conseguidos por dos jugadores
de baloncesto en los ltimos siete partidos. Calcula el coeficiente de variacin y analiza
la dispersin de los puntos.
Jugador A 20 22 30 21 20 24 22
Jugador B 32 28 34 28 20 10 12
Jugador A
= 21,29
S = 1,39
CV
A
= 0,07 = 7%
Jugador B
= 23,43
S = 8,86
CV
B
= 0,38 = 38%
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
74
Interpretacin:
El jugador B tiene una media superior al jugador A, pero es mucho ms irregular.
El jugador B tiene un CV
x
de 38%, mientras que el A lo tiene del 7%
Ejemplo 2: En un grupo, A, de personas, la estatura media es 165 cm, con una
desviacin tpica de 10,5 cm. En otro grupo, B, la estatura media es 140 cm y su
desviacin tpica, 8,4 cm. Calcula el coeficiente de variacin en los dos casos y
compara la dispersin de ambos grupos.
Solucin:
Grupo A
= 165 cm
S = 10,5 cm
CV
A
= 0,0636 = 6,36 %
Grupo B
= 140 cm
S = 8,4 cm
CV
B
= 0,06 = 6 %
Interpretacin: La dispersin es mayor en el grupo A.
2.4 Medidas de Forma.
Hasta ahora, hemos estado analizando y estudiando la dispersin de una
distribucin, pero parece evidente que necesitamos conocer ms sobre el
comportamiento de una distribucin. En esta parte, analizaremos las medidas de
forma, las cuales nos permiten comprobar si una distribucin de frecuencias tiene
determinadas caractersticas especiales, el nivel de concentracin de datos, etc.
Asimismo, las medidas de forma son indicadores estadsticos que permiten
identificar si una distribucin de frecuencias presenta uniformidad.
2.4.1 Coeficiente de Asimetras o Sesgo de Pearson.
El objetivo de la medida de la asimetra es, sin necesidad de dibujar la distribucin
de frecuencias, estudiar la deformacin horizontal de los valores de la variable
respecto al valor central de la media. Estas medidas de forma pretenden estudiar
la concentracin de la variable hacia uno de sus extremos.
Una distribucin es simtrica si a la derecha y a la izquierda de la media existe el
mismo nmero de valores, equidistantes dos a dos de la media, y adems con la
misma frecuencia. Asimismo, para hacer uso del coeficiente de asimetra la
distribucin debe ser unimodal.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
75
Una distribucin es Simtrica si = Me = Mo
En caso contrario, decimos que la distribucin es Asimtrica, y entonces puede
ser de dos tipos:
Asimtrica a la izquierda. Es el caso en que Mo Me x
Curva Asimtrica a la izquierda o Asimetra negativa.
Asimtrica a la derecha. Es el caso en que Mo Me x
Curva Asimtrica a la derecha o Asimetra Positiva.
- Calculo del Coeficiente de asimetra de Pearson
La medida obtenida depende de las unidades que en cada caso se usen, por lo
que, para comparar la asimetra de dos o ms curvas, es necesario estandarizar
los sesgos, obtenindose la siguiente frmula:
- Primer coeficiente de asimetra:
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
76
Si A
1
> 0, la asimetra de la distribucin de frecuencias es positiva.
Si A
1
= 0, la distribucin de frecuencias es simtrica.
Si A
1
< 0, a asimetra de la distribucin de frecuencias es negativa
En distribuciones que no son muy asimtricas se cumple la siguiente relacin:
Moda = 3(media mediana)
- Segundo coeficiente de asimetra
Si A
2
> 0, la asimetra de la distribucin de frecuencias es positiva
Si A
2
= 0, la distribucin de frecuencias es simtrica.
Si A
2
< 0, la asimetra de la distribucin de frecuencias es negativa.
- Tercer coeficiente de asimetria
Si A
3
> 0, la asimetra de la distribucin de frecuencias es positiva
Si A
3
= 0, la distribucin de frecuencias es simtrica.
Si A
3
< 0, la asimetra de la distribucin de frecuencias es negativa.
Ejemplo: Para la variable edad de los estudiantes del Programa de Lenguas
Extranjeras, se obtuvieron los valores de las siguientes medidas: =40,1; Me
=38,75; Mo =37,4 y S =9,915. Calcular el coeficiente de asimetra
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
77
Solucin:
Haciendo uso del segundo coeficiente de asimetra:
=
()
0,4085
Interpretacin: La distribucin de las edades presenta una moderada asimtrica
positiva.
2.4.2 Diagrama de caja.
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una
presentacin visual que describe varias caractersticas importantes, al mismo
tiempo, tales como la dispersin y simetra. Para su realizacin se representan los
tres cuartiles y los valores mnimo y mximo de los datos, sobre un rectngulo,
alineado horizontal o verticalmente.
- Construccin del diagrama de caja.
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms
largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relacin con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mnimo y mximo de la variable. Las lneas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que
cualquier dato o caso que no se encuentre dentro de este rango es marcado e
identificado individualmente.
Por ejemplo: En la siguiente tabla mostramos las edades de un grupo de 20
docentes:
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
Solucin
1 Ordenamos la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
78
2 Calculamos los cuartiles
Q
1
, el cuartil Primero es el valor mayor que el 25% de los valores de la
distribucin. Como n = 20 resulta que n/4 = 5; el primer cuartil es la semisuma de
dicho valor y el siguiente:
Q
1
=
= 24,5
Q
2
, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor
de la variable que ocupa el lugar central en un conjunto de datos ordenados.
Como
= 33,5
Q
3
, el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la
distribucin. En nuestro caso, como
= 15, resulta
Q
2
=
= 39
3 Dibujamos la grfica
El bigote de la izquierda representa al colectivo de edades ( X
mn
, Q
1
)
La primera parte de la caja a (Q
1
, Q
2
),
La segunda parte de la caja a (Q
2
, Q
3
)
El bigote de la derecha viene dado por (Q
3
, X
mx
).
Interpretacin:
- La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir
que las edades comprendidas entre el 25% y el 50% de la poblacin est ms
dispersa que entre el 50% y el 75%.
- El bigote de la izquierda (Xmm, Q
1
) es ms corto que el de la derecha; por ello
el 25% de los ms jvenes estn ms concentrados que el 25% de los
mayores.
- El rango intercuartlico = Q
3
- Q
1
= 14,5; es decir, representa el 50% central de
los datos.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
79
Ejercicios resueltos.
1) La profesora Jessica decide comparar las notas obtenidas en el examen final
del curso de ingls entre dos grupos de estudiantes, obtenindose los
siguientes datos:
Grupo A 16 11 08 12 15 16 18 16
Grupo B 14 17 16 18 08 08 12 19
a) Halla el promedio de cada grupo e interpreta.
b) Calcula la mediana de cada grupo e interpreta.
c) Halla la moda de cada grupo e interpreta.
d) De acuerdo a los estadgrafos estimados cul sera tus conclusiones.
Fundamenta tu respuesta.
Solucin:
a) El promedio del grupo A.
Interpretacin: El promedio de las notas obtenidas en el examen final del
curso de ingls por el grupo A es de 14 puntos.
El promedio del grupo B
=
Interpretacin: El promedio de las notas obtenidas en el examen final del
curso de ingls por el grupo B es de 14 puntos.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
80
b) Para calcular la mediana de ambos grupos ordenamos los datos en forma
ascendente.
Como el nmero de datos es par, la mediana es el resultado de la
semisuma de los valores centrales.
Mediana para el grupo A:
Me
A
= 8 11 12 15 16 16 16 18
Me
A
= 15,5
Interpretacin: El 50% inferior de los estudiantes del grupo A obtuvieron
notas iguales o menores a 15,5 puntos y el otro 50% superior obtuvieron
notas iguales o mayores a 15,5 puntos en el examen final del curso de
ingls.
Mediana para el grupo B:
Me
B
= 8 8 12 14 16 17 18 19
Me
B
Interpretacin: El 50% inferior de los estudiantes del grupo B obtuvieron
notas iguales o menores a 15 puntos y el otro 50% superior obtuvieron
notas iguales o mayores a 15 puntos en el examen final del curso de ingls.
c) La moda es el valor que se repite con mayor frecuencia:
Grupo A:
= 16
Interpretacin: La nota ms frecuente en el grupo A es 16 puntos en el
examen final del curso de ingls.
Grupo B:
= 08
Interpretacin: La nota ms frecuente en el grupo B es 08 puntos en el
examen final del curso de ingls.
2) Se ha realizado un estudio sobre el nmero de veces que un grupo de alumnos
del PROLEX han asistido a la biblioteca durante el mes de enero del 2012,
obtenindose los siguientes datos:
x
i
0 1 2 3 4 5
f
i
4 12 10 18 9 7
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
81
a) Calcula la media aritmtica e interpreta el resultado
b) Halla la mediana e interpreta el resultado.
c) Determina la moda e interpreta el resultado.
Solucin:
a) Hallamos la media aritmtica
Interpretacin: Los alumnos de PROLEX han asistido en promedio 2,62
veces a la biblioteca durante el mes de enero del 2012.
b) Hallamos la mediana, para lo cual procedemos de la siguiente manera:
- Completar
- Calcular
- Ubicamos un f
i
en nuestro caso la
4ta clase.
- La mediana es el valor asociado a f
i
.
Interpretacin: El 50% inferior de los estudiantes asisti a la biblioteca 3 o
menos veces a la biblioteca y el otro 50% superior asisti 3 o ms veces a
la biblioteca.
0 4 0
1 12 12
2 10 20
3 18 54
4 9 36
5 7 35
Total 60 157
0 4 4
1 12 16
2 10 26
3 18 44
4 9 53
5 7 60
n=60
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
82
c) La moda es el valor asociado a la ms alta frecuencia
En nuestro caso
Interpretacin: La mayora de los alumnos del PROLEX han asistido tres
veces a la biblioteca durante el mes de enero del 2012.
3) En familia del profesor Gmez, el salario mensual del padre es de S/. 800 y el
salario de la madre es de S/. 1500. En la familia del profesor Prez, el padre
gana S/. 1860 y la madre S/. 540. Cul es el rango en cada familia? En cul
de ellas es mayor la dispersin?
Solucin:
R
Gmez
= 1500 900= 600
R
Prez
= 1860 540 = 1320
Hay mayor dispersin en la familia del profesor Prez, tambin se puede
decir, que la familia Gmez presenta mayor homogeneidad en los salarios.
4) El profesor de Educacin Fsica de la I.E. Mara de Los ngeles duda entre
seleccionar a Elena o Mara para el equipo de bsquet. El puntaje conseguido
por cada una, en una semana de entrenamiento, fueron los siguientes:
Elena 18 23 22 24 19 25 16
Mara 18 26 18 28 22 17 18
Calcula la desviacin estndar y analiza cul de las dos es ms regular.
Solucin
a) Para Elena
Elena
=
= 21
Elena
=
= 3,11
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
83
b) Para Mara
Mara
=
= 21
Mara
=
= 4,105
Es ms regular Elena porque la dispersin de datos es menor.
5) Segn los datos de una encuesta realizada entre estudiantes de Lenguas
Extranjeras de la UNMSM, la estatura media de dichos estudiantes es de
167,67 cm con una desviacin de 8,49 cm y el peso medio es de 61,61 kg. con
una desviacin de 11,27 kg. Cul de las dos variables presenta mayor
dispersin en torno a su media?
()
- El evento de obtener un nmero primo es, B = {2, 3, 5}
()
- El evento de obtener un nmero mayor que 6 es, C = { }
()
- El evento de obtener un nmero menor que 7 es, D = { 1, 2, 3, 4, 5, 6}
()
3.1.5 Propiedades de las probabilidades
Las propiedades fundamentales de las probabilidades son tres:
a) La probabilidad es un nmero positivo menor o igual a uno.
0 s P(A) s 1
Adems:
P(A) = 0 , si A = { } Probabilidad nula
P(A) = 1, si A = O Probabilidad segura
b) La probabilidad que no ocurra un evento es igual a uno menos la probabilidad
que si ocurra el evento.
P(no A ) = 1 P(A)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
95
c) La probabilidad que ocurra al menos unos de dos eventos, es igual a la suma
de las probabilidades de esos eventos, menos la probabilidad que si ocurran
los dos eventos a la vez.
( ) ( ) ( ) ( ) B A P B P A P B A P + =
Ejemplo 1: En una bolsa hay 3 bolas verdes y cuatro amarillas. Cul es la
probabilidad de sacar una bola azul?
Solucin:
()
No hay ninguna probabilidad de sacar una bola azul. A esto lo llamaremos:
Probabilidad imposible o nula.
Ejemplo 2: En una bolsa hay 15 bolas verdes Cul es la probabilidad de sacar
una verde?
Solucin:
()
En este caso existe cien por ciento de certeza que el suceso ocurra. Es una
Probabilidad segura.
Ejemplo 3: Una carta es escogida al azar desde un paquete ordinario de cartas.
Hallar la probabilidad de no obtener un siete.
Solucin:
Sea el suceso A = obtener un siete, entonces:
P (obtener un siete) = P (A) =
Nos piden: P (no obtener un siete) = P (A), aplicando la propiedad
P (A) = 1 P
(A) =
Interpretacin: Existe un 92% de probabilidades de no obtener un siete.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
96
Ejemplo 4: La probabilidad de que un alumno apruebe matemtica es de 0,6, de
que apruebe comunicacin es 0,5 y de que apruebe las dos asignaturas es 0,3.
Se elige un alumno al azar, calcule la probabilidad de que apruebe al menos una
asignatura.
Solucin:
Definimos los eventos y las probabilidades correspondientes:
A = Aprobar matemtica P (A) = 0,6
B = Aprobar comunicacin P (B) = 0,5
A
B) =
0,3
A
M) = 0
Cuando esto sucede, se dice que estos eventos son mutuamente excluyentes,
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
97
es decir, que ambos eventos no pueden ocurrir al mismo tiempo.
Nos estn pidiendo: J
M)
P(J
= 0,15 = 12,5%
D = {(CC,P),(C,P,C),(P,C,C)}
Entonces: P(D) =
3
= 0,375= 37,5%
F = {(CC,C),(C,C,P),(C,P,C),(P,C,C)}
Entonces: P(F) =
4
= 0,50 = 50
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
107
c) Realizamos las operaciones respectivas
(AD) = {(C,C,C),(C,C,P),(C,P,C),(P,C,C)}
Entonces: P(AD) =
4
= 0,50 = 50%
(DF) = {(C,C,P),(C,P,C),(P,C,C)}
Entonces: P(DF) =
3
= 0,375 = 37,5%
3) En un grupo del Programa de Lenguas Extranjeras de la UNMSM hay 10
alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un da
asisten 45 alumnos, encontrar la probabilidad de que un alumno:
a) Sea hombre.
b) Sea mujer morena.
c) Sea hombre o mujer.
Solucin:
a) Sea hombre.
()
b) Sea mujer morena.
()
= 0,8 = 80 %
c) Sea hombre o mujer.
() = 100 %
4) Un estudio realizado en una institucin educativa sobre problemas visuales,
detect que el 14% de los alumnos tena miopa, el 18% presentaba
astigmatismo y el 5% ambos problemas. Si se escoge un alumno al azar,
calcula la probabilidad de que:
a) Tenga miopa o astigmatismo o ambos problemas.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
108
b) No sufra de astigmatismo.
c) Padezca solamente miopa.
d) No tenga estas enfermedades.
e) Presente miopa, sabiendo que sufre. astigmatismo
Solucin:
Definimos los eventos:
A: Alumno con miopa.
B: Alumno con astigmatismo.
Las probabilidades dados en el problema son:
P(A) = 0,14
P(B) = 0,1
P(AB) = 0,05
a) Nos estn pidiendo P(AB), aplicamos la siguiente propiedad:
P(AB) = P(A) P(B) P(AB)
Sustituyendo los valores:
P(AB) = 0,14 0,1 0,05 = 0,7
Por lo tanto la probabilidad de tener miopa o astigmatismo o ambos problemas es
del 27%.
b) Nos piden P(B), empleamos la propiedad del evento complementario:
P(B) = 1 P(B)
Remplazando valores:
P(B) = 1 0,1 = 0,
En consecuencia la probabilidad de no tener astigmatismo es del 82%
c) Debemos calcular la P(A - B), usamos la propiedad del evento diferencia:
P(A B) = P(A) P(AB)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
109
Sustituyendo los valores:
P(A B) = 0,14 0,05 = 0,0
Luego la probabilidad de padecer nicamente miopa es del 9%
d) De manera similar al ejercicio b, pero para la unin de eventos, realizamos lo
siguiente:
P(AB) = 1 P(AB)
Sustituyendo los valores: P(AB) = 1 - 0,7 = 0,73
Entonces la probabilidad de no sufrir estos problemas es del 73%
e) Ahora nos piden la P(AB), utilizando probabilidad condicional:
( )
( )
( )
28 , 0
18 , 0
05 , 0
/ = = =
B P
B A P
B A P
Luego, la probabilidad de padecer miopa sabiendo que se tiene astigmatismo es
del 28%.
5) En una encuesta realizada entre alumnos del Programa de Licenciatura de
Lenguas Extranjeras de la U.N.M.S.M. se obtuvo los siguientes datos acerca
del motivo de su eleccin de la Universidad para estudiar dicha profesin:
Prestigio Costo Otros
Hombres 420 395 75
Mujeres 400 530 50
Si se elige un alumno al azar:
a) Cul es la probabilidad de que sea mujer?
b) Determina la probabilidad de que el motivo de su eleccin haya sido por el
prestigio.
c) Cul es la probabilidad de que sea hombre y el motivo el costo?
d) Si el alumno es mujer, cul es la probabilidad de que el prestigio de la
Universidad sea el motivo de su eleccin?
e) Cul es la probabilidad de que el alumno sea hombre, si se sabe que el
motivo de su eleccin fue el costo?
f) Calcula la probabilidad de que sea mujer o que otros fueron los motivos de su
eleccin.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
110
Solucin:
Colocamos los totales en la tabla:
a) Tenemos que hallar la P(mujer):
P(mujer) =
0
170
= 0,541 = 5,41
b) Nos piden calcular la P(prestigio):
P(prestigio) =
0
170
= 0,435 = 43,5
c) Se pide la P(hombre costo):
P(hombre costo) =
35
170
= 0,11 = 1,1
d) Debemos calcular la P(prestigiomujer), aplicamos la probabilidad condicional:
P(prestigiomujer) =
P(prestigio mujer)
P(mujer)
=
400
170
0
170
= 0,40 = 40,
e) Igual que el ejercicio anterior se debe encontrar la P(hombrecosto):
P(hombrecosto) =
P(hombre costo)
P(costo)
=
35
170
5
170
= 0,470 = 4,70
f) Ahora nos piden la P(mujer otros), utilizamos la propiedad de unin de
eventos:
P(mujer otros) = P(mujer) P(otros) P(mujer otros)
=
0
170
15
170
50
170
=
1055
170
= 0,564 = 56,4
Prestigio Costo Otros Total
Hombres 420 395 75 890
Mujeres 400 530 50 980
Total 820 925 125 1870
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
111
Ejercicios propuestos.
1) En un grupo de 30 estudiantes del Programa de Lenguas Extranjeras de la
UNMSM estudian al menos de una de las siguientes materias: Lgica o
Estadstica: 20 asisten a Lgica, 21 a Estadstica. Encontrar la probabilidad de
que un estudiante escogido al azar estudie ambos cursos.
2) Se quiere seleccionar por sorteo a un comit conformado por 4 miembros para
elaborar las actividades extraescolares en la institucin educativa San Mateo
Apstol entre los 10 profesores y los 5 alumnos. Halla la probabilidad de que
dicho comit incluya:
a) Dos profesores y dos alumnos
b) Un alumno.
3) Un estudiante de la Facultad de Educacin hace dos pruebas en un mismo da.
La probabilidad de que supere la primera es de un 60%, la de que supere la
segunda, de un 80% y la de que supere las dos, de un 50%. Calcula:
a) La probabilidad de que supere, al menos, una de las pruebas.
b) La probabilidad de que no supere ninguna prueba.
4) En una reunin hay 50 ex alumnos, de los cuales 20 hablan francs y 40
ingls.
a) Cul es la probabilidad de que eligiendo a un conferenciante al azar slo
hable ingls?
b) Y la de que hable francs?
c) Y la de que hable ingls y alemn?
d) Cul es la probabilidad de que dos miembros elegidos al azar no puedan
entenderse?
5) Un grupo de alumnos del PROLEX est formada por 10 hombres y 10 mujeres,
la mitad de las mujeres y la mitad de los hombres han elegido francs como
asignatura optativa.
a) Cul es la probabilidad de que una persona elegida al azar sea hombre o
estudie francs?
b) Y la probabilidad de que sea mujer y no estudie francs?
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
112
Autoevaluacin de la unidad 3.
1) La probabilidad de un evento seguro toma valor igual a:
a) 1,00
b) 0,344
c) 0,00
d) 0,75
e) 0,10
2) La probabilidad de un evento puede tomar valor igual a:
a) 2,478
b) 0,344
c) 5,44
d) 10,25
e) 1,01
3) Un estudio realizado a docentes de la especialidad de ingls del nivel
secundario de la UGEL 05 reporta que el 20 % prefiere radio Oxigeno y un
30 % prefiere radio Miraflores y un 40% escucha Oxigeno o Miraflores. Si se
elige al azar un docente de la poblacin, cul es la probabilidad de escuche
ambas radios.
a) 12%
b) 10%
c) 16%
d) 18 %
e) 40%
4) A un congreso internacional de Educacin asisten 40 mujeres, de las que 10
hablan francs, y 30 hombres de los que 4 hablan francs. Se elige un
congresista al azar, calcula la probabilidad de que sea mujer o hable francs.
a) 0,68
b) 0,40
c) 0,63
d) 0,60
e) 0,50
5) Las probabilidades de que un hombre y una mujer de 40 aos vivan hasta los
75 son 0,49 y 0,53, respectivamente. Halla la probabilidad de que ninguno
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
113
llegue a los 75 aos.
a) 0,30
b) 0,20
c) 0,26
d) 0,24
e) 0,10
6) En una institucin educativa, 22 de cada 100 chicas y 5 de cada 10 chicos
llevan lentes. Si el nmero de chicas es tres veces superior al de los chicos,
hallar la probabilidad de que un estudiante elegido al azar sea chica, sabiendo
que lleva lentes.
a) 0,57%
b) 0,50%
c) 0,60%
d) 0,54%
e) 0,55%
7) El departamento de seleccin de personal de la Facultad de Educacin
entrevista a 65 docentes para el dictado del curso de Estadstica Aplicada a la
Educacin en el Programa de Lenguas Extranjeras, de los cuales 35 de ellos
poseen experiencia laboral previa y 40 disponen de un ttulo universitario.
Cul es la probabilidad de que se elija a un docente que tenga experiencia
laboral y un ttulo universitario?
a) 15,38%
b) 18,53%
c) 16,23%
d) 23,18%
e) 14,92%
8) Las estadsticas deportivas en vley entre los equipos de la UNMSM y la UNI
son las siguientes: el 25% de las veces ha ganado el equipo de la UNMSM; el
45% de las veces ha ganado la UNI, y el 30% han empatado. En el prximo
torneo van a enfrentarse en tres ocasiones. Cul es la probabilidad de que el
equipo de la UNMSM gane los tres partidos?
a) 2,56%
b) 3,56%
c) 4,24%
d) 1,56%
e) 2,32%
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
114
9) En un aula con 24 estudiantes de 1 de secundaria, los profesores de
Matemticas, Comunicacin e Ingls piden cada da al azar los cuadernos a
algunos alumnos para revisarlos. El de Matemtica a 4 alumnos, el de Lengua
a 6, y el de Ingls a 8. Halla la probabilidad de que a un alumno concreto, en
un da, le pidan 2 cuadernos.
a) 16.08%
b) 13,82%
c) 15.21%
d) 17.46%
e) 18.06%
10) Completa la siguiente tabla de contingencia que muestra la distribucin de
tres secciones del 4 ao de una Institucin Educativa.
Alumnos Alumnas
A 30
B 60 100
C 78
100 232
Cul es la probabilidad de que, sabiendo que es alumna, corresponda a la
seccin C?
a) 32,32%
b) 36.36%
c) 35.64%
d) 34.21%
e) 33.42%
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
115
Lectura N 3
PRIMERAS DEFINICIONES Y TEOREMAS BSICOS.
Laplace, Pierre-Simon, Ensayo filosfico sobre las probabilidades
Traduccin de Pilar Castillo, Alianza editorial, 1985
El primero en dar la definicin clsica de probabilidad fue Jacob Bernoulli (16541705), matemtico
suizo que trabaj en la universidad de Basilea en 167, en su obra Ars conjectandi (El arte de la
conjetura) que fue publicada algunos aos despus de la muerte del autor. En esta obra
encontramos entre otras cosas la importante proposicin conocida como el Teorema de Bernoulli
mediante el cual la teora de la probabilidad fue elevada por primera vez del nivel elemental de
conjunto de soluciones de problemas particulares a un resultado de importancia general. Bernoulli
siempre detac la importancia de que los fenmenos aleatorios dejaran de enfocarse como casos
particulares y se intentara ver los conceptos generales que habas detrs de ellos, slo as se
avanzara y profundizara en el entendimiento de esta materia.
Ms adelante, el matemtico francs exiliado en Inglaterra Abraham De Moivre (16671754)
acept la definicin dada por Bernoulli y la reformul en trminos ms modernos para la poca:
una fraccin en la que el numerador es igual al nmero de apariciones del suceso y el
denominador es igual al nmero total de casos en los que es suceso pueda o no pueda ocurrir. Tal
fraccin expresa la probabilidad de que ocurra el suceso.
La definicin clsica de la probabilidad, en su forma actual, est basada en el concepto de
equiprobabilidad de los resultados, basado a su vez en la simetra. Se supone que un experimento
se puede descomponer en n sucesos equiprobables y mutuamente excluyentes B
1
,.,B
n
llamados sucesos bsicos o elementales. As, la probabilidad de suceso A es el nmero del
intervalo [0,1] que expresa el cociente entre los m sucesos elementales que componen A y el
nmero total n de posibles sucesos elementales. La traba fundamental que encuentra esta
interpretacin de la probabilidad es la dificultad de descomponer un suceso en sucesos
elementales equiprobables lo que es fcil para problemas sencillos ( cartas, dados, etc), pero
es de gran dificultad en problemas ms complicados.
Adems otro de los descubrimientos importantes de Bernoulli fue el saber obtener la probabilidad
de ocurrencia de un suceso sin necesidad de contar los casos favorables (bien por omisin de
datos o bien por la imposibilidad de contarlos). Para ello invent la probabilidad a posteriori, es
decir: mediante la observacin mltiple de los resultados de pruebas similares De esta manera,
introdujo el concepto de probabilidad estadstica: asignar como probabilidad de un suceso el
resultado que se obtendra si el proceso se repitiera en condiciones similares un nmero grande de
veces. Sin embargo, estas condiciones no eran muy concretas y con ellas no se poda dar lugar a
una definicin seria y rigurosa de todos los conceptos q manejaba Bernoulli. En primer lugar, se
habla de un nmero grande de veces, pero no se da ninguna indicacin sobre cul es ese nmero
o lo suficientemente grande que debe ser, no se especifica tampoco que significa condiciones
similares y tampoco se establece cul es el error admitido respecto al resultado terico.
Precisamente, fueron la necesidad de precisar con exactitud qu se entiende por un nmero
grande de repeticiones y de calcular el error del resultado obtenido respecto del resultado terico,
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
116
lo que llevaron a Jacob Bernoulli a idear, en su forma ms intuitiva y bsica, la Ley de los Grandes
Nmeros.
A continuacin expondremos los tres teoremas ms importantes de la probabilidad clsica. Estos
teoremas los idearon Bernoulli (Teorema de la suma, formalizado por Bayes) , De Moivre (Teorema
de la multiplicacin) y Bayes (Teorema de la probabilidad condicionada), aunque todos los
conceptos que se manejan en estos teoremas aparecen ya de forma implcita y muy frecuente en
los diferentes trabajos de Pascal, Fermat y Huygens.
Teorema de la Suma
Pascal dio a entender implcitamente que saba cmo calcular los casos favorables de un suceso A
si conoca los casos favorables de unos A
j
disjuntos cuya unin es A (es decir, si los A
j
son una
particin de A). Jacob Bernoulli tambin fue consciente de ello, y fue ms lejos al darse cuenta de
que la probabilidad de la unin no es la suma de las probabilidades si los sucesos no son disjuntos,
aunque no supo dar la razn. No fue ninguno de ellos quien formul finalmente el teorema de la
suma de las probabilidades, sino el reverendo ingls Thomas Bayes (17021761), cuyo trabajo fue
ledo pstumamente, en 1763. En esta obra, Bayes da la primera definicin rigurosa y explcita de
sucesos disjuntos y enunci la frmula ahora conocida:
() () ( )
Teorema de la Multiplicacin
Al igual que el teorema anterior, el teorema de la multiplicacin de probabilidades era conocido por
casi todos los matemticos anteriores a travs de resultados particulares. No obstante, fue
Abraham De Moivre el primero que lo enunci rigurosamente. De Moivre fue un hugonote francs
que debido a su religin se ausent de Francia y vivi como refugiado en Inglaterra. All public su
obra The doctrine of chances (Doctrina de las Probabilidades) en 1711. De Moivre present el
importante concepto de independencia de sucesos aleatorios as, escribi: Diremos que dos
sucesos son independientes, si el primero de ellos no tiene ninguna relacin con el otro y procedi
a definir los sucesos dependientes: Dos sucesos son dependientes si estn ligados el uno al otro y
la probabilidad de ocurrencia de uno de ellos influye en la probabilidad de ocurrencia del otro. Una
vez hecho esto, De Moivre lo aplic al clculo de probabilidades: la probabili dad de ocurrencia de
dos sucesos dependientes es igual a la probabilidad de ocurrencia de uno de ellos dividida por la
probabilidad de que el otro ocurra si el primero ya ha ocurrido. Esta regla puede generalizarse para
varios sucesos . El caso de varios sucesos lo describa as: Se necesita elegir uno de ellos como
el primero, otro como el segundo, y as. Luego, la ocurrencia del primero debe considerarse
independiente de todas las dems; el segundo debe considerarse con la condicin de que el
primero ha ocurrido: el tercero con la condicin de que tanto el primero como el segundo han
ocurrido, y as. De aqu, la probabilidad de las ocurrencias de todos los sucesos es igual al
producto de todas las probabilidades Esto es:
(
) (
)(
) (
)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
117
La obra de De Moivre cont con tres ediciones, lo que da una idea del gran inters que despert
esta materia en aquella poca. En las dos ltimas ediciones de l a obra el autor tambin da las
primeras indicaciones acerca de la distribucin normal de las probabilidades, que ms tarde
desarrollara un papel sumamente importante en el desarrollo la teora de la probabilidad.
Teorema de Bayes:
El trabajo de De Moivre fue seguido y difundido en la mayora de los crculos cientficos
importantes de Europa y fue el britnico Thomas Bayes, probablemente alumno de De Moivre en
Londres, quien extendi el trabajo del francs y expres la probabilidad condicional en funci n de
la probabilidad de la interseccin:
()
()()
()
Adems, el teorema que lleva su nombre no es slo suyo, ya que Bayes no estaba en condiciones
de formular con probabilidades totales. Fue PierreSimon Laplace (17491827) quien mejor y
desarroll la mayor parte del teorema de Bayes en su Thorie analytique des probabilits
(Experiencia en la Filosofa de la Teora de la Probabilidad) en 1812.
Sea A un suceso que ocurre en conjuncin con uno y slo uno de los n sucesos disjuntos B
1
B
n
.
Si se sabe que el suceso A ha ocurrido, cul es la probabilidad de que el suceso B
J
tambin?
Laplace respondi de la siguiente manera: La probabilidad de existencia de una de esas causas
es igual a una fraccin con un numerador igual a la probabilidad del suceso que se sigue de esta
causa y un denominador que es la suma de las probabilidades relativas a todas las posibles
causas. Si estas diferentes causas a priori no son equiprobables, entonces en lugar de tomar la
probabilidad del suceso que sigue a cada causa, se toma el producto de esta probabilidad por
tantas veces la probabilidad de la causa. Esta frmula se escribe en notacin ms actual de la
siguiente manera:
(
)
(
)(|
)
(|
=
(
)
Aparte de esta revisin importantsima del teorema de Bayes, Laplace incluye en su obra una
exposicin sistemtica muy completa de la teora matemtica de los juegos de azar con
aplicaciones a una gran variedad de cuestiones cientficas y prcticas. En su libro citado
anteriormente dedica una extensa introduccin escrita para los lectores no matemticos a explicar
sus puntos de vista generales sobre todas las cuestiones y apreciaciones de los resultados
alcanzados con la ayuda de la teora de la probabilidad.
El estudio de esta introduccin es muy famoso y se recomienda a todos los interesados en la
historia de la ciencia.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
118
Introduccin.
En muchas situaciones de la actividad cotidiana se presentan circunstancias en
las que parecen estar relacionadas dos o ms variables. Por ejemplo:
- El gasto de una familia y el ingreso familiar.
- Las horas de prctica del curso de Estadstica y el nmero de estudiantes
que lo reprueban.
Capacidades a desarrollar.
- Determinar la relacin de dependencia entre dos
variables.
- Calcular e interpretar los coeficiente de correlacin .
Unidad 4: Regresin y Correlacin
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
119
- El tiempo efectivo de servicio de los trabajadores y la edad.
- La produccin y ventas de una fbrica.
Existe una tcnica para establecer matemticamente la relacin que puede existir
entre variables como las sealadas anteriormente. Esta tcnica es el anlisis de
regresin.
4.1 Conceptos bsicos.
4.1.1 Regresin
La regresin es un mtodo de clculo para establecer una relacin matemtica
entre dos o ms variables. Este mtodo aplicado a la Estadstica permite predecir
matemticamente el comportamiento de una variable a partir del comportamiento
conocido de otra u otras variables. Esta relacin entre las variables se establece a
travs de una ecuacin que se llama Ecuacin de Regresin
Al establecer la relacin entre dos variables encontramos una variable
independiente, la cual en el plano cartesiano se sita en el eje x y la otra
dependiente, la cual se sita en el eje y
Ejemplo:
El gasto de una familia y el ingreso
familiar.
- El ingreso familiar: independiente
- El gasto de una familia: dependiente.
Esta relacin podemos representarla mediante un grfico de dispersin, el cual es
la representacin grfica en el plano cartesiano, de los valores que toma la
variable independiente (x) y la variable dependiente (y).
Veamos:
Al analizar la edad y el tiempo de servicio de los trabajadores se consider lo
siguiente:
Edad x 48 40 30 42 27 34 40 32
Tiempo de servicio y 24 18 9 22 4 10 16 8
La representacin grfica de los valores de esta tabla en el plano cartesiano,
recibe el nombre de Grfico de Dispersin, as tenemos
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
120
4.1.2 Tipos de relacin entre las variables
Como ya sabemos, la relacin entre dos o ms variables recibe el nombre de
regresin, cuya clasificacin la podemos apreciar en el siguiente esquema:
Esquema: Tipos de Regresin
Fuente: Adaptado de Rincn, G. (2011)
0
5
10
15
20
25
30
0 10 20 30 40 50 60
T
i
e
m
d
e
s
e
r
v
i
c
i
o
s
(
a
o
s
)
Edad (aos)
Diagrama de Dispersin de la Edad y el
Tiempo de Servicio
Tipos de relacin
entre variables
1. Cantidad de
variables
a. Regresin
Univariada
b. Regresin
Multivariada
2. Representacin
grfica de la
ecuacin
a. Regresin Lineal
Directa
Inversa
b. Regresin
Curvilnea
Directa
Inversa
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
121
Es as como los tipos de relacin entre variables van de acuerdo:
1. A la cantidad de variables que se relacionan y pueden ser: Regresin
Univariada o Multivariada.
a) Regresin Univariada, solo interviene una variable independiente.
b) Regresin Multivariada, interviene ms de una variable independiente.
2. A la representacin grfica de la ecuacin de regresin y pueden ser:
Regresin Lineal o Curvilnea.
a) Regresin Lineal, cuando la representacin grfica de la ecuacin de
regresin es una lnea recta. Al mismo tiempo, sta Regresin Lineal puede
ser: directa e inversa.
- Regresin Lineal Directa
Sucede cuando al aumentar el valor de la variable independiente aumenta en
forma proporcional, el valor de la variable dependiente. Por lo tanto, una recta
parece describir de manera apropiada la relacin entre estas variables.
Grficamente, podemos apreciar lo siguiente:
- Regresin Lineal Inversa.
Sucede cuando al aumentar el valor de la variable independiente disminuye el
valor de la variable dependiente en una proporcin similar. A continuacin,
veamos su representacin grfica:
0
1
2
3
4
5
6
7
8
9
10
0 5 10 15 20 25 30
V
a
r
i
a
b
l
e
y
Variable x
x y
8 5
13 4
6 3
24 9
18 7
20 5
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
122
b) Regresin Curvilnea, cuando la representacin grfica de la ecuacin de
regresin es una lnea curva. sta regresin tambin puede ser directa e
inversa.
- Regresin Curvilnea Directa.
Es cuando al aumentar de valor la variable independiente, la variable
dependiente aumenta ms que proporcionalmente.
La representacin grfica de una Regresin Curvilnea Directa viene a ser de
la siguiente manera:
0
5
10
15
20
25
30
0 5 10 15 20 25 30
V
a
r
i
a
b
l
e
y
Variable x
0
5
10
15
20
25
0 5 10 15 20
V
a
r
i
a
b
l
e
y
Variable x
x y
19 9
3 24
16 11
24 6
8 24
x y
16 12
18 21
8 6
12 7
17 17
10 8
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
123
- Regresin Curvilnea Inversa.
Es cuando al aumentar de valor la variable independiente, la variable
dependiente disminuye ms que proporcionalmente.
La representacin grfica de una Regresin Curvilnea Indirecta viene a ser
de la siguiente manera:
4.2 La Regresin Lineal.
Cuando los puntos del grfico de dispersin se pueden relacionar mediante una
lnea recta que pase muy cercana de todos los puntos.
Esta recta tiene por ecuacin:
Donde:
y = variable dependiente
x = variable independiente.
0
2
4
6
8
10
12
14
16
18
20
0 5 10 15 20 25
V
a
r
i
a
b
l
e
y
Variable x
x y
14 2
5 9
10 7
2 18
20 2
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
124
4.2.1 La recta de regresin.
Si deseamos ajustar la nube de puntos haremos uso de la recta de regresin.
La recta de regresin pasa por el punto (
( )
b) Recta de regresin de x sobre y
La recta de regresin de x sobre y se utiliza para estimar los valores de la
variable x a partir de los valores de la variable y.
La pendiente de la recta se calcula a partir del cociente entre la covarianza y la
varianza de la variable y.
( )
Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre
s, y sus ecuaciones son:
y = x =
Antes de resolver algunos ejemplos sobre regresin lineal y correlacin, es bueno
tener presente las frmulas que nos van ayudar a encontrar tanto las rectas de
regresin como el coeficiente de correlacin tambin llamado correlacin de
Pearson.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
125
Media aritmtica
Varianzas
Desviaciones tpicas o estndares
Covarianza
Recta de regresin y sobre x Recta de regresin x sobre y
( )
( )
Veamos a continuacin el siguiente ejemplo:
Las participaciones de doce alumnos de la I.E Sto. Toms de Aquino en la
clase de Matemtica y Fsica son las siguientes:
Matemtica 2 3 4 4 5 6 6 7 7 8 10 10
Fsica 1 3 2 4 4 4 6 4 6 7 9 10
Solucin:
Hallando las rectas de regresin
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
126
x
i
y
i
x
i
y
i
x
i
2
y
i
2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
=72 =60 =431 =504 =380
1 Hallamos las medias aritmticas.
= 5
2 Calculamos la covarianza.
()
3 Calculamos las varianzas.
4 Recta de regresin de y sobre x.
y 5 =
(x 6)
y = 0,986x 0,916
5 Recta de regresin de x sobre y.
x 6 =
(y 5)
x = 0,888y + 1,56
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
127
4.3 Correlacin lineal.
La correlacin es la forma numrica en que evala la relacin de dos o ms
variables; por lo tanto, mide la dependencia de una variable con respecto de otra
variable independiente. El coeficiente de correlacin lineal resulta de dividir la
covarianza entre el producto de las desviaciones tpicas de ambas variables.
El coeficiente de correlacin lineal se expresa mediante la letra r y se calcula
mediante la siguiente ecuacin
4.3.1 Propiedades del coeficiente de correlacin
- El coeficiente de correlacin no vara al hacerlo la escala de medicin, es decir,
si expresamos la altura en metros o en centmetros el coeficiente de
correlacin no vara.
- El signo del coeficiente de correlacin es el mismo que el de la covarianza.
- Si la covarianza es positiva, la correlacin es directa, si la covarianza es
negativa, la correlacin es inversa y si la covarianza es nula, no existe
correlacin.
- El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y
1.
1 r 1
- Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
- Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
- Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin
es dbil.
- Si r = 1 1, los puntos de la nube estn sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.
Veamos el siguiente ejemplo:
Las participaciones de doce alumnos de una clase en Matemticas y Fsica son
las siguientes:
Matemtica 2 3 4 4 5 6 6 7 7 8 10 10
Fsica 1 3 2 4 4 4 6 4 6 7 9 10
Hallar el coeficiente de correlacin de la distribucin e interpretarlo.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
128
Solucin:
x
i
y
i
x
i
. y
i
x
i
2
y
i
2
2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100
=72 =60 =431 =504 =380
1 Hallamos las medias aritmticas
= 5
2 Calculamos la covarianza.
6(5) = 5,917
3 Calculamos las desviaciones tpicas.
= 2,449
= 2,582
4 Aplicamos la frmula del coeficiente de correlacin lineal.
()()
Interpretacin: Al ser el coeficiente de correlacin positivo, la correlacin es
directa y como est muy prximo a 1, la correlacin es muy fuerte.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
129
Ejercicios resueltos.
1) En la I.E. Juana Alarco se realiza una investigacin con cinco nios de los
niveles de inicial y primaria de 2, 3, 5, 7 y 8 aos de edad y que pesan,
respectivamente, 14, 20, 32, 42 y 44 kilos.
a) Hallar la ecuacin de la recta de regresin de la edad sobre el peso y
viceversa.
b) Cul sera el peso aproximado de un nio de seis aos?
Solucin:
Elaboramos la siguiente tabla:
Edad
x
i
Peso
y
i
x
i
2
y
i
2
x
i
. y
i
2 14 4 196 28
3 20 9 400 60
5 32 25 1 024 160
7 42 49 1 764 294
8 44 64 1 936 352
=25 =152 =151 =5 320 =894
Luego:
a) Hallamos las medias:
= 30,4
Hallamos las varianzas:
Hallamos la Covarianza:
()
La recta de regresin edad sobre peso:
x 5 = 0,192 (y 30)
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
130
x = 0,192y 0,76
La recta de regresin peso sobre edad:
y 30,4 = 5,154(x 5)
y = 5,15x + 4,65
b) y = 5,15 (6) + 4,65
y = 35,57Kg.
2. Las notas obtenidas por cinco alumnos de la I.E. Miguel Grau en Francs e
Ingls son:
Francs 06 04 08 05 03.5
Ingls 06.5 04.5 07 05 04
Determinar las rectas de regresin y calcular la nota esperada en ingls para un
alumno que tiene 7.5 en francs.
Solucin:
Francs
x
i
Ingls
y
i
x
i
2
y
i
2
x
i
. y
i
6 6,5 36 42,25 39
4 4,5 16 20,25 18
8 7 64 49 56
5 5 25 25 25
3,5 4 12,25 16 14
=26,50 =27 =153,25 =152,50 =152
Determinando las rectas de regresin.
a) Hallamos las medias:
= 5,40
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
131
Hallamos las varianzas:
Hallamos la Covarianza:
()
Hallamos la recta de regresin de y sobre x
y 5,4 =
(x 5,3)
y = 0,695x 1,715
Hallamos la recta de regresin de x sobre y
x 5,3 =
(y 5,4)
x = 1,328y 1,873
Calculando la nota esperada.
y = 0,695(7,5) + 1,715
y = 6,928
3) En la tabla siguiente se indica la edad (en aos) y la conducta agresiva
(medida en una escala de cero a 10) de 10 nios.
Edad 6 6,4 6,7 7 7,4 7,9 8 8,2 8,5 8,9
Conducta agresiva 9 6 7 8 7 4 2 3 3 1
Calcular
a) Obtener la recta de regresin de la conducta agresiva en funcin de la edad.
b) A partir de dicha recta, obtener el valor de la conducta agresiva que
correspondera a un nio de 7,2 aos.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
132
Solucin:
Edad
x
i
Conducta
agresiva
y
i
x
i
2
y
i
2
x
i
. y
i
6 9 36 81 54
6,4 6 40,96 36 38,4
6,.7 7 44,89 49 46,9
7 8 49 64 56
7,4 7 54,76 49 51,8
7,9 4 62,41 16 31,6
8 2 64 4 16
8,2 3 67.24 9 24,6
8,5 2 72,25 4 17
8,9 1 79,21 1 8,9
=75 =49 =570,72 =313 =345,2
a) Hallamos las medias:
= 4,9
Hallamos las varianzas:
Hallamos la Covarianza:
()
Hallamos la recta de regresin de y sobre x:
y 4,9 = -2,713 (x 7,5)
y = -2,713x + 25,248.
b) y = -2,713 (7,2) + 25,248
y = 5,714
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
133
4) El nmero de horas dedicadas al estudio de una asignatura y la calificacin
obtenida en el examen correspondiente, de ocho personas es:
Horas (X) 20 16 34 23 27 32 18 22
Calificacin (Y) 6,5 6 8,5 7 9 9,5 7,5 8
Calcular:
a) La recta de regresin de y sobre x.
b) Calificacin estimada para una persona que hubiese estudiado 28 horas.
Solucin:
Horas
x
i
Calificacin
x
i
x
i
2
y
i
2
x
i
. y
i
16 6 256 36 96
18 7,5 324 56,25 135
20 6,5 400 42,25 130
22 8 484 64 176
23 7 529 49 161
27 9 729 81 243
32 9,5 1 024 90,25 304
34 8,5 1156 72,25 289
=192 =62 =4 902 =491 =1 534
a) Hallamos las medias:
= 7,75
Hallamos la varianza:
()
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
134
Hallamos la recta de regresin de y sobre x:
y 7,75 =
( )
y = 0,156x + 4,006
b) y = 0,156(28) + 4,006
y = 8,4
5) Las estaturas y pesos de diez jugadores del equipo de basquetbol de la
UNMSM son las siguientes:
Estatura (x)
186 189 190 192 193 193 198 201 203 205
Peso (y)
85 85 86 90 87 91 93 103 100 101
Calcular:
a) La recta de regresin de y sobre x.
b) El coeficiente de correlacin.
c) El peso estimado de un jugador que mide 208 cm.
Solucin:
x
i
y
i
x
i
2
y
i
2
x
i
y
i
186 85 34 596 7 225 15 810
189 85 35 721 7 225 16 065
190 86 36 100 7 396 16 340
192 90 36 864 8 100 17 280
193 87 37 249 7 569 16 791
193 91 37 249 8 281 17563
198 93 39 204 8 649 18 414
201 103 40 401 10 609 20 703
203 100 41 209 10 000 20 300
205 101 42 025 10 201 20 705
1 950 921 380 618 85 255 179 971
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
135
a) Hallamos las medias:
= 92,10
Hallamos las varianzas:
Hallamos las desviaciones tpicas o estndar:
= 6,07
= 6,56
Hallamos la recta de regresin de y sobre x.
y 92,10 = 1,02 (x 195)
y= 1,02x 106,80
b) r =
() ()
Correlacin positiva muy fuerte.
c) y = 1,02(208) 106,80
y = 105,36 Kg.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
136
Ejercicios propuestos.
1) Un investigador cree que la inteligencia de los nios, medida a travs del
coeficiente intelectual (CI en puntos), depende del nmero de hermanos. Toma
una muestra aleatoria de 15 nios y ajusta una regresin lineal simple. Los
resultados aparecen en la salida adjunta.
CI 110 115 120 118 110 108 105 104 98 99 98 100 90 93 90
Hermanos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6
Calcular:
a) La recta de regresin de y sobre x.
b) El coeficiente de correlacin.
2) Hay inters en conocer qu tipo de relacin existe entre el nmero de horas
diarias dedicadas al estudio por 10 alumnos universitarios y la nota que
obtienen al final del curso. La informacin obtenida fue la siguiente:
N horas de estudio 3 4 3 5 6 7 5 8 8 10
Nota final 12 13 13 16 17 17 16 17 18 18
Calcular:
a) La recta de regresin de y sobre x.
b) El coeficiente de correlacin.
3) La informacin siguiente corresponde a puntajes obtenidos por 8 estudiantes
en su examen final del curso de Estadstica y su nota promedio del campus
virtual.
a) Determinar la ecuacin de regresin lineal de y sobre x.
b) Calcular el coeficiente de correlacin lineal.
Examen Final 10 16 15 14 12 11 17 14
Promedio de Campus Virtual 11 15 14 12 12 12 16 15
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
137
4) Se ha realizado una encuesta a un grupo de docentes, preguntndoles por el
nmero de personas que habitan su hogar y el nmero de habitaciones que
tiene la casa. La tabla siguiente recoge la informacin obtenida:
N de personas 3 5 4 6 5 4
N de habitaciones 2 3 4 4 3 3
Halla el coeficiente de correlacin. Cmo es la relacin entre las dos
variables?
5) La estatura, en centmetros, de seis chicos de la misma edad y la de sus
padres viene recogida en la siguiente tabla:
X: Hijo 160 150 160 170 180 170
Y: Padre 180 170 175 185 180 175
a) Halla las dos rectas de regresin.
b) Observando el grado de proximidad entre las dos rectas, cmo crees que
ser la correlacin entre las dos variables?
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
138
Autoevaluacin de la unidad 4.
Del siguiente estudio, responde las preguntas 1 y 2.
Se ha preguntado a los alumnas de la Institucin Educativa Repblica de Chile el
nmero de horas de estudio diario, X, y el nmero de asignaturas aprobadas al
final del ao escolar, Y. A la nube de puntos resultado de la encuesta se ha
ajustado la recta de regresin y = 3,8x + 0,2.
1. Para aprobar 4 asignaturas, cunto tiempo de estudio deberan emplear?
a) 30 minutos.
b) 1 hora.
c) 1 hora y media.
d) 2 horas.
e) 2 horas y media.
2. Y para superar las 11 asignaturas, es decir, todas, cul sera la
recomendacin de horas de estudio?
a) 1,84 horas.
b) 1,96 horas.
c) 2,54 horas
d) 2,76 horas.
e) 2,84 horas.
De acuerdo a los siguientes datos, responde las preguntas 3, 4 y 5.
La media de los pesos de un grupo de alumnos del PROLEX es de 72 kilogramos,
y la de sus estaturas, 173 centmetros. Las desviaciones tpicas son 4 kilogramos
y 9 centmetros, y la covarianza es 35.
3. Cul es el coeficiente de correlacin?
a) 0,6922
b) 0,7211
c) 0,8355
d) 0,9722
e) 0,9988
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
139
4. Calcula la recta de regresin del peso respecto a la estatura.
a) y = 0,1675x + 16,5
b) y = 1,3875x + 15,5
c) y = 2,1875x + 15,5
d) y = 2,7275x + 14,5
e) y = 2,1641x + 13,5
5. Cul es el peso estimado para un individuo de 182 centmetros?
a) 76,1143 kg
b) 72,3012 kg
c) 78,4628 kg
d) 68,4311 kg
e) 69,2865 kg
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
140
Lectura N 4
LA ESTADSTICA EN LA INVESTIGACIN EDUCATIVA
Javier Gil Flores
Extracto de la Revista de Investigacin Educativa, 2003
Vol. 21, n. 1, pgs. 231-248
Pocas objeciones pueden hacerse a la idea de que la Estadstica es una herramienta fundamental
para la investigacin cientfica, y consideramos que esta afirmacin es igualmente vlida en el caso
de la investigacin educativa. De ah, que muchas titulaciones universitarias, y en particular las del
mbito de las Ciencias de la Educacin, incluyan en sus planes de estudios asignaturas de
contenido estadstico, que frecuentemente encuentran una continuidad en la formacin
investigadora dispensada a travs de los programas de Tercer Ciclo. Sin embargo, la Estadstica
trasciende el contexto acadmico y est presente en distintos mbitos de la actividad humana. Si
examinamos el sentido que popularmente se da a la Estadstica, encontramos que la opinin
pblica est ms familiarizada con el trmino estadsticas, en plural. Con frecuencia aparecen en
los medios de comunicacin informaciones acerca de acontecimientos de las esferas poltica,
econmica o social, que vienen expresadas en forma de o acompaadas de estadsticas. As,
podemos referirnos a las estadsticas sobre los resultados de unos comicios, la evolucin del IPC
en las distintas comunidades autnomas, la superficie forestal devastada por los incendios en la
ltima dcada,... En definitiva, la idea de estadsticas en el hombre de la calle quedara asociada a
la de una informacin numrica, a veces apoyada mediante la representacin grfica, con la que
se pretende expresar la importancia cuantitativa o magnitud de algunos fenmenos, sucesos,
realidades o se muestra comparativamente su modificacin al variar las coordenadas espacio-
tiempo.
Las estadsticas, desde esta percepcin, se traducen en un conjunto de datos numricos recogidos
sobre una realidad o a los productos de su procesamiento a travs de la aplicacin de un mtodo
sistemtico de trabajo. Los procedimientos para llegar a esos resultados, consistentes en la
recopilacin, ordenacin y presentacin constituiran la estadstica (esta vez en singular). El
estadstico, por tanto, aparece como alguien que recopila grandes cantidades de informacin
cuantitativa y despus consigue obtener valores numricos representativos de esa informacin, los
cuales permitirn tal vez fundamentar la adopcin de medidas de tipo poltico, econmico,
administrativo... Sin embargo, la recopilacin y descripcin de conjuntos de datos numricos es
slo una de las tareas de la Estadstica.
Esta idea de la Estadstica asociada a conjuntos de informaciones expresadas numricamente ha
estado presente desde sus orgenes, pero el concepto de estadstica ha evolucionado
histricamente. Las definiciones iniciales que limitaban la Estadstica a los mtodos de recopilacin
y ordenacin de datos, clasificados y corregidos, acerca de aspectos de inters para la
administracin de los Estados, dieron paso en una etapa posterior a otras que caracterizan la
Estadstica como una verdadera ciencia, estrechamente conectada a la teora de las
probabilidades. Tras fusionarse en el siglo XIX con la corriente de estudios sobre el clculo de
probabilidades, se constituy en una rama de la matemtica aplicada, entendiendo sta como el
uso de los principios y modelos matemticos en diversos mbitos de la ciencia o la tcnica. Dentro
de la propia Estadstica, a su vez, podemos diferenciar dos vertientes: una que ha sido
denominada con los calificativos de formal, terica, matemtica o pura, y otra que conocemos
como Estadstica aplicada. Esta ltima juega un papel clave en muchos mbitos cientficos, al
servicio de la investigacin y el anlisis de la realidad.
Alcanzar una definicin nica de la ciencia estadstica resulta una tarea difcil. De acuerdo con los
datos aportados por Piatier (1967), ya en 1870 el nmero de definiciones se elevaba a 63 y, en
1935, Willcox presentaba hasta un total de 115 definiciones en su artculo Definitions of statistics,
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
141
aparecido en el nmero tres de la Revue de lInstitut International de Statistique. En este sentido,
cabe tambin mencionar la conocida afirmacin que realizara sir M.G. Kendall en 1945, sealando
que entre los temas respecto a los que los estadsticos no estn de acuerdo, se encuentra
precisamente la definicin de su propia ciencia. Y llegaramos a la conclusin de que esta idea
posiblemente conserva cierta vigencia, si examinramos la variedad de definiciones que muchos
manuales dedicados a esta materia incluyen en prefacios, introducciones o captulos iniciales que
tratan de concretar el campo de estudio en el que se centrar la obra. Desde nuestro punto de
vista, en una definicin de Estadstica resultaran caractersticos rasgos como los que sintetizamos
a continuacin:
- La Estadstica es una ciencia que tiene por objeto el estudio de mtodos y tcnicas para el
tratamiento de conjuntos de datos numricos.
- Las tcnicas estadsticas permiten la descripcin de conjuntos de datos y la inferenci a
sobre conjuntos ms amplios.
- Los mtodos desarrollados por la Estadstica pueden ser aplicados en distintos campos del
saber, constituyendo un importante instrumento para el estudio cientfico.
Centrando la atencin sobre la Estadstica aplicada al campo de la investigacin educativa, la
Estadstica habr de ser vista como un conjunto de mtodos, tcnicas y procedimientos para el
manejo de datos, su ordenacin, presentacin, descripcin, anlisis e interpretacin, que
contribuyen al estudio cientfico de los problemas planteados en el mbito de la educacin y a la
adquisicin de conocimiento sobre las realidades educativas, a la toma de decisiones y a la mejora
de la prctica desarrollada por los profesionales de la educacin.
Volviendo a la imagen popular de la Estadstica, entre las personas que no se cuentan entre sus
estudiosos o aplicadores ha sido a veces objeto de definiciones o mejor, calificaciones que
encierran una cierta crtica, tratando de cuestionar los mtodos del conocimiento estadstico y en
consecuencia los resultados derivados de la aplicacin de los mismos. Lgicamente se trata de
definiciones que desde el punto de vista epistemolgico no tienen mayor inters, pero que apuntan
hacia concepciones que podran encontrarse entre las ideas previas del ciudadano comn y
tambin del profano que inicia el estudio sistemtico de esta disciplina. As, la caricaturizacin de la
Estadstica queda reflejada en afirmaciones de tono humorstico como: la estadstica es la ciencia
que explica cmo si t te comes dospollos y yo ninguno, nos hemos comido uno cada uno por
trmino medio (Pea, 1987:19-20) o la frase de Bernard Shaw si un hombre tiene la cabeza en
un horno y los pies en la nevera, su cuerpo est a una temperatura media ideal. La Estadstica,
desde este punto de vista, sera la ciencia que permite ocultar las diferencias individuales a travs
de los valores promedio. Esta creencia de que puede servir, ms que para revelar, para ocultar
informacin ha dado lugar a que la Estadstica haya podido ser considerada un instrumento al
servicio del engao o la manipulacin. El estadstico, segn Glass y Stanley (1980), ha sido
tachado de mentiroso y se le ha acusado del delito de ejercer el arte de mentir con estadsticas,
manteniendo una apariencia de objetividad y veracidad. Macauley (citado en Piatier, 1967)
afirmaba que las cifras dicen siempre lo que un hombre inteligente quiere que digan, y se
atribuye a Benjamin Disraeli, poltico conservador britnico que lleg a ser primer ministro de la
Reina Victoria, la frase hay tres clases de mentiras: la mentira ordinaria, la mentira mal
intencionada y la estadstica.
Contrarrestar estas opiniones, que dibujan una imagen de la Estadstica apoyada en actitudes de
temor, recelo o desprecio, exige que hagamos hincapi en un correcto uso de los mtodos
estadsticos, para lo cual resulta imprescindible un buen conocimiento de los mismos, de las
condiciones en que pueden ser aplicados y del significado de los resultados obtenidos. En realidad,
las mentiras de la Estadstica derivan no de sta en s misma, sino de la eventual falta de
conocimientos o sentido comn por parte de quienes la aplican y del uso interesado de la misma.
Sobre estas consideraciones acerca del uso abusivo de la Estadstica, volveremos ms adelante,
cuando abordemos los riesgos que entraa la utilizacin de la Estadstica en el estudio de la
realidad educativa.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
142
LA ESTADSTICA EN EL PROCESO DE INVESTIGACIN
Habitualmente se acepta que la Estadstica resulta una herramienta de trabajo til en la
investigacin educativa en la medida en que ofrece tcnicas y procedimientos que pueden ser
aplicados en la etapa de anlisis de datos. Aceptando que sta es la aplicacin de mayor peso en
el contexto de la investigacin educativa, a travs de los prrafos que siguen trataremos de
atenuar el valor de lo que podran suponer concepciones reduccionistas, ocupndonos del papel
que la Estadstica tambin desempea en momentos del proceso de investigacin diferentes a la
fase de anlisis de datos.
a) Planteamiento del problema y formulacin de hiptesis
La Estadstica est presente en la formulacin del problema de investigacin. El proceso de
investigacin constituye un todo interrelacionado en el que las decisiones sobre cualquiera de los
elementos suponen condicionantes de cara a los restantes elementos del proceso. Desde esta
perspectiva, la formulacin del problema determinar en buena medida el tipo de datos que es
necesario recoger, las tcnicas de recogida adecuadas para ello y los procedimientos estadsticos
que se utilizarn en el anlisis. Por otra parte, entre las caractersticas que debe poseer cualquier
problema de investigacin se encuentra su resolubilidad, aspecto que a veces slo queda
garantizado si contamos con tcnicas estadsticas adecuadas, capaces de abordar los
interrogantes de partida. Por ejemplo, el planteamiento de problemas que supongan
comparaciones entre mltiples grupos no podra hacerse sin contar con tcnicas como el anlisis
de la varianza; un gran nmero de problemas de investigacin en los que se incluyen mltiples
dimensiones o variables simultneamente de hecho no han llegado a ser estudiados hasta contar
con tcnicas de anlisis multivariante que permiten abordarlos.
El mismo argumento podra utilizarse para justificar la presencia de la Estadstica en la formulacin
de hiptesis. La formulacin de hiptesis no puede hacerse de espaldas a consideraciones acerca
de las tcnicas estadsticas que permitirn su contrastacin.
Como afirman Arnal, Del Rincn y Latorre (1992), el investigador se ve en la necesidad de
salvaguardar la coherencia entre la teora, la hiptesis y el posterior anlisis estadstico que le
permitir aceptarla o rechazarla. En el marco de los programas de investigacin positivistas la
hiptesis cientfica, para ser contrastada, suele ser expresada en trminos estadsticos, dando
paso a la aplicacin de tcnicas para el contraste de hiptesis.
En el planteamiento del problema y la posterior formulacin de hiptesis han de tenerse en cuenta
tanto el marco terico como los trabajos previos realizados sobre el mismo tema, a cuya revisin
podran contribuir tcnicas de metaanlisis, aplicadas a la sntesis e interpretacin tanto de los
resultados obtenidos en la investigacin como de los mtodos utilizados para ello (Gmez Benito,
1987; Snchez y Ato, 1989). Los resultados a los que nos conduce el metaanlisis son sntesis de
los obtenidos en las diferentes investigaciones realizadas sobre un tema, nos informan sobre el
rigor de la misma, los mtodos empleados, la representatividad de las muestras, la fiabilidad y
validez de los estudios. Una va para determinar las tendencias dominantes en el modo de abordar
el estudio de un tema, los aspectos del mismo que son objeto de mayor atencin por parte de la
comunidad cientfica, o los autores que por encontrarse entre los ms citados gozan de mayor
autoridad, la constituye la utilizacin de revisiones bibliomtricas, en las que a travs de estudios
estadsticos se pueden poner de manifiesto las tendencias que se dibujan en publicaciones o
investigaciones sobre un tema. Las bases documentales informatizadas permiten con facilidad
realizar estadsticas acerca del nmero de registros relativos a diferentes tpicos, lo cual nos
aporta cierta aproximacin a la importancia y relevancia de distintos objetos de investigacin o
modos de abordarlos a lo largo de una determinada poca.
Todo este tipo de resultados estadsticos en ningn modo sustituyen a la revisin exhaustiva de la
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
143
literatura y el estudio del marco terico-conceptual en el que se inscribe el trabajo de investigacin,
pero constituyen una informacin complementaria en manos del investigador a la hora de concretar
el objeto de inters y fundamentar su estudio. Por otra parte, a veces la formulacin del problema
no se apoya slo en resultados de investigaciones anteriores, sino que el investigador recurre a
trabajos descriptivos previos o estudios pilotos, en los que el empleo de la Estadstica puede
contribuir a clarificar el problema en estudio. Los resultados de una descripcin estadstica acerca
de determinadas variables implicadas en algn fenmeno educativo, podran dar pie a que se
formularan hiptesis en las que se contemple la relacin entre variables; y estudios basados en la
obtencin de medidas estadsticas de correlacin entre variables facilitaran el planteamiento de
problemas y la formulacin de hiptesis que suponen relaciones de causalidad. Tatsuoka y
Tiedeman (1963), en su trabajo sobre la Estadstica en el mtodo cientfico, insisten en esta
posibilidad, afirmando el papel de las tcnicas estadsticas en el desarrollo de constructos tericos
e hiptesis acerca de las relaciones entre ellos. De este modo, la Estadstica est presente en la
fase inductiva del mtodo cientfico, contribuyendo a la creacin de modelos tericos a partir de los
cuales se deducirn hiptesis contrastables que relacionan variables observables.
b) Diseo de investigacin
La Estadstica forma parte de los diseos de investigacin experimentales. Como es sabido, en el
concepto de diseo es posible contemplar de un lado la organizacin de los aspectos que
constituyen el experimento y, de otro, el procedimiento estadstico que har posible la
interpretacin de los resultados (Fisher, 1953). Para Kerlinger (1981:214), el principio estadstico
en el que descansa el diseo es maximizar la varianza sistemtica, regular la varianza sistemtica
extraa y minimizar la varianza de error. Las tcnicas estadsticas constituyen una parte
contemplada en el diseo del experimento en la medida en que facilitarn el anlisis de los datos y
posibilitarn el control de la varianza debida a variables extraas. Si dentro del diseo del
experimento se consideran grupos experimentales y grupos control, que antes de la aplicacin de
los tratamientos han de ser equivalentes, el investigador necesitar recurrir a tcnicas estadsticas
para el contraste de hiptesis acerca de la existencia de diferencias entre los grupos y comprobar
de ese modo la equivalencia pretendida. Adems, la Estadstica est presente cuando el diseo
incluye la seleccin de sujetos.
La teora de muestras proporcionar tanto los procedimientos de seleccin como la determinacin
del tamao muestral necesario para mantener el error y la confianza dentro de lmites aceptables.
La recogida de datos es una tarea en la que aparentemente no parecen jugar un papel las tcnicas
estadsticas. Sin embargo, la Estadstica est de manera implcita presente si consideramos el
modo en que se elaboran los instrumentos utilizados para la recogida de datos (tests,
cuestionarios, protocolos de observacin, etc.). A esta disciplina corresponde un papel crucial en la
construccin de tales instrumentos, dado que las tcnicas estadsticas estn en la base de los
procedimientos por los cuales se analizan sus caractersticas tcnicas. Por citar algunos ejemplos,
la determinacin de la fiabilidad y validez de algunos instrumentos se apoya directamente en
coeficientes de correlacin; la aplicacin de tcnicas de anlisis de componentes principales o
anlisis factorial permite explorar o confirmar la dimensionalidad de los instrumentos; los mtodos
para el anlisis de items, en la teora clsica de los tests o en la teora de respuesta al tem, se
basan en correlaciones y en la estimacin de parmetros recurriendo a diferentes procedimientos
estadsticos, tales como los mtodos de mxima verosimilitud o los mtodos de inferencia
bayesiana; tests como el de chi-cuadrado permiten valorar el grado de ajuste de las respuestas a
los items a modelos logsticos de uno, dos o tres parmetros. Al margen de todo el aparato
estadstico que se esconde tras la elaboracin o el anlisis de los instrumentos de recogida de
datos, la Estadstica puede participar indirectamente en la operacin de recogida proporcionando
primeras elaboraciones de los datos en el momento mismo de su registro. Por ejemplo, cuando tras
aplicar un test se registran los resultados en forma de percentiles o eneatipos, resultantes de la
comparacin de la puntuacin del sujeto con un grupo normativo.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
144
c) Anlisis de datos
Ya hemos destacado la importancia de las tcnicas estadsticas en la fase de anlisis de datos.
Traigamos aqu, para insistir en esta idea, las palabras de De la Orden (1985:XXI), cuando afirma
que la forma ms adecuada de razonar sobre la base del gran nmero de observaciones exigidas
para el estudio experimental de la educacin, con pretensin generalizante, es la Estadstica. De
acuerdo con el concepto de Estadstica que hemos apuntado, a la Estadstica corresponden tareas
de organizacin, descripcin, anlisis y presentacin de datos acerca de las muestras estudiadas,
y tambin de generalizacin de los resultados a las poblaciones de donde las muestras fueron
extradas. El anlisis estadstico de los datos supone una descripcin de stos, el descubrimiento
de regularidades y la inferencia de caractersticas relativas a conjuntos ms amplios que los
directamente estudiados.
d) Obtencin de conclusiones y redaccin del informe
Recordando las palabras de Siegel (1991:20), la estadstica nos proporciona herramientas que
formalizan y uniforman nuestros procedimientos para sacar conclusiones . De alguna forma, las
conclusiones estn predeterminadas por el tipo de tcnicas estadsticas que utilicemos. Un anlisis
de regresin, por ejemplo, nos permitir obtener conclusiones acerca de la posibilidad de que
determinadas variables independientes puedan predecir el valor observado en una variable
dependiente; un anlisis de conglomerados nos llevar a concluir sobre formas de agrupamiento
entre los individuos u objetos que estudiamos; un anlisis simple de la varianza supondr llegar a
conclusiones acerca de las diferencias significativas entre las medias de diferentes grupos; etc. En
cualquier caso, la Estadstica estar presente a la hora de elaborar las conclusiones, aportando las
claves para la interpretacin de los resultados del anlisis.
La presentacin de las conclusiones, as como de todo el proceso de investigacin, debe contar
con la inclusin de resultados estadsticos. Aunque no se trata de una aplicacin de tcnicas
estadsticas en el momento de redactar el informe, s que la Estadstica est de algn modo
presente a la hora de mostrar los resultados. Las conclusiones de un estudio se vern
convenientemente ilustradas mediante la presentacin de tablas, cuadros, etc. recogiendo medias,
porcentajes, coordenadas, correlaciones, o cualquier otro tipo de estadsticos. La inclusin de los
pesos factoriales de las variables consideradas en un anlisis factorial, por ejemplo, es
imprescindible si queremos ilustrar el modo en que cada factor se ve saturado por las variables
observadas. Otro tanto podemos decir acerca de los resultados estadsticos expresados
grficamente.
La utilizacin de determinadas tcnicas estadsticas y la intencin posterior de comunicar los
resultados obtenidos requieren incluir representaciones estrechamente vinculadas a aqullas en
los informes de investigacin. Tcnicas como el anlisis de conglomerados, el path-analysis o el
anlisis de correspondencias, son indisociables de formas de representacin grfica como
dendogramas, diagramas de flujos o grficos factoriales, respectivamente.
En cuanto a la calidad de las investigaciones, la Estadstica aporta sus procedimientos para
garantizar la validez interna y la validez externa en los experimentos. Procedimientos de muestreo
aleatorio y tcnicas estadsticas como el anlisis de la covarianza, para controlar el efecto de
variables intervinientes que pudieran enmascarar el efecto de las variables independientes,
resultan recursos tiles en este sentido.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
145
Solucionario de los ejercicios propuestos.
UNIDAD 1
1. a) Poblacin.
b) Poblacin.
c) Muestra.
d) Poblacin.
e) Muestra.
f) Poblacin.
g) Muestra.
h) Muestra.
i) Muestra.
j) Muestra.
2. Clasificacin de la variable Escala de medicin
a) Cuantitativa discreta Razn
b) Cuantitativa discreta Razn
c) Cualitativa o categrica Ordinal
d) Cuantitativa discreta Razn
e) Cualitativa o categrica Nominal
f) Cuantitativa continua Intervalar
g) Cuantitativa discreta Intervalarr
h) Cualitativa o categrica Ordinal
i) Cuantitativa discreta Razn
j) Cualitativa o categrica Nominal
k) Cualitativa o categrica Ordinal
l) Cuantitativa discreta Razn
m) Cualitativa o categrica Nominal
n) Cuantitativa discreta Intervalar
o) Cuantitativa discreta Intervalar
3. Caso 1
Poblacin
Alumnos del Programa de Lenguas Extranjeras de la
UNMSM.
Muestra
142 alumnos del Programa de Lenguas Extranjeras de la
UNMSM.
Unidad estadstica
Un alumno del Programa de Lenguas Extranjeras de la
UNMSM.
Variable Grado de satisfaccin.
Tipo de variable Cualitativa o Categrica.
Escala de medicin Ordinal
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
146
Caso 2
Poblacin Vecinos del distrito de Jess Mara.
Muestra 128 vecinos del distrito de Jess Mara.
Unidad estadstica Un vecino del distrito de Jess Mara.
Variable Razas caninas.
Tipo de variable Cualitativa o Categrica.
Escala de medicin Nominal.
Caso 3
Poblacin Alumnas de la I.E. Mercedes Indacochea de Barranco.
Muestra
6 alumnas de la I.E. Mercedes Indacochea de
Barranco.
Unidad estadstica
Una alumna de la I.E. Mercedes Indacochea de
Barranco.
Variable Gastos en golosinas.
Tipo de variable Cuantitativa continua.
Escala de medicin Intervalar.
4. a) La tabla queda de la siguiente manera:
x
i
f
i
F
i
h
i
(%) H
i
(%)
12 7 7 15.56 15.56
13 14 21 31.11 46.67
14 10 31 22.22 68.89
15 12 43 26.67 95.56
16 2 45 4.44 100.0
n = 45 100.0
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
147
5. a) La tabla queda de la siguiente manera, recuerda que es una variable
cualitativa, por lo tanto, solo representamos f
i
y h
i
, as como su ngulo central.
x
i
f
i
h
i
(%) Operacin ngulo
Primavera 12 23.08 (360x23.08)100 83.09
Verano 14 26,92 (360x26.92)100 96.91
Otoo 13 25.00 (360x25.00)100 90
Invierno 13 25.00 (360x25.00)100 90
n = 52 100.0
b)
0
2
4
6
8
10
12
14
16
12 13 14 15 16
A
l
u
m
n
o
s
Edades
Edad de los alumnos de la I.E. "Bartolom
Herrera"
Primaver
a
23%
Verano
27%
Otoo
25%
Invierno
25%
Nacimiento por estacin del ao de los
alumnos del primer ao de la I.E. "Pedro Ruz
gallo" de Trujillo.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
148
UNIDAD 2
1. a) = 52
Interpretacin:
Los alumnos del PROLEX utilizan en promedio 52 minutos para trasladarse
desde sus hogares hasta la universidad los das sbados.
b) Me = 51
Interpretacin:
El 50% inferior de los alumnos del PROLEX utilizan 52 minutos o menos y el otro
50% superior utiliza 52 o ms minutos para trasladarse desde sus hogares hasta
la universidad los das sbados.
c) La distribucin presenta dos modas: Mo
1
= 48 y Mo
2
= 51 ( es bimodal)
Interpretacin:
El tiempo ms utilizado por los alumnos de PROLEX, para trasladarse desde sus
hogares hasta la universidad los das sbados es de 48 y 51 minutos..
2. Promocin 2010
a)
2010
= 2.67
Interpretacin:
Los estudiantes del PROLEX leyeron en promedio 2.67 libros durante los
meses de enero, febrero y marzo del 2012.
b) Me
2010
= 3
Interpretacin:
El 50% inferior de los alumnos del PROLEX leyeron 3 o menos libros y el otro
50% superior leyeron 3 o ms libros durante los meses de enero, febrero y
marzo del 2012.
c) Mo
2010
= 3
Interpretacin:
La mayora de los alumnos del PROLEX leyeron 3 libros durante los meses
de enero, febrero y marzo del 2012.
Promocin 2011
a)
2011
= 2.67
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
149
Interpretacin:
Los estudiantes del PROLEX leyeron en promedio 2.67 libros durante los
meses de enero, febrero y marzo del 2012.
b) Me
2011
= 3
Interpretacin:
El 50% inferior de los alumnos del PROLEX leyeron 3 o menos libros y el otro
50% superior leyeron 3 o ms libros durante los meses de enero, febrero y
marzo del 2012.
c) Mo
2011
= 3
Interpretacin:
La mayora de los alumnos del PROLEX leyeron 3 libros durante los meses
de enero, febrero y marzo del 2012.
Conclusin: Ambos conjuntos de datos presentan igual promedio, mediana y
moda.
3. Desviacin estndar:
Interpretacin:
Las edades de un grupo de estudiantes de la Facultad de Educacin se dispersa
en promedio 1.85 aos con respecto a su valor central.
Varianza:
Interpretacin:
Las edades de un grupo de estudiantes de la Facultad de Educacin se dispersa
en promedio 1.85 aos
2
con respecto a su valor central.
4. CV(
E
)= 0,125 = 12,5% CV(
L
) = 0,1667 = 16,67%
De los resultados podemos afirmar que los gastos mensuales de la Facultad de
Letras presentan mayor variacin que la facultad de Educacin.
5. El grfico se representa:
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
150
UNIDAD 3
1. La probabilidad del que el estudiante estudie ambos cursos es de 0.3667 o
36,67%.
2. a) 450
b) 600
3. a) 90%
b) 10%
4. a)
b)
c)
d)
5. a) 0,75
b) 0,75
UNIDAD 4
1) a) y = - 0.172x + 20.798
b) r = - 0.902
2) a) y = 0.853x + 10.667
b) r = 0.898
3) a) y = 0.672x + 4,219
x = 1.178x 2.131
b) r = 0.631
4) r = 0.631
La relacin entre las dos variables presenta una correlacin significativa.
5) a) y = 0.318x + 125.03
x = 1.273y 60,958
b) La correlacin entre las dos variables es significativa.
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
151
Claves de respuesta de las autoevaluaciones.
Unidad 1 Unidad 2 Unidad 3
Unidad 4
1 B 1 C 1 A 1
B
2 C 2 B 2 B 2
E
3 D 3 C 3 B 3
D
4 B 4 D 4 A 4
C
5 A 5 A 5 D 5
A
6 C 6 E 6 A
7 A 7 C 7 A
8 D 8 C 8 D
9 C 9 D 9 E
10 A 10 C 10 B
Programa de Licenciatura para Profesores sin Ttulo Pedaggico en Lengua Extranjera
Estadstica aplicada a la Educacin
152
Bibliografa.
ANGELES, C. y LA HOZ, A. Estadstica aplicada a la Educacin. Facultad de
Educacin. UNMSM. Per. 1997.
ARON, A. y ARON, E. Estadstica para Psicologa. Ed. Pearson. Sao Paulo. 2001.
AVILA, R. Estadstica elemental. Estudios y Ediciones RA. Per. 2010.
FERNANDEZ, J. Estadstica descriptiva: Una invitacin a la investigacin. Fondo
Editorial del Pedaggico San Marcos. Per. 2005.
FERREIRO, O. y FERNNDEZ, P. La estadstica, una ciencia de la controversia,
Artculo publicado en la Revista Universitaria N 25 del Instituto de Matemticas y
Fsica .Universidad de Talca. Chile. 1988.
MENDENHALL, W; BEAVER, R. y BEAVER, B. Introduccin a la Psicologa y
Estadstica. Ed. Language Learning. Mxico. 2008.
MOYA, R. Estadstica descriptiva. Ed. San Marcos. Per. 2010.
RINCN, G. Apuntes docentes: Estadstica. Unidades Tecnolgicas de Santander.
Colombia. 2011.
RUIZ, D. Manual de Estadstica. Editado por eumednet. Universidad de Mlaga.
2004.