You are on page 1of 410

UNIVERSIDAD NACIONAL DEL ALTIPLANO

Facultad de Ingeniera Estadstica e Informtica

2 R.C.
2
1

R.R./Ho: Aceptar R.R./Ho:


Ho:

ESTADSTICA APLICADA A LA
EDUCACIN

PREPARADO POR:

VLADIMIRO IBAEZ QUISPE, M.Sc.

Puno, Abril del 2007


-2- V. Ibaez Q.

VLADIMIRO IBAEZ QUISPE


Ingeniero Estadstico, UNA - Puno - Per.
M.Sc. en Informtica
Profesor Principal - Facultad de Ingeniera Estadstica e
Informtica.

Derechos Reservados:

Ninguna parte de este libro puede ser reproducida sin


la autorizacin del autor.

2007, Editorial Universitaria.

Primera Edicin: 2007


Impreso en Puno - Per.

Ciudad Universitaria. Apartado 291. Fax (054) 352992.


Puno - Per

Diagramacin y Composicin:
Vladimiro Ibaez Quispe
Estadstica Aplicada a la Educacin -3-

PRESENTACION

La presente publicacin: Estadstica Aplicada a la


Educacin, est preparada para los estudiantes que se ini-
cian en la formacin bsica, y nace gracias a la inquietud de
los profesores universitarios y estudiantes de pre-grado y post-
grado en diferentes reas como: Ciencias Sociales, Educa-
cin y profesionales investigadores, entre otros que muy
gentilmente me animaron para que se pueda entender mejor
la estadstica, desde un punto de vista paramtrica, es decir
estimar los parmetros poblacionales a partir de la muestra y
realizar la inferencia a la poblacin para tomar una buena
decisin. Con esta publicacin espero contribuir con algo a
todos los interesados en reas afines, asimismo se incorpora-
r el uso del software estadsticos para el procesamiento au-
tomatizado de las diferentes pruebas estadsticas.

Espero que el presente trabajo sea til en los conoci-


mientos bsicos de la estadstica y espero las sugerencias de
los interesados en compartir la misma idea que sin duda ser-
vir para corregir, ampliar la publicacin, y por ende motiva-
r la preparacin de nuevas publicaciones.

El Autor
Abril, 2007
-4- V. Ibaez Q.
Estadstica Aplicada a la Educacin -5-

INDICE
Pg.

Presentacin .................................................................................... 03
Indice .............................................................................................. 05
CAPITULO 1: CONCEPTOS BSICOS DE ESTADSTICA ........... 07
1.1. Clasificacin de la Estadsticas............................................ 08
1.2. Poblacin y Muestra ............................................................ 09
1.3. Parmetro y Estadgrafo ...................................................... 11
CAPITULO 2: PROC. Y MTODOS DE RECOLECCIN DE DATOS . 13
2.1. Fuentes de Informacin ....................................................... 13
2.2. Sistema de recoleccin ........................................................ 15
2.3. Tcnica de recoleccin ........................................................ 15
2.4. Tipos de datos ..................................................................... 20
CAPITULO 3: ETAPA DE ELABORACIN DE DATOS ...................... 25
3.1. Revisin y correccin de la informacin recogida ................ 25
3.2. Tablas de distribucin de frecuencias .................................. 26
Ejercicios propuestos ........................................................... 44
CAPITULO 4: ETAPA DE PRESENTACIN DE DATOS ..................... 47
4.1. Representacin tabular ........................................................ 47
4.1.1. Cuadros estadsticos .................................................. 47
4.1.2. Partes de un cuadro estadstico ................................... 47
4.1.3. Tipos de tablas estadsticas ........................................ 50
4.2. Representacin grfica ........................................................ 55
CAPITULO 5: ESTADGRAFOS DE POSICIN .................................. 77
5.1. Introduccin ........................................................................ 77
5.2. Medidas o estadgrafos de tendencia central ......................... 78
5.3. Medidas de posicin o cuantiles ........................................... 111
Ejercicios Propuestos ................................................................ 131
CAPITULO 6: ESTADGRAFOS DE DISPERSIN.............................. 133
6.1. Introduccin ............................................................................ 133
6.2. Recorrido o rango (R) .............................................................. 133
6.3. Recorrido intercuartlico (RI) .................................................... 134
6.4. Recorrido interdecil (RID) ........................................................ 136
6.5. El rango semi-intercuartil (Q) ................................................... 136
-6- V. Ibaez Q.
Pg.
6.6. La desviacin media (DM) ........................................................ 136
6.7. Desviacin mediana absoluta (DMe) ......................................... 139
6.8. La varianza .............................................................................. 141
6.9 Desviacin estndar o desviacin tpica ................................... 146
6.10 Error estndar (E.S.) ............................................................... 149
6.11 Correccin Sheppard ............................................................... 151
6.12 Medidas de dispersin relativa ................................................ 151
6.13 Coeficiente de variacin (CV) .................................................. 153
6.14 Estadgrafos de deformacin .................................................... 155
6.15 Estadgrafos de Apuntamiento o Kurtosis ................................ 162
Ejercicios propuestos 6 ............................................................. 165
CAPITULO 7: PROBABILIDADES...................................................... 167
7.1. Experimento aleatorio................................................................. 167
7.2. Conceptos de probabilidad.......................................................... 168
7.3. Teoremas................................................................................... 174
CAPITULO 8: DISTRIBUCIN DE LA PROBABILIDAD...................... 185
8.1. Distribucin Bernoull................................................................ 186
8.2. Distribucin Binomial................................................................ 187
8.3. Distribucin de Poisson.............................................................. 191
8.4. Distribucin normal................................................................... 195
8.5. Distribucin Ji-cuadrado............................................................ 203
8.6. Distribucin t-Student................................................................ 206
8.6. Distribucin t-Student................................................................ 206
8.7. Distribucin F........................................................................... 208
CAPITULO 9: INFERENCIA ESTADSTICA....................................... 215
9.1. Estimacin................................................................................ 215
9.2....9.11 Intervalos confidenciales................................................. 218
CAPITULO 10: PRUEBA DE HIPTESIS............................................ 251
10.1. Hiptesis estadsticas................................................................ 251
10.2. Hiptesis Nula y Alternativa..................................................... 252
10.3. Procedimiento de la prueba de hiptesis - 10.12....................... 256
CAPITULO 11: ANLISIS DE REGRESIN......................................... 307
CAPITULO 12: DISEOS EXPERIMENTALES................................... 335
CAPITULO 13: EXPERIMENTOS FACTORIALES.............................. 349
CAPITULO 14: PRUEBA NO PARAMTRICAS.................................. 367
BIBLIOGRAFA CITADA .............................................................. 409
Estadstica Aplicada a la Educacin -7-

1
CONCEPTOS BSICOS DE
ESTADSTICA
Qu es Estadstica?. La estadstica es una ciencia que nos proporciona un con-
junto de mtodos y procedimientos para recoleccin, clasificacin (organizacin),
anlisis e interpretacin del comportamiento de los datos para tomar decisiones con
respecto a una caracterstica materia de estudio o investigacin.
La estadstica es parte del mtodo cientfico y se define como un conjunto de
tcnicas usadas para recopilar, organizar, presentar, analizar e interpretar datos, con
el fin de obtener conclusiones y tomar decisiones sobre determinados hechos o fen-
menos en estudio.
El trmino estadstica tambin se emplea para designar un rea de estudio,
una disciplina. Por ejemplo, cuando se emplea esta palabra en el ttulo de un libro o
cuando nos referimos a los cursos de estadstica de la currcula de una profesin, etc.
Etimologa. La etimologa de la palabra estadstica no tiene un origen claro, por
lo que hay varias teoras; unos dicen que proviene del griego STATERA que quiere
decir balanza, otros del griego STATIZEIN que significa comprobar, otros del latn
STATUS que indica situacin y otros del alemn STAAT que quiere decir estado
poltico.

Objetivos de la Estadstica. La estadstica tiene cuatro grandes objetivos:


-8- V. Ibaez Q.
1. Planificar y disear experimentos, es la manera de plantear un problema con
el fin de obtener la informacin (encuestas, censos, etc.)
2. Describir la informacin obtenida tratando de ordenar para luego presentarla
en cuadros, grficos y si es posible reducir a unos pocos datos que la represen-
tan para luego interpretarlas (Estadsticas descriptivas).
3. El anlisis cientfico, este es el objetivo fundamental de la Estadstica, que
significa realizar estudios acerca de la verificacin de los resultados obteni-
dos tratando de contestar toda pregunta que podra surgir del problema fun-
damentndolo con pruebas razonables. Esto constituye la INFERENCIA ES-
TADSTICA, analizando el grado de error que podra cometerse al hacer in-
ferencia a la vez que mide el grado de confiabilidad del estudio que se realice.
4. Prediccin del futuro. Consiste en buscar la forma de obtener una estimacin
de lo desconocido del fenmeno en estudio, los alcances que podra tener a
partir del anlisis cientfico.

1.1. CLASIFICACIN DE LA ESTADSTICA

La estadstica se puede clasificar en dos campos grandes: Estadstica Descriptiva


y Estadstica Inferencial.

A. Estadstica Descriptiva o Deductiva.


Es la parte de la estadstica que trata solamente de recoleccin, clasificacin,
presentacin, descripcin y simplificacin de los datos, es decir el objetivo es pre-
sentar la informacin en forma clara y comprensible, sin sacar conclusiones o
inferencias de un grupo mayor. Los grficos, tablas y mapas que muestra datos de tal
forma que sean ms fciles de entender son todos ejemplos del uso de Estadstica
Descriptiva. Es decir, las conclusiones obtenidas son vlidas slo para dicha pobla-
cin.

Tablas

Recoleccin Crtica de Presentacin ANLISIS


de Datos los Datos de los datos DESCRIPTIVO

Grficas

B. Estadstica Inferencial o Inductiva.


La estadstica inferencial es el conjunto de mtodos o tcnicas que posibilitan
la generalizacin o toma de las decisiones en base a una informacin parcial obteni-
da mediante tcnicas descriptivas. La Estadstica inferencial es la que nos proporcio-
na la teora necesaria para inferir o estimar las leyes de una poblacin partiendo de
los resultados o conclusiones del anlisis de una muestra.
Estadstica Aplicada a la Educacin -9-

POBLACIN

Estimacin
muestreo
Inferencial

muestra

Campos de una investigacin con Estadstica

1 2 3 4 5 6 7 8 9
Compilacin Reglas Organizacin Sistematizac. Anlisis Interpretacin Decisin Conclusin Inferencia a
de datos Normas de datos de datos X, s,r de Resultados Buena slida Poblacin

14444444444442444444444444 3 1444444444 424444444444 3


Estadstica Descriptiva Estadstica Inferencial

1.2. POBLACIN Y MUESTRA

Poblacin. Es el conjunto de todos los individuos, objetos u observaciones que


poseen al menos una caracterstica comn susceptible de ser estudiada. Una pobla-
cin se define como la totalidad de valores posibles (mediciones o conteos) de una
caracterstica particular de un grupo especificado de objetos. Al grupo especificado
de objetos se llama un universo. Los trminos poblacin y universo, suelen usarse
indistintamente.

Mu
n

est
i

ra
ac
bl
Po

Inferencia
Estadstica
estadstica
descriptiva

Error

Probabilidades
- 10 - V. Ibaez Q.
Ejemplos:
- La poblacin humana infectadas con SIDA.
- Los ciudadanos de un pas en edad de votar en las elecciones.
- Poblacin de puntajes de rendimiento en la lectura de todos los alumnos del
primer nivel del sistema universitario.
- Poblacin de todos los posibles resultados de cara y sello que se obtienen al
arrojar una moneda un nmero indefinido de veces.
- La poblacin de estudiantes de la UNA-Puno.

La poblacin puede clasificarse como finita o infinita, dependiendo del n-


mero de elementos que la forman.

Poblacin Finita.- Una poblacin finita es aquella que tiene un nmero limitado
de elementos.

Ejemplo:
- Todo los pacientes atendido con cncer en el ao 2004 en el HRMNB-Puno.
- Las estaturas de todos los estudiantes que actualmente estudian en las Universi-
dades del Per.
- Alumnos matriculados enl a Universidad Nacional del Altiplano - Puno.
- Todas las personas que compran telfono celular.

Poblacin Infinita.- Es aquella que no tiene lmite o cotas, es decir, tiene un


nmero infinito de elementos.

Ejemplo:
- Calidad de todas las unidades producida mediante un proceso manufacturero.
- Los peces del Lago Titicaca.
- El nmero de peces en un ro.
- El nmero de granos de arroz recolectados en una regin.
- Los gases, los lquidos y algunos slidos, tales como talco, puesto que las unida-
des no pueden identificarse ni contarse.

Muestra.- Es una parte o un subconjunto representativo de la poblacin.


Ejemplo:
- La poblacin consiste en un total de pacientes atendidos con cncer en el ao
2004, una muestra ser el nmero de pacientes atendidos con cncer en Febrero
del 2004.
Observaciones. Estadsticamente son los datos que se recolectan para un estu-
dio.
Estadstica Aplicada a la Educacin - 11 -

1.3. PARMETRO Y ESTADGRAFO.

Parmetro.- Es una medida resumen que describe una caracterstica de toda la


poblacin, es decir son los valores que se calculan a partir de la poblacin.

- (Media poblacional).
- 2 (Varianza poblacional).
- P (Proporcin poblacional).

Estadstico o Estadgrafo.- Es una medida resumen que describe una caracte-


rstica de la muestra.

- x (Media muestral)
- s (Varianza muestral).
2

- p$ (proporcin muestral)
- 12 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 13 -

2
PROCEDIMIENTOS Y
MTODOS DE
RECOLECCIN DE DATOS

En esta etapa empieza la ejecucin de la investigacin; es decir, el investigador


pone en marcha la etapa de planeamiento. A travs de la recoleccin, se obtiene los
datos que se requieren para alcanzar los objetivos y demostrar las hiptesis de la
investigacin. La obtencin de los datos se hace teniendo en cuenta los siguientes
procedimiento:

2.1. FUENTES DE INFORMACIN.


Es el lugar, la institucin, la persona donde estn los datos que se necesitan
para cada una de las variables o aspectos de la investigacin. Cuando se recoge
informacin es posible que los datos ya hayan sido obtenidos de las unidades de
observacin y publicados o registrados por otros, o que los datos se tengan que obte-
ner directamente de las unidades de observacin en forma personal. Segn los casos,
estamos hablando de las fuentes de informacin, que son los siguientes:

2.1.1. Fuentes de datos internos.


Es la informacin recopilada por la empresa (o la institucin) de los
resultados de su propia gestin. Estas pueden ser por ejemplo:
- Reportes financieros,
- Reportes de operaciones, que estn dadas por la informacin de la pro-
duccin, ventas, compras, estados de prdidas y ganancias.
- 14 - V. Ibaez Q.

2.1.2. Fuentes de datos externos.


Son informaciones estadsticas elaboradas por instituciones de investi-
gacin, ya sean pblicos o privados, o dependencias especializadas, requeridos a
nivel nacional o sectorial.

2.1.3. Fuentes Primarias.


Si la informacin se obtiene directamente de la misma persona o entidad
utilizando ciertas tcnicas (entrevista, cuestionario, etc.). Ejemplos:
- Aplicar un test a un grupo de estudiantes para determinar el nivel inte-
lectual.
- Llevar a cabo una encuesta para conocer la situacin socio-econmica
de los pobladores del Asentamiento Humano Y.
- Los resultados de los censos de poblacin y vivienda, censo agropecuario,
censo econmico, ndices de precios al consumidor, etc.
- Observar la reaccin de un grupo de pacientes con determinada enfer-
medad.

2.1.4. Fuentes Secundarias.


Si la informacin a obtener, ya ha sido recopilada y elaborada por otras
personas o instituciones de los datos de fuentes primarias.

Ejemplo:
Este tipo de informacin se puede encontrar en los informes estadsticos
de las Instituciones Pblicas y Privadas. En el Per, el Instituto Nacional
de Estadstica e Informtica (INEI), publica boletines estadsticos con
respecto a la produccin, inversin, poblacin, migracin, salud. sta
institucin se encarga de formular y desarrollar el sistema Estadstico
Nacional; adems levanta los censos nacionales de poblacin y vivienda
cada 10 aos y los censos econmicos cada 10 aos, etc. Otras publica-
ciones pueden ser la Tesis, Anuarios, Series de Compendios, Revistas,
Folletos, etc.

El Ministerio de Industria Turismo e Integracin. Encargada de elaborar


estadsticas como: ndice de volumen fsico de produccin, producto bru-
to interno (PBI), etc.

El Ministerio de Economa y Finanzas. Encarga de elaborar estadsticas


de comercio al por mayor y al por menor, comercio exterior (importacin
y exportacin), etc.
Estadstica Aplicada a la Educacin - 15 -

2.2. SISTEMA DE RECOLECCIN.

Los datos pueden ser recogidos a travs de:

2.2.1. Registros.
Mediante los registros se anotan los datos en forma regular, permanente
y obligatoria, obteniendo la informacin total y sistemtica de los hechos ocurridos.

Ejemplo:
- Registro de contribuyentes.
- Registro Electoral.
- Registro Civil, etc.

2.2.1. Encuestas.
Es la recoleccin de datos en forma temporal (a travs de una muestra) y
puede ser:

Censal. Cuando abarca a toda la poblacin en estudio. Ejemplo:


- Censo Nacional de Poblacin y Vivienda de una localidad o de un pas.
- Censo Nacional Agropecuario de un pas.

Muestral. Cuando abarca una parte de la poblacin en estudio.


Ejemplo:
- Encuesta fecundidad
- Encuesta de nutricin.
- Encuesta de las Enfermedades Diarrecas Agudas de un Hospital, etc.

2.3. TCNICAS DE RECOLECCIN.


Existen muchos procedimientos para recoger la informacin, entre los cuales
el investigador debe elegir los que se adapten mejor a las circunstancias o al tipo de
investigacin. Entre las tcnicas ms usuales tenemos:

- Observacin.
- La tcnica documental.
- Entrevista.
- El cuestionario.
- Preparacin del cuestionario y formulario.
- 16 - V. Ibaez Q.
2.3.1. Observacin.

La observacin es el mtodo bsico que se utiliza para adquirir infor-


macin acerca del mundo que nos rodea, y por lo tanto, constituye la tcnica primor-
dial de la investigacin cientfica.

Tipos de observacin:
a) Segn el lugar o mbito donde se encuentran los datos, se tienen:
- Observacin documental, cuando los datos son recogidos en ma-
nuscritos o impresos.
- Observacin de campo, que puede ser observacin de monumen-
tos de campo y observacin de conductas.

b) Segn como se relaciona el investigador con el objeto de estudio;


como:
- Observacin directa; cuando el investigador puede recoger y ob-
servar datos mediante su propia observacin, obtener informa-
cin del comportamiento tal como ocurre.
- Observacin indirecta; cuando el investigador verifica los datos
que ha tomado de otros, aqu el investigador no est presente en
el momento de la ocurrencia del fenmeno.
- Observacin no participante; cuando el investigador extrae sus
daatos, pero sin una participacin en los acontecimientos de la
vida del grupo que estudia.
- Observacin participante o activa; cuando el investigador, de una
u otra manera, se introduce y acta en el grupo observado, de
modo que se le acepta como miembro, y es identificado como
observador.

c) Segn los medios utilizados, se tiene:


- La observacin no estructura; asistemtica y libre, aqu los hechos
se observan al natural, en forma espontnea, en el momento mis-
mo, que en muchas de las veces puede sorprender al observador.
- La observacin estructurada; sistemtica o regulada, aqu se tiene
un plan especfico para la realizacin de las observaciiones, para
lo cual se recurre al empleo de instrumentos o guas para la reco-
pilacin de datos.
Estadstica Aplicada a la Educacin - 17 -
2.3.2. La tcnica documental.

La tcnica documental es un tipo de observacin que recopila o busca


sus datos en documentos, fuentes escritas o grficas de todo tipo. En los documentos
se tienen:
- Documentos acadmicos, constituido por la bibliografa ms impor-
tante para conocer el estado del conocimiento de una ciencia.
- Actas e informes, donde las actas son documentos que recogen lo
ocurrido en el momento mismo en que est pasando; en tanto que los
informes son documentos escritos despus de ocurrido el aconteci-
miento.
- Documentos personales, como las autobiografas, darios, cartas, his-
torias de vidas y estudios de casos.
- Fotografas, planos, videos, etc.

2.3.3. Entrevista.
La entrevista es una situacin de interrelacin o dilogo entre perso-
nas es una tcnica donde una persona llamada entrevistador, encuestador o
empadronador solicita al entrevistado, le proporciona algunos datos o informacin.
La entrevista es un dilogo intencionado entre personas. El xito de la entrevista
como tcnica de recoleccin, depende de la eficiencia del trabajo del entrevistador.

La entrevista como tcnica de recoleccin, presenta diversas modali-


dades, como:
- La entrevista asistemtica o libre.
- Entrevista estructura, en la cual se precisa previamente los puntos
interrogar, existe un libreto o cuestionario.
- Entrevista focalizada, donde la interrogacin se centra alrededor de
un solo tema especfico.
- Entrevista simultnea, cuando los entrevistados son varios al mismo
tiempo.
- Entrevista sucesiva, cuando son varias entrevistas, pero en diveros
momentos.

2.3.4. El cuestioanrio.
El cuestionario es un instrumento constitudo por un conjunto de pre-
guntas sistemticamente elaboradas, que se formulan al encuestado o entrevistado,
con el propsito de obtener los datos de las variables consideradas en el estudio.
Cuando las preguntas se organian y se imprimen, se obtiene el formulario o cdula,
que es el instrumento que se utiliza para registrar las respuestas o datos.
- 18 - V. Ibaez Q.
La elaboracin del cuestionario requiere de un conocimiento previo
del fenmeno, tener precisado cules son las unidades de anlisis y qu aspectos
interesa estudiar. El cuestionario debe ser adaptado a las necesidades de la investiga-
cin y a las caractersticas del grupo que se estudia, su estructura y su forma deben
estar cuidadosamente elaboradas, la redaccin de las preguntas requiere de una ex-
periencia y para comprobar su comprensin, es recomendable someter a prueba todo
tipo de cuestionario.

2.3.5. Preparacin del cuestionario y formulario.


La preparacin y presentacin del cuestionario supone elaborar el for-
mulario, que es el diseo del documento donde se registran los datos referentes a la
unidad de investigacin, permite obtener los datos para llenar los cuadros estadsti-
cos establecidos. Su preparacin se efecta durante la fase del planeamiento de la
encuesta, despus de que estn definidos aquellos aspectos que son fundamentales
para conseguir informacin de buena calidad y fcil de procesar.

A. Criterios para preparar el cuestionario y el formulario.


- Objetivos de la investigacin.
- Sistema de variables.
- Caractersticas del informante.
- Tiempo disponible para efectuar la recoleccin.
- Tcnica de recoleccin.
- Procedimiento de elaboracin.

B. Caractersticas formales del cuestionario y el formulario.


- Forma y tamao del formulario.
- Calidad del papel del formulario.
- Tipo y color de la impresin.
- Tipo de archivo.

C. Formas y clases de preguntas.


Existen algunas clases de preguntas que se utilizan con mayor fre-
cuencia en la construccin de cuestionario.

- Preguntas abiertas, llamadas tambin ilimitadas, son aquellas


que el investigado responde con su propio vocabulario, sin que
se le ponga alguna alternativa, conjunto de palabras o frases.

Ejemplo: Describe el fenotipo de un animal.


Describa el sistema de manejo que realiza.
Estadstica Aplicada a la Educacin - 19 -
- Preguntas cerradas dicotmicas, aquellas que slo pueden res-
ponderse por un SI o NO, o simplemente cuando slo tienen dos
alternativas.

Ejemplo: Sabe leer? Si ( ) 1, No ( ) 2


Sexo: Masculino ( ) 1 Femenino ( ) 1.
Trabaja actualmente? Si ( ) 1, No ( ) 2.

- Preguntas cerradas de eleccin mltiple, son aquellos que pro-


ponen un conjunto de alternativas en la respuesta.

Ejemplo: - Categora Docente: Principal ()1


Asociado ()2
Auxiliar ()3
Jefe de Prctica ()4

- Nivel de instruccin: Primaria ()1


Secundaria ()2
Superior ()3

- Preguntas literales, son preguntas abiertas cuyas respuestas se


expresan con una palabra o cantidad.

Ejemplo: Cul es su estado civil?


Cul es su ocupacin actual?
Lugar de nacimiento.

- Preguntas con respuesta en grados de intensidad, cuyas res-


puestas indican un grado de intensidad dentro de una escala cre-
ciente o decreciente, ascendente o descendente. Hay una abanico
cerrado, donde el encuestado tiene que elegir una de las posibili-
dades.

Ejemplo:

La gestin del Director de Regin de Educacin es:


Muy buena ( ), Buena ( ), Regular ( ), Mala ( ), No Opina ( ).
- 20 - V. Ibaez Q.

2.4. TIPOS DE DATOS.

La informacin recopilada de las fuentes primarias o secundarias, puede estar


referida a caractersticas cualitativas o cuantitativas.

Variable: Es una caracterstica de la poblacin o fenmeno que puede tomar


diferentes valores de un conjunto de magnitudes diferentes.

Ejemplo: Las horas extras trabajadas por los trabajadores de la UNA y los valo-
res de esta variable vendran dadas por las diferentes horas trabajados por cada traba-
jador fuera de la jornada normal: ninguna, una, dos, tres, .....,. Las variables se deno-
tan por X, Y, etc.

Las variables se clasifican en: CUALITATIVAS y CUANTITATIVAS.

2.4.1. Segn la naturaleza de la variable.

A. Variable Cualitativa.
Expresan una cualidad, caracterstica, atributo o condicin social.
Es decir, son variables cuyos valores son cualidades que presenta la poblacin o son
aquellas cuyo dominio de variacin son objeto de clasificacin. Las variables cualita-
tivas se clasifican en: 1) Nominales y 2) Ordinales.

1. Variable Cualitativa Nominal: Son aquellas que establecen la


distincin de los elementos en las categoras sin implicar orden
entre ellas.

Ejemplos:
- Color de cabello: Negro, Castao, pelirrojo, rubio.
- Color de ojos: Marrn, gris, verde, azul.
- Estado civil: soltero, casado, viudo, divorciado.
- Partidos polticos: Conservador, liberal, independiente y so-
cialista.
- En el sexo: Masculino y Femenino.

2. Variable Cualitativa Ordinal: Son variables que expresan or-


den, de acuerdo a una caracterstica medible cualitativa, es decir
son aquellas que agrupan a los objetos, individuos, en categoras
ordenadas, para establecer relaciones comparativas. Es decir, son
suceptibles de ordenacin pero no de medicin cuantitativas.
Estadstica Aplicada a la Educacin - 21 -
Ejemplos:
- Nivel de instruccin: Analfabeto, primaria, secundaria y su-
perior.
- Nivel socio-econmico: Bajo, medio, alto.
- La variable cualitativa de estudio: 1er., 2do, 3er, 4to, etc.

B. Variables cuantitativas.
Es aquella variable que est asociada a una caracterstica cuantitati-
va. Se obtienen como resultado de mediciones y conteos.

Ejemplo: - El peso de los pacientes con diferentes enfermedades.


- La frecuencia respiratoria de los pacientes.
Las variables cuantitativas se clasifican en: Discretas y continuas.

1. Variable Discreta: Se expresan por nmeros reales enteros posi-


tivos nunca en nmeros o cantidades fraccionarias; son aquellas
que surgen por el procedimiento de conteo.

Ejemplo: - El nmero de hijos por familia.


- El nmero de estudiantes de la Escuela Profesional
de Odontologa
- Nmero de nacidos vivos: 100, 150 y 200 nios.
- Nmero de alumnos: 50, 80 y 100 estudiantes.

2. Variable Contnua: Son aquellas que pueden tomar infinitos va-


lores entre dos nmeros, tomando cualquier valor dentro de su
rango. Ejemplos:
- Peso: 56.5, 58.7 y 60.0 kg.
- Temperatura: 28.5C, 32.0C, 35.5C
- Estatura de los estudiantes de la UNA - Puno.
- La frecuencia respiratoria a 3827 msnm. en de los habitantes de
la costa.
- Nivel de colesterol de ciertos pacientes del Hospital MNB - Puno.
La diferencia entre las variables cuantitativas y cualitativas, es
que en el primer caso se puede calcular promedios, en cambio en
el segundo caso se calculan con porcentajes.
- 22 - V. Ibaez Q.

Nominal (cualidad)
Variable
cualitativa
Ordinal (categorizar)

TIPOS DE DATOS
Discreta (conteo)
Variable
cuantitativa
Contnuas (intervalo)

2.4.1. Segn la Escala de Medicin.

A. Variables Nominales.
Son aquellas que establecen dos o ms categoras que no guardan solu-
cin entre ellas.
Ejemplo: - Sexo: Masculino, femenino
- Estado civil: Soltero, Casado, Viudo, Divorciado.
- Ocupacin: Profesor, Enfermera, Artesano, etc.
- Lugar de nacimiento: Puno, Juliaca, Arequipa, etc.
- Raza de los seres humanos: Blanca, Negra, Amarilla.

B. Variables Ordinales.

Es el segundo nivel de medicin donde la variable establece categoras


jerarquizadas. Este nivel de medicin no mide las magnitudes de las diferencias,
pero s permite apreciar que los valores asignados a los individuos caen ms alto o
bajo que otros.
Ejemplo:
- Nivel socio-econmico: Alto, Medio, Bajo.
- Orden de mritos: Primero, Segundo y Tercero.
- Grado de instruccin: Primero, Segundo, Tercero, Cuarto y Quinto.

C. Variables de Intervalos.

Son aquellas que establecen categoras que guardan entre s un orden


o jerarqua convencional y mantienen grados de distancia entre ellas, pero no tienen
un origen comn.
Estadstica Aplicada a la Educacin - 23 -

Ejemplo:
- Cociente de inteligencia.
- Puntuacin en una escala de calificacin,
- Temperatura, presin arterial, etc.

D. Variables de razn o proporcin.

Son aquellas que comprenden a todos los tipos anteriores, establecen


categoras, orden, distancia y origen comn cuyos valores se expresan como nme-
ros reales.

Ejemplo:
- Pesos, estatura, produccin anual, cantidad de accidentes, tiempo de
reaccin mental

CLASIFICACIN DE LAS VARIABLES SEGN SU NATURALEZA

Escala de
Medicin:

NOMINAL

CUALITATIVAS
ORDINALES
ORDINAL
VARIABLES

INTERVALO
CUANTITATIVAS:
- Discretas
- Contnuas
RAZN O
PROPORCIN
- 24 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 25 -

3
ETAPA DE ELABORACIN
DE DATOS
Una vez recogida la informacin, es necesario revisarla cuidadosamente y luego
resumirla y presentarla convenientemente. En esta etapa de organizacin, se consi-
deran tres pasos siguientes:
- Revisin y correccin de la informacin recogida.
- Presentacin de la informacin en tablas de frecuencias.

3.1. REVISIN Y CORRECCIN DE LA INFORMACIN RE-


COGIDA.
La revisin y la correccin de la informacin recolectada debe ser obligatoria-
mente el paso previo a la clasificacin y automatizacin de los datos. Un corrector
puede encontrar una o varias de las siguientes cosas que deberan ser corregidos o
tratadas.
a. La escritura es demasiado pobre para leerla o la marca no esta colocada
adecuadamente.
b. Las respuestas son inconsistentes; cuando una respuesta est en conflicto
con otra (es necesario volver al informante).
c. Las respuestas son incompletas; se presentan respuestas sin contestar, rea-
lizar esfuerzos para obtener una respuesta.
d. Se necesitan clculos; si las cifras son reportadas en detalle, los clculos
deberan ser completados por el corrector.
- 26 - V. Ibaez Q.

3.2. TABLAS DE DISTRIBUCIN DE FRECUENCIAS.


Una vez aplicado una encuesta, es indispensable clasificarlos stos datos para
presentarlos en un cuadro o tabla resumen de las observaciones originales en una
tabla de distribucin de frecuencias o tabla de frecuencias de acuerdo a la clasifica-
cin de variables.

3.2.1. Variables cuantitativas contnuas (datos con nmeros decimales).

1. Ordenar los datos en forma creciente o decreciente: Xmin, X2, X3, ...,
Xmx.
2. Determinacin del rango (R). Se observa, cul es el valor ms alto
(Xmx) que se llamar lmite superior y el valor ms bajo (Xmn), se le
llamar lmite inferior.
El rango est dado por la diferencia del Xmx menos el Xmn.
R = Xmx - Xmn
3. Encontrar el nmero aproximado de intervalos (NC), para esto exis-
ten varios criterios. No hay una frmula exacta para calcular el n-
mero de intervalos de clase. Este nmero es determinado por tenta-
tivas y aproximaciones. Entre ms datos se tengan, ms intervalos
de clase deben considerarse, aqu presentamos algunos criterios:
i. Tomar un nmero arbitrario que sea mayor o igual a 5, y menor o
igual a 16.
5 NC 16
ii. Mtodo muy utilizado es la regla de Sturges: K = 1+3.3Log10(n),
n 10 .
iii. Un procedimiento, no muy recomendado, es calculando cuando
K = 5, si n < 25 y K = n , si n >25.
iv. En la prctica se determina NC atendiendo a varios factores
tales como: finalidad del estudio, grado de variabilidad de los
datos, necesidad de efectuar comparaciones con otros estudios
para mantener intervalos y su nmero.
4. Encontrar la amplitud de clase o intervalo de clase (C), para esto
divdase el rango de las observaciones entre el nmero de intervalos
de clase, esto es:
R
C=
NC
Estadstica Aplicada a la Educacin - 27 -
5. Determinar el nuevo Rango: R = KxC R = NCxC, donde R debe
ser mayor al rango encontrado de las observaciones.
6. Hallar la diferencia de Rangos: x = R ' - R
7. Clculo de lmites de clase (se encontrar el lmite inferior de la
primera clase del intervalo y el lmite superior del ltimo intervalo
de clase).
x
LCI = X mn (redondear al valor inmediato superior, an
2
cuando la parte decimal sea menor a 5).
x
LCS = X mx +
2
8. Una vez que se tiene los nuevos lmites, se comienza a construir la
tabla de la distribucin de frecuencias por intervalos de clase, te-
niendo en cuenta que los valores sean mutuamente excluyentes.
Las diferentes tablas de frecuencias que se pueden confeccionar para
un conjunto de datos contnuos est dada en la siguiente tabla.

TABLA 3.1: DISTRIBUCIN DE FRECUENCIA.

* * *
Y'i-1 - Y'i ni Ni Yi hi Hi hix100 Hix100 N i H i 100xH i
*
Y'0 - Y'1 n1 N1 Y1 h1 H1 h1x100 H1x100 N 1 1 100
* * *
Y'1- Y'2 n2 N2 Y2 h2 H2 h2x100 H2x100 N 2 H 1 100xH 1
* * *
Y'2 - Y'3 n3 N3 Y3 h3 H3 h3x100 H3x100 N 3 H 2 100xH 2
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
* * *
Y'm-1 - Y'm nm n Ym hm 1 100xhm 100 N m H m 100xH m
Totales n 1 100

EJEMPLO:

Las calificaciones de una prueba matemtica de 50 alumnos, sobre 100 puntos de


una clase han sido los siguientes:
- 28 - V. Ibaez Q.

Datos dados en calificativos


87 76 67 58 92 59 41 50 90 75
80 81 70 73 69 61 88 46 85 97
50 47 81 87 75 60 65 92 77 71
70 74 53 43 91 89 84 83 70 46
84 76 78 64 69 76 78 67 74 64
a. Construya la tabla de distribucin de frecuencias.

SOLUCIN:
1. Ordenar los datos en forma ascendente.
2. Determinacin del rango (R): R = Xmx - Xmn = 97-41 = 56
3. Encontrar el nmero aproximado de intervalos (NC), usaremos la frmula
de Sturges:
K = 1+3.3Log10(n) = 1 + 3.3Log(50) = 6.6 ~ 7
4. Encontrar la amplitud de clase o intervalo de clase (C):
R 56
C= = =8
NC 7
5. Determinar el nuevo Rango: R = KxC=8x7 = 56
6. Hallar la diferencia de Rangos: x = R - R = 56 - 56 = 0
7. Clculo de lmites de clase:
x 0
L C I = X m n = 41 = 41
2 2
x 0
L C S = X mx += 97 + = 97
2 2
8. Asignar cada dato obtenido al intervalo de clase correspondiente.

TABLA 3.2: DISTRIBUCIN DE LAS FRECUENCIAS ABSOLUTAS.

Calificativos
Y'i-1 - Y'i Conteo o Paloteo ni
41 - 49 47 41 43 46 46 5
49 - 57 50 50 53 3
57 - 65 58 64 59 60 64 61 6
65 - 73 67 69 65 67 71 70 70 69 70 9
73 - 81 76 76 78 75 76 78 77 74 75 80 74 73 12
81 - 89 87 84 81 87 81 88 84 83 85 9
89 - 97 92 92 90 91 89 97 6
Total 50
Estadstica Aplicada a la Educacin - 29 -
Completando la tabla de distribucin de frecuencias se tiene:

TABLA 3.3: DISTRIBUCIN DE FRECUENCIA DE LOS 50 ALUMNOS DE


DEL CURSO DE MATEMTICAS.

* * *
[Y'i-1 - Y'i> ni Ni Yi hi Hi hix100 Hix100 Ni H i 100xH i
41 - 49 5 5 45 0.10 0.10 10 10 50 1.00 100
49 - 57 3 8 53 0.06 0.16 6 16 45 0.90 90
57 - 65 6 14 61 0.12 0.28 12 28 42 0.84 84
65 - 73 9 23 69 0.18 0.46 18 46 36 0.72 72
73 - 81 12 35 77 0.24 0.7 24 70 27 0.54 54
81 - 89 9 44 85 0.18 0.88 18 88 15 0.30 30
89 - 97 6 50 93 0.12 1 12 100 6 0.12 12
Totales 50 1 100

INTERPRETACIN:
n1 = 5 alumnos tienen calificativos mayor o igual a 41 puntos y menores a 49
puntos en el curso de matemticas.
n5 = 12 alumnos tienen calificativos mayor o igual a 73 y menores a 81 puntos,
respectivamente, en el curso de matemticas.
n2 = 3 alumnos que tienen calificativos mayor o igual a 49 y menores a 57 puntos
en el curso de matemticas.
h5x100 = 24%, es el porcentaje de alumnos que tienen calificativos de 73 o ms
pero menos de 81 puntos, son altos en el en el curso de matemticas.
h4 = 0.18, es la proporcin de alumnos que presentan puntajes comprendido entre
65 o ms pero menos de 73 puntos.
N*5 = 27, es el nmero de alumnos que presentan puntajes por lo menos 73 pun-
tos.
H6 = 0.88, es la proporcin de alumnos que presentan puntajes menos de 89
puntos.
H*3 = 0.84, es la proporcin de alumnos que presentan puntajes por lo menos de
57 puntos.

Terminologa usada en la construccin de la distribucin de Frecuencias.

1. CLASE.- Se llama clase a cada uno de los intervalos de clase o grupos de datos
en las que se distribuye el total de observaciones.
Xmx = mx{X/i = 1,2,3, ..., n}
- 30 - V. Ibaez Q.
Xmn = mn{X/i = 1,2,3, ..., n}

2. INTERVALO DE CLASE.- Es el ancho o magnitud dentro de una clase, cuyos


datos se encuentran por un lmite inferior y un lmite superior. Sea m el
nmero de clases y Y1, Y2, Y3, ...., Ym, los extremos o lmites de los interva-
los de clase, entonces: Yi-1-Yi, i = 1,2,3, ...., m.
Ejemplo: 41 49, 49 57, .... ,89 97
3. INTERVALO ENTRE CLASES.- Es la magnitud o ancho de clase a clase y se
estima restando del lmite superior, el lmite inferior de cada intervalo de clase.
Ejemplo:
49 - 41 = 8 81 - 73 = 8, etc.
4. MARCAS DE CLASE PUNTOS MEDIOS (Yi).- Es el punto medio de cada
intervalo de clase. Se obtiene sumando los dos puntos (lmite inferior y lmite
superior) de un intervalo de clase y luego dividido entre dos. Es denotado por
Yi, i = 1,2,3, ... , m simplemente:
Y 'i 1 + Y 'i
Yi = , i = 1,2, ... , m.
2
Ejemplo:
41 + 49 49 + 57 89 + 97
Y1 = = 45 , Y2 = = 53 , ......., Y7 = = 93
2 2 2
5. FRECUENCIA ABSOLUTA (ni).- Es el nmero de veces una observacin o
varios datos numricos se repite, es decir, es el nmero de observaciones del
conjunto original que pertenece a dicha clase.

TABLA 3.4: DISTRIBUCIN DE FRECUENCIAS ABSOLUTAS.

[Y'i-1 - Y'i > Conteo, paloteo Frec. Absoluta (ni )


41 - 49 n1 = 5
49 - 57 /// n2 = 3
57 - 65 / n3 = 6
65 - 73 //// n4 = 9
73 - 81 // n5 = 12
81 - 89 //// n6 = 9
89 - 97 / n7 = 6
Totales n = 50
Estadstica Aplicada a la Educacin - 31 -
6. FRECUENCIA ABSOLUTA ACUMULADA (Ni).- Es la acumulacin del va-
lor de las frecuencias absolutas en forma sucesiva, comenzando de la parte
inferior de la distribucin.
i
N i = n1 + n 2 + L + n i = n j
j=1

Ejemplo:
N1 = n1 = 5, es el nmero de personas con calificativos menores a 49 puntos.
N2 = n1 + n2 = 5 + 8 = 8
N3 = n1 + n2 + n3 = 5 + 3 +6 = 14
N4 = n1 + n2 + n3 + n4= 5 + 3 + 6 + 9 = 23
N5 = n1 + n2 + n3 + n4 + n5 = 5 + 3 + 6 + 9 + 12 = 35
N6 = n1 + n2 + n3 + n4 + n5 + n6 = 5 + 3 + 6 + 9 + 12 + 9 = 44
N7 = n1 + n2 + n3 + n4 + n5 + n6 + n7 = 5 + 3 + 6 + 9 + 12 + 9 + 6 = 50
N8 = n = 50

7. FRECUENCIA RELATIVA (hi).- Es el valor relativo que toma la frecuencia


absoluta, se estima dividiendo la frecuencia de cada intervalo de clase entre la
sumatoria total de las frecuencias.
ni n
hi = , i = 1,2, L , m h i = m i
ni
n
i =1

Ejemplo:
n1 5
h1 = = = 0 .1 , prop. de muestras de personas que tienen puntajes 49.
n 50
n2 3
h2 = = = 0.06
n 50
n3 6
h3 = = = 0.12
n 50
.... = .... = ...... = ......
n7 6
h7 = = = 0.12
n 50

8. FRECUENCIA RELATIVA ACUMULADA (Hi).- Es la agrupacin o acumu-


lacin de las frecuencias relativas en forma ascendente y sucesiva, comenzando
- 32 - V. Ibaez Q.
de la parte inferior de la distribucin.
i
H i = h1 + h 2 + L + h m = h j
j=1

Ejemplo:
H1 = 0.10
H2 = h1 + h2 = 0.10 + 0.06 = 0.16
H3 = h1 + h2 + h3 = 0.10 + 0.06 + 0.12 = 0.28
H4 = h1 + h2 + h3 + h4= 0.10 + 0.06 + 0.12 + 0.18 = 0.46
H5 = h1 + h2 + h3 + h4 + h5=0.10 + 0.06 + 0.12 + 0.18 + 0.24 = 0.70
H6 = h1 + h2 + h3 + h4 + h5 + h6 = 0.10 + 0.06 + 0.12 + 0.18 + 0.24 + 0.18= 0.88
H7 = h1+h2+h3+h4+h5+h6+h7 = 0.10+0.06+0.12+0.18+0.24+0.18+0.12 = 1.00

9. FRECUENCIA ABSOLUTA ACUMULADA mayor o igual que (N*i).- Es


el nmero de observaciones mayores o iguales que el extremo inferior del inter-
valo de clase i-simo, es decir mayor o igual a Yi-1.
m
N*i = n1 + ni+1 + L + nm = n j
j=1

Ejemplo:
N*1 = n1 + n2 + n3 + n4 + n5 + n6 + n7 = n = 50
N*2 = n2 + n3 + n4 + n5 + n6 + n7 = 3 + 6 + 9 +12 + 9 + 6 = 45
N*3 = n3 + n4 + n5 + n6 + n7 = 6 + 9 +12 + 9 + 6 = 42
N*4 = n4 + n5 + n6 + n7 = 9 + 12 + 9 + 6 = 36
N*5 = n5 + n6 + n7 = 12 + 9 + 6 = 27
N*6 = n6 + n7 = 9 + 6 = 15
N*7 = n7 = 6 = 6

10. FRECUENCIA RELATIVA ACUMULADA (mayor o igual que) (H*i).- Es la


frecuencia relativa total correspondiente a los valores observados mayores o
iguales al extremo inferior del intervalo de clase i-simo, mayor o igual que
Yi-1.
m
H*i = h1 + hi+1 + L + hm = h j
j=1

Ejemplo:
H*1 = h1 + h2 + h3 + h4 + h5 + h6 + h7 = 1.00
H*2 = h2+h3+h4+h5+h6+h7 = 0.06+0.12+0.18+0.24+0.18+0.12 = 0.90
Estadstica Aplicada a la Educacin - 33 -
H*3 = h3 + h4 + h5 + h6 + h7 = 0.12+0.18+0.24+0.18+0.12 = 0.84
H*4 = h4 + h5 + h6 + h7 = 0.18+0.24+0.18+0.12 = 0.72
H*5 = h5 + h6 + h7 = 0.24+0.18+0.12 = 0.54
H*6 = h6 + h7 = 0.18+0.12 = 0.3
H*7 = h7 = 0.12 = 0.12

3.2.2. Distribucin de frecuencias con variables cuantitativas.


(datos con nmeros enteros).

Este tipo de distribucin, se utiliza cuando los datos toman valores


numricos enteros y para transformar este tipo de distribuciones a distribuciones de
frecuencias, se construye con intervalos de clases no traslapados.

PROCEDIMIENTO.
1. Ordenar los datos en forma creciente o decreciente: Xmin, X2, X3, ..., Xmx.
2. Determinacin del rango (R): R = Xmx - Xmn+ 1 (para intervalos de
clase no traslapados).
3. Determinacin del nmero de intervalos de clase (NC): Utilizando la regla
de Sturges: K = 1+3.3Log10(n), n 10 .
4. Encontrar la amplitud de clase o intervalo de clase (C), para esto divdase
el rango de las observaciones entre el nmero de intervalos de clase, esto
es:
R
C=
NC
5. Determinar el nuevo Rango: R = KxC R = NCxC, donde R ' R .
6. Hallar la diferencia de Rangos: x = R ' - R
7. Determinacin de los lmites de clase:
x x
LCI = X mn , LCS = X mx +
2 2
NOTA: Agregar C - 1 para obtener el lmite superior de clase, para usar
intervalos no traslapados y se aaden los dems intervalos. Para
formar el primer intervalo de clase, se toma el valor mnimo de la
distribucin (LCI) y a ella le sumamos C-1, entonces LCS1.

8. Determinacin de la frecuencia de clase.- Consiste en determinar el nme-


ro de observaciones que caen en cada intervalo de clase.
- 34 - V. Ibaez Q.
EJEMPLO:
Se obtienen 40 datos de pesos (kg) a pacientes con caries del Hospital Regional
Manuel Nuez Butrn - Puno. Los datos se presentan a continuacin:
57 56 92 88 87 96 67 113 120 76
40 60 76 106 73 74 118 76 100 93 n = 40
52 54 77 82 77 118 108 132 82 78
80 94 83 84 64 103 128 102 118 96
a) Construya la tabla de distribucin de frecuencias.

SOLUCION:
1. Ordenar los datos en forma creciente o decreciente: Xmin, X2, X3, ..., Xmx.
2. Determinacin del rango (R): R = Xmx - Xmn+ 1= 132 - 40 + 1 = 93 (+1
por ser discreta).
3. Determinacin del nmero de intervalos de clase (NC): Por Sturges
K = 1+3.3Log10(n) = 1 + 3.3Log(40) = 6.29 ~ K = 6

4. Encontrar la amplitud de clase o intervalo de clase (C):


R 93
C= = = 155
. 16
K 6
5. Determinar el nuevo Rango: R = KxC = 6x16 = 96.
6. Hallar la diferencia de Rangos: x = R - R = 96 - 93 = 3, donde R ' R .
7. Determinacin de los lmites de clase:
x 3
LCI = X mn = 40 = 38.5 39
2 2
x 3
LCS = X mx + = 132 + = 1335 . 134
2 2
8. Determinacin de la frecuencia de clase.- Consiste en determinar el nme-
ro de observaciones que caen en cada intervalo de clase.

Observacin:

Para formar el primer intervalo de clase, se toma el valor mnimo de la distri-


bucin 39 a este valor se suma el (C-1) = 16 - 1 = 15, es decir 39+15 = 54,
luego la primera clase es <39 - 54], la segunda clase es: 55+15 = 70, luego la
segunda clase es <55 - 70], y as sucesivamente hasta formar el ltimo inter-
valo de clase [119 - 134>.
Estadstica Aplicada a la Educacin - 35 -

TABLA 3.5: DISTRIBUCIN DE FRECUENCIAS ABSOLUTAS.

In t. D e c la s e Va lo re s q u e c a e n d e n t ro d e l in te rv a lo ni
39 - 54 40, 52, 54 3
55 - 70 57, 56, 60, 64, 67 5
71 - 86 80, 76, 77, 83, 82, 84, 73, 77, 74, 76, 82, 76, 78 13
87 - 102 94, 92, 88, 87, 96, 102, 100, 93, 96 9
103 - 118 106, 118, 103, 118, 108, 113, 118 7
119 - 134 128, 132, 120 3
T o ta le s 40

Convirtiendo los intervalos de clase a lmites reales de clase, es decir encontrar


los intervalos de clase traslapados, esto se logra de la siguiente manera:

TABLA 3.6: LMITES REALES DE CLASE Y FRECUENCIA ABSOLUTA.

In t. De clas e Valo res q u e caen d en tro d el in terv alo ni


38.5 - 54.5 40, 52, 54 3
54.5 - 70.5 57, 56, 60, 64, 67 5
70.5 - 86.5 80, 76, 77, 83, 82, 84, 73, 77, 74, 76, 82, 76, 78 13
86.5 - 102.5 94, 92, 88, 87, 96, 102, 100, 93, 96 9
102.5 - 118.5 106, 118, 103, 118, 108, 113, 118 7
118.5 - 134.5 128, 132, 120 3
T o tales 40

En resumen, se tiene la tabla completa de la distribucin de frecuencias:

TABLA 3.7: DISTRIBUCIN DE FRECUENCIA DE LOS PACIENTES CON


CARIES.

* * *
Int. De clase ni Ni Yi hi Hi hix100 Hix100 Ni H i 100xH i
39 - 54 3 3 46.5 0.075 0.075 7.5 7.5 40 1.000 100
55 - 70 5 8 62.5 0.125 0.200 12.5 20.0 37 0.925 92.5
71 - 86 13 21 78.5 0.325 0.525 32.5 52.5 32 0.800 80.0
87 - 102 9 30 94.5 0.225 0.750 22.5 75.0 19 0.475 47.5
103 - 118 7 37 110.5 0.175 0.925 17.5 92.5 10 0.250 25.0
119 - 134 3 40 126.5 0.075 1.000 7.5 100 3 0.075 7.5
Totales 40 1.000 100
- 36 - V. Ibaez Q.
INTERPRETACIN:

n1 = 3 pacientes tienen mayor a 39 kg. y menor o igual a 54 kg.

n3 = 13 pacientes poseen mayores a 71 kg. y menores o iguales a 86 kg.

N2 = 8 pacientes poseen menores o igual a 70 kg.

h3x100 = 32.5% es el porcentaje de pacientes que poseen entre 71 y 86 kg.

h4 = 0.225 es la proporcin de pacientes que poseen 87 o ms, pero menor o igual


102 kg..

Otra forma de construir la tabla de distribucin de frecuencias.

1. Ordenar los datos en forma ascendente o descendente: Xmin, X2, X3, ..., Xmx.
2. Determinacin del rango (R): R = Xmx - Xmn = 132 - 40 = 92
3. Determinacin del nmero de intervalos de clase (NC), por Sturges es:
K = 1+3.3Log10(n) = 1 + 3.3Log(40) = 6.29 ~ K = 6
4. Encontrar la amplitud de clase o intervalo de clase (C):
R 92
C= = = 15.33 16
K 6
5. Determinacin del nuevo Rango: R = KxC = 6x16 = 96.
6. Clculo del nmero de rango: x = R - R = 96 - 92 = 4, donde R ' R .
Entonces:
2 ( S e l e r e s t a a l Xmn , e s t o e s : 4 0 - 2 = 3 8
x = 4
2 (Se le suma al X mx, esto es: 132 + 2 = 134

OBSERVACIN:

a) Si la diferencia es nmero par, se reparte equitativamente entre el primero


y ltimo dato:

Ejemplo:
2 (Se le resta al primer dato).
x = 4
2 (Se le suma al ltimo dato)
Estadstica Aplicada a la Educacin - 37 -
b) Si la diferencia es un nmero impar, se reparte en dos nmeros consecuti-
vos el menor para el primer dato y el mayor para el ltimo dato.

Ejemplo:
1 (Se le resta al primer dato).
x = 3
2 (Se le suma al ltimo dato)

2 (Se le resta al primer dato).


x = 5
3 (Se le suma al ltimo dato)

3 (Se le resta al primer dato).


x = 7
4 (Se le suma al ltimo dato)

7. Determinacin de la frecuencia de clase, que consiste en determinar el


nmero de observaciones que caen dentro de cada intervalo de clase.

TABLA 3.7: DISTRIBUCIN DE FRECUENCIA DE LOS PACIENTES DEL


HRMNB-PUNO.

* * *
Int. De clase ni Ni Yi hi Hi hix100 Hix100 Ni H i 100xH i
38 - 54 2 2 46 0.050 0.050 5.0 5.0 40 1.000 100
54 - 70 6 8 62 0.150 0.200 15.0 20.0 38 0.950 95.0
70 - 86 13 21 78 0.325 0.525 32.5 52.5 32 0.800 80.0
86 - 102 9 30 94 0.225 0.750 22.5 75.0 19 0.475 47.5
102 - 118 6 36 110 0.150 0.900 15.0 90.0 10 0.250 25.0
118 - 134 4 40 126 0.100 1.000 10.0 100 4 0.100 10.0
Totales 40 1.000 100

3.2.3. Distribucin de frecuencias con variable cuantitativa discreta.

Cuando los datos no constituyen en intervalos (son discontnuas), en-


tonces el inters del investigador es conocer la distribucin de esta caracterstica a
partir de la informacin recopilada. Entonces una distribucin de frecuencias es un
arreglo de los valores observados Y1, Y2, .... , Yn de la variable Y (poblacin) con sus
respectivas frecuencias que se presenta a continuacin:
- 38 - V. Ibaez Q.

TABLA 3.8: DISTRIBUCIN DE FRECUENCIA PARA LA VARIABLE DIS-


CRETA.

* * *
Valores de Yi ni Ni hi Hi hix100 Hix100 N i H i 100xH i
* * *
Y1 n1 N1 h1 H1 h1x100 H1x100 N 1 H 1 100xH 1
* * *
Y2 n2 N2 h2 H2 h2x100 H2x100 N 2 H 2 100xH 2
* * *
Y3 n3 N3 h3 H3 h3x100 H3x100 N3 H3100xH 3
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
* * *
Ym nm Nm hm Hm 100xhm Hmx100 N m H m 100xH m
m m

Totales n = ni h =1 i 100
i=1 i=1

Donde:
Yi = Son los valores de la variable.
ni = Son frecuencias absolutas.
Ni = Son frecuencias absolutas acumuladas (o menor que).
hi = Son frecuencias relativas.
Hi = Son frecuencias absolutas acumuladas.
Ni* = Frecuencia absoluta acumulada mayor que.
Hi* = Frecuencia relativa acumulada mayor que.
100xhi = Frecuencia relativa porcentual.
100xHi = Frecuencia relativa acumulada porcentual.
100xHi* = Frecuencia relativa acumulada porcentual.

EJEMPLO:

Construya una tabla de frecuencias para los datos que corresponden a 42 pacien-
tes con infeccin dentaria; registrndose el nmero de extracciones o curaciones
durante el ao 2000 en el Hospital Regional Manuel Nuez Butrn - Puno.
Nmero de pacientes
9 8 7 2 3 9 0 9 2 4 5 7 8 1
6 4 3 4 0 1 6 3 9 1 7 2 2 6 n = 42
4 2 8 2 2 4 5 6 1 3 3 3 7 4
Estadstica Aplicada a la Educacin - 39 -
SOLUCION:

TABLA 3.11: DISTRIBUCIN DE FRECUENCIA PARA LOS PACIENTES CON


INFECCION DENTARIA EN EL HRMNB - PUNO, 2000.

Extraccin o curaciones Pacientes


* * *
(Yi) ni Ni hi Hi hix100 Hix100 N i H i 100xH i
0 2 2 0.05 0.05 5 5 42 1.0000 100.00
1 4 6 0.10 0.14 10 14 40 0.9524 95.24
2 7 13 0.17 0.31 17 31 36 0.8571 85.71
3 6 19 0.14 0.45 14 45 29 0.6905 69.05
4 6 25 0.14 0.60 14 60 23 0.5476 54.76
5 2 27 0.05 0.64 5 64 17 0.4048 40.48
6 4 31 0.10 0.74 10 74 15 0.3571 35.71
7 4 35 0.10 0.83 10 83 11 0.2619 26.19
8 3 38 0.07 0.90 7 90 7 0.1667 16.67
9 4 42 0.10 1.00 10 100 4 0.0952 9.52
10 10
Total n = 42
i=1
i h =1
i=1
i 100

INTERPRETACIN:
n3 = 7, significa que en 7 pacientes hay 2 para extraccin.
N5 = 25, significa que en 25 pacientes, hay 0,1,2,3, y 4 para curaciones o extrac-
cin en el HRMNB-Puno.
h4 = 0.14, significa la proporcin de pacientes en la muestra que tiene 3 extrac-
ciones, la cual expresado en porcentaje es 14%.
h5x100 = 14%, porcentaje de pacientes con 4 extracciones.
100xH7 = 75%, es el porcentaje de pacientes en la muestra, por lo menos 6 extrac-
ciones.
N1* = 42, significa que en la encuesta hay 0 y 9 curaciones o extracciones de
dientes en HRMNB-Puno.
N2* = 40, significa que en la encuesta hay 40 pacientes que tienen por lo menos 1
extraccin.

PROPIEDADES DE LAS FRECUENCIAS.


1) Las frecuencias absolutas (ni) y las frecuencias absolutas acumuladas (Ni) son
siempre enteros no negativos.
- 40 - V. Ibaez Q.

n i 0, N i 0 y N *i 0 para i = 1,2,...., m
2) La suma de todas las frecuencias absolutas es igual al nmero total del conjun-
to de observaciones.
m

n
i =1
i = n1 + n 2 +L+ n m = n

3) Las frecuencias relativas (hi) y las frecuencias relativas acumuladas (Hi) son
siempre nmeros fraccionarios no negativos, no mayores que uno.
0 h i 1, 0 H i 1 y 0 H *i 1 para i = 1, 2, ...., m
4) La frecuencia absoluta acumulada menor que correspondiente al valor Xm co-
incide con el nmerto total del conjunto de observaciones.
m
N m = n i = n.
i =1
5) La frecuencia absoluta acumulada mayor que correspondiente al valor X1 coin-
cide con el nmero total del conjunto de datos.
m
N = n i = n.
*
1
i =1
6) La frecuencia relativa acumulada menor que correspondiente al valor Xm co-
incide con la unidad.
m
H m =
i=1
hi = 1

7) La frecuencia relativa acumulada mayor que correspondiente al valor X1 coin-


cide con la unidad.
m
H 1* = h i = 1
i =1

8) La frecuencia absoluta acumulada menor que correspondiente al valor Y1 es n1


1
N1 = ni = 1
i =1
9) La frecuencia absoluta acumulada mayor que correspondiente al valor Xm es
n m.
m
N *
m =
i= m
ni = nm
Estadstica Aplicada a la Educacin - 41 -
10) La frecuencia relativa acumulada menor que correspondiente al valor X1 es h1
es:
1
H 1 = h i = h1
i =1
11) La frecuencia relativa acumulada mayor que correspondiente al valor Xm es
hm.
m
H = hi = h m
*
m
i=m

3.2.4. DATOS DE VARIABLES CUALITATIVAS.

Cuando se tiene la informacin de tipo cualitativo, la forma de presen-


tar la tabla de distribucin de frecuencias es la siguiente:

TABLA 3.12: DISTRIBUCIN DE FRECUENCIA DE VARIABLES CUALITA-


TIVAS.

Frec. Absoluta Frec. Relativas Frec. Rel. Porcentual


Variable ni hi 100xhi
Caracterstica A nA hA 100xhA
Caracterstica B nB hB 100xhB
... ... ... ...
... ... ... ...
Caracterstica Z nZ hZ 100xhZ
Totales n 1 100%

3.2.5. DIAGRAMA DE HOJAS Y TALLOS.

La tcnica para presentar datos numricos conocida como representa-


cin tallo-hoja (Stem-and-leaf), ha ganado popularidad recientemente y sirve para
datos cuantitativos, y es til cuando el nmero total de observaciones es pequeo
(menor de 50). Esta tcnica es una combinacin de dos procedimientos: uno grfico
y otro de ordenacin. Los principios bsicos para construir son los siguientes:

a) Redondear los datos a dos o tres cifras significativas, expresndolos en unida-


des convenientes.
- 42 - V. Ibaez Q.
b) Disponerlos en una tabla con dos columnas separadas por una lnea como
sigue:
i. Para datos con dos dgitos, escribir a la izquierda de la lnea los dgitos de
las decenas, que forman el tallo, y a la derecha las unidades que sern las
ramas. Por ejemplo 89 se escribe:
Tallo Hoja
8 9
ii. Para datos con tres dgitos el tallo estar formado por los dgitos de las
centenas y decenas, que se escribirn a la izquierda, separados de las unida-
des. Por ejemplo: 349
Tallo Hoja
34 9
c) Cada tallo define una clase, y se escribe slo una vez. El nmero de hojas
representa la frecuencia de dicha clase, que se ubica en una tercera columna
del diagrama.

EJEMPLO:

Construir una representacin Tallo-Hoja para el siguiente conjunto de 20 califi-


caciones de exmenes.
82 74 88 66 58 74 78 84 96 76
62 68 72 92 86 76 52 76 82 78

SOLUCION:

TABLA 3.15: DIAGRAMA DE TALLOS Y HOJAS DE LAS 20 CALIFICACIO-


NES DE EXAMENES.

Tallo Ho ja Frecu en cia


5 82 2
6 628 3
5 tallo s 7 44862668 8
8 28462 5
9 62 2
n = 20

Diagramas de Doble Tallo y Hojas. Existen dos formas de realizar:


Estadstica Aplicada a la Educacin - 43 -
a) Se debe considerar los nmeros 0, 1, 2, 3 y 4 colocando con un *
b) Otro grupo de nmeros que se debe tomar en cuenta es: 5,6,7,8 y 9, para lo
cual se debe colocar con diferente smbolo .
EJEMPLO:
Con la informacin que corresponde a 20 calificaciones de exmenes de los
estudiantes. Construir el diagrama doble de tallos-hojas.

TABLA 3.16: DIAGRAMA DE DOBLE TALLO Y HOJAS DE LOS 20 CALIFI-


CACIONES DE EXAMENES DE LOS ESTUDIANTES.

Tallo Hoja Frecuencia


5* 2 1
5 8 1
6* 2 1
6 68 2
7* 442 3
7 86668 5
8* 242 3
8 86 2
9* 2 1
9* 6 1
n = 20

VENTAJAS DE LOS DIAGRAMAS DE HOJAS Y TALLOS.

- Es flexible en cuanto a poder incluir datos extremos sin perder el grado de


detalle en el resto de los datos.
- Permiten percibir caractersticas de los datos que a veces los intervalos cu-
bren.
- Los diagramas de tallos y hojas conservan los datos originales, por lo que es
fcil identificar algn dato particular si lo quisiramos.
- No necesita algn grfico adicional para percibir la forma de la distribucin.

DESVENTAJAS:

- No es una representacin prctica para cantidades volmenes de informa-


cin que se pueda disponer.
- 44 - V. Ibaez Q.

EJERCICIOS PROPUESTOS 3.1

1. Los resultados obtenidos por una clase en el desarrollo del test de Raven, fueron:
37 39 32 12 28 45 30 11 38 41 37 32 39 29 12 17 20 39 18 35 33 22 41
32 21 37 37 10 42 18 42 47 23 19 45 32 36 10 40 38 21 29 44 21 35 36
a) Elaborar una tabla de distribucin de frecuencias.
b) Construir el polgono de frecuencias.
c) Construir el polgono acumulativo de frecuencias y ojivas.
2. Las calificaciones de 40 estudiantes sobre una prueba de aptitud son las siguien-
tes:
27.8 43.0 28.7 19.1 45.7 33.5 16.9 43.6 24.7 9.7 28.4 27.2 19.8 21.0 39.5
44.6 25.5 34.1 0.6 15.4 35.0 35.0 13.4 11.8 17.0 48.8 40.6 38.6 32.0 16.4
19.2 11.8 3.9 33.4 27.9 32.5 0.2 13.5 3.53 31.0
Construya:
a) La tabla de distribucin de frecuencias.
b) Graficar el histograma de frecuencias, polgono de frec. absolutas y relativas y,
ojivas.
3. Hallar las frecuencias que faltan en el siguiente cuadro de frecuencias:
In terv alo s ni hi Hi
- 24 0.15
- 0.25
- 44 0.90
45 -
T o tal 60

4. Se tiene una distribucin de frecuencias con cuatro intervalos de amplitud cons-


tante para 50 datos:

Intervalos ni hi Hi
- 3 0.08
- 5 0.40
- 12
- 9 0.36
Total
Completar el cuadro de distribucin de frecuencias.
Estadstica Aplicada a la Educacin - 45 -

5. Hallar las frecuencias relativas y construir el histograma y poligono de frecuen-


cias de la alturas de 100 estudiantes que a continuacin se indica (altura en m).

1.66 1.59 1.72 1.61 1.79 1.67 1.69 1.59 1.60 1.72
1.64 1.56 1.67 1.67 1.73 1.68 1.67 1.76 1.66 1.64
1.61 1.57 1.62 1.68 1.69 1.80 1.67 1.69 1.65 1.57
1.61 1.75 1.68 1.76 1.69 1.61 1.53 1.66 1.75 1.65
1.66 1.66 1.75 1.55 1.60 1.69 1.68 1.78 1.69 1.65
1.72 1.70 1.64 1.57 1.76 1.66 1.62 1.64 1.70 1.63
1.62 1.68 1.63 1.76 1.64 1.60 1.78 1.64 1.65 1.57
1.62 1.73 1.67 1.68 1.54 1.76 1.65 1.62 1.63 1.79
1.66 1.78 1.70 1.64 1.66 1.73 1.63 1.77 1.67 1.63
1.59 1.64 1.68 1.60 1.53 1.70 1.67 1.64 1.65 1.79
- 46 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 47 -

4
ETAPA DE PRESENTACIN
DE DATOS

4.1. REPRESENTACIN TABULAR.

4.1.1. CUADROS ESTADSTICOS.

En general un cuadro estadstico es un arreglo ordenado, de filas y


columnas de los datos o series estadsticas, por tanto tien dos entradas ( o ms de
dos). En ellas pueden representarse caractersticas cualitativas, cuantitativas o una
combinacin de ambas. Se puede tambin considerar variables discretas, contnuas o
de ambos tipos. La finalidad es ofrecer informacin resumida de fcil lectura, com-
paracin e interpretacin. Segn su objetivo, las lneas (horizontales) y columnas
(verticales) de un cuadro se deben organizar de modo que pongan en evidencia los
aspectos que interesa mostrar y resaltar las comparaciones que se desean hacer notar.
La tabla de distribucin de frecuencias es un caso especial de un cuadro estadstico.

4.1.2. PARTES DE UN CUADRO ESTADSTICO

Consiste en la presentacin ordenada de los datos en filas y columnas


con el objeto de facilitar su lectura y posterior anlisis e interpretacin.
- 48 - V. Ibaez Q.
Las partes esenciales de un cuadro estadstico son:
1. Nmero.- Es el cdigo de identificacin del cuadro. Este nmero se
escribe a continuacin de la palabra CUADRO.
Ejemplo: Cuadro N 2.3, indica el tercer cuadro del captulo 2.
2. Ttulo.- Es la indicacin que preside a la tabla y es colocada en la
parte superior de la misma. El ttulo debe reunir las condiciones
siguientes: a) Ser completo, b) ser conciso.
a. Ser Completo.- Un ttulo completo debe indicar claramente cul
es el contenido del cuadro estadstico. Debe responder a las pre-
guntas: Qu, Cmo, Dnde y Cundo.

Qu.- A que se refiere la tabla que se estudia. Cul es el universo


que se investiga.
Cmo.- Cmo se estudia, de acuerdo a cules caractersticas se
clasifican los individuos u objetos estudiados. Las variables ubi-
cadas en las filas se identifican con la proposicin POR y las de
la columna con la proposicin SEGN.
Cundo.- Momento o perodo de tiempo a que se refiere el estu-
dio.
Dnde.- Lugar a que se refiere la informacin.

b. Ser conciso.- El ttulo debe ser breve, lo ms conciso posible,


aunque no debe sacrificarse la claridad a la concisin.

3. Cuadro propiamente dicho.- Es la parte del cuadro que contiene la


informacin y consta de un conjunto de casillas o celdas, dispuestas
en columnas y filas. Sus elementos esenciales son: Encabezamiento
de las columnas, columna principal o matriz y cuerpo.

Encabezamiento.- Es la primera fila del cuadro, en el se explica las


categoras y el objeto de cada una de las columnas, indica la natura-
leza de los datos inscritos en cada celda que se hallan debajo. Deben
ser breves y explcitos.

Columna principal o Matriz.- Es aquella en que se anotan las


categoras o las diferentes clases de la escala de clasificacin utili-
zada.

Cuerpo.- Es el conjunto de celdas o casillas que son las interseccio-


nes de filas y columnas, donde estn anotados los datos numricos.
Estadstica Aplicada a la Educacin - 49 -
4. Notas explcitas o Clase.- Contiene habitualmente la FUENTE de
los datos representados y cualquier NOTA ACLARATORIA sobre
el contenido del cuadro.

FUENTE.- Es la indicacin al pie del cuadro que sirve para nom-


brar la entidad responsable de donde se obtuvieron los datos.

EJEMPLO:

Se tiene la siguiente informacin de poblacin de alpacas por departamentos


en el Per, 1994.

CUADRO 4.1 DISTRIBUCIN DE LA POBLACIN DE ALPACAS


POR DEPARTAMENTOS: PER - 1994.

Dep a rta men to N d e c ab ezas %


Pu n o 1,723,110 56.94
Cu zco 400,877 13.25
A re q u ip a 262,000 8.66
Hu an ca v elica 203,550 6.73
A y ac u c h o 162,225 5.36
A p u rimac 96,810 3.20
M o qu egu a 42,100 1.39
T ac n a 33,768 1.12
Cerro d e Pa s c o 28,190 0.93
Ju n n 27,700 0.92
Lima 20,132 0.67
A n ca s h 12,511 0.41
Cajama rc a 5,097 0.17
La Lib e rta d 4,782 0.16
Hu an u c o 3,235 0.11
T o tal 3,026,087 100.00
FUENT E: M INA G-OIA , 1999 y Co mp ila ci n d e CISA , 1994.

Qu : Distribucin de la poblacin de alpacas.


Cmo : Por Departamentos.
Cundo : En 1994.
Dnde : En el Per.
- 50 - V. Ibaez Q.

4.1.3. TIPOS DE TABLAS ESTADSTICAS.

A. De acuerdo al Uso.

1. Tabla General o de Referencia.

Como su nombre mismo lo indica son tablas referenciales que


se utilizan generalmente como fuente de informacin, ya que contiene datos en deta-
lle sobre diversas variables de un fenmeno. Ejemplo: Cuadro N 4.2.

2. Tabla de Texto o Resumen.

Son tablas que se elaboran en base a la tabla general o de refe-


rencia, de donde se seleccionan una o ms variables de inters o que presentan cierta
relacin entre s, con el fin de explicar una determinada situacin.

En relacin al ejemplo anterior, de todas las variables que con-


tiene la tabla general, se puede elaborar una tabla resumen, seleccionando dos varia-
bles.

Ejemplo: Cuadro N 4.3.

CUADRON 4.2
UNIVERSIDADFEMENINADEL SAGRADOCORAZN
ALUMNASMATRICULADASPORDEPARTAMENTOSDE PROCEDENCIA, SEGNDATOSPERSONALES1992

Dpto. de EDAD ESTADOCIVIL COLEGIODEPROCEDENCIA PROG.


Procedencia 16- 19 20- 23 24- 27 28y + Soltera Casada Estatal Particular P. Religioso ACADEMICA
Arequipa
Cajamarca
Cuzco
Ica
Junn
La Libertad
Lambayeque
Lima - Callao
Piura
Tacna
FUENTE: UNIFE, Secretara General.
Estadstica Aplicada a la Educacin - 51 -

CUADRO N 4.3
UNIVERSIDAD FEM ENINA DEL SAGRADO CORAZN
ALUM NAS M ATRICULADAS POR DEPARTAM ENTOS DE PROCEDENCIA
SEGN EDAD 1992.
Dpto. de EDAD
Procedencia 16 - 19 20 - 23 24 - 27 28 y + TOTAL
Arequipa
Cajamarca
Cuzco
Ica
Junn
La Libertad
Lambayeque
Lima - Callao
Piura
Tacna
FUENTE: UNIFE, Secretara General.

B. Desde el Punto de Vista de su disposicin.

1. Tablas de una entrada o entrada simple.

Son tablas en cuyo orden presentan una sola variable, anlisis o


caracterstica y su clasificacin va definida en columna matriz.

Ejemplo: Cuadro N 4.4 y 4.5.

CUA DRO N 4.4


HOSPITA L M A NUEL NUEZ BUTRON
PACIEN T ES AT ENDIDO S DE T U BERCU LO SIS PU LM ON AR, POR
NIVEL D E INST RUCCI N - PUNO : M ARZ O 1998.

NIVEL DE
INSTRUCCIN NM ERO %
A nalfabeto 38 31.67
Primaria 63 52.50
Secundaria 16 13.33
Superior 3 2.50
TOTA L 120 100.00
FUENTE: Hos pital M anuel Nuez Butrn, Oficina de Es tads tica
- 52 - V. Ibaez Q.

C U A D R O N 4 .5

H O S P IT A L M A N U E L N U E Z B U T R O N
P A C IE N T E S A T E N D ID O S D E T U B E R C U L O SIS P U L M O N A R ,
P O R ED A D . PU N O : M A R Z O 1998.

ED A D
(A o s c u m p lid o s ) N M ER O
0 - 9 9
10 - 19 15
20 - 29 26
30 - 39 30
40 - 49 34
50 - 59 5
60 - 69 1
TOTA L 120
F U E N T E : H o s p it a l M a n u e l N u e z B u t r n , O fic in a d e E s t a d s t ic a

Como se puede observar en stos dos ejemplos, cada tabla presenta


una variable que se distribuye en columna matriz: nivel de instruccin (Cuadro N
4.4), edad (Cuadro N 4.5). Asimismo, en el ttulo se puede apreciar que despus de
mencionar la naturaleza del problema (pacientes atendidos de tuberculosis pulmonar)
se les da el criterio de la clasificacin (POR nivel de instruccin, POR edad), donde
la variable est precedida de la palabra POR.

2. Tablas de dos entradas o entrada doble.

Son tablas que presentan simultneamente dos variables, an-


lisis o caractersticas relacionados, donde una va definida en columna matriz (verti-
cal) y la otra en encabezado (horizontal). Ejemplo: Cuadro 4.6 y 4.7.

C U A D R O 4 .6

H O S P IT A L M A N U E L N U E Z B U T R N
P A C IE N T E S A T E N D ID O S D E T U B E R C U L O SIS P U L M O N A R ,
P O R N IV E L D E IN ST R U C C I N , SE G N SE X O . M A R Z O 1 9 9 8

N IV E L D E S E X O
IN S T R U C C I N M a s c u lin o F e m e n in o TOTA L
A n a lfa b e t o 28 10 38
P rim a ria 32 31 63
S e c u n d a ria 9 7 16
S u p e rio r 1 2 3
TOTA L 70 50 120
F U E N T E : H o s p it a l M a n u e l N u e z B u t ro n . O fic . D e E s t a d s t ic a .
Estadstica Aplicada a la Educacin - 53 -

C U A D R O 4.7

H O S P IT A L M A N U EL N U E Z B U T R N
P A C IE N T E S A T E N D ID O S D E T U B E R C U L O SIS P U L M O N A R ,
P O R E D A D , S E G N T I P O D E R E SI D E N C IA - M A R Z O 1 9 9 8

ED A D T IP O D E R ES ID E N C IA
(A o s c u m p lid o s ) U RBA N A RURA L TOTA L
00 - 0 9 1 8 9
10 - 1 9 4 11 15
20 - 2 9 8 18 26
30 - 3 9 10 20 30
40 - 4 9 7 27 34
50 - 5 9 - 5 5
60 - 6 9 - 1 1
TOTA L 30 90 12 0
F U EN T E: H o s p it a l M a n u e l N u e z B u t ro n . O fic . D e Es t a d s t ic a .

Podemos observar en los dos ejemplos que cada tabla presenta


dos variables: Nivel de Instruccin y Sexo (Cuadro N 4.6); edad y tipo de residencia
(Cuadro N 4.7). En el ttulo podemos apreciar que luego de la naturaleza del proble-
ma (pacientes atendidos de tuberculosis pulmonar) se lee el criterio de clasificacin
(POR Nivel de Instruccin, SEGN Sexo; POR edad, SEGN Tipo de Residencia);
las variables estn precedidas de las palabras POR, SEGN, las mismas que ayudan
a conectar dos variables relacionadas.

3. Tablas Complejas.

Son tablas que presentan en forma simultnea tres o ms varia-


bles, anlisis o caractersticas relacionadas que van definidas unas en columna ma-
triz (vertical) y otras en encabezado (horizontal).

Es necesario tener en cuenta que el objetivo de elaborar tablas o


cuadros estadsticos, es presentar ordenadamente los datos de tal manera que facili-
ten su anlisis e interpretacin para la toma de decisiones. Por lo tanto, los cuadros
estadsticos no deben ser complicados, ni presentar muchas variables.
- 54 - V. Ibaez Q.

CUADRO N 4.8

HOSPITAL MANUEL NUEZ BUTRN


PACIENTES ATENDIDOS DE TUBERCULOSIS PULMONAR, POR NIVEL
DE INSTRUCCIN, SEGN TIPO DE RESIDENCIA Y SEXO - MARZO 1998.

TIPO DE RESIDENCIA
NIVEL DE Zona Urbano Zona Rural TOTAL
INSTRUCCIN Masculino Femenino Masculino Femenino
Analfabeto 6 4 22 6 38
Primaria 9 6 23 25 63
Secundaria 3 2 6 5 16
Superior - - 1 2 3
TOTAL 18 12 52 38 120
FUENTE: Hospital Manuel Nuez Butrn, Oficina de Estadstica.

CUADRO N 4.9

HOSPITAL MANUEL NUEZ BUTRN


PACIENTES ATENDIDOS DE TUBERCULOSIS PULMONAR POR EDAD,
SEGN TIPO DE RESIDENCIA Y SEXO - MARZO 1998.

TIPO DE RESIDENCIA
EDAD Zona Urbano Zona Rural TOTAL
Masculino Femenino Masculino Femenino
00 - 09 1 - 3 5 9
10 - 19 3 1 6 5 15
20 - 29 4 4 11 7 26
30 - 39 7 3 12 8 30
40 - 49 3 4 16 11 34
50 - 59 - - 3 2 5
60 - 69 - - 1 - 1
TOTAL 18 12 52 38 120
FUENTE: Hospital Manuel Nuez Butron. Oficina de Estadstica.
Estadstica Aplicada a la Educacin - 55 -
Se puede apreciar en los ejemplos que cada tabla presenta tres variables: Ni-
vel de Instruccin, Tipo de Residencia y Sexo (Cuadro N 4.8); Edad, Tipo de Resi-
dencia y Sexo (Cuadro N 4.9). En el ttulo observamos que en el criterio de clasifi-
cacin, las variables estn precedidas de las palabras: POR, SEGN, (POR nivel de
instruccin, SEGN tipo de residencia, y Sexo; POR edad, SEGN tipo de residen-
cia y sexo), las mismas que ayudan a conectar las variables.

4.2. REPRESENTACIN GRFICA.

Un grfico es la representacin de un fenmeno estadstico por medio de figu-


ras geomtricas (puntos, lneas, rectngulos, paralelepipedo, etc.) cuyas dimensiones
son proporcionales a la magnitud de los datos representados. El grfico es un auxi-
liar del cuadro estadstico, no lo sustituye sino que lo complementa. Los grficos
constituyen un complemento del anlisis descriptivo y en su presentacin pueden ir
acompaados de la tabla o cuadro que le dio origen, ya que sta presenta detalles que
no aparecen en el grfico.

Importancia.
Los grficos son importantes por lo siguiente:
- Son esenciales en el estudio y presentacin de trabajos estadsticos. Los
datos transformados en dibujo permite un examen visual que constituye,
muchas veces, la primera etapa de un anlisis e interpretacin de datos.
- Permiten observar en forma instantnea el comportamiento de la variable o
variables materia de estudio.
- Permiten formar una idea bastante aproximada sobre la tendencia de las
variables en el futuro.

Ventajas y Desventajas del grfico.


El grfico tiene la ventaja sobre el cuadro de permitir observar de un solo
golpe de vista apreciar ms rpidamente los datos y darse cuenta de todo conjunto de
elementos.

Limitaciones en la construccin del grfico:


- El grfico no puede presentar tantos grupos de datos como una tabla. Un
cuadro puede tener 4 o ms columnas de datos, sin embargo representado
esto es un grfico que dificulta su comprensin.
- En los cuadros pueden darse valores exactos, en los grficos muchas veces
solo valores aproximados.
- 56 - V. Ibaez Q.
4.2.1. PARTES DE UN GRFICO.

Las partes de un grfico a considerarse son:


A. El Ttulo.- Expresa el contenido del grfico y por lo general, es
igual o parecido al ttulo del cuadro estadstico que sirvi de refe-
rencia.
B. Escalas.- Para graficar, se utiliza el sistema cartesiano, compuesto
por dos ejes: uno horizontal llamado abcisa; y otro vertical llamado
ordenada. Ambos ejes se cortan en un punto llamado origen. Las
escalas vienen a ser la graduacin de ambos ejes, segn la naturale-
za de las variables y frecuencias correspondientes.
C. Cuerpo.- Es el grfico en s, y constituye la representacin en dibu-
jo de los datos.
D. Fuente.- Indica el origen de los datos estadsticos que se est repre-
sentando en el grfico.

4.2.2. TIPOS DE GRFICOS ESTADSTICOS.


Existen diversidad de grficos estadsticos; stos se eligen de acuerdo
al tipo de variable y al propsito para el cual se construyen.

Los grficos ms importantes y de mayor uso son:

A. Cuando los Datos son Medidos a Nivel Nominal u Ordinal.

1. Grfico de Barras.
Es usado generalmente para representar hechos o fenmenos
sin continuidad, sin movimiento, de tal forma que permita visualizar la magnitud y
comparar los elementos en que se clasifican las variables. Los grficos de barras,
pueden ser de los siguientes tipos:

a. Grfico de Barras Simple.


Para su elaboracin se debe contar con una tabla o cuadro
de entrada simple. Recomendaciones para su construccin: No existen reglas defini-
das estrictas para la construccin de grficos de barras, se darn algunas recomenda-
ciones que pueden ser tomadas en cuenta:
1. Todas las barras, rectngulos o paraleleppedos deben te-
ner el mismo grosor.
2. El espacio entre las barras deben ser de la misma magni-
tud. No debe ser inferior que la mitad de una barra, ni
mayor que el ancho de la misma.
Estadstica Aplicada a la Educacin - 57 -
3. Las barras, por esttica deben ordenarse de mayor a me-
nor cuando se pueda.
4. La escala de la frecuencia debe empezar por cero.
5. Deben dibujarse a buen criterio, lneas de fondo en la
grfica; ellas facilitan la lectura de los valores.
6. No se debe recargar las barras tratando de expresar mu-
chos productos en cada una de ellas.
7. Si el grfico tiene muchas barras es preferible reemplazar
por un diagrama lineal.
EJEMPLO:
Se considera el nmero de nios con diferentes enfermedades infecciosas en
el Departamento de Puno (1998).

CU A D RO N 4.10
N M ER O D E N I O S EN F ER M O S EN EL D EP A R T A M EN T O D E P U N O
1998

IRA N M ERO %
En fe rme d a d mu y g ra v e 390 45.35
N e u mo n a 170 19.77
N e u mo n a g ra v e 250 29.07
N o n e u mo n a 50 5.81
T o ta l 860 100.00
FU EN T E: Es -Sa lu d -Pu n o .

(1) Representar grficamente el nmero de pacientes por grado de instruc-


cin.
SOLUCIN:
GRFICO N 4.1
NMERO DE NIOS ENFERMOS CON IRA, 1998

400
350
300
N de Nios

250
200
150
100
50
0
En f. M u y N e u mo n a N e u mo n a No
g ra v e g ra v e n e u mo n a
En fe r m e dad IR A

FUENTE: Del Cuadro N 4.10


- 58 - V. Ibaez Q.

(2) Representar grficamente el porcentaje de nios enfermos con IRA.

GRFICO N 4.2
PORCENTAJES DE NIOS CON IRA, 1998

50
45
40
Porcentajes (%)

35
30
25
20
15
10
5
0
En f. M uy Neumo na Neumo na No
grave grave neu mona
Enfermedad IRA

b. Grfico de Barras Compuestas.

Para la elaboracin se debe contar con una tabla o cuadro de


entrada doble.

EJEMPLO:
Se considera el nmero de nios de ambos sexos con la enfermedad IRA.

CUADRO N 4.11
Nmero nios con enfermedad IRA, 1998

Sexo
IRA Varn Mujer Total
Enf. Muy grave 185 205 390
Neumona 100 70 170
Neumona grave 95 155 250
No neumona 10 40 50
Total 390 470 860
FUENTE: Es-Salud - Puno.
Estadstica Aplicada a la Educacin - 59 -

GRFICO N 4.3

NMERO DE NIOS CON ENFERMEDAD IRA, SEGN SEXO, 1998

220
200
180
Varn
N de enfermos

160
140 Mujer
120
100
80
60
40
20
0
Enf. M uy Neumona Neumona No
grave grave neu mo na
Enfe rme dad IR A

FUENTE: Del Cuadro N 4.11

NOTA: Los grficos compuestos deben contener una leyenda que identifi-
quen los componentes de cada clasificacin.

c. Grfico de Barras Superpuestas.

La informacin representada a travs de barras compuestas,


tambin puede representarse en barras superpuestas.

EJEMPLO: Tomar la informacin del Cuadro N 4.11

(1) Representar grficamente el nmero de alpacas por colores y sexo.


(2) Representar grficamente el porcentaje de alpacas de color y sexo.

SOLUCIN:

Solucin para la pregunta (1)


- 60 - V. Ibaez Q.

GRFICO N 4.4

NMERO DE NIOS ENFERMOS CON IRA, SEGN SEXO, 1998

400
380
360
340
320
300 Mujer
280
N de nios

260 Varn
240
220
200
180
160
140
120
100
80
60
40
20
0
Enf. M u y Neu mon a Neu mon a No
g rav e g rav e n eumo n a

Enfe rme dad de IR A

FUENTE: Del Cuadro N 4.11

Solucin para la pregunta (2). En este caso, se necesita traducir los


valores absolutos del Cuadro en porcentajes.

Sexo
Total (%)
IRA Varn (%) Mujer (%)
Enf. Muy grave 47.44 52.56 100
Neumona 58.82 41.18 100
Neumona grave 38.00 62.00 100
No neumona 20.00 80.00 100
FUENTE: Es-Salud - Puno.
Estadstica Aplicada a la Educacin - 61 -

GRFICO N 4.5
PORCENTAJE DE ENFERMEDADES EN NIOS CON IRA, SEGN SEXO,
1998

100
95
90
85
80
75 Mujer
PORCENTAJES

70
65 Varn
60
55
50
45
40
35
30
25
20
15
10
5
0
Enf. Muy Neumona Neumona No
grave grave neumona

Enfermedad de IRA

FUENTE: Del Cuadro N 4.11

2. Grfico de Sectores o Pastel (circulares).


Es una representacin grfica de un conjunto de datos estadsti-
cos, en un crculo, por medio de sectores circulares. Se utiliza para representar datos
cualitativos o cuantitativos discretos. Es utilizado principalmente cuando se preten-
de comparar cada valor de la variable con el total. Para construir el grfico de sector,
se utiliza una circunferencia, cuyo crculo se divide en sectores tales que sus medidas
angualres centrales y, por tanto la superficie del sector circular sean proporcionales a
las magnitudes de los valores de la variable que representan. Al total le corresponde
el crculo completo, es decir los 360 de la circunferencia y por una regla de tres
simple se encontrar el nmero de grados que le corresponde a cada parte.
- 62 - V. Ibaez Q.

m
Total (n) 360 con n = ni
i =1

parte (ni) X

Entonces, el nmero de grados que corresponde a una parte ser en general:


Parte(n i ) x360 n i x360
X = Nmero de grado = =
Total( n) n
parte( n i ) n i
Observe que: = , es la frecuencia relativa del suceso que le co-
total( n) n
rresponde la frecuencia absoluta ni.

EJEMPLO:
Construya un grfico de sector para los datos de los nios enfermos con IRA.

Frec. Absoluta
IRA ni
Enf. Muy grave 390
Neumona 170
Neumona grave 250
No neumona 50
Total 860

SOLUCIN:
391x360
Para enferdad muy grave: 860 360 X = = 163
860
390 X

170x 360
Para neumona: X = = 71
860
250x360
Para neumona grave: X = = 105
860
50 x 360
Para no neumona: X = = 21
860
Estadstica Aplicada a la Educacin - 63 -
GRFICO N 4.6

NMERO DE NIOS CON ENFERMEDAD IRA, 1998

21
No
neum.

105 Enf. Muy grave


Enf.
neumona 163 Neumona
Muy
grave Neumona grave
grave
No neumona
neumoa

71

FUENTE: Del cuadro N 4.11

Los grficos de sectores, se utilizan muy frecuentemente para repre-


sentaciones grficas de distribuciones porcentuales. En este caso al total representa-
do por el 100% le corresponde los 360 del crculo. La regla general es:

100% 360
Parte % X, entonces

(parte%)x360
X = nmero de grados =
100%

= (parte %)x(3.6)
- 64 - V. Ibaez Q.
EJEMPLO:
Colores de alpacas del CIP. La Raya.

Frec. Absoluta
IRA ni hi x100%
Enf. Muy grave 390 45.3
Neumona 170 19.8
Neumona grave 250 29.1
No neumona 50 5.8
Total 860 100.0

SOLUCIN:
Para Enf. muy grave: X = (45.3)x(3.6) = 163
Neumona: X = (19.8)x(3.6) = 71
Neumona grave: X = (29.1)x(3.6) = 105
No neumona: X = (5.8)x(3.6) = 21
360

GRFICO N 4.7

PORCENTAJE DE NIOS CON ENFERMEDAD IRA, 1998

No
neumona
Neumona 5.8% Enf. Muy
grave
grave
29.1%
45.3%

Neumona
19.8%

FUENTE: Del cuadro N 4.11


Estadstica Aplicada a la Educacin - 65 -

3. Grfico lineal o de tendencia.

Se usa para representar una distribucin de frecuencias dada en


el tiempo (das, semanas, meses, aos, etc.), llamada tambin serie cronolgica. Pue-
den incluir hasta tres hechos o situaciones, razn por la cual pueden ser simples o
compuestos.

TRAZADO DE GRFICAS LINEALES.

1. La frecuencia se coloca en el eje vertical y el mtodo de clasificacin en el


eje horizontal.
2. Las dos escalas deben guardar proporcin de tal forma que el grfico no d
impresin de fluctuaciones muy lentas o muy exageradas. Se acepta una
proporcin de 1 a 1 o de 1 a 2.
3. La escala que representa la frecuencia debe empezar por cero. Cuando no
puede aparecer de forma normal se parte de escala con una lnea en zig-
zag ( ).

4. El ttulo se coloca generalmente en la parte superior del grfico, fuera del


mismo y explicar lo ms claro y preciso posible el contenido.
5. Debe indicar destacando con claridad la unidad de medida utilizada.
6. Cada escala debe ser rotulada de tal forma que se comprenda fcilmente
qu representa: Edad en aos o en meses, kilos o libras de peso, etc.
7. Las escalas no deben tener demasiadas subdivisiones.
8. El grfico progresa generalmente de izquierda a derecha y de abajo hacia
arriba.
9. Las lneas del propio grfico deben dibujarse ms gruesas que las escalas.
10. No deben trazarse ms lneas coordenadas que las necesarias para la fcil
lectura, procurando que el cero aparezca en el diagrama.
11. El grfico generalmente debe ir acompaado de la tabla que le di origen.
12. Para alcanzar su objetivo con sencillez no debe contener ms lneas o
smbolos que los que el ojo pueda cmodamente seguir.

EJEMPLO:

Se tiene la siguiente informacin del CIP - La Raya, para la caracterstica


rendimiento del velln en alpacas de la raza Huacaya y Suri.
- 66 - V. Ibaez Q.
CUADRO N 4.12

CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA


RENDIMIENTO DEL VELLN DE ALPACA HUACAYA Y SURI, POR EDAD.

Edad Rendimiento (%)


1 ao 86.70
2 aos 88.60
3 aos 90.00
4 aos 90.80
5 aos 91.50
6 aos 92.00
Fuente: CIP - La Raya, Oficina de Registros.

GRFICO N 4.8
CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA
RENDIMIENTO (%) DE VELLN DE ALPACAS HUACAYA Y SURI, POR
EDADES.

96
94
92
Rendimiento (%)

90
88
86
84
82
80
1 2 3 4 5 6
EDAD ES (aos)

FUENTE: De Cuadro N 4.12.


Estadstica Aplicada a la Educacin - 67 -
EJEMPLO:
Dada la siguiente tabla, construir el grfico lineal compuesto:

CUADRO N 4.13
CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA
LONGITUD DE MECHA (cm) DE ALPACAS POR EDAD Y SEGN RAZA
(Varios aos de Estudio)

RAZA
Edad Wacaya Sury TOTAL
1 ao 12.30 16.80 29.10
2 aos 12.10 16.20 28.30
3 aos 11.30 15.50 26.80
4 aos 10.90 13.40 24.30
5 aos 10.50 12.90 23.40
6 aos 10.60 12.10 22.70
7 aos 9.60 11.60 21.20
8 aos 9.20 11.20 20.40
9 aos 8.70 11.00 19.70
10 aos 8.50 10.50 19.00
Fuente: CIP-La Raya, Oficina de Registros.

GRFICO N 4.9
CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA
LONGITUD DE MECHA (cm) DE ALPACAS POR EDAD Y SEGN RAZA.

20.0

16.0
LONGITUD (cm

12.0
W acaya

8.0
Su ry

4.0

0.0
1 2 3 4 5 6 7 8 9 10
EDAD (aos )

FUENTE: Del Cuadro N 4.13.


- 68 - V. Ibaez Q.

CUADRO N 4.14
CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA
NMERO DE ALPACAS DE RAZA HUACAYA POR AOS (1 ao de Edad)
1982 - 1991

N de
A O
A lp a c a s
1982 570
1983 546
1984 507
1985 636
1986 780
1987 715
1988 963
1989 991
1990 991
1991 937
T o tal 7636
F u e n t e : C IP - L a R a y a , O fic in a d e R e g is t ro s .

GRFICO N 4.10

CENTRO DE INVESTIGACIN Y PRODUCCIN LA RAYA


N DE ALPACAS DE RAZA HUACAYA POR AOS (1 ao de Edad)
1982 - 1991

1200

1000
N de Alpacas

800

600

400

200

0
1 98 2 1 98 3 1 98 4 1 98 5 1 98 6 1 98 7 1 98 8 1 98 9 1 99 0 1 99 1

AO S

FUENTE: Del Cuadro N 4.14.


Estadstica Aplicada a la Educacin - 69 -
4. Grficos de PICTOGRAMA O PICTGRAFOS.
Un pictograma es la representacin de las series estadsticas
por medio de smbolos que por su forma sugieren la naturaleza de los datos. Consiste
en tomar como unidad un smbolo arbitrario para el que debemos fijar previamente
el valor que le asignamos como tal unidad. La magnitud de los datos dados por los
pictogramas son aproximaciones burdas y no sirven para anlisis serios de estadsti-
ca. Una representacin que puede resultar til es la obtenida al combinar los diagramas
de barras con los pictogramas.

EJEMPLO:
La poblacin Bovino de Brown Swiss en las 3 provincias del Departamento de
Puno.
La provincia de Megar : 300 bovinos
La provincia de Azngaro : 200 bovinos
La provincia de San Romn: 100 bovinos
Tomando como unidad = 100 bovinos se tiene:
La poblacin de bovino para la Prov. de Melgar :

La poblacin de bovino para la Prov. de Azngaro :

La poblacin de bovino para la Prov. de San Romn :

GRFICO N 4.11
EVOLUCIN DE UNA POBLACIN POR ESPECIES ANIMALES
1998 - 1999

Equinos Vacunos P orcinos O vinos Aves

Pictograma Combinado con diagrama de barras


- 70 - V. Ibaez Q.

B. Cuando los datos son medidos a Nivel de Intervalo o razn.

1. Histograma de Frecuencias.
Se usa para representar grficamente las distribuciones de fre-
cuencias absolutas o relativas de datos cuantitativos contnuos agrupados en clases y
queda representado por una serie de rectngulos semejantes a los diagramas de ba-
rra. Las barras del histograma se colocan slo verticalmente y deben ir uno al lado de
las otras sin que haya un espacio que las separe. La base de cada rectngulo es la
amplitud de la clase de la variable correspondiente. Estos grficos reciben el nombre
de Histograma de frecuencias Absolutas histogramas de frecuencias relativas. Se
traza en el plano cartesiano en el eje de las X se coloca las variables y en el eje de
las Y cualesquiera de las frecuencias formndose rectngulos unidos entre si, con-
servando la misma amplitud intervlica.

EJEMPLO: Graficar la siguiente informacin:

CUADRO N 4.15

CALIFICACIONES DE LA PRUEBA
MATEMTICA (PUNTAJES)

[Y'i-1 - Y'i > Frec. Absoluta (n i )


41 - 49 5
49 - 57 3
57 - 65 6
65 - 73 9
73 - 81 12
81 - 89 9
89 - 97 6
Totales n = 50

FUENTE: Oficina de Registros.


Estadstica Aplicada a la Educacin - 71 -

GRFICO N 4.12 GRFICO N 4.13


Histograma de Frecuencia absoluta Histograma de Frecuencia relativa
para las calificaciones (puntajes) para las calificaciones (puntajes).

12 0.24
13 0.24
12 0.22
11 0.20 0.18 0.18
Frec. absoluta (ni )

Frec. relativa (h i)
10 9 9 0.18
9 0.16
8 0.14 0.12 0.12
7 6 6 0.10
5 0.12
6 0.10
5 0.08 0.06
4 3
3 0.06
2 0.04
1 0.02
0 0.00
45 53 61 69 77 85 93 45 53 61 69 77 85 93

Calificativos (puntos) Calificativos (puntos

2. Polgono de Frecuencias.

Se utiliza para variables cuantitativas contnuas procedindose


de dos formas diferentes:
a. Teniendo como base un histograma, se obtienen uniendo los
puntos medios de las bases superiores de los rectngulos en
el histograma de frecuencias absolutas o relativas, uniendo
con segmentos de recta hasta llegar a tocar el eje de X
conservando la misma amplitud intervlica.
EJEMPLO:
Las calificaciones de una prueba matemtica de 50 alumnos, sobre 100 pun-
tos de una clase han sido los siguientes:

Ca lific a tiv o s Pu n to s me d io s Fre c . A b s o lu ta


(p u n ta je s ) Yi ni
41.0 - 49.0 45 5
49.0 - 57.0 53 3
57.0 - 65.0 61 6
65.0 - 73.0 69 9
73.0 - 81.0 77 12
81.0 - 89.0 85 9
89.0 - 97.0 93 6
T o ta le s 50
- 72 - V. Ibaez Q.

GRFICO N 4.14

Calificativos de la prueba matemtica


(puntajes) de dao

13 Polgono de Frecuencia
12
13 Polgono de Frecuencia 11
12

Frec. absoluta (ni )


11
10
9
Frec. absoluta (ni )

10
9 8
8 7
7 6
6 5
5
4 4
3 3
2 2
1 1
0 0
45 53 61 69 77 85 93
45 53 61 69 77 85 93
Calificativos (puntajes)
Calificativos (puntajes)

a) b)

b. La otra forma de representar grfico de un polgono es utili-


zando las marcas de clase puntos medios, ubicndolo en el
eje de las X.

3. Polgono de frecuencia acumulada u ojivas.

Esta representacin grfica es vlida para variables estadsticas


contnuas que estn agrupadas en intervalos de clase. Una ojiva es la representacin
grfica de una distribucin de frecuencias absolutas acumuladas o las frecuencias
relativas acumuladas. Para graficar se debe representar en el eje de las abscisas los
distintos intervalos de clase que deben estar naturalmente traslapados. En el extremo
superior de cada intervalo se levanta una vertical con altura igual a la frecuencia
(absoluta o relativa) acumulada, luego se unen los extremos superiores de las vertica-
les con segmentos rectilneos, as el polgono de frecuencia acumuladas absolutas
alcanzar su mxima altura en el ltimo intervalo.
Estadstica Aplicada a la Educacin - 73 -
OJIVA MENOR QUE.- Es la representacin grfica de una
distribucin de frecuencias absolutas acumuladas menor que o las frecuencias re-
lativas acumuladas menor que. Se construye de la siguiente forma:
1. Se llevan sobre un eje horizontal los lmites de los intervalos
de clase Y0, Y1, .... , Ym.
2. Se levanta sobre el extremo superior de cada clase un seg-
mento cuya longitud coincida con la frecuencia absoluta
acumulada o con frecuencia relativa acumulada de dicha
clase, segn sea el caso de frecuencia absoluta acumuladas
o una ojiva de frecuencia relativas acumuladas.
3. Luego se unen con segmentos de rectas los extremos superio-
res de dichos segmentos verticales.

EJEMPLO:
Construir la ojiva menor que de frecuencias absolutas acumuladas y de
frecuencias relativas acumuladas para los calificativos de la prueba de matemtica
(puntajes).

SOLUCIN:
Escribimos las tablas de distribucin de frecuencias absolutas acumuladas
y frecuencias relativas acumuladas de la siguiente manera:

CUADRO N 4.16
CALIFICATIVOS DE LA PRUEBA DE MATEMTICA DE 50 ALUMNOS
(puntajes)

Calificativos Frec. A bsol. A cum. Frec. Relat. Acumul.


(puntajes ) Ni Hi
menor que 41 0 0.000
menor que 49 5 0.100
menor que 57 8 0.160
menor que 65 14 0.280
menor que 73 23 0.460
menor que 81 35 0.700
menor que 89 44 0.880
menor que 97 50 1.000
- 74 - V. Ibaez Q.
GRFICO N 4.15 GRFICO N 4.16
Distribucin acumulada menor que Distribucin relativa acumulada
para los calificativos (puntajes) en alumnos de calificativos (puntajes)
de matemtica de alumnos de matemtica

Hi 1.00
Ni 50
45 0.90
40 0.80 Ojiva menor que
35 Ojiva menor que 0.70
30 0.60
25 0.50
20 0.40
15 0.30
10 0.20
5 0.10
0 0.00
41 49 57 65 73 81 89 97 41 49 57 65 73 81 89 97
Calificativos (puntajes) Calificativos (puntajes)

FUENTE: Del Cuadro N 4.16

OJIVA MAYOR O IGUAL QUE.- Es la representa-


cin grfica de una distribucin de frecuencias absolutas acumuladas mayor o igual
que o las frecuencias relativas acumuladas mayor o igual que. Se construye com-
pletamente similar a la ojiva menor que.

EJEMPLO: Construir la ojiva mayor o igual que, de las frecuencias absolutas


acumuladas y frecuencias relativas acumuladas para la distribucin de calificativos
(puntos) del ejemplo anterior.

CUADRO N 4.17
CALIFICATIVOS (puntajes) MAYOR O IGUAL QUE DE ALUMNOS DE
MATEMTICA

Calificativos
(puntajes ) N*i H*i
mayor o igual que 41 50 1.00
mayor o igual que 49 45 0.90
mayor o igual que 57 42 0.84
mayor o igual que 65 36 0.72
mayor o igual que 73 27 0.54
mayor o igual que 81 15 0.30
mayor o igual que 89 6 0.12
mayor o igual que 97 0 0.00
Estadstica Aplicada a la Educacin - 75 -
GRFICO N 4.17 GRFICO N 4.18
Distribucin acumulada menor que Distribucin relativa acumulada
de las calificaciones de la prueba de las calificaciones de la prueba
matemtica (puntos) matemtica (puntos)

50
N*i H*i 1.0
45 Ojiva mayor o igual que (N*i) Ojiva mayor o igual que (H*i)
40 0.9
35 0.8
30 0.7
0.6
25
0.5
20 0.4
15 0.3
10 0.2
5 0.1
0 0.0
41 49 57 65 73 81 89 97 41 49 57 65 73 81 89 97

Calificativos (puntajes) Calificativos (puntajes)

FUENTE: Del Cuadro N 4.17

GRFICO N 4.19
OJIVAS MAYOR O IGUAL QUE Y OJIVA MENOR O IGUAL QUE
PARA LOS CALIFICATIVOS (puntos)

1.0 H* i Hi
hi
0.9
ojiva
ojiva
0.8 menor
mayor
0.7 o igual que
o igual que
0.6
0.5
0.4
0.3
0.2
0.1
0.0
41 49 57 65 73 81 89 97
Mediana
Calificativo (puntaje s)

FUENTE: Del Cuadro N 4.16 y 4.17


- 76 - V. Ibaez Q.
4. Diagrama de frecuencias (BASTONES).
Se usa para representar los diferentes tipos de distribuciones de
frecuencias de datos discretos. Si se desea representar grficamente las distribucio-
nes de frecuencias absolutas o frecuencias relativas, se llevar sobre un eje horizontal
los valores X1,X2,X3,...,Xm, y levantar sobre cada uno de ellos un segmento vertical
de longitud igual a la frecuencia absoluta frecuencia relativa correspondiente al
valor.

CUADRO N 4.18
PACIENTES CON INFECCION DENTARIA EN EL HRMNB - PUNO, 2000.

Extr. o curac. Pacientes


* * *
(Yi ) ni Ni hi Hi h i x100 Hi x100 N i H i 100xH i
0 2 2 0.05 0.05 5 5 42 1.0000 100.00
1 4 6 0.10 0.14 10 14 40 0.9524 95.24
2 7 13 0.17 0.31 17 31 36 0.8571 85.71
3 6 19 0.14 0.45 14 45 29 0.6905 69.05
4 6 25 0.14 0.60 14 60 23 0.5476 54.76
5 2 27 0.05 0.64 5 64 17 0.4048 40.48
6 4 31 0.10 0.74 10 74 15 0.3571 35.71
7 4 35 0.10 0.83 10 83 11 0.2619 26.19
8 3 38 0.07 0.90 7 90 7 0.1667 16.67
9 4 42 0.10 1.00 10 100 4 0.0952 9.52
10 10
Total n
i =1
i = 42 h
i =1
i =1 100

FUENTE: Ejemplo de la Tabla 3.11.

GRFICO N 4.20 GRFICO N 4.21


Frecuencias absolutas del nmero Frecuencias relativas del nmero de
de extracciones o curaciones. extracciones o curaciones

ni 7 hi 0.20
0.18
6 0.16
5 0.14
4 0.12
3 0.10
0.08
2 0.06
1 0.04
0 0.02
0.00
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9

N de extraciones o curaciones N de ovinos

FUENTE: Del Cuadro N 4.18


Estadstica Aplicada a la Educacin - 77 -

5
ESTADGRAFOS DE
POSICIN
5.1. INTRODUCCIN.

Los datos organizados en una distribucin de frecuencias, cuyas caractersti-


cas ms esenciales se destacan, es necesario calcular un conjunto de indicadores que
caractericen algo ms precisa y puntual la distribucin que se esta estudiando. Las
cifras descriptivas que se obtienen como funcin de una muestra (X 1,X2,....,Xn) ,
como funcin de un conjunto de datos (representa un subconjunto de la poblacin),
se llama Estadgrafo o Estadstico. Existen cuatro tipos de estadgrafos: De posi-
cin, dispersin, concentracin y de forma (kurtosis).
Los estadgrafos de posicin, son aquellos que describen la posicin que ocu-
pa la distribucin de frecuencias respecto a un valor de la variable, y se distinguen
dos tipos: Los estadgrafos de Tendencia Central y los de localizacin.
Los estadgrafos de tendencia central tienden a ocupar posiciones centrales o
intermedios entre el menor y mayor valor del conjunto de datos y brindan de alguna
forma informacin sobre el centro de la distribucin. Los ms importantes son: La
media aritmtica o media, la media geomtrica, la media armnica, la media cuadrtica
y la mediana.
Los estadgrafos de localizacin, sealan la localizacin de los valores ms
frecuentes o de valores extremos, los ms usados son: la moda, los cuartiles, etc.
- 78 - V. Ibaez Q.

5.2. MEDIDAS O ESTADGRAFOS DE TENDENCIA CENTRAL.

5.2.1. MEDIA ARTIMTICA O MEDIA.


La media aritmtica es la medida de tendencia central, es decir es la
suma de los valores observados de la variable, dividido por el nmero de observacio-
nes, y se puede calcular con datos no agrupados y datos agrupados (tabulados).

Ejemplo: Nmero medio de accidentes, rendimiento promedio de notas, etc.

A. MEDIA ARITMTICA CON DATOS NO AGRUPADOS.


La media aritmtica o media (o promedio) de una muestra x1,x2,...,xn
de tamao n de una variable o caracterestica X, se denota por M(x) o x es
dado por:
Parmetro (Poblacin).
N N

X + X 2 +L+ X N Xi X i
= M ( ) = 1 = i =1
o = i =1
N N N

Estadstico (muestra):
n n

x + x 2 +L + x n xi x i
x = M ( x) = 1 = i =1
o x= i =1
n n n
donde n es el tamao de la muestra nmero de elementos del con-
junto de datos u observaciones.

EJEMPLO:
Encuentre la media aritmtica de los siguientes datos.
6.4, 9.5, 8.3, 2.3, 5.0, 3.7, 13.4, 7.4, 5.4, 7.5

SOLUCIN: Sustituyendo las observaciones en la frmula se tiene:


10

X i
.
6.4+9.5+8.3+2.3+5.0+3.7+13.4+7.4+5.4+7.5 689
x = i=1 = = = 689
.
10 10 10
El promedio de la longitud de mecha (cm) de las 100 alpacas es 10.25 cm.
Estadstica Aplicada a la Educacin - 79 -

Ejemplo: Con los datos discretos que corresponde a los pacientes con infec-
cin dentaria en el HRMNB-Puno. Calcular el promedio.
42

x i
9 + 6 + 4 + 8+L+1 + 6 + 4
x= i =1
= = 4.33
42 42

B. MEDIA ARITMTICA CON DATOS AGRUPADOS.


Si los datos han sido clasificados en m clases en una tabla de
frecuencias con marcas de clase Yi y frecuencias absolutas ni = 1,2,....,m, la media
aritmtica esta dado por:
m m

Y n + Y2 n 2 +L+ Yi n i Yi n i Yn i i
Y = M ( Y) = 1 1 = i =1
= i =1
m

n
n n
i
i =1

m
con frecuencia relativa Y = h Y
i =1
i i

EJEMPLO:
Calcular la media aritmtica de los datos agrupados en la distribucin de
frecuencias para los calificativos (puntos) de los alumnos de matemtica.

Calificativos ni Yi niYi
41 - 49 5 45 225.00
49 - 57 3 53 159.00
57 - 65 6 61 366.00
65 - 73 9 69 621.00
73 - 81 12 77 924.00
81 - 89 9 85 765.00
89 - 97 6 93 558.00
8 8
Totales n i = 50 nY i i = 3618.00
i =1 i =1
- 80 - V. Ibaez Q.
Luego, la media aritmtica de stos datos es:
7

n1Y1 + n2Y2 + n3Y3 + n4Y4 + n5Y5 + n6Y6 + n7Y7 Yn i i


3618
Y = = i =1
=
n1 + n2 + n3 + n4 + n5 + n6 + n7 7

n
50
i
i =1

Yn i i
3618
Y = i =1
= = 72.36
50 50

5.2.2. Media Aritmtica para datos tabulados de variable DISCRETA.


Cuando los datos tabulados son discretos, se puede comprobar que la
media aritmtica del conjunto original x1,x2,...,xn, coincide con la media de los datos
agrupados, en este caso no hay prdida de informacin.
m

n Y i i

X = M ( x) = Y = M ( Y) , Y= i =1

n
EJEMPLO:
Calcular la media aritmtica de los datos agrupados que corresponden a los
pacientes con infeccin dentaria.

Ext ra c . O c u ra c io n e s P a c ie n t e s
(Y i ) ni Y ini
0 2 0
1 4 4
2 7 14
3 6 18
4 6 24
5 2 10
6 4 24
7 4 28
8 3 24
9 4 36
10 10
T o ta l n i = 42 Yn i i = 182
i=1 i=1

Aplicando la frmula se tiene:


Estadstica Aplicada a la Educacin - 81 -

10

n Y + n 2 Y2 +L+ n10 Y10 n Y i i


Y=X= 1 1 = i =1
n n
182
Y=X= = 4.33 pacientes con extracciones dentadura..
42
Este nmero representa que en promedio, el nmero de extracciones o
curaciones es aproximadamente 4, es decir el nmero de pacientes con extracciones
o curaciones que se espera que tenga por persona es 4.

NOTA: El promedio encontrado (4.33) coincide con los datos no agru-


pados, es exactamente igual.

OBSERVACIN:
Cuando los datos tabulados son contnuos hay prdida de informacin
en relacin con el conjunto original de datos y esto afecta a los estadgrafos calcula-
dos a partir de los datos agrupados: y =M(y) es una aproximacin a la media arit-
mtica del conjunto original x1,x2,...,xn, x =M(x), porque se considera en el clculo
de y , las marcas de clase Yi como representante de la clase i, i = 1,2,..,m. Es decir
estamos suponiendo que las frecuencias de cada clase estn condensadas en la marca
de clase puntos medios.
m

Yn i i
X = M ( x) Y = M ( y) = i =1

n
EJEMPLO:
Realizamos una comparacin con datos no agrupados y datos que estn tabu-
lados en una distribucin de frecuencias.
100

X i
10251
.
Datos no agrupados: X = i =1
= = 10.251
n 100
8

n Y i i
1025.6
Datos agrupados: Y= i =1
= = 10.256
n 100
La diferencia es en: Y X = 10.256 10.251 = 0.005
- 82 - V. Ibaez Q.
Es decir, se pierde informacin con datos originales cuando se calcula con
datos agrupados en 0.005, esto es: X Y 10.251 10.256

PROPIEDADES DE LA MEDIA ARITMTICA.


P-1. Si todos los valores observados X1, X2, ... , Xn son iguales a k (donde k
es una constante), entonces: M(X) = M(k) = k
La media aritmtica de una constante es la misma constante:
n

k /
nk
M ( x) = X k = i =1
= =k
n n/
EJEMPLO:
Se tiene los siguientes datos: 5, 5, 5, 5, 5, 5, 5, entonces k = 5
7

5 7x5
X5 = i =1
= =5
7 7

P-2. Si a cada valor de las observaciones X 1, X2, ... , Xn se le suma o resta una
constante, la media aritmtica del nuevo conjunto transformado Yi = Xi
k, i = 1,2,..,n, es la media aritmtica del conjunto original ms o
menos la constante.
y = M(y) = M(x)k, donde Yi = Xi k, k = constante, i = 1,2,..,n
n

y
b g
i
1 n 1 n 1 n
Y= i =1

n
= i
n i =1
X k = i n
n i =1
X
i =1
k

/
nk
Y = X = Xk
n/
EJEMPLO: 6, 8, 4, 2, 4, 6 y k = 4

Y=
1 6
i
6 i =1
X 4b=
1 6
i 6
6 i =1
X g
1 6
i =1
4
Estadstica Aplicada a la Educacin - 83 -

=
6 + 8 + 4 + 2 + 4 + 6 6/ x4 30
= 4 = 5 4
9 RS
6 6/ 6 1 T
P-3. Si cada valor de un conjunto X1, X2, ... , Xn se multiplica por una cons-
tante diferente de cero, la media aritmtica del conjunto transformado
Yi = kXi, i = 1,2,..,n, es la media aritmtica del conjunto original mul-
tiplicado por la constante:
y = M(y) = kM(x)
Prueba:

1 n 1 n k n
Y = M(y) = i n = i n = Xi =kM(x) = kX
n i=1
y = kX =
i 1 i 1

EJEMPLO: Sean 3, 4, 8, 2, 3, k=3

Fy I 5

G JJ = 3L 3 + 4 + 8 + 2 + 3O = 3FG 20IJ = 3x4 = 12


Y = M ( y) = 3G
i

GGH 5 JJK MN 5 PQ H 5 K
i =1

P-4. La suma algebraica de las desviaciones de cada valor observado X1,


X2,..., Xn con respecto a su media es cero:

cX Xh = 0
n
(para datos no agrupados)
i
i =1

n cY Yh = 0
m
(para datos agrupados).
i i
i=1
Donde: m = Es el nmero de clases.
ni = Frecuencia absoluta de la clase i.
Yi = Punto medio marcas de clase del intervalo i.

P-5. La suma de los cuadrados de las desviaciones de cada una de las observa-
ciones X1, X2, ... , Xn con respecto a su media es mnima. Si k es
cualquier valor, entonces:

c h b g
n n
Xi X Xi k
2 2
(para datos no agrupados).
i =1 i =1
- 84 - V. Ibaez Q.

c h b g
m m

ni Yi Y ni Yi k (para datos agrupados o clasificados).


2 2

i =1 i =1

P-6. Si X1, X2, ... , Xn y Y1, Y2, ... , Yn son dos conjuntos de observaciones de
n valores cada uno de dos variables X e Y, expresados en las mismas
unidades:
M(XY)=M(x)M(Y)

LM X OP = M(X )
m m
M
N Q
i =1
i
i =1
i

P-7. La media aritmtica se puede utilizar para estimar la cantidad total de


una poblacin.
TOTAL = N x
5.2.3. MTODOS DE CLCULO DE LA MEDIA ARITMTICA

Existen dos mtodos de clculo de la media aritmtica para los datos


tabulados en distribucin de frecuencias. Pero, dado que en algunos casos el clculo
puede resultar tedioso o con cifras muy grandes, conviene aplicar algn procedi-
miento abreviado. stos mtodos se basan en restar una constante, multiplicar por
una constante en ambas operaciones a la vez.

5.2.4. MEDIA ARITMTICA PONDERADA ( X P )


El promedio ponderado permite calcular un promedio que toma en
cuenta la importancia o el peso que tiene cada valor sobre el total. La media aritm-
tica de los valores X1, X2, ... , Xk ponderada por los pesos w1, w2, ... ,wk es igual a:
k

w x + w 2 x 2 +L+ w k x k w x i i
XP = 1 1 = i =1
w1 + w 2 +L+ w k k

w i =1
i

Otra forma de definir, es igual a la sumatoria del producto de cada uno


de los valores u observaciones (Xi) por sus respectivos pesos o ponderaciones (wi)
dividida entre la suma de las ponderaciones.
Estadstica Aplicada a la Educacin - 85 -
EJEMPLO:

En el siguiente ejemplo, se trata de las notas de un alumno X i y se desea


calcular el promedio ponderado final.
k

Tipo de exmenes Wi Notas Tipo de exmenes X i Wi Xi XW


i i
i =1

Exmenes Escritos 3 12 10 11 Exmenes Escritos 33 3 11.0 33.0


Trabajos Encargados 1 12 13 Trabajos Encargados 25 1 12.5 12.5
Prcticas calificadas 2 11 10 13 12 Prcticas calificadas 46 2 11.5 23.0
3 3 3
Total W = 6
i=1
i Total W = 6
i=1
i XW= 68.5 i i
i=1

X W i i
68.50
XP = i =1
3
= = 114
. 11 ,
W
6
i
i =1

Entonces el promedio ponderado final de un estudiante es 11 puntos.

5.2.5. LA MEDIA GEOMTRICA ( X g )


La media geomtrica, se usa especialmente en los casos en que existe
una tasa de crecimiento relativamente constante (poblacin, montos medios de capi-
tales sujetos a interes compuesto, etc.). O simplemente, cuando se desea un porcenta-
je medio de crecimiento o de baja, segn corresponda. Tambin se utiliza de prefe-
rencia cuando es conveniente dar importancia a los valores pequeos.

A. MEDIA GEOMTRICA PARA DATOS NO AGRUPADOS.


La media geomtrica simple ( X g ) Mg de n observaciones
X1, X2, ... , Xn positivas, es igual a la raiz ensima del producto de los n valores
observados.
n
X g = M g = n X1 X 2 L X n = n X
i =1
i

EJEMPLO:
Se registr a 10 pacientes varones su peso (kg). Las medidas son las siguien-
tes:
- 86 - V. Ibaez Q.

74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, n = 10
Calcular la Media Geomtrica ( X g )

SOLUCIN:
i) Xg = Mg = 10 74x70x73xL83x80 = 76.41671885 , entonces X g = 76.

El promedio geomtrico de peso en varones es 76 cm.

ii) Otra forma de calcular la Media geomtrica, es utilizando Logaritmos:


10

Xi 74 70 73 77 78 83 70 77.5 83 80 Log(X ) =
i=1
i

Log(Xi) 1.86923 1.84510 1.86332 1.88649 1.89209 1.91908 1.84510 1.88930 1.91908 1.90309 18.83188

10

Log ( X ) i
18.83188386
Xg = i =1
= = 1.883188386
n 10

LM Log( X ) OP
10

= Anti log M
MM n PPP = Anti log(1883188386
i
Pero: X g i =1
. ) = 76.4167188

N Q
X g = 76 cm., es igual al i).

B. MEDIA GEOMTRICA PARA DATOS AGRUPADOS.


Si los datos estn agrupados en intervalos de clase, la media
geomtrica ponderada, es igual a la raz ensima del producto de las marcas de clase
o puntos medios elevados a sus respectivas frecuencias, cuyo ndice radical es igual
al nmero de observaciones.
m

Yini , donde n = n i
m
Yg = n Y1n1 . Y2n2 . Y3n3 L Ymnm = n
i =1 i =1
Yi = Marcas de clase, i = 1,2,...,m, m = Nmero de clases.
Estadstica Aplicada a la Educacin - 87 -
Aplicando logaritmos a ambos miembros de la ecuacin anterior es:
1
LogYg =Logn Y1n1.Y2n2 .Y3n3LYmnm = nL
1 ogY1 +n2LogY2+L+nmLogYm
n
1 m
= n i LogYi
n i =1

LM n LogY OP
m

Y = Anti log M
MM n PPP
i i
i =1
g

N Q
EJEMPLO:
Hallar la media geomtrica Yg para los siguientes datos agrupados:

Marcas de clase Yi 45 53 61 69 77 85 93
Frecuencia (ni) 5 3 6 9 12 9 6

SOLUCIN:

[Y'i-1 - Y'i> Yi ni LogYi niLogYi


41 - 49 45 5 1.6532125 8.2660626
49 - 57 53 3 1.7242759 5.1728276
57 - 65 61 6 1.7853298 10.7119790
65 - 73 69 9 1.8388491 16.5496418
73 - 81 77 12 1.8864907 22.6378887
81 - 89 85 9 1.9294189 17.3647703
89 - 97 93 6 1.9684829 11.8108977
Totales 50 n LogY =
i i 92.514068

8
1 92 .514068
L ogYg =
n
n L ogY
i =1
i i =
50
= 1.85028
- 88 - V. Ibaez Q.

Luego: Y g = A n t i lo g ( 1 .8 5 0 2 8 ) = 7 0 .8 4
Yg 7 1
Es el promedio geomtrico para la variable calificaciones (puntajes) en
personas con dao cerebral post-meningtico.

DESVENTAJAS:
- Su clculo es engorroso.
- Esta limitado para valores positivos para que pueda ser interpretado.
- Si algn valor de la variable es cero, la X g ser cero.
- Si aparece algn valor negativo, la media geomtrica toma un valor
imaginario.
PROPIEDADES DE LA X g

P-1. La X g de n observaciones es tal que si es sustituida por cada una de


las observaciones, deja inmutado el producto de los trminos.
X1 . X 2 L X n = Xgn
P-2. La X g de una serie de relaciones es igual a la relacin entre la X g de

los numeradores y la Yg de los denominadores.

X1 X 2 X n n X1 X 2 L X n
n L =
Y1 Y2 Yn n Y1 Y2 L Yn
P-3. La X g de trminos positivos es siempre menor o igual que la X (media
aritmtica). Es igual a la media aritmtica, solo en el caso en que todos
los trminos sean iguales entre si X Xg .
P-4. El promedio geomtrico es menor que el promedio aritmtico, pero ma-
yor que el promedio armnico: X Xg X H .

5.2.6. LA MEDIA ARMNICA ( XH )

La media armnica, se emplea para obtener un valor representativo de


un conjunto de datos expresados en forma de tasas.
Estadstica Aplicada a la Educacin - 89 -

A. MEDIA ARMNICA CON DATOS NO AGRUPADOS.


La media armnica XH o MH de n trminos no nulos X1, X2, ...
, Xn, es el recproco de la media aritmtica de los recprocos de esos trminos:

1 n
XH = M H = n
= n
1 1
X
i =1
X
i =1
i i
n
Donde: n = Nmero de observaciones
Xi = Observaciones de la muestra.

EJEMPLO:

Se registr a 10 pacientes con infeccin dentaria el peso (kg). La informacin


se presenta a continuacin:
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, n = 10
Calcular el promedio XH de la variable peso (kg)?

SOLUCIN:
10
Xi 74 70 73 77 78 83 70 77.5 83 80
i=1
1
Xi =

1/Xi 0.0135 0.0143 0.0137 0.0130 0.0128 0.0120 0.0143 0.0129 0.0120 0.0125 0.1310907

n 10
XH = 10
= = 76.283 XH = 76.28 cm.
1
X
0131090709
.
i =1 i

Respuesta: El promedio armnico de la variable peso es 76.28 kg.


Calculamos:
74 + 70 + 73+L+83 + 80
X = M ( x) = = 76.55 cm.
10
Xg = Mg = 10 74x70x73xL83x80 = 76.41671885

Entonces: X Xg XH entonces 76.55 76.42 76.28


- 90 - V. Ibaez Q.

B. MEDIA ARMNICA CON DATOS AGRUPADOS.


Sean Y1, Y2, ... ,Ym (marcas de clase), valores de la variable Y,
asociados a las frecuencias absolutas n1, n2, ... ,nm, respectivamente.
m
n n
YH = = m
, n = ni
n1 n 2 n ni
+
Y1 Y2
+L+ m
Ym
i =1 Yi
i =1

1
Tambin se puede usar con frecuencias relativas: YH = m
h
Yi
i =1 i

USOS:
- Determinar la velocidad promedio de recorrido de reacciones qumicas,
de precios, de rendimientos, etc.
- Para estimar el nmero de repeticiones por tratamiento, cuando se trata
de estimar el error estndar en un anlisis de varianza (datos
desbalanceados).

EJEMPLO:
Encontrar la Media Armnica YH para los datos agrupados en intervalos de
calificativos (puntajes) de los alumnos de matemtica.

[Y'i-1 - Y'i > Yi ni 1/Yi n i /Yi


41 - 49 45 5 0.0222222 0.1111111
49 - 57 53 3 0.0188679 0.0566038
57 - 65 61 6 0.0163934 0.0983607
65 - 73 69 9 0.0144928 0.1304348
73 - 81 77 12 0.0129870 0.1558442
81 - 89 85 9 0.0117647 0.1058824
89 - 97 93 6 0.0107527 0.0645161
Totales 50 n i Yi = 0.722753
Estadstica Aplicada a la Educacin - 91 -

7
n 50
YH = 7
= = 69.1799 , n = ni = 50
ni 0.722753

i =1 Yi
i =1

Respuesta:
El promedio armnico es 69 puntos para los alumnos de matemticas.
Entonces podemos comprobar que:
Y Yg YH entonces 72 .36 70.84 69 .18

PROPIEDADES DE LA MEDIA ARMNICA.


- La suma algebraica de las desviaciones de los recprocos de las observacio-
nes del recproco de la media armnica es nula.
F1
GH Y X
8
1 IJ = 0
i =1 i H K
- La media armnica es menor o igual que la X g ( XH Xg )

- XH Xg X

5.2.7. LA MEDIA CUADRTICA ( Xq )

A. LA MEDIA CUADRTICA CON DATOS NO AGRUPADOS.


La media cuadrtica ( Xq ) de las observaciones X1, X2, ... , Xn es
igual a la raz cuadrada del cociente que resulta de dividir la sumatoria de los cuadra-
dos de las observaciones entre el nmero de observacion.

X 2
i
Xq = Mq ( x) = i =1
n
Donde: X q = Media cuadrtica.
Xi = Valores de las observaciones.
n = Tamao de la muestra.
- 92 - V. Ibaez Q.
EJEMPLO:
Encontrar la media cuadrtica de los 10 pacientes con infeccin dentaria para
la variable peso (kg).
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, n = 10

SOLUCIN:
10
Xi 74 70 73 77 78 83 70 77.5 83 80 X =
i=1
2
i

2
Xi 5476 4900 5329 5929 6084 6889 4900 6006.25 6889 6400 58802.25

10

X 2
i
58802.25
Xq = i =1
= = 76.6826
n 10

Xq = 76.68 kg.

Respuesta:
El promedio curtico de la variable peso en personas con infeccin denta-
ria es 76.68 kg.

B. LA MEDIA CUADRTICA CON DATOS AGRUPADOS ( Yq ).


Es igual a la raz cuadrada del cociente que resulta de dividir la
sumatoria del producto de las frecuencias absolutas (ni) por los cuadrados de las
marcas de clase puntos medios entre el nmero de observaciones n.
m

n Y i i
2
m
Yq = M q (Y) = i =1
, Donde: n = n i
n i=1

Yi = Marca de clase

EJEMPLO:
Encontrar la Media Cuadrtica Yq para los datos agrupados en intervalos de
clase de los alumnos del curso de matemtica (puntos).
Estadstica Aplicada a la Educacin - 93 -

2 2
[Y'i-1 - Y' i> Yi ni Y i niY i
41 - 49 45 5 2025.0000 10125.00
49 - 57 53 3 2809.0000 8427.00
57 - 65 61 6 3721.0000 22326.00
65 - 73 69 9 4761.0000 42849.00
73 - 81 77 12 5929.0000 71148.00
81 - 89 85 9 7225.0000 65025.00
89 - 97 93 6 8649.0000 51894.00
Totales 50 n Y i i
2
= 271794.00

271794
Yq = = 73.728 kg.
50
Rpta: El promedio curtico de la calificacin es 73.73 puntos.

PROPIEDADES:
1. La media curtica es mayor o igual que la media aritmtica: X Xq = Mq(X)

2. X H X g X X q , la media cuadrtica es mayor o igual a la media


aritmtica, y la media aritmtica es mayor o igual a la media geomtrica y
ste ltimo es mayor o igual al promedio armnico.

5.2.8. LA MEDIANA (Me Me(X),


~
X)
Es el valor central de un conjunto de n observaciones X1, X2, ... , Xn
de la variable o caracterstica X, los mismos que son ordenados de menor a mayor, es
decir el valor divide a una serie de observaciones en dos partes, de modo que el 50%
de las observaciones son menores o iguales al valor de la mediana y los otros 50% de
las observaciones son mayores o iguales a la mediana.

50% 50%

X1 Me Xn
- 94 - V. Ibaez Q.
A. MEDIANA CON DATOS NO AGRUPADOS.
En este caso no es fcil localizar la mediana cuando se trata de un
nmero considerable de observaciones, a menos que la muestra tenga pocas observa-
ciones, para lo cual es necesario ordenar los datos. Hay que distinguir dos situacio-
nes: Nmero de observaciones IMPAR y nmero de observaciones es PAR.
1. Si el nmero de observaciones n es impar, se ordenan los
datos en orden creciente X(1), X(2), X(3), ...., X(n), denotado a X(1) como la observacin
ms pequea, X(2) la segunda observacin menor, ....., X(n), denota la observacin
mayor, es decir X (1) X ( 2 ) L X ( n ) , y tomar como valor de la mediana el valor de
la observacin que ocupa la posicin central.

Me = X c n+1 h
2
{X~ = Me(x) = Me = X n+1
2

EJEMPLO:
Encontrar la mediana de los 9 estudiantes de un Colegio, para la variable
peso (kg).
74, 70, 73, 77, 78, 83, 70, 83, 80

SOLUCIN:
i) Se ordenan los datos: X1= 70, X2= 70, X3= 73, X4= 74,
X5= 77, X6= 78, X7= 80, X8= 83, X9= 83

70 70 73 74 77 78 80 83 83

X (1 ) X (2 ) X (3 ) X (4 ) X (5 ) X (6 ) X (7 ) X (8 ) X (9 )

ii) Existen n = 9, un nmero impar de observaciones, entonces la mediana


es el valor de la observacin que ocupa la posicin central.
~
X = Me = X ( n +1) = X ( 9 +1) = X ( 5) = 77
2 2
2. Si el nmero de observaciones n es par, una vez ordenado el
conjunto de observaciones, existen dos valores centrales X n y X( n )+1 , pudindose
2 2

tomar como mediana cualquiera de ellos, o cualquier valor entre stos dos, para esto
se toma como mediana la semisuma de ambos valores.
Estadstica Aplicada a la Educacin - 95 -

X n + XF nI
~ GH 2 JK + 1
X = Me =
2

2
EJEMPLO:
Encontrar la mediana de los 10 estudiantes, para la variable peso (kg).
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80 n = 10

SOLUCIN:
i) Se ordenan los datos: X1= 70, X2= 70, X3= 73, X4= 74, X5= 77,
X6= 77.5, X7= 78, X8= 80, X9= 83, X10= 83

ii) Existen n = 10, un nmero par de observaciones, entonces la mediana


es el promedio de las observaciones centrales:
X 10 = X ( 5) = 77 y X 10 = X 6 = 77.5
+1
2 2

X10 + X10
~ +1 X(5) + X(6) 77 + 775
.
X = Me = 2 2
= = = 77.25
2 2 2

70 70 73 74 77 77.5 78 80 83 83

X (1 ) X (2 ) X (3 ) X (4 ) X (5 ) X (6 ) X (7 ) X (8 ) X (9 ) X (1 0 )

Respuesta: La mediana del peso (kg) en estudiantes de un Colegio es 77.25


kg, o el peso mediano es 77.25 kg.

R| X n +1 , si " n" es un nm ero entero im par.


Me = X = S X
2
~
+ X n+2
|| n

T
2 2
, si " n" es nm ero entero par.
2

B. MEDIANA CON DATOS AGRUPADOS.


Cuando los datos estn agrupados en intervalos de clases o en una
distribucin de frecuencias no es posible individualizar la observacin mediana y
slo es factible determinar el intervalo en que se encuentra. Para determinar la me-
diana se presentan dos casos: variable discreta y variable contnua.
- 96 - V. Ibaez Q.
a) VARIABLE DISCRETA.

El procedimiento para calcular la mediana es:


1. Construir la tabla de distribucin de frecuencias absolutas
acumuladas (Ni) menor que.
2. Se determina la menor frecuencia absoluta acumulada Nj que
n
supera n , entonces se puede tener que: N j1 < N j .
2 2
i) Cuando n >Nj-1, entonces la mediana es: Me(Y) = Yj
2

Yi ni Ni
Y1 n1 N1
Y2 n2 N2
. . .
. . .
Yj-1 nj-1 Nj-1 n
> N j1
Yj nj Nj 2
. . .
. . .
Ym nm n
Total n

n
ii) Cuando = Nj-1, entonces Yj-1 Yj y cualquier valor
2
entre stos dos se puede considerar como la media-
na, y se calcula como:
Yj1 + Yj
Me =
2
Estadstica Aplicada a la Educacin - 97 -

Yi ni Ni
Y1 n1 N1
Y2 n2 N2
. . .
. . Nj-2 n
= N j1
Yj-1 n j-1 Nj-1 2
Yj nj Nj
. . .
. . .
Ym nm n
Total n

EJEMPLO:
Encontrar la mediana para los datos que corresponden a 42 pacientes con
infeccin dentaria; registrndose el nmero de extracciones o curaciones durante el
ao 2000 en el Hospital Regional Manuel Nuez Butrn - Puno.

SOLUCIN:
1) Construir la tabla de distribucin de frecuencias absolutas acumuladas
menor que.

Extr. O curac.
(Yi) ni Ni
0 2 2
1 4 6
2 7 13
3 6 19 n
= 21 > N 4 = 19
44 6 25 2
5 2 27
6 4 31
7 4 35
8 3 38
9 4 42
10
Total n
i =1
i = 42
- 98 - V. Ibaez Q.

n 42
2) Ubicar la posicin de la mediana: n = 42, = =21, entonces la menor
2 2
frecuencia absoluta que supera a 21 es N5 = 25 >21, luego j = 5 y j-1=5-
1=4.
n 42
3)
2
=
2
=21>Nj-1 = N4 = 19. Entonces la mediana es Me = Y5 = 4

b) VARIABLE CONTNUA.
Cuando la variable es contnua, entonces el problema consiste
en determinar un punto dentro del intervalo en que est comprendido la mediana,
esto se puede lograr con el procedimiento que consiste en:
1. Construir la tabla de distribucin de frecuencias absolutas acu-
muladas (Ni) menor que.
2. Se determina la menor frecuencia absoluta acumulada Nj que
n
supera n , entonces se puede tener que: N j1 < N j .
2 2
n
i) Si ocurre que =Nj-1, la mediana es: Me(Y) = Yj-1, donde
2
Yj-1= Lmite inferior de la clase mediana.

Y'i-1 - Y'i Yi ni Ni
Y'0 - Y'1 Y1 n1 N1
Y'1 - Y'2 Y2 n2 N2
Y'2 - Y'3 Y3 n3 N3
. . . .
. . . .
. . . .
n
Y'j-2 - Y'j-1 Yj-1 n j-1 Nj-1 = N j 1
2
Y'j-1 - Y'j Yj nj Nj
. . . .
. . . .
Y'm-1 - Y'm Ym nm n
Totales n
Estadstica Aplicada a la Educacin - 99 -

n
ii) Si >Nj-1, la mediana se debe encontrar dentro de la clase
2
j, es decir, en el intervalo [Yj-1,Yj>, llamada clase me-
diana. La frmula de la mediana es:

LM n N OP
+c M 2 PP
j1
Me = Yj'1
MN N N
j
j j1
Q
Donde: cj = Amplitud de la clase mediana.
Nj = Frecuencia absoluta acumulada de la clase mediana.
n = Nmero de observaciones en la muestra.
Yj-1 = Lmite inferior de la clase mediana.

Y'i-1 - Y'i Yi ni Ni
Y'0 - Y'1 Y1 n1 N1
Y'1- Y'2 Y2 n2 N2
Y'2 - Y'3 Y3 n3 N3
. . . .
. . . .
. . . .
Y'j-2 - Y'j-1 Yj-1 nj-1 Nj-1 n
> N j1
Y'j-1 - Y'j Yj nj Nj 2
. . . .
. . . .
Y'm-1 - Y'm Ym nm n
Totales n

Tambin se puede calcular con frecuencias relativas acumuladas:

LM 1 H OP
+c M 2 PP
j1
Me = Y '
j 1 j
MN H H
j j 1
Q
- 100 - V. Ibaez Q.
Donde: cj = Amplitud de la clase mediana.
Hj = Frecuencia relativa acumulada de la clase mediana.
Yj-1 = Lmite inferior de la clase mediana.

Con la distribucin de frecuencias relativas acumuladas menor que, es


n
similar a las frecuencias absolutas acumuladas. En este caso es reemplazado por
2
1
, Nj por Hj y Nj-1 por Hj-1.
2

Y'i-1 - Y'i hi Hi
Y'0 - Y'1 h1 H1
Y'1 - Y'2 h2 H2
Y'2 - Y'3 h3 H3
. . .
. . .
. . .
Y'j-2 - Y'j-1 h j-1 Hj-1 1
> H j1
Y'j-1 - Y'j hj Hj 2
. . .
. . .

EJEMPLO:

Calcular la Mediana (Me) para los calificativos (puntos) de alumnos del curso
de matemticas.

SOLUCIN:

1) Construir la tabla de distribucin de frecuencias.


Estadstica Aplicada a la Educacin - 101 -

[Y'i-1 - Y'i > ni Ni


41 - 49 5 5
49 - 57 3 8
57 - 65 6 14
n 50
65 - 73 9 23
= = 25 > N 4 = 23
73 - 81 12 35 2 2
81 - 89 9 44
89 - 97 6 50
Totales 50

n 50
2) Ubicar la posicin de la mediana: n = 50, entonces = =25, entonces la
2 2
menor frecuencia absoluta acumulada que supera es N5 = 35 >25, luego j =
5 y j-1=5-1=4, La clase mediana es Y4 - Y5 = 73 - 81

n 50
3) Como = =25>23 = N4 , la mediana esta dada por:
2 2

LM n N OP LM50 N OP
+c M 2 PP =Y +8MM N2 N PP = 73+8LMN25352323OPQ
j 1 4
Me = Yj'1 '
j
MN N N
j j 1
4

Q N Q 5 4

LM 2 OP = 74.33 puntos.
Me = 73 + 8
N12 Q
Respuesta: La mediana de los calificativos (puntos) en alumnos de matemti-
ca es 74.33 puntos.

EJEMPLO:
Se obtienen 40 datos de pesos (kg) en pacientes con caries del Hospital Regio-
nal Manuel Nuez Butrn - Puno.

SOLUCIN:

1) Construir la tabla de distribucin de frecuencias:


- 102 - V. Ibaez Q.

Int. De clase Lmites Reales de Clase ni Ni


39 - 54 38.5 - 54.5 3 3
n
55 - 70 54.5 - 70.5 5 8 =20>8
71 - 86 70.5 - 86.5 13 21 2
87 - 102 86.5 - 102.5 9 30
103 - 118 102.5 - 118.5 7 37
119 - 134 118.5 - 134.5 3 40
Totales Totales n = 40

n 40
2) Ubicar la posicin de la mediana: n=40, entonces = =20, entonces N3
2 2
= 21 >20, luego j=3 y j-1=3-1=2, la clase mediana es Y2 - Y3 = 70.5 -
86.5
n 40
3) Como = =20>8 = N2, la mediana esta dada por:
2 2

LM n N OP LM 40 N OP
+c M 2 PP = Y + 16MM N2 N PP = 705. + 16LMN2021 88OPQ
j1 2
Me = Y ' '
j1 j
MN N Nj j1
Q
2

N 3 2
Q
LM12 OP = 85.27 kg.
Me = 70.5 + 16
N13 Q
Respuesta: La mitad de los pacientes con caries poseen menos de 85 personas
y la otra mitad poseen mayores a esa suma.

PROPIEDADES DE LA MEDIANA.

P-1. La suma de las desviaciones absolutas de las observaciones con relacin


a la mediana es mnimo.
n

X
i =1
i Me = mnimo , para datos no agrupados.

n Y Me = mnimo , para datos agrupados.


i =1
i i
Estadstica Aplicada a la Educacin - 103 -
P--2. Si a es cualquier valor, entonces la propiedad se escribe:
n n

i =1
X i M e X i a , para datos no agrupados.
i =1

m m

n
i=1
i Y i M e n i Y i a , para datos agrupados.
i =1

P-3. En una distribucin simtrica se cumple:


Me = Ym+1 , si m es impar
2

Me = Ym' , si m es par.
2
Donde: Yi = Marca de clase puntos medios.
m = Nmero de clases.
Yi = Lmite de clase.

VENTAJAS DE LA MEDIANA.
- La mediana es un estadgrafo que no est afectada por valores extremos, y
por lo tanto es ms representativa que la media aritmtica cuando alguno de
los valores de la variable se aleja mucho de los dems o cuando las series
son poco simtricas.
- Es til cuando los datos agrupados tienen clases abiertas en los extremos.
- Se aplica tambin a variables que pertenecen a la escala ordinal.

DESVENTAJAS DE LA MEDIANA.
- Se deben organizar los datos antes de realizar cualquier tipo de clculo para
determinar la mediana.
- Ciertos procedimientos estadsticos que usan la mediana son mucho ms
complejos que aquellos que usan la media.
- La mediana no es adecuado a manipulaciones algebraicas posteriores.

5.2.9. LA MODA (Md = Mo = Xmo)

Es un estadgrafo de posicin que puede definirse como el valor ms


frecuente, es decir, el que se presenta una frecuencia mayor que las de los valores
inmediatamente anterior y posterior. En varios campos es de importancia, por ejem-
plo, en un estudio de mercados, el intervalo modal de los ingresos puede representar
el principal grupo de consumidores potenciales.
- 104 - V. Ibaez Q.

A. MODA CON DATOS SIMPLES NO AGRUPADAS.


La moda de una muestra x1,x2,....,xn, es aquel valor de la variable
que se presenta con mayor frecuencia, es decir es el valor que ms se repite, y lo
denotamos por (Md). La moda no siempre existe y no siempre es nica. El conjunto
de datos puede tener lo siguiente:
- La distribucin que tiene una sola moda, se llama unimodal.
- La distribucin que tiene dos modas, se llama bimodal.
- La distribucin que tiene ms de dos modas, se llama multimodal.

EJEMPLO:
Se registr los pesos de los estudiantes varones del sexto grado del sector rural
en el Distrito de Acora. La informacin se presenta a continuacin:
Peso del nio (kg: 39, 42, 40, 40, 41, 41, 42, 42, 45, 42
Ordenado : 39, 40, 40, 41, 41, 42, 42, 42, 42, 45
Determine, y presente grficamente la moda de las observaciones dadas ante-
riormente:

SOLUCIN:
39 40 40 41 41 42 42 42 42 45
: 1
1
424
3 1424
2
3 144424443
2 4
:
1

El valor 42 ocurre 4 veces, el valor 40 se repite 2 veces y el 45 y 39 ocurre una


sola vez. Luego la moda de stas observaciones es: Md = 40, Md = 41 y Md = 42 con
la variable peso (kg).

ni 5
Valor de la Frec. Absolut. 4
var. Xi ni 3
39 1
40 2
2
41 2 1
42 4 0
45 1
Total 10
39 40 41 42 45
Xi

Luego la Md = 42. Polgono de frecuencia de la distribucin unimodal


Estadstica Aplicada a la Educacin - 105 -

EJEMPLO: Se ha considerado los siguientes datos:


Valor de la variable : 72, 78, 75, 80, 79, 81, 71, 82, 83, 77
Ordenado : 71, 72, 75, 77, 78, 79, 80, 81, 82, 83

Valor de la Frec. Absoluta


ni 2
variable Xi ni
71 1
72 1 No tiene moda, yestetipo de distribucinsellama Uniforme
75 1
77 1
78 1
1
79 1
80 1
81 1
82 1
83 1 0
Total 10 71 72 75 77 78 79 80 81 82 83X
i

Polgono de frecuencia de la distribucin Uniforme.

EJEMPLO: Se consider los siguientes datos:


Valor de la variable : 70, 78, 75, 78, 71, 71, 71, 78, 81, 80
Ordenando se tiene : 70, 71, 71, 71, 75, 78, 78, 78, 80, 81

SOLUCIN:

Valor de la Frec. Absolut.


ni 4
var. Xi ni
70 1 3
71 3
75 1 2
78 3
80 1 1
81 1
0
Total 10
70 71 75 78 80 81 Xi
Md = 71 y Md = 78 Es una distribucin Bimodal
Son dos valores modales
- 106 - V. Ibaez Q.

B. MODA CON DATOS AGRUPADOS.

Se usa cuando los datos estn tabulados en distribucin de frecuen-


cias, y en esta se observa a la clase que contiene mayor frecuencia, ser la que contie-
ne a la moda.

a) VARIABLE DISCRETA.

Cuando la variable es discreta, la moda se determina simple-


mente fijndose en el valor de la variable que ms se repite.

b) VARIABLE CONTNUA.

Se pueden presentarse los siguientes casos:


i) Si las densidades de frecuencias de la clase inmediatamente
antes de la clase modal (la clase PREMODAL) e inmedia-
tamente despus de la clase modal (la clase POSMODAL)
son aproximadamente iguales, como se ver en el grfico de
histograma, la moda se aproxima satisfactoriamente por el
punto medio de la clase modal, es decir las marcas de clase
Yi.

ni

Yi'1 + Yi'
Md = Yi =
2

0 Marcas de clase
Y' i-1 M d Y' i

ii) Cuando no se cumple la condicin anterior, como sugiere en


el histograma de la figura siguiente, para un conjunto de
datos tabulados con intervalos de clase de igual amplitud
Estadstica Aplicada a la Educacin - 107 -
(ci = c), la estimacin de la moda se calcula por la frmula
obtenida grficamente como sigue:

ni M Q
c
P

n j+1 T
c
n j1 R

Clase Pos-Modal
c
Clase Pre-Modal

'
Yj1 Md Y j'

La frmula de la Moda (Md) es:

Md = Yj'1 + c
LM n n j1
OP Md = Yj'1 + c
LM OP
MNdn n i + dn n iPQ N + Q
j 1

j j1 j j+1 1 2

Donde:
'
Yj1 : Lmite inferior de la clase modal.

nj-nj-1= 1 : Diferencia entre la frecuencia de la clase inmediatamente anterior a


la clase modal.
nj-nj+1= 2 : Diferencia entre la frecuencia de la clase inmediatamente posterior a
la clase modal.
c : Amplitud de la clase modal.
nj-1 : Frecuencia absoluta de la clase premodal.
nj : Frecuencia absoluta de la clase modal
nj+1 : Frecuencia absoluta de la clase posmodal.
- 108 - V. Ibaez Q.
EJEMPLO:
Determinar la moda (Md) de la siguiente distribucin de frecuencias.

[Y'i -1 - Y'i > ni


41.0 - 49.0 5
49.0 - 57.0 3
57.0 - 65.0 6
65.0 - 73.0 9
73.0 - 81.0 12 M od
81.0 - 89.0 9
89.0 - 97.0 6
T o tales 50

SOLUCIN:
1) Se identifica el intervalo de la clase modal, observando la tabla de frecuen-
cias absolutas, en este caso es 12 que est en el cuarto intervalo. Entonces:

Yj-1 - Yj = 73 - 81, luego j = 5, j -1 =4


Y3 - Y4 = 73 - 81
nj = n4 = 12
nj-1 = n3 = 9 c=8
nj+1 = n5 = 9

2) Reemplazando los valores identificado en la frmula de la moda, se tiene:


LM n n OP = 73 + 8L 12 9 O = 77 punto
Md = Y4' + c
N bn n g + bn n g Q
5 4
5 4

5
MN(12 9 ) + (12 9 ) PQ
6

EJEMPLO: Determinar la moda de la siguiente distribucin de frecuencias:

Int. De clase ni
[0 - 1 > 3
[1 - 2 > 10
[2 - 3 > 17 Frec. Ms alta.
[3 - 4 > 8
[4 - 5 > 5
Total 43
Estadstica Aplicada a la Educacin - 109 -
SOLUCIN:
1) Se identifica el intervalo de la clase modal observado en la frecuencia abso-
luta n3 = 17, entonces:
Yj-1 - Yj = Y2 - Y3 =2 - 3, luego j = 3, j -1 = 2
nj = n3 = 17
nj-1 = n2 = 10 c=1
nj+1 = n4 = 8

2) Reemplazando a la frmula de moda se tiene:

LM n n OP = 2 +1L 17 10 O = 2.44
Nbn n g + bn n gQ MN(17 10) + (17 8) PQ
Md = Y2' + c 3 2

3 2 3 4

Entonces la Md = 2.44 ~ 2.

VENTAJAS DE LA MODA
1. La moda, se puede usar como una localizacin, tanto para datos cualita-
tivos y cuantitativos.
2. La moda no est indebidamente afectada por valores extremos. An si los
valores altos son muy altos y los valores pequeos muy pequeos, se escoge
el valor ms frecuente del conjunto de datos como el valor modal.
3. La moda se puede calcular an cuando una ms de las clases sean abiertas
en los extremos.
4. La moda al igual que la mediana, es de fcil comprensin, y no queda
influenciada por los valores extremos.

DESVENTAJAS DE LA MODA
1. Muy a menudo, no hay un valor modal, porque el conjunto de datos no
contiene valores que se repitan ms de una vez. Otras veces, cada valor es
la moda, porque cada una aparece el mismo nmero de veces. Por consi-
guiente, la moda no es una medida til en estos casos.
2. Cuando el conjunto de observaciones contiene dos, tres o ms modas, stas
son difciles de interpretar y comparar.
3. Al igual que la mediana, presenta una gran inestabilidad en el muestreo y
tampoco permite un tratamiento algebraico.
4. La moda es an menos importante que la mediana, debido a su ambige-
dad.
- 110 - V. Ibaez Q.
5.2.10. RELACIN ENTRE MODA, MEDIA y MEDIANA.

A. DISTRIBUCIONES SIMTRICAS.
Es cuando los valores de la variable, cuya representacin grfica es
acampanada y adems unimodal; en este caso coinciden exactamente en el mismo
los estadgrafos como: Media, Mediana y Moda. Tal como se puede apreciar en el
siguiente grfico.

X = Me = Md
X = Me = Md

B. DISTRIBUCIONES ASIMTRICAS.
Si la distribucin tiene la forma acampanada, es unimodal, pero
no tiene simetra, las 3 medidas estadsticas toman valores diferentes y la mediana
queda comprendida generalmente entre la Moda (Md) y la Media Artimtica ( x ).
i) Si la distribucin es ms alargada o sesgada para valores grandes
de la variable (asimetra a la derecha o positiva), entonces debe
cumplir que:

Sesgada a la derecha

X > Me > Md
Md Me X

ii) Si la distribucin es ms alargada o sesgada para valores peque-


os de la variable (Asimetra a izquierda o negativa), entonces:

Sesgada a la izquierda

X < Me < Md
X Me Md

De i) y ii) vemos que la mediana es el mejor medida de tendencia


Estadstica Aplicada a la Educacin - 111 -

central en la ubicacin, ya que se encuentra entre la Md y x . Entonces, si la distri-


bucin es moderamente asimtrica y unimodal, se cumple aproximadamente la si-
guiente relacin:
X Md 3( X Me)
Md = X 3( X Me)
Md = 10.256 - 3(10.256-10.275) = 10.313

5.3. MEDIDAS DE CUANTILES.

Estas medidas se llaman cuantiles o cuantilas; es decir son aquellos valores de


la variable que dividen una distribucin de frecuencias o el total de observaciones
debidamente ordenadas en 4, 6, 8, 10 o cien partes iguales, y estos cuantiles son ms
usados en el anlisis estadstico y son: cuartiles, deciles y percentiles, los valores se
dan a menudo en tanto por ciento.

5.3.1. CUARTILES.
Los cuartiles son estadgrafos de posicin que dividen a un conjunto
de datos o distribucin de frecuencias ordenados en forma ascendente o descendente
en CUATRO PARTES de igual tamao, esto significa que entre dos cuartiles conse-
cutivos se encuentran no ms de 25% del total de n observaciones, y se denota por
Qi, i = 1,2,3. En forma esquemtica se puede observar que:

Xmn. Xmx.
0% Q1 Q2 = Me Q3 100%

n 2n n 3n
25% 25% = 25% 25%
4 4 2 4
50% 50%
75%

A. PRIMER CUARTIL (Q1).


Es un valor que supera a no ms del 25% de las n observaciones
y que es superado por no ms del 75% de las n observaciones. En otras palabras, el
25% de las observaciones tienen valores inferiores o iguales a Q1, en tanto que el
75% restante tienen valores superiores a Q1.

25% de n Q1 75% de n
- 112 - V. Ibaez Q.

a) Q1 CON DATOS NO AGRUPADOS.

Sea x1,x2,x3,....,xn un conjunto de observaciones de una variable


o caracterstica X.
1. Se ordenan los datos en forma ascendente o descendente:
X(1),X(2),X(3),....,X(n) X(n),X(n-1),.....,X(2),X(1).
n +1
2. Se localiza el punto de posicin del valor correspondiente a la
4
observaciones ordenada.
n +1 n +1
i) Si es un entero, entonces Q1 = al punto de posicin de = Xn+1
4 4 4

n +1
ii) Si no es un entero, realizar una interpolacin lineal entre los
4
dos valores de las dos observaciones entre las cuales se encuentra
la fraccin.

EJEMPLO:
Determinar el primer cuartil Q1 de pesos (kg) de los pacientes en el HRMNB-
Puno.
74, 71, 73, 77, 78, 83, 70, 77.5, 83, 80

SOLUCIN:
1. Se ordena los datos:
Q1

70 70 73 74 77 77.5 78 80 83 83

X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10)

2. Como n = 10, entonces n + 1 = 10 + 1 = 11 = 2.75 , el valor de Q1 es el segundo


4 4 4
dato ms 75% de la diferencia entre los valores de las observaciones segun-
do y tercero. Esto es:

X( 2) = 70 UV Q1 = 70 + (73 70)(0.75) = 72.25


X(3) = 73 W
Q1 = 72.25 cm.
Estadstica Aplicada a la Educacin - 113 -

EJEMPLO (cuando el nmero de datos es impar).


1. Ordenar los datos:

70 70 73 74 77 77.5 78 80 83 83 84

X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)

2. Como n = 11, entonces n + 1 = 11 + 1 = 12 = 3 , es un entero, entonces Q1 es la


4 4 4

tercera observacin ordenada: Q1 = X n +1 = X3 = 73 .


4

b) Q1 CON DATOS AGRUPADOS TABULADOS.

Si los datos estn agrupados en distribucin de frecuencias en-


tonces Q1, se determina con los siguientes pasos:

1. Se toman las frecuencias absolutas acumuladas menor que Ni o frecuen-


cias relativa acumuladas menor que Hi.
2. Se identifica la clase que contiene a Q1, determinando la menor de las
n
frecuencias absolutas acumuladas Nj que supera a o la menor Hj que
4
1
supeara a .
4
n 1
N j1 < Nj H j1 < H j por lo tanto, la clase que contiene a Q1 es
4 4
" Yj'1 Yj' " .
n 1
i. Si N j1 = H j 1 = , el primer cuartil es Q1, = Yj-1 donde Yj-1=Lmite
4 4
inferior de la clase que contiene a Q1.
n 1
ii. Si N j 1 < H j1 < , entonces, el primer cuartil debe encontrarse dentro
4 4
del intervalo [Yj-1- Yj>, entonces Q1 debe localizar a una distancia
d de Yj-1, expresado de la siguiente manera: Q1, = Yj-1 +d.
- 114 - V. Ibaez Q.

Y'i-1 - Y'i ni Ni Y'i-1 - Y'i hi Hi


Y'0 - Y'1 n1 N1 Y'0 - Y'1 h1 H1
Y'1- Y'2 n2 N2 Y'1- Y'2 h2 H2
. . . . . .
. . . . . .
. . . . . .
Y'j-2 - Y'j-1 nj-1 Nj-1 n Y'j-2 - Y'j-1 hj-1 Hj-1 1
> N j1 > H j1
Y'j-1 - Y'j nj Nj 4 Y'j-1 - Y'j hj Hj 4
. . . . . .
. . . . . .

El d se puede calcular mediante dos mtodos: el mtodo de


interpolacin algebraica y el grfico, usaremos el mtodo de interpolacin algebraica,
se hace mediante una regla de tres simple:
Si en una amplitud cj Nj - Nj-1 observaciones

n
en qu amplitud d N j1 observaciones
4

Esto es: ci N j N j1 U| LM n N OP
V| de donde: d = M 4 PPc
j1

MN N N
n
d N j1
W
j

4 j j1
Q
Luego:

LM n N OP
+c M 4 PP
j1
'

MN N N
Q1 = Yj-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Q1.
cj = Amplitud de la clase que contiene a Q1.
Nj = Frecuencia absoluta acumulada de la clase que contiene a Q1.
Nj-1 = Frecuencia absoluta acumulada inmediatamente anterior a la clase de Q1.

Para frecuencia Relativa Acumulada Hi


Estadstica Aplicada a la Educacin - 115 -

LM 1 H OP
+c M 4 PP
j1
'

MN H H
Q1 = Yj-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Q1.
cj = Amplitud de la clase que contiene a Q1.
Hj = Frecuencia relativa acumulada de la clase que contiene a Q1.
Hj-1 = Frec. relativa acumul. inmediatamente anterior a la clase de Q1.

EJEMPLO:
Calcular el primer cuartil (Q1) con los datos de que corresponden a los califi-
cativos (puntajes) de los alumnos del curso de matemticas.

SOLUCIN:
1) Construir la tabla de distribucin de frecuencias.

[Y'i -1 - Y'i > ni Ni


41 - 49 5 5
49 - 57 3 8 n 50
= = 1 2 .5 N 2 = 8
57 - 65 6 14 4 4
65 - 73 9 23
73 - 81 12 35
81 - 89 9 44
89 - 97 6 50
T o ta le s 50

n 50
2. Ubicar la posicin de Q1: n = 50, entonces = =12.5, entonces la menor
4 4
n
frecuencia absoluta acumulada (Ni) que supera a =25 es N3 =14 >8, luego
4
j = 3 y j-1=3-1=2, entonces el intervalo que contiene a Q1 es: Y2 - Y3 = 57
- 65.
n 50
3) Como = =12.5>N2 =8, entonces el primer cuartil es:
4 4

LM n N OP LM 50 N OP
+c M 4 PP = Y + c MM N4 N PP = 57 + 8LMN1214.5-88 OPQ = 63.0
j 1 2
' '
Q1 = Y j-1 j
MN N Nj j 1
Q
2 j

N 3
Q 2

Q3 = 63.0 puntos.
- 116 - V. Ibaez Q.

n
Se debe comprobar que: N j1 < N j esto es igual a: 8 12.5 < 14
4
Respuesta: Significa que el 25% del total de personas, es decir 12.5 califica-
ciones se encuentran inferiores a 57 puntos y los 75% de los alumnos restantes tienen
calificativos superiores a 57 puntos.

B. SEGUNDO CUARTIL (Q2) o CUARTIL MEDIANA Q2 = Me.


Es un valor que est en el centro, y por lo tanto coincide con la
mediana Q2=Me.

LM 2/ n N OP LM n N OP
+ c M 4/ PP = Y +c M 2 PP
j1 j1
Q 2 = Me = Y ' '
j1
MN N N
j
j j1
Q
j1 j
MN N N
j j1
Q
C. TERCER CUARTIL (Q3).
Es un valor que supera a no ms del 75% de las n observaciones
y que es superado por no ms del 25% de las n observaciones. Es decir, que el 75%
de las observaciones tienen valores inferiores o iguales a Q3 y el 25% restante tienen
valores superiores a Q3.
75% de n Q3 25% de n

a) Q3 CON DATOS NO AGRUPADOS.

Sea x1,x2,x3,....,xn un conjunto de observaciones de una variable


o caractersticas X. Entonces Q3 se determina:
1. Se ordena los datos en forma ascendente o descendente:
X(1),X(2),X(3),....,X(n) X(n),X(n-1),.....,X(2),X(1).

2. Se localiza el punto de posicin del valor correspondiente a la 3( n + 1)


4
observaciones ordenada.

3 ( n + 1)
i) Si es un entero, entonces Q3 = al punto de posicin de
4
3( n + 1)
= X3( n+1)
4 4
Estadstica Aplicada a la Educacin - 117 -
3 ( n + 1)
ii) Si no es un entero, es decir es fraccionario, realizar una
4
interpolacin lineal entre los dos valores correspondientes a las
dos observaciones entre las cuales se encuentra la fraccin.

EJEMPLO:
Determinar para el tercer cuartil Q3 para los datos del ejemplo anterior que
corresponde al peso (kg) de pacientes del HRMNB-Puno.
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, 84 n = 11

SOLUCIN:
1. Se ordena los datos en forma ascendente:
Q3

70 70 73 74 77 77.5 78 80 83 83 84

X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)

3(11 + 1) 36
2. Como n = 11, entonces = = 9 , el valor de Q3 es la novena obser-
4 4

vacin ordenada. Entonces: Q 3 = X 3(11+1) = X ( 9 ) = 83 kg.


4

EJEMPLO (cuando el nmero de datos es par, es decir n = 10).

1. Ordenar los datos:

74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80 n = 10

Q3

70 70 73 74 77 77.5 78 80 83 83

X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10)

2. Como n = 10, entonces 3( n + 1) = 33 = 8.25 , es un nmero fraccionario, en-


4 4
- 118 - V. Ibaez Q.
tonces se realiza la interpolacin lineal, es el octavo dato ms 25% de la
diferencia entre los valores de las observaciones octava y novena. La octa-
va observacin es 80 y la novena es 83, entonces:
Q3 = 80 + (83 - 80)x(0.25) = 80.75

Q3 CON DATOS AGRUPADOS TABULADOS.


b)
Si los datos estn agrupados en distribucin de frecuencias o
clases, entonces Q3, se determina:
1. Se construye la tabla de frecuencias absolutas acumuladas menor que
Ni o frecuencias relativa acumuladas menor que Hi.
2. Se identifica la clase que contiene a Q3, determinando la menor de las
3n
frecuencias absolutas acumuladas Nj que supera a o la menor Hj
4
3
que supeara a .
4
3n 3
N j1 < Nj H j1 < H j por lo tanto, la clase que contiene a Q3
4 4
es " Yj'1 Yj' " .
3n 3
i. Si N j1 = H j1 = , el tercer cuartil es Q3, = Yj-1.
4 4
3n 3
ii. Si N j1 < H j1 < , entonces, el tercer cuartil debe encontrarse den-
4 4
tro del intervalo [Yj-1- Yj>. Es decir Q3 debe localizarse a una
distancia d de Yj-1, expresado como: Q3 = Yj-1 +d.

Y'i-1 - Y'i ni Ni Y'i-1 - Y'i hi Hi


Y'0 - Y'1 n1 N1 Y'0 - Y'1 h1 H1
Y'1- Y'2 n2 N2 Y'1- Y'2 h2 H2
. . . . . .
. . . . . .
. . . . . .
Y'j-2 - Y'j-1 nj-1 Nj-1 3n Y'j-2 - Y'j-1 hj-1 Hj-1 3
> Nj1 > H j1
Y'j-1 - Y'j nj Nj 4 Y'j-1 - Y'j hj Hj 4
. . . . . .
. . . . . .
Estadstica Aplicada a la Educacin - 119 -
El clculo de d se hacen en forma similar al Q1.

Si en una amplitud cj Nj - Nj-1 observaciones

3n
en qu amplitud d N j1 observaciones
4

Esto es: ci N j N j1 U| LM 3n N OP
V| de donde: d = c M 4 PP
j1

MN N N
3n
d N j1
W
j

4 j j1
Q
Luego:

LM 3n N OP
+c M 4 PP
j1
'

MN N N
Q3 = Yj-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Q3.
cj = Amplitud de la clase que contiene a Q3.
Nj = Frecuencia absoluta acumulada de la clase que contiene a Q3.
Nj-1 = Frecuencia absoluta acumulada inmediatamente anterior a la clase de Q3.

Cuando se usa las frecuencias acumulada relativa, la frmula es la si-


guiente:

LM 3 H OP
+c M 4 PP
j1
'

MN H H
Q3 = Yj-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Q3.
cj = Amplitud de la clase que contiene a Q3.
Hj = Frecuencia relativa acumulada de la clase que contiene a Q3.
Hj-1 = Frecuencia relativa acumulada inmediatamente anterior a la clase de Q 3.
- 120 - V. Ibaez Q.
EJEMPLO:
Calcular el tercer cuartil (Q3) con los datos que corresponde a los calificativos
(puntajes) de personas con dao cerebral post-meningtico.

SOLUCIN:
1) Construir la tabla de distribucin de frecuencias.

Calificativos ni Ni
41 - 49 5 5
49 - 57 3 8
57 - 65 6 14
65 - 73 9 23
73 - 81 12 35 3n 3( 50 )
= = 375
. > N5 = 35
81 - 89 9 44 4 4
89 - 97 6 50
Totales 50

3 n 3( 50 )
2) Ubicar la posicin de Q3: n = 50, entonces = =37.5, entonces, j = 6,
4 4
j-1 = 5, por lo tanto, la clase que contiene a Q3 es Y5 - Y6 = 81 - 89.

3n
3) Como =37.5>N5 =35, el tercer cuartil es:
4
n
Se debe comprobar que: N j1 < N j esto es igual a: 35 375
. < 44
4

LM 3n N OP LM 3(50) N OP
+c M 4 PP = Y + c MM N4 N PP = 81 + 8LMN 3744.5-3535OPQ = 83
j 1 5
' '
Q3 = Y j-1 j
MN N N
j j 1
Q
5 j

N 6 5
Q
Q3 = 83.22 puntos.

Respuesta: Significa que del total de alumnos, el 75%, es decir 37.5 tienen
calificativos (puntos) inferiores o iguales a 83.22 puntos, y el 25% restante tienen
calificativos superiores a los 83.22 puntos.
Estadstica Aplicada a la Educacin - 121 -

5.3.2. DECILES (Di)

Los DECILES son estadgrafos de tendencia central o de posicin que


dividen al total de las observaciones de una muestra o distribucin de frecuencias en
10 partes iguales, tal que entre dos deciles consecutivas, se encuentre no ms del
10% del total de las observaciones (cada parte incluye el 10% de las observaciones).
Los deciles, se representan por la letra Di, donde D, indica Decil y i
el orden del decil buscado. En total hay nueve decilas denotados por: D1, D2, D3,
...,D9.

Esquemticamente se puede observar:

0% 10% D1 10% D2 10% D3 10% D4 10% D5 10% D6 10% D7 10% D8 10% D9 10% 100%

X min n 2n 3n 4n 5n 6n 7n 8n 9n X mx
10 10 10 10 10 10 10 10 10

14444444
4244444444
35n=n14444444
4244444444
3
50% 10 2 50%

a) DECILES CON DATOS NO AGRUPADOS.

Sea x1,x2,x3,....,xn un conjunto de observaciones de una variable


caracterstica X .
1. Se ordenan los datos en forma ascendente o descendente:
X(1),X(2),X(3),....,X(n) X(n),X(n-1),.....,X(2),X(1).
i(n)+5
2. Se localiza el punto de posicin del valor correspondiente a la
10
observaciones ordenada. Entonces:
i ( n) 5
i) Si +
L
es un entero, entonces Di = X i ( n ) 5O
NM 10 + 10 QP
10 10

i ( n) 5
ii) Si + no es un entero exacto, Di se obtiene por interpolacin
10 10
lineal entre los dos valores correspondientes a las dos observacio-
nes entre las cuales se encuentra la fraccin.

EJEMPLO:
Determinar el primer decil (Di ) para los datos del ejemplo anterior que co-
rresponde al peso (kg) de los pacientes del HRMNB - Puno.
- 122 - V. Ibaez Q.

74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80, 84 n = 11

SOLUCIN:
1. Se ordena los datos en forma ascendente:
D1

70 70 73 74 77 77.5 78 80 83 83 84

X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10) X(11)

2. Ubicacin de la posicin, como n = 11, entonces 1(11) + 5 = 16 = 16


. , el valor
10 10 10
de D1, se realiza mediante la interpolacin lineal: D1 = 70+(70-70)x0 =
70.

D5 = ?
i) ubicar la posicin de D5: 5(11) + 5 = 60 = 6, D5 = X 5(11) 5 = X ( 6) = 77.5 cm.
10 10 10 +
10 10

Si n = 10, calcular D5:


1. Ordenar los datos:
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80 n = 10
D5

70 70 73 74 77 77.5 78 80 83 83

X (1 ) X (2 ) X (3 ) X (4 ) X (5 ) X (6 ) X (7 ) X (8 ) X (9 ) X (1 0 )

5(10) 5 55
2) ubicar la posicin de D5: + = . , D5 = 77 + ( 77.5 77) x0.5 = 77.25 cm.
= 55
10 10 10
Si n = 11, calcular D9:
9 (11) 5 104
i) ubicar la posicin de D9: + = = 10.4 , D 9 = 83 + (84 83) x1 = 84 cm.
10 10 10

Respuesta: D9= 84 kg, nos indica que el 90% de los pesos de personas,
tienen medidas inferiores o igual a 84 kg. y el resto de medidas (10%), tienen pesos
(kg) superiores a 84 kg.
Estadstica Aplicada a la Educacin - 123 -
b) DECILES CON DATOS AGRUPADOS TABULADOS (Di).

Si los datos estn agrupados o tabulados en una distribucin de


frecuencias o clases, entonces Di, se determina:
1. Se construye la tabla de frecuencias absolutas acumuladas menor que
Ni o frecuencias relativa acumuladas menor que Hi.

i( n) i
2. Se determina la posicin o si se considera la tabla de Hj, i = 1,2,3,
10 10
..., 9.

3. Se identifica la clase que contiene a Di, identificando a la frecuencia


i( n) i
acumulada Nj Hj inmediatamente a (o a ). En estas condicio-
10 10
nes, se tiene que Yi-1 - Yi es la clase que contiene a Di.
i(n) i
N j1 < N j H j1 < H j por lo tanto, la clase que contiene a Di
10 10
es " Yj'1 Yj' " .

i(n) i
i. Si N j1 = H j1 = , entonces Di, = Yj-1.
10 10
i(n) i
ii. Si > N j1 > H j1 , entonces Di = Yj-1 +d.
10 10

Y'i-1 - Y'i ni Ni Y'i-1 - Y'i hi Hi


Y'0 - Y'1 n1 N1 Y'0 - Y'1 h1 H1
Y'1- Y'2 n2 N2 Y'1- Y'2 h2 H2
. . . . . .
. . . . . .
. . . . . .
Y'j-2 - Y'j-1 nj-1 Nj-1 i(n) Y'j-2 - Y'j-1 hj-1 Hj-1 i
>Nj1 > Hj1
Y'j-1 - Y'j nj Nj 10 Y'j-1 - Y'j hj Hj 10
. . . . . .
. . . . . .

El clculo de d se hacen en forma similar al Di.


- 124 - V. Ibaez Q.

Si en una amplitud cj Nj - Nj-1 observaciones

i(n)
en qu amplitud d Nj1 observaciones
10

Esto es: ci N j N j1 U| LM i(n) N OP


V| de donde: d = c M 10 PP
j1

MN N N
in
d N j1
W
j

10 j j1
Q
Luego:

LM i(n) N OP
+ c M 10 PP,
j1
'
i = 1,2,...,9
MN N N
Di = Y j-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Di.
cj = Amplitud de la clase que contiene a Di.
Nj = Frecuencia absoluta acumulada de la clase que contiene a D i.
Nj-1 = Frec. absoluta acumulada inmediatamente anterior a la clase de Di.

Cuando se usa las frecuencias acumulada relativa, la frmula es la si-


guiente:

LM i H OP
+ c M 10 PP,
j 1
'
i = 1,2,....,9
MN H H
D i = Yj-1 j
j j 1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Di.
cj = Amplitud de la clase que contiene a Di.
Hj = Frecuencia relativa acumulada de la clase que contiene a Di.
Hj-1 = Frec. relativa acumulada inmediatamente anterior a la clase de Di.

EJEMPLO:

Calcular los siguientes deciles: D1, D2,D3, ... , D9 para las calificaciones de la
prueba de matemticas de 50 alumnos que corresponde al ejemplo anterior:
Estadstica Aplicada a la Educacin - 125 -
SOLUCIN:

CUARTO DECIL (D4)


1) Construir la tabla de distribucin de frecuencias.

calificativos ni Ni
41 - 49 5 5
49 - 57 3 8
57 - 65 6 14
D4
65 - 73 9 23
D5 , D6
73 - 81 12 35
D8
81 - 89 9 44
89 - 97 6 50
Totales 50

4(n) 4( 50 )
1) Ubicar la posicin de D4: n = 50, entonces = =20, ste nmero
10 10
esta comprendido entre 14 y 23, entonces j =4, j-1 = 3, con: Y3 - Y4 = 65 - 73.
4 ( 50 )
2) Como =20>N3 = 14, entonces reemplazando en la frmula se tiene:
10

LM 4(50) N OP
= Y + c M 10 P L 20 14 OP = 70.33
= 65 + 8M
3

N 23-14 Q
'
D4 3
MN N N PQ
j
4 3

D4 = 70.33 puntos.

Respuesta: El 40% de los alumnos tienen calificativos inferior a 70.33 puntos,


y el resto 60% de alumnos tienen calificativos mayores a 70.33 puntos.

QUINTO DECIL (D5)


5(n) 5( 50 )
1) Ubicar la posicin de D5: n = 50, entonces = =25, ste nmero
10 10
esta comprendido entre 23 y 35, entonces j =5, j-1 = 4, se encuentra en el
intervalo de clase: Y4 - Y5 = 73 - 81.
- 126 - V. Ibaez Q.

5( 50 )
2) Como =25>N4 =23, entonces reemplazando en la frmula se tiene:
10

LM 5(50) N OP
= Y + c M 10 PP = 73 + 8LMN 2535- 2323OPQ = 74.33
4
'

MN N N
D5 4 j
5 4
Q
D5 = 74.33 puntos (este valor coincide con la Me).

Respuesta: El 50% de los alumnos tienen calificativos como mximo 74.33


puntos y el otro 50% tienen calificativos mayores a 74.33 puntos.

5.3.3. PERCENTILES CENTILAS (Pi).

Los percentiles son estadgrafos de posicin que dividen a la totalidad


de observaciones de la muestra en 100 partes iguales; es un estadgrafo que da una
idea porcentual de la distribucin de los datos. Los percentiles, se aplican cuando
existen numerosos valores de la variable con una alta frecuencia total. Existen 99
percentiles, y se denota por Pi, i = 1,2,3, ..., 99. Para visualizar mejor, se presenta el
esquema siguiente:

Xmn. P 50 Xmx.
0%
P1 P2 P3 ...... ...... P 50 ...... P 97 P 98 P 99 100%

1% 1% 1% 1% ...... ...... 1% 1% 1%
2% 98%
98% 2%
99% 1%

PRIMER PERCENTIL (P1). Es el valor que supera a no ms de un


cntimos de las observaciones y es superado por no ms de 99 cntimos de ellas. P1 es
el valor que deja 1% de las observaciones menores o iguales a l y el 99% superiores
a l.

SEGUNDO PERCENTIL (P2). Es el valor que supera a no ms de


dos centcimos de las observaciones y es superado por no ms de 98 centcimos de
ellas. P2, es el valor que deja 2% de las observaciones menores o iguales a l y el 98%
superiores a l.
Estadstica Aplicada a la Educacin - 127 -
As sucesivamente, puede definir cada uno de los percentiles.

NOVENTA Y NUEVE AVO PERCENTIL (P99). Es el valor que su-


pera a no ms de 99 centcimos de las observaciones y es superado por no ms de 1
centcimo de ellas. P99, es el valor que deja 99% de las observaciones menores o
iguales a l y el 1% superiores a l.

CLCULO DE LOS PERCENTILES (Pi).


Los percentiles, se determinan de la misma forma que los cuartiles y deciles.
Para datos agrupados se sigue los siguientes pasos:
1) Se construye la tabla de frecuencias absolutas acumuladas menor que Ni
o frecuencias relativa acumuladas menor que Hi.
i( n)
2. Se determina la posicin , si se trabaja con la frecuencia absoluta acu-
100
i
mulada Ni o con la frecuencia relativa acumulada Hi, i = 1,2,3, ..., 99.
100
3. Se identifica la clase que contiene a Pi, identificando a la frecuencia acumu-
i( n) i
lada Nj Hj inmediatamente a (o a ). Para esto, se debe cumplir las
100 100
siguientes condiciones.
i(n) i
N j1 < N j H j1 < H j luego el intervalo de clase que contiene a
100 100
Pi es " Yj'1 Yj' " .
4. Ubicacin de los percentiles:
i(n) i
i. Si N j1 = H j1 = , entonces Pi, = Yj-1.
100 100
i(n) i
ii. Si Nj1 < Hj1 < , entonces Pi = Yj-1 +d.
100 100
Donde d se determina por interpolacin algebraica o por el mtodo grfico.

Si en una amplitud cj Nj - Nj-1 observaciones

i(n)
en qu amplitud d N j1 observaciones
100

Esto es: ci N j N j1 U| LM i(n) N OP


V| de donde: d = c M 100 PP
j1

MN N N
in
d N j1
W
j

100 j j1
Q
- 128 - V. Ibaez Q.
Luego:
LM i(n) N OP
+ c M 100 PP ,
j 1
'
i = 1,2 , ... ,99
MN N N
Pi = Y j-1 j
j j 1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Pi.
cj = Amplitud de la clase que contiene a Pi.
Nj = Frecuencia absoluta acumulada de la clase que contiene a Pi.
Nj-1 = Frec. absoluta acumulada inmediatamente anterior a la clase de Pi.
n = Tamao de muestra.
Cuando se usa las frecuencias acumulada relativa, la frmula es la si-
guiente:
LM i H OP
+ c M 100 PP,
j1
'
i = 1,2,....,99
MN H H
Pi = Y j-1 j
j j1
Q
Donde: Yj-1 = Lmite inferior de la clase que contiene a Pi.
cj = Amplitud de la clase que contiene a Pi.
Hj = Frecuencia relativa acumulada de la clase que contiene a Pi.
Hj-1 = Frec. relativa acumulada inmediatamente anterior a la clase de Pi.

EJEMPLO:
Calcular los percentiles: P10, P17, P20, P30, P25, P50, P75, P90 para los calificativos
(puntos) de los alumnos de matemticas del ejemplo anterior.

PERCENTIL (P10)
1. Se construye la tabla de distribucin de frecuencias:

Calificativos (punt os) ni Ni


41 - 49 5 5
49 - 57 3 8
57 - 65 6 14 P25
65 - 73 9 23
P50
73 - 81 12 35
P75
81 - 89 9 44
89 - 97 6 50
Totales 50
Estadstica Aplicada a la Educacin - 129 -
PERCENTIL (P25)
i(n) 25( 50 )
1) Ubicar la posicin de P25: n = 100, entonces = =12.5, este valor
100 100
est comprendido entre los valores 8 y 14, entonces j =3, j-1=2, el percentil
se encuentra en el intervalo: Y2 - Y3 = 57 - 65

LM 25(50) N OP
+ c M 100 PP = 57 + 8 LMN 1214.5-88 OPQ = 63.0
2
'

MN N N
P25 = Y 2 j
3 2
Q
P25 = Q1 = 63.0 puntos.

PERCENTIL (P50)
i(n) 50( 50 )
1) Ubicar la posicin de P50: n = 100, entonces = =25, entonces ste
100 100
valor est comprendido entre 23 y 35, luego j =5, j-1 = 4, por lo tanto, la
clase que contiene a P50 es Y4 - Y5 = 73 - 81.
50( 50 )
2) Como =25>N4 =23, entonces: Y4 - Y5 = 73 - 81.
100
Reemplazando en la frmula de Percentil, se tiene:

LM 50(50) N OP
= Y + c M 100 P L25 23OP = 74.33
= 73 + 8M
4

N 35-23 Q
'

MN N N PQ
P50 4 j
5 4

P50 = Q2 = Me = 74.33 puntos.

Respuesta: El 50% de los alumnos tienen calificativos (puntos) inferiores o


iguales a 74.33 puntos y el resto de alumnos 50% tienen calificativossuperiores a
74.33 puntos.

PERCENTIL (P75)
i(n) 75( 50 )
1) Ubicar la posicin de P75: n = 50, entonces = =37.5, entonces
100 100
ste valor est comprendido entre 35 y 44, luego j =6, j-1 = 5, por lo tanto,
la clase que contiene a P75 es Y5 - Y6 = 81 - 89.
- 130 - V. Ibaez Q.

75( 50 )
2) Como =37.5>N5 =35, entonces, reemplazar en la frmula:
100

LM 75(50) N OP
= Y + c M 100 P L37.5 35OP = 83.22
= 81 + 8M
5

N 44 - 35 Q
'

MN N N PQ
P75 5 j
6 5

P75 = Q3 = 83.22 puntos

Respuesta: El 75% de los alumnos tienen calificativos como mximo de 83.22


puntos y el resto 25% de las calificaciones son superiores a 83.22 puntos en el curso
de matemticas.

FRMULA GENERAL:

R| Cuartil U| LM ? n N OP
C=S
| Qu int il |V = Y '
+c M ?
j1
PP
|| Decil || j1
MN N N
j
j1
Q
TPercentilW
j
Estadstica Aplicada a la Educacin - 131 -

EJERCICIOS 5.1

1. La siguiente distribucin de las edades de los profesores de un colegio, se presenta


a continuacin:
In terv a lo (Ed a d e n a o s ) Frec u en cia (n i )
27 - 32 2
32 - 37 5
37 - 42 6
42 - 47 3
a) Dibuje el histograma de frecuencias y polgono de frecuencias,
b) Graficar la Ojiva menor y mayor,
c) Calcule: Media, Mediana, Moda, Media Geomtrica, Media Armnica, Media
cuadrtica, Q1, Q2, Q3, D1, D5, D9 y P20, P30, P50, P75,P90, e interprete los resulta-
dos.

2. Se tiene el siguiente cuadro de frecuencias correspondientes al nmero de casos de


cancer en un grupo de hospitales.

Casos de cncer 1 - 4 4 - 7 7 - 10 10 -13 13 -16


ni 4 10 12 3 1

a) Dibuje el histograma de frecuencias, polgono de frecuencia, graficar ojiva


menor y mayor.
b) Calcular: Media aritmtica, Mediana, Moda, Media Geomtrica, Media Ar-
mnica, Media cuadrtica, distribuciones asimtricas o simtricas e interprete
los resultados.
b) Calcular: Q1, Q2, Q3, D1, D2, D3, D4, D5, D6, D7, D8, D9 y P5, P10, P15, P20, P25,
P30, P35, P40, P45, P50, P55, P60, P65, P70, P75, P80, P85, P90, P95, e interprete los
resultados.
- 132 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 133 -

6
ESTADGRAFOS DE
DISPERSIN

6.1. INTRODUCCIN.

Las medidas de dispersin son los que cuantifican el grado de concentracin


o de dispersin de los datos de la muestra en torno de un promedio o valor central de
la distribucin.

La idea de dispersin, se relaciona con la mayor o menor concentracin de los


datos a un valor central, generalmente la media aritmtica, mediana y moda, pero
Cul es la distancia, diferencia o dispersin de los valores de una caracterstica o
variable respecto a un punto de referencia?. Este problema ser abordado definiendo
un conjunto de indicadores, llamados los estadgrafos de dispersin. El recorrido
como estadgrafo de dispersin es muy limitado, pues solo considera los valores ex-
tremos de la distribucin, y no indica nada de cmo se dispersan o comparten los
valores intermedios.

6.2. RECORRIDO O RANGO.

El caso ms simple para conocer la dispersin entre valores, es determinar la


diferencia o distancia entre el mayor y menor valor de una distribucin. Denotado
por R y se define por:
- 134 - V. Ibaez Q.

6.2.1. RECORRIDO CON DATOS NO AGRUPADOS.

R = Xmx - Xmn.

EJEMPLO:
i) Rango Rc = Xmx - Xmn= 47 - 25 = 22 kg.
ii) Rango Rpg = Xmx - Xmn= 42 - 32 = 10 kg.

6.2.2. RECORRIDO PARA DATOS AGRUPADOS.

Para datos agrupados en tablas con intervalos de frecuencias, se tiene


que:
R = Ym - Y0

Donde: Ym = Lmite superior del ltimo intervalo.


Y0 = Lmite o extremo inferior del primer intervalo.

EJEMPLO:
Para el ejemplo anterior que corresponde a los calificativos de la prueba de
matemticas de los 50 alumnos, se tiene tabulados o agrupados en tablas de distribu-
cin de frecuencias:

Tabla de Distribucin para personas


[Y'i-1 - Y'i> ni Ni hix100
41 - 49
41 5 5 10
49 - 57 3 8 6
57 - 65 6 14 12
65 - 73 9 23 18
73 - 81 12 35 24
81 - 89 9 44 18
89 - 97 97 6 50 12
Totales 50 100

R = Y'7 - Y'0 =97 - 41 = 56 puntos


Estadstica Aplicada a la Educacin - 135 -

6.3. RECORRIDO INTERCUARTLICO.

Esta definido como la diferencia entre el tercer y primer cuartil tambin la


diferencia entre los percentiles 75 avo y 25 avo. Denotado por: RI = Q3 - Q1 RI =
P75 - P25
El diagrama siguiente muestra el recorrido intercuartil:

RECORRIDO INTERCUARTLICO

X (1) X (n)

1/4 elemento 1/4 elemento

Dato menor Primer cuartil Segundo cuartil Tercer cuartil Dato mayor

Q 1 = P 25 Q 2 = P 50 Q 3 = P 75

Esta medida es ms exacta que el recorrido de la variable (Rango), ya que


evita el inconveniente de valores extremos o sospechozos, tratando de que los valores
separen entre si el 50% de los valores, los ms centrales de la variable.

EJEMPLO:
Calcular el RI para la siguiente informacin de que corresponde a los pesos
de nios de 6to. grado de primaria.

SOLUCIN:
Clculo de Q1 = ?; n = 20

1. Se ordenan los datos en forma ascendente o descendente.

Q1 Q3

Xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Pesos (kg) 25 25 26 26 27 27 27 28 28 29 30 30 34 35 37 38 38 38 42 47

2. Ubicar la posicin del Q1, entonces n + 1 = 21 = 5.25 , el valor Q1, es el 5to.


4 4
dato ms el 25% de la diferencia entre los valores de las observaciones
5to. y 6to., es decir:
- 136 - V. Ibaez Q.

X ( 5) = 27 UV
Q 1 = X ( 5) + X ( 6) X ( 5) ( 0.25)
X (6) = 27 W Q1 = 27 + ( 27 27)( 0.25) = 27 kg
Clculo de Q3.
1. Ubicar la posicin del Q3, entonces 3 ( n + 1) = 3 ( 2 1) = 1 5.7 5
4 4

X(15) = 37 UV
Q1 = X(15) + X(16) X(15) (0.75)
X(16) = 38 W Q1 = 37 + (38 37)(0.75) = 37.75 kg

6.4. RECORRIDO INTERDECIL (RID).


Es la diferencia entre los percentiles 90avo. y dcimo, y est definido por:
Ejemplo: Para los siguiente percentiles, calcular RID:
RID = P90 - P10 = 40 - 33 = 7.0 kg.

6.5. EL RANGO SEMI-INTERCUARTIL (Q).


Llamada tambin desviacin del cuartil, es el recorrido semi-intercuartil, est
definido por la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1) dividido
entre 2.
Q 3 Q1
Q=
2
Esta expresin da una idea de la dispersin del 50% de los datos centrales, es
decir mide el recorrido promedio de un cuarto de los datos. El Q es representativo de
la dispersin de los datos, calculndose el promedio de la mitad de los elementos del
medio en lugar de escoger uno de los cuartos. El rango semi-intercuartlico (Q), es
mucho ms estable que el rango y se usa por lo general para comparar dos o ms
distribuciones y para determinar el coeficiente de curtosis percentlico.

NOTA: Tambin se puede considerar X = 1 ( Q1 + Q 3 ) como una medida de


2
tendencia central, que permitir obtener un valor aproximado de la
media.

6.6. LA DESVIACIN MEDIA (DM).

La desviacin media o desviacin promedio de las diferencias absolutas, es


simplemente la media aritmtica de los valores absolutos de las desviaciones de to-
dos los valores en relacin con algn punto central, como la media o la mediana.
Estadstica Aplicada a la Educacin - 137 -
6.6.1. DESVIACIN MEDIA CON DATOS NO AGRUPADOS.
Sean x1, x2,...,xn, una muestra de tamao n. La desviacin media
absoluta o desviacin media DM es la media aritmtica de los valores absolutos de
las desviaciones de los valores observados respecto de la media aritmtica.
n

X i X
DM = i =1
n
Donde: x = Promedio aritmtico de la muestra.
xi = Son las observaciones individuales de la muestra.
n = Es el nmero total de observaciones tamao de la muestra.
= Indica valor absoluto de una observacin dado.

6.6.2. DESVIACIN MEDIA CON DATOS AGRUPADOS.


Si las Y1,Y2,Y3,....,Ym, ocurren con frecuencias n1,n2,n3,....,nm, respec-
tivamente, la desviacin media se obtiene:
m

n i Yi Y
DM = i =1
n
Donde: m = Nmero de clases.
ni = Frecuencia absoluta de la clase i.
Yi = Marcas de clase o puntos medios de la clase i.
Tambin se puede calcular con frecuencia relativas, usando la siguien-
te frmula:
m m
ni
DM =
i =1 n
Yi Y = h
i =1
i Yi Y

EJEMPLO:

Con los datos agrupados en la distribucin de frecuencias, calcular la desvia-


cin media de los calificativos (puntajes) de las alumnos de matemticas. Calcular la
desviacin media (DM).
- 138 - V. Ibaez Q.

[Y'i-1 - Y'i> ni Yi niYi Yi Y n i Yi Y


41 - 49 5 45 225 27.36 136.80
49 - 57 3 53 159 19.36 58.08
57 - 65 6 61 366 11.36 68.16
65 - 73 9 69 621 3.36 30.24
73 - 81 12 77 924 4.64 55.68
81 - 89 9 85 765 12.64 113.76
89 - 97 6 93 558 20.64 123.84
5 5
Totales 50 n Y = i i 3618 n i Yi Y = 586.56
i =1 i =1

n Y i i
3618
Y = i =1
= = 72.36 puntos
n 50
5

n Y Yi i
586.56
DM = i =1
= = 1173
. puntos. esto quiere decir que el promedio de
n 50
las desviaciones de calificaciones (puntos), respecto a la calificacin promedio es
11.73 puntos.

VENTAJAS:

- Es fcil de definir y calcular e incluye todas las observaciones adecuadamen-


te ponderados.
- La desviacin media absoluta es una mejor medida de dispersin que el
recorrido, porque toma en cuenta todas las observaciones.

DESVENTAJAS:

- No es susceptible de tratamiento algebraico, lo que no permite obtener fr-


mulas abreviadas de clculo, como ocurre con la media aritmtica y des-
viaciones medias de dos o ms muestras.
- El empleo de la desviacin media como medida de dispersin estn en des-
ventaja, dado que es difcil de operar.
Estadstica Aplicada a la Educacin - 139 -

6.7. DESVIACIN MEDIANA ABSOLUTA (DMe).

La desviacin mediana DMe es el promedio de los valores absolutos de las


diferencias entre cada observacin y la mediana de stas.

6.7.1. DESVIACIN MEDIANA ABSOLUTA PARA DATOS NO AGRU-


PADOS.
Es la diferencia absoluta entre los valores de cada observacin y la
mediana dividido entre el nmero total de observaciones, y esta definido por:
n

X i Me
DMe = i =1
n
EJEMPLO:
Encontrar la desviacin mediana absoluta de los pesos de los profesores de un
colegio.
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80 n = 10

SOLUCIN:
1. Ordenar en forma ascendente de menor a mayor los datos:
70 70 73 74 77 77.5 78 80 83 83
X(1) X(2) X(3) X(4) X(5) X(6) X(7) X(8) X(9) X(10)

2. Existen n = 10, un nmero par de observaciones:


X 10 = X ( 5) = 77 y X 10 = X ( 6) = 77.5
+1
2 2

X10 + X10
+1 X( 5 ) + X( 6 ) 77 + 77.5
Me = 2 2
= = = 7725
. kg.
2 2 2

3. Se calculan las desviaciones:


10

X i Me
37.5
DMe = i =1
= = 3.75 kg.
n 10
- 140 - V. Ibaez Q.
6.7.2. DESVIACIN MEDIANA ABSOLUTA CON DATOS AGRUPA-
DOS.
La desviacin mediana absoluta es la diferencia absoluta de cada uno
de las marcas de clase o puntos medios con respecto a la mediana y multiplicado por
las frecuencias absolutas, dividido entre el nmero total de datos. Esta definido por:
m

n Y Mei i m
DMe = i=1
, n = ni
n i =1

EJEMPLO:
Con los datos agrupados de las calificaciones de los alumnos de matemticas.
Calcular la desviacin mediana absoluta (DMe).

[Y'i-1 - Y'i> ni Yi Ni Yi Me ni Yi Me
41 - 49 5 45 5 29.33 146.65
49 - 57 3 53 8 21.33 63.99
57 - 65 6 61 14 13.33 79.98
65 - 73 9 69 23 n
= 25 > N4 = 23
5.33 47.97
73 - 81 12 77 35 2 2.67 32.04
81 - 89 9 85 44 10.67 96.03
89 - 97 6 93 50 18.67 112.02
5
Totales 50 n
i =1
i Yi Me = 578.68

SOLUCIN:
LM 50 N OP
Me = Y + 8M 2 P
4
F 25 23IJ = 74.33
= 73 + 8G
H 35 23K
'
3
MN N N 5PQ 4

Me = 74.33 puntos.

Luego, se calcula la desviacin media absoluta (DMe):


7

n Y Mei i
578.68
DMe = i =1
= = 11.57 puntos.
50 50
Estadstica Aplicada a la Educacin - 141 -

6.8. LA VARIANZA.
La varianza, es una medida que cuantifica el grado de dispersin o de varia-
cin de los valores de una variable cuantitativa con respecto a su media aritmtica. Si
los valores tienden a concentrarse alrededor de su media, la varianza ser pequea,
en cambio si los valores tienden a distribuirse lejos de la media, la varianza ser
grande.

6.8.1. VARIANZA POBLACIONAL.


La varianza o variancia de una poblacin finita de N elementosX1, X2,
... , XN, se define como la media aritmtica del cuadrado de las desviaciones de las
observaciones con respecto a su media , y est denotado por 2 .
N

(X i ) 2
2 = i =1
= M ( X ) 2
N

6.8.2. VARIANZA MUESTRAL.


La varianza de una muestra x1, x2, ... , xn, de una variable o caracters-
tica X en forma abreviada V(X), se define como la media del cuadrado de las
desviaciones de las observaciones con respecto de la media aritmtica, y se denota
por S2x .

(X i X) 2
V( x) = S2x = i =1
n
Si se conoce la media aritmtica poblacional , la mejor estimacin
de la varianza poblacional 2 a partir de una muestra esta definido por:
n

(X i ) 2
V( x) = i =1
, n = Nmero de elementos de la muestr
n
Pero en la prctica rara vez se conoce , por esta razn se realiza la
estimacin de la muestra x , que lo sustituye a , lo cual nos permite que la suma
de cuadrados debe ser mnimo, es decir:
- 142 - V. Ibaez Q.

(x
i =1
i x ) 2 = mnimo

A. VARIANZA PARA DATOS NO AGRUPADOS.

1. Para n>30 (varianza de la poblacin).


Existen varias frmulas para efectuar los clculos para datos no
agrupados.
N
( Xi ) 2
cX h
N
2 N
i X X 2
i i =1
N
i) =
2 i =1
ii) = 2 i =1

N N

N N
N X 2i ( X i ) 2
N

X 2
i NX 2

iii) 2 = i =1 iv) 2 = i =1
2
i =1

N N

2. Para n 30 (Varianza de la muestra).


n
( xi ) 2
bx g
n n
x
2
i x 2
i i =1
n
i) S = 2 i =1
ii) S = 2 i =1
n 1 n 1

n n n
n x 2i ( x i ) 2 x 2
i nx 2
iii) S =2 i =1 i =1
iv) S2 = i =1
n2 n n 1

EJEMPLO:
Los datos corresponden a la variable peso (kg) de los profesores de un Cole-
gio.
74, 70, 73, 77, 78, 83, 70, 77.5, 83, 80 Calcular la varianza?.

bx xg
10 10


2
Xi i
765.5 203.225
X = i =1
= = 76 .55 kg. ; S = 2 i =1
= = 22.58 kg.
10 10 n 1 9
Estadstica Aplicada a la Educacin - 143 -

10

10 ( xi )2
x i
2
i =1
n
58802.25
10
. )2
( 7655
S2 = i =1
= = 22.58 kg.
n 1 9

B. VARIANZA PARA LOS DATOS AGRUPADOS.

Cuando los datos estn tabulados en distribuciones de frecuencias,


se puede calcular la varianza con los datos discretos y contnuos.

1. Varianza con variable Discreta.


La varianza de n valores de una variable estadstica discreta
Y que se clasifican en m valores distintos de Y1, Y2,..,Ym con frecuencias absolutas
respectivas n1, n2,..,nm y cuya media aritmtica es Y , se calcula con la siguiente
frmula:

c h n cY Yh
m m

ni Yi Y
2 2
i i
S2 = i =1
, para (n 30); S2 = i=1
, para (n>30)
n 1 n
Frmulas equivalentes
m m m
n n i Yi2 ( n i Yi ) 2 ( n i Yi ) 2 m

, S = n i Yi nY
m 2 2 2
S =
2 i =1 i =1
, S = n iY
2
i
2 i =1

n2 i =1 n i =1

2. Varianza con datos tabulados por intervalos.


La varianza de n valores de alguna variable X, discreta o
contnua, que estn clasificado en una distribucin de frecuencias de m-intervalos,
con marcas de clases Y1, Y2,..,Ym, frecuencias absolutas respectivas n1, n2,..,nm, se
calcula utilizando la siguiente frmula:

1. Para n>30.
m
( n i Yi ) 2
c h
m

n Y
m

n i Yi Y
2 2 i =1
i i
n
i) S = i =1
ii) S = i =1
2 2

n n
- 144 - V. Ibaez Q.

m m
n n i Yi2 ( n i Yi ) 2
m

ni Yi2 nY 2
iii) S 2 = i =1 iv) S 2 = i =1 i =1

n n2
2.Para n 30 (Varianza de la muestra).
m
( n i Yi ) 2
n cY Y h
m m

n Y
2
i i i i
2
i =1
n
i) S = 2 i =1
ii) S = 2 i =1

n 1 n 1
m m
n n i Yi2 ( n i Yi ) 2
m

n Y i i
2
nY 2

iii) S2 = i =1 iv) S2 = i =1 i =1

n 1 n2 n

NOTA: para n>30, se dividir solo entre n.


m
n h i (Yi Y ) 2
Para frecuencias relativas: S2 = i =1 n , factor de correc-
,
n 1 n -1
cin de Bessel.

EJEMPLO:
Calcular la varianza para las calificaciones (puntos) de los alumnos del curso
de matemticas.

Y'i-1 - Y'i ni Yi niYi (Yi Y) (Yi Y)2 i i Y)


n(Y 2

41 - 49 5 45 225 -27.36 748.569600 3742.848000


49 - 57 3 53 159 -19.36 374.809600 1124.428800
57 - 65 6 61 366 -11.36 129.049600 774.297600
65 - 73 9 69 621 -3.36 11.289600 101.606400
73 - 81 12 77 924 4.64 21.529600 258.355200
81 - 89 9 85 765 12.64 159.769600 1437.926400
89 - 97 6 93 558 20.64 426.009600 2556.057600
8 8 8
Total n = 50
i=1
i nY = i i 3618 n(YY) =
i=1
i i
2
9995.52
i=1
Estadstica Aplicada a la Educacin - 145 -

n Y i i
3618
Y = i =1
= = 72.36 puntos.
n 50

Reemplazando a la frmula:

n cY Y h
7
2
i i
9995.52
S2 = i =1
= = 199.9 puntos.
n 50

n cY Y h
8
2
i i
999552
.
S2 = i =1
= = 203.99 puntos.
n 1 49
Entonces: S2 = 199.9 puntos.

De igual forma se puede calcular la varianza con frecuencias relativas:


m
S2 = h i Yi2 Y 2
i =1
Tambin se puede calcular, usando las otras frmulas de varianzas
dadas anteriormente.

PROPIEDADES DE LA VARIANZA.

P-1. La varianza de un conjunto de observaciones x1, x2,..,xn, siempre es un


nmero no negativo V(x) 0.
P-2. La varianza de una constante es cero, es decir, si x1=x2=....=xn=c, V(c)=0.
P-3. Si a cada observacin x1, x2,..,xn se adiciona o se resta una constante c>0,
la varianza del nuevo conjunto de valores Y1, Y2,..,Yn, donde Yi = xic,
i = 1,2,..,n, coincide con la varianza del conjunto original.
V(Y) = V(Xc) = V(X)
P-4. La varianza del producto de una constante por una variable, es igual al
cuadrado de la constante por la varianza de la variable: V(cX) = C2V(X),
c = constante.
P-5. V(cX+b) = C2V(X), c y b son constantes.
P-6. La varianza de la suma de una variable ms una constante, es igual a la
varianza de la variable: V(X+c) = V(X).
- 146 - V. Ibaez Q.
6.10. DESVIACIN ESTNDAR DESVIACIN TPICA ( S).

Es uno de los estadgrafos de dispersin de mayor uso, en el cual las unidades


de la variable ya no estn elevadas al cuadrado.
La desviacin estndar, al igual que la varianza, es no negativa, puesto que es
la raz cuadrada positiva de la varianza. A mayor dispersin le corresponder una
mayor desviacin estndar.
En general, los estadgrafos de dispersin, se usa para comparar dos o ms
distribuciones o poblaciones con variables de la misma caracterstica. A mayor dis-
persin o heterogeneidad entre los valores o elementos de una poblacin, correspon-
der un valor mayor para el estadgrafo de dispersin. Su valor indica el valor abso-
luto que en promedio se desvian los datos individuales de una poblacin, ms o
menos de la media de dicha poblacin.
La desviacin estndar o desviacin tpica S de las observaciones x1, x2, x3
...,xn de una caracterstica X, est definido como la raz cuadrada positiva de la
varianza.

S = V ( x ) = + S2

6.10.1 DESVIACIN ESTNDAR PARA DATOS NO AGRUPADOS.

En forma similar a las frmulas de varianza tenemos las siguientes


frmulas de desviacin estndar, tomando la raz cuadrada de las frmulas de la
varianza:
1. Desviacin estndar, para n>30 poblaciones.

N
( X i )2
c h
N N

X
2
Xi X 2
i i =1
N
i) = ii) =
i =1 i =1

N N

N N
N X 2i ( X i ) 2
N

X2i NX2
iii) = i =1 iv) = i =1 i =1

N N2

2. Para n 30 (desviacin estndar para la muestra).


Estadstica Aplicada a la Educacin - 147 -

n
( xi ) 2
bx g
n n
x x
2
i
2
i i =1
n
i) S = i =1
ii) S = i =1
n 1 n 1

x
n n
n x 2i ( x i ) 2 nx 2
2
i
iii) S = i =1 i =1
iv) S= i =1
n2 n n 1
Donde: n = tamao de la muestra.
Xi = Variable observado.
x = Promedio aritmtico.
EJEMPLO:
Con los datos de peso (kg) que corresponde a los nios del sexto grado de
educacin primaria, calcular la desviacin estndar (S).
Desviacin estndar (S) para los nios.
20

20 ( x i ) 2
x 2
i i =1
n
21053
(637) 2
20 = 764.55 = 6.343 kg
S= i =1
=
n 1 19 19

Es decir que los pesos (kg) de los nios del sexto grado de primaria es
6.34 kg mayores o menores que el peso promedio 31.85 kg.

Para ver si esta correctamente la desviacin estndar, los valores de-


ben estar entre 2 ni mayor 6, sta condicin comprobamos con la siguiente razn:

R 47 25
= = 3.468
S 6.34

6.10.2 DESVIACIN ESTNDAR CON DATOS AGRUPADOS.

Para estimar la desviacin estndar, es fcil calcular primero la varianza


y luego sacando la raz cuadrado, se obtiene la desviacin estndar; para datos agru-
pados tambin provienen de las frmulas para estimar varianza.
- 148 - V. Ibaez Q.

m
( n i Yi ) 2
n cY Y h
m m

nY
2 2 i =1
i i i i
n
ii) S =
i =1
i) S = i =1
n 1 n 1

m m
n n i Yi2 ( n i Yi ) 2
m

nY i i
2
nY 2

iii) S = i =1 iv) S = i =1 i =1

n 1 n2 n

EJEMPLO:
Calcular la desviacin estndar (S) de los calificativos del curso de matem-
ticas (puntos) de los alumnos.

Y'i-1 - Y'i ni Yi niYi (Yi Y) (Yi Y)2 i i Y)


n(Y 2

41 - 49 5 45 225.00 -27.36 748.569600 3742.848000


49 - 57 3 53 159.00 -19.36 374.809600 1124.428800
57 - 65 6 61 366.00 -11.36 129.049600 774.297600
65 - 73 9 69 621.00 -3.36 11.289600 101.606400
73 - 81 12 77 924.00 4.64 21.529600 258.355200
81 - 89 9 85 765.00 12.64 159.769600 1437.926400
89 - 97 6 93 558.00 20.64 426.009600 2556.057600
8 8 8
Total n =
i=1
i 50 n Y = i i 3618 n (Y Y)
i=1
i i
2
= 9995.52
i=1

n Y i i
3618
Y = i =1
= = 72.36 puntos.
n 50

n cY Y h
7
2
i i
.
999552
Reemplazando a la frmula: S = i =1
= = 14.139 puntos.
n 50

n cY Y h
8
2
i i
9995.52
S= i =1
= = 14.283 puntos.
n 1 49
Estadstica Aplicada a la Educacin - 149 -
Para los dos mtodos abreviados, la desviacin estndar, se obtiene simple-
mente sacando la raz cuadrada de la varianza, es decir: S = S2 .

PROPIEDADES DE LA DESVIACIN ESTNDAR (S).


Las propiedades de este estadgrafo de dispersin son triviales y similares a la
varianza:
P-1. La desviacin estndar o tpica de un conjunto de observaciones x1, x2,..,xn,
siempre es un nmero no negativo S 0.
P-2. La varianza de una constante es cero, es decir S(c)=0.
P-3. Si a cada valor de las observacin x1, x2,..,xn se le agrega o se resta una
constante b, la desviacin estndar del nuevo conjunto de valores Y1,
Y2,..,Yn, donde Yi = xib, i = 1,2,..,n, coincide con la desviacin tpica
del conjunto original.
SY = SXb = SX

P-4. Si cada valor de las observaciones x1, x2,..,xn, se multiplica por una cons-
tante a, la desviacin estndar del nuevo conjunto de valores Y 1,
Y2,..,Yn, donde Yi = axi, i = 1,2,..,n, es igual a la desviacin estndar del
conjunto original multiplicado por el valor positivo (valor absoluto) de
dicha constante.
SY = SaX = a S X
P-5. La desviacin estndar para el total, se puede estimar con:
STotal = NS, Donde: N = Nmero de elementos de la poblacin.

VENTAJAS DE LA DESVIACIN ESTNDAR (S).


- La desviacin estndar es sin duda, la medida de dispersin que posee una
mayor estabilidad frente a las fluctuaciones de la muestra tomada.
- Se basa en todos los valores de la variable, atendiendo a su magnitud como
a su signo.
- Es indispensable cuando se trata de interpretar datos en relacin con la
distribucin normal.

6.12. ERROR ESTNDAR (E.S.)

Este estadstico de dispersin desviacin estndar de promedios, est dado


por el cociente que resulta de dividir la desviacin estndar entre la raz cuadrada del
tamao de la muestra n.
- 150 - V. Ibaez Q.

S
SX = , Donde: S = Desviacin estndar.
n
n = Tamao muestral.
S X , se le conoce E.S. de la media de una muestra tomada al azar de una
poblacin N( , ) , su valor indica la desviacin promedio de las medias (en una
poblacin de muestras) con respecto al valor de la poblacin original muestreada.
La desviacin estndar de los promedios o error estndar ( S X ), puede dedu-
cirse de la desviacin estndar de la poblacin original con la frmula siguiente:

S Nn
SX = , sta frmula, se usa para poblaciones finitas relativa-
n N 1
mente pequeas.
n
Si N , es decir si N es muy grande entonces N 0 , es decir
n
es una
N
cantidad que se acerca al valor cero, a medida que aumenta N.

Nn Nn
Entonces el factor de correccin , se convierte en uno, es decir 1,
N 1 N
S
quedando la frmula S X = (1) , entonces la frmula se convierte en:
n

S
SX =
n
EJEMPLO:
Calcular el Error Estndar (E.S.) con los datos de pesos (kg) de los pacientes
del HRMNB - Puno.

SOLUCIN:
6.34
S = 6.34 kg, n = 20, entonces SX = = 1.418 , S X =1.42 kg.
20
USOS:

- Debe omitirse fraccin de muestreo, cuando el tamao de muestra n es


menor del 10% del tamao de la poblacin N finita.
- Debe usarse la fraccin de muestreo slo cuando es mayor al 10% del tama-
o de la poblacin.
Estadstica Aplicada a la Educacin - 151 -

6.13. CORRECCIN SHEPPARD.

Ocurre que en el clculo de la varianza y por tanto de la desviacin estndar,


se introduce cierto error al agrupar los datos en clases. Para corregir ste error se
emplea la varianza corregida, con la siguiente frmula:

c2
V( X) corregida = V( X) (varianza correccin Sheppard).
12
Donde: c = Es la amplitud del intervalo de clase.

EJEMPLO:

Con los datos calculados para los pacientes. Calcular la Varianza por la Co-
rreccin de Sheppard.

(4.4) 2
V( X) corregida = 29.499 = 27.88566 27.89 kg.
12

6.14. MEDIDAS DE DISPERSIN RELATIVA.

6.14.1. COEFICIENTE DE APERTURA.


Se define como el cociente entre el valor mximo y el valor mnimo del
recorrido de la variable, es el nmero de veces que engloba el mayor valor al ms
pequeo: Denotado con la siguiente expresin:
X mx.
C. A. =
X mn .
EJEMPLO:
Para los datos de pacientes, encontrar el C.A.

SOLUCIN:
47.0
C. A. = = 188
. kg 2.0 kg
25.0

6.14.2. RECORRIDO RELATIVO (R.R.).

Se define como el recorrido de la variable dividido por la media arit-


mtica, otra forma de definir es el nmero de veces que el recorrido engloba a la
media aritmtica:
- 152 - V. Ibaez Q.

R X mx . X mn .
R . R. = =
X X
EJEMPLO:
Para los datos de pesos de los pacientes, encontrar R.R.
SOLUCIN:
47 25 22
R. R. = = = 0.69 kg
3185
. 3185
.

6.14.3. DISPERSIN RELATIVA (RIR).

Esta definido como la dispersin absoluta dividida por la media arit-


mtica, es el nmero de veces que la dispersin absoluta que contiene a la media
aritmtica.
Dispersin Absoluta Dispersin Absolut
Dispersin relativa = =
Media Aritmtica X
(Q3 -Q1 ) 2
RIR = Re corrido semi Intercuartlico Relativo =
X
EJEMPLO:
Con la informacin que corresponde a los pesos de los pacientes. Calcular RIR.

SOLUCIN:
20 + 1 21
1) Ubicar la posicin del cuartil Q1: = = 5.25
4 4
2) Como no es un entero, entonces realizar por la interpolacin lineal, y esta
comprendido entre los valores de: X(5)= 27 y X(6) = 27, entonces:
Q1 = 27 + (27 - 27)(0.25) = 27
Q3 = ?
3( n + 1) 3(21)
1) Ubicar la posicin del cuartil Q3: Si = = 1575
. , no es un nmero
4 4
entero, entonces realizar la interpolacin lineal.
Q3 = 37 + (38-37)(0.75) = 37.75

Una vez calculado los Q1 y Q3, podemos calcular el RIR:


(Q 3 - Q1 ) 2 (37.75 - 27) 2
RIR = = = 0.169
X 31.85
Estadstica Aplicada a la Educacin - 153 -

6.15. COEFICIENTE DE VARIACIN (CV).

Es un estadgrafo de dispersin o dispersin relativa que est expresado en


unidades independientes de la naturaleza de la variable y el valor se expresa general-
mente en trminos de porcentuales. Es un estadgrafo que se utiliza para comparar
dos o ms distribuciones cuando las unidades de medida de las variables estn expre-
sados en diferentes unidades o escalas de medida. Ejm. Comparar sueldos expresa-
dos en soles y en dlares; extensiones o superficies medida en metros cuadrados y
otro en pies cuadrados, etc.
Cuando se compara dos o ms distribuciones, es ms homognea o presenta
menos discrepancia, aquella distribucin que tiene el menor coeficiente de varia-
cin, es decir los datos son ms heterogneos cuando tienen mayor coeficiente de
variacin. Para encontrar un coeficiente de variabilidad bajo, se debe tomar en cuen-
ta en los diferentes experimentos en determinar tamaos de la unidad experimental,
en el cual el CV, debe tender a estabilizarse, all se define el tamao ptimo de la
parcela o unidad experimental. El CV, es una medida de variabilidad con respecto a
la magnitud de las cantidades originales que se han estimado, en otras palabras el
CV, se define como la razn entre la desviacin estndar y la media aritmtica mul-
tiplicado por 100, otra forma es que el CV expresa la desviacin estndar por unidad
experimental, como un porcentaje de la media general del experimento.
S
CV.= x100
X
Donde: CV. = Coeficiente de variabilidad.
S = Desviacin estndar.
x = Promedio de la muestra.
EJEMPLO:
Calcular los CV. para los pesos de pacientes del HRMNB-Puno.

n = 20 FG 6.34 IJ x100
X = 31.85
CV . =
H 31.85 K
S = 6.34 CV. = 19.91%
Interpretacin:

El CV. de los pacientes presentan una variabilidad alta (CV. = 19.91%), esto
nos indica que existe bastante variabilidad entre unidades experimentales, es decir
los pesos (kg) entre pacientes.
- 154 - V. Ibaez Q.
Caractersticas del Coeficiente de Variabilidad.

- Cuando se comparan dos o ms distribuciones, es ms homognea la distri-


bucin que tenga un menor CV. en caso inverso ser alta el CV.
- Cuando se incrementa el nmero de muestra o a mayor nmero de unidades
experimentales por tratamiento, el CV. ser menor.
- Una desventaja del CV. es que no se debe utilizar sta expresin, cuando las
variables utilizadas no tengan un cero verdadero, por cuanto el CV. exige
que la variable en estudio tenga cero verdadero, motivo por el cual el CV.
no se puede utilizar en campos de Educacin y psicologa.

En experimentos agrcolas el CV. vara generalmente hasta un 30 - 35%,


valores superiores a stos lmites pueden considerarse como extremos; en cambio en
trabajos de investigacin en laboratorio (anlisis en laboratorio) el CV. deben ser
bastante bajos, debido a que el control lo realiza una persona o varios y no estn
afectos a los factores de variabilidad como en el campo experimental (medio ambien-
te, clima, lluvia, viento, temperatura, etc.). De igual manera debe ser bajo el CV. en
los experimentos en que se analizan calidad (4 a 8%) como son fabricacin de ali-
mentos (galletas, concentrados, conservas, chocolate, mquinas, televisores, etc.).

En los experimentos en ganadera, el CV. por lo general es alto, por los dife-
rentes factores medio ambientales que se presentan en el lugar de la experimenta-
cin, es decir la variabilidad del experimento, se debe a los factores como: edad,
talla, peso, raza del animal, lugar clima, droga utilizada, diseo, salud del animal,
prdida de unidad experimental, entre otros. Considerando estos factores la escala
siguiente puede ser usado para calificar la precisin de los experimentos que se rea-
lizan en el campo (esto no es absoluto ms bien es una pauta para sugerir la preci-
sin).
Entre 5 a 10% = Excelente
Entre 11 a 20% = Muy buena
Entre 21 a 25% = Buena
Entre 26 a 35% = Deficiente.
Entre 36 a 45% = Muy mala.
Mayor a 45%.

Sin embargo, podemos comparar con otros autores la precisin del CV. para
juzgar y diferenciar en los lugares en que ellos han trabajado:

As Calzada, B.J. (1970), sugiere la siguiente escala para calificar la preci-


sin de los experimentos de campo por el CV. cuando los datos analizados corres-
Estadstica Aplicada a la Educacin - 155 -
ponden a rendimiento:
Entre 5 a 10% = Excelente
Entre 11 a 15% = Muy buena
Entre 16 a 20% = Buena
Entre 21 a 25% = Regular
Entre 26 a 31% = Mala
Ms de 31% = Muy mala.

Sin embargo, Reyes, C.P. (1980), en Mxico indica que el CV, para tres po-
blaciones de igual , pero diferente de .
CV. = 20% muy variable.
CV. = 10% variable
CV. = 5% relativamente uniforme.

6.16. ESTADGRAFOS DE DEFORMACIN


Medidas de forma de la distribucin.

En diferentes trabajos es necesario calcular una medida que muestre las di-
recciones de la dispersin de los datos con respecto a su centro y que completan la
descripcin de las distribuciones de frecuencias. Estas caractersticas se llaman ASI-
METRA (no tener simetra) y curtosis o apuntamiento, es decir las medidas de
dispersin solo indican la magnitud de las variaciones, pero no dan informacin
acerca de la direccin de las variaciones.

6.16.1 MEDIDA DE ASIMETRA (AS).

Es la deformacin horizontal de la curvas de una distribucin de fre-


cuencias. La curva se observar si est bien formada o no en relacin a una curva
normal. La deformacin consiste en analizar la SIMETRA ASIMETRA de las
distribuciones.

a) Cuando la curva est inclinada o alargada hacia la derecha (Fig. A),


se le denomina ASIMETRA POSITIVA o hacia la derecha, en
esta curva el promedio aritmtico es mayor que la mediana (Me) y
sta mayor que la moda (Md) X > Me > Md .
- 156 - V. Ibaez Q.

ni + Sesgada a la derecha

Fig. A

X > Me > M d Y' i

b) Cuando la curva est inclinada o alargada hacia la izquierda (Fig.


B), se llama ASIMETRA NEGATIVA o hacia la izquierda, en
esta curva el X < Me < Md .

ni - Sesgada a la
izquierda Fig. B

X < Me < M d Y' i

c) En la curva (Fig. C), podemos ver que la inclinacin es igual a


ambos lados, es decir la curva es SIMTRICA de ambos lados. En
esta curva el promedio aritmtico, la mediana y la moda coinciden
en un mismo punto en el eje horizontal, es decir X = Me = Md .
ni =
Fig. C

X = Me = Md Y' i

La deformacin o asimetra, se deduce comparando la distribucin con


la forma de la curva normal que corresponde a una distribucin SIMTRICA, en
general toda la distribucin que cumpla con X = Me = Md , es simtrica y si no
coinciden es asimtrica.
Estadstica Aplicada a la Educacin - 157 -
6.16.2 COEFICIENTE DE ASIMETRA.

Una medida absoluta de la asimetra est dado por la diferencia entre


la media aritmtica y la moda: AS = X Mo .
Interpretacin:
AS, ser negativa (AS<0), si la distribucin tiene asimetra negativa.
AS, nulo (AS = 0), si la distribucin es simtrica.
AS, ser positiva (AS>0), si la distribucin tiene asimetra positiva.

Pero est medida tiene el inconveniente de expresar en unidades origi-


nales de la variable, y as cambia al cambiar la unidad de medicin.

6.16.3 COEFICIENTE DE ASIMETRA DE PEARSON.

Teniendo en cuenta que la media aritmtica y la moda coinciden en


una distribucin simtrica, Karl Pearson propuso un coeficiente relativo de asimetra
para curvas de frecuencias unimodales:
Y Mo Pr omedio Moda
Primer coeficiente: CAs = =
S Desviacin estndar
3( Y Me) 3(Pr omedio Mediana )
Segundo coeficiente: CAs = =
S Desviacin estndar
Interpretacin:

Si CAs < 0, la distribuc. es asimtrica negativa (o sesgada hacia la izquierda).


Si CAs = 0, la distribucin es simtrica.
Si CAs > 0, la distribuc. es asimtrica positiva (o sesgada hacia la derecha).

6.16.4 COEFICIENTE DE ASIMETRA EN FUNCIN DE LOS


CUARTILES.

Los ms importantes son:


A. El coeficiente de asimetra CUARTLICO o de Bowley, esta dado
en funcin de los cuartiles:
Q 3 2 Q 2 + Q1
CAs =
Q 3 Q1
- 158 - V. Ibaez Q.
B. El coeficiente de asimetra en funcin de los percentiles (10 - 90),
est dado por:
( P90 P50 ) ( P50 P10 ) P90 2 P50 + P10
CAs = =
P90 P10 P90 P10
La interpretacin es la misma que los otros coeficientes de asimetra.

EJEMPLO:
Con los datos de la distribucin de frecuencias. Calcular CAs.
Intervalo 32 - 34 34 - 36 36 - 38 38 - 40 40 - 42
Frecuencia 4 5 8 1 2
a) Calcular los coeficientes de Asimetra de Pearson.
b) Calcular el coeficiente de Asimetra por la frmula de los momentos.
c) Calcular los coeficientes por el mtodo de los cuantiles.
SOLUCIN:
2 3 4
[Y'i-1 - Y'i> ni Ni Yi niYi ui = (Yi - 37)/2 uini u ini u ini u ini
32 - 34 4 4 33 132 -2 -8 16 -32 64
34 - 36 5 9 35 175 -1 -5 5 -5 5
36 - 38 8 17 37
37 296 0 -13 5 0 0 0
38 - 40 1 18 39 39 1 1 1 1 1
40 - 42 2 20 41 82 2 4 8 16 32
5 5 5 5 5
Totales n =20 nY =724
i=1
i i un = -8 u n = 30 u n = -20 u n = 102
i=1
i i
i=1
2
i i
i=1
3
i i
i=1
4
i i

a) Calcularemos primero las tres medidas de tendencia central y la desviacin


tpica.
1. Clculo de la media aritmtica:
FG 8IJ = 36.2
Y = O t + cM ( u ) = 37 + 2
H 20 K
2. Clculo de la mediana (Me):
n 20
i) Ubicar la posicin de la Me: = = 10 , ste valor est comprendido
2 2
entre los valores de 9 y 17, entonces j = 3, j-1 = 2, entonces Y2 - Y3 = 36 - 38
n 20
ii) Como = = 10 >N =9, es cierto, entonces calcular la Mediana:
2 2 2

LM 10 N OP = 36 + 2FG 10 9 IJ = 36.25 kg.


Me = Y2' + c j
NN N Q H 17 9 K
2

3 2
Estadstica Aplicada a la Educacin - 159 -
3. Clculo de la moda (Md) de la distribucin:

i) La frecuencia absoluta alta es n3 = 8, entonces j=3, j-1=2, entonces


Y2 - Y3 = 36 - 38, n2 = 5, n3 = 8, n4 = 1.

ii) Reemplazando a la frmula se obtiene:


LM n n OP = 36 + 2FG 8 5 IJ = 36 + 2FG 3 IJ = 366.
Md = Y2' + c
N ( n n ) + (n n ) Q H (8 5) + (8 1)K H 10K
3 2

3 2 3 4

4. Clculo de la desviacin tpica de la distribucin:

L F I
c M n u G n u J
5 5 2
OP
M H K PQ = 4 30 (8)
2 2
n
= N
i i i i 2
i =1 i =1 20
S2 = 5.64 kg.
n 1 19

Luego: S = S2 = 5.642 = 2.375

Por lo tanto, los coeficientes de Asimetra de Pearson son:

Y Mo 36.2 36.6
CAs = = = 0168
.
S 2.375
3( Y Me) 3(36.2 36.25)
CAs = = = 0.063
S 2.375

Interpretacin:

Como CAs < 0, entonces la distribucin es asimtrica negativa (o sesgada


hacia la izquierda).

b) Calcularemos primero los tres cuartiles:


L nN
M OP
1. Q 1 = Y j'1 + c j M 4 PP
j 1

MN N N
j j 1
Q
- 160 - V. Ibaez Q.
n 20
i) Ubicar la posicin del Q1: = = 5, ste valor est comprendido entre los
4 4
valores de 4 y 9, entonces j = 2, j-1 = 1, entonces Y1 - Y2 = 34 - 36.
n 20
ii) Como = = 5 >N =4, es cierto, entonces reemplazamos a la Q1:
4 4 1

LM 5 4 OP = 34 + 2FG 1IJ = 34.4 kg.


Q1 = 34 + 2
N9 4Q H 5K
2. Q2 = 36.25 kg. (coincide con la mediana).
LM 3n N OP
+c M 4 PP
j 1
3. Calcular el Q 3 = Y '
j 1 j
MN N Nj j1
Q
3n 3(20)
i) Ubicar la posicin del Q3: = = 15, ste valor est comprendido entre los
4 4
valores de 9 y 17, entonces j = 3, j-1 = 2, entonces Y2 - Y3 = 36 - 38.
3n 3(20)
ii) Como = = 15>N =9, es cierto, entonces reemplazamos a la Q3:
4 4 2

LM15 9 OP = 36 + 2FG 6IJ = 37.5 kg.


Q 3 = 36 + 2
N17 9 Q H 8K
Por tanto el coeficiente de Asimetra cuartlico de Bowley es:

Q 3 2Q 2 + Q1 37.5 2( 36.25) + 34.4 0.6


CAs = = = = 01935
.
Q 3 Q1 37.5 34.4 31
.

Interpretacin:
La conclusin sera de que la asimetra de CAs<0, es decir es sesgada a la
izquierda.

c) Calcularemos ahora los Percentiles:

LM 10 n N OP
+ c M 100 PP
j 1
i) P10 = Y '
j 1 j
MN N N j j 1
Q
Estadstica Aplicada a la Educacin - 161 -

10n 10(20)
- Ubicar la posicin del P10: = = 2, ste valor est comprendido entre
100 100
los valores de 0 y 4, entonces j = 1, j-1 = 0, entonces Y0 - Y1 = 32 - 34.

10n 10( 20)


- Como = = 2 >N =0, es cierto, entonces reemplazamos a la P10:
100 100 0

LM 2 0 OP = 33 kg.
P10 = 32 + 2
N4 0Q
LM 50n N OP
+ c M 100
MN N N PPQ
j1
ii) P50 = Yj'1 j
j j1

50 n 50( 20)
- Ubicar la posicin del P10: = = 10 , ste valor est comprendido entre
100 100
los valores de 9 y 17, entonces j = 3, j-1 = 2, entonces Y2 - Y3 = 36 - 38.

50 n 50(20)
- Como = = 10 >N =9, es cierto, entonces reemplazamos a la P50:
100 100 2

LM10 9 OP = 36 + 2FG 1IJ = 36.25 kg., coincide con Q y mediana.


P50 = 36 + 2
N17 9 Q H 8K 2

LM90n
N j 1
OP
iii) MM
P90 = Yj'1 + c j 100
N j N j 1
PP
N Q
90 n 90( 20)
- Ubicar la posicin del P90: = = 18 , ste valor est comprendido entre
100 100
los valores de 18 y 20, entonces j = 5, j-1 = 4, y es Y4 - Y5 = 40 - 42.
90 n 90( 20)
- Como = = 18 =N =18, son iguales entonces el P90 = Yj-1 =Y4 =40.
100 100 4

Por tanto, el coeficiente de Asimetra Percentlico es:

P90 2P50 + P10 40 2(36.25) + 33


CAs = = = 0.0714 kg.
P90 P10 40 33
En conclusin podemos indicar que existe asimetra, lo que da CAs>0, es
decir es alargada o sesgada hacia la derecha.
- 162 - V. Ibaez Q.

6.17. ESTADGRAFOS DE APUNTAMIENTO KURTOSIS.


(Medidas de deformacin Kurtosis).

El apuntamiento de una distribucin de frecuencias indica la mayor o menor


altura del mximo central, con respecto a la altura de la curva normal con media y
desviacin estndar igual que la distribucin que se estudia.

6.17.1 KURTOSIS.
Es el grado de apuntamiento de una curva de distribucin; es decir es
la deformacin vertical de una curva de frecuencias. La curtosis se determina compa-
rando la curva resultante de frecuencias con la forma de una curva normal o SIM-
TRICA, sta curva tiene la media aritmtica y la desviacin estndar igual a la distri-
bucin que se estudia. La kurtosis puede ser: Leptokrtica, Platikrtica y Mesokrtica.

A. LEPTOKRTICA.
Es cuando la curva presenta una elevacin de forma pico o apunta-
miento relativamente alta. Esta forma de distribucin muestra una gran concentra-
cin de las observaciones o datos en el centro, tal como se observa en la siguiente
figura:

Leptokrtica

B. MESOKRTICA.
Es cuando la curva no es muy alta o apuntada ni achatada, esta
forma de curva es intermedia entre una leptokrtica y Platikrtica, a este curva se le
considera como una distribucin normal. La kurtosis de una curva normal debe
cumplir que: K = 0.263.

Mesokrtica
Estadstica Aplicada a la Educacin - 163 -
C. PLATIKRTICA.
Es cuando la curva tiene muy poco altura o apuntamiento pico,
es decir la curva es achatada, esta curva representa a una distribucin de frecuencias
opuesto a la leptokrtica, y est representada en la siguiente figura:

Platikrtica

Cuando: K1 = 3, entonces la curva es Mesokrtica (curva normal).


K1 > 3, entonces la curva es Leptokrtica (curva apuntada).
K1 < 3, entonces la curva es Platikrtica (curva achatada).

6.17.2. MEDIDAS DE LA KURTOSIS.

El grado de kurtosis o apuntamiento puede medirse en funcin de


momentos o de cuantiles.

A. KURTOSIS EN FUNCIN DE CUANTILES.


Q 3 Q1
El coeficiente est dado por: K 3 =
2( P90 P10 )
Donde: K3 = Coeficiente de Kurtosis percentlico.
Q1= Es el primer cuartil.
Q3 = Es el tercer cuartil.
P90 y P10 = son los percentiles de 90avo y 10mo.

Interpretacin:

Si K3=0.263, la distribucin es Mesokrtica (apuntamiento de la curva nor-


mal).
Si K3>0.263, la distribucin es Leptokrtica o puntuguda (ms apuntada que
la curva normal).
Si K3<0.263, la distribucin es Platikrtica o achatada (ms aplastada que la
curva normal).
- 164 - V. Ibaez Q.

EJEMPLO:
Con la informacin siguiente. Calcular el coeficiente de kurtosis por momen-
tos y percentlico?.
2 3 4
[Y'i-1 - Y'i> ni Ni Yi niYi ui = (Yi - 37)/2 uini u ini u ini u ini
32 - 34 4 4 33 132 -2 -8 16 -32 64
34 - 36 5 9 35 175 -1 -5 5 -5 5
36 - 38 8 17 37
37 296 0 -13 5 0 0 0
38 - 40 1 18 39 39 1 1 1 1 1
40 - 42 2 20 41 82 2 4 8 16 32
5 5 5 5 5
Totales n =20 nY =724
i=1
i i u n = -8 u n = 30 u n = -20 u n =102
i=1
i i
i=1
2
i i
i=1
3
i i
i=1
4
i i

SOLUCIN:
a) Calcular el coeficiente de Kurtosis Percentlico.
En el ejemplo anterior, ya se ha calculado los cuartiles y percentiles:

Q1= 34.4, Q2= 36.25 y Q3= 37.50; P10=33 y P90= 40

Q 3 Q1 37.50 34.4 310


.
Reemplazando al: K 3 = = = = 0.2214
2( P90 P10 ) 2( 40 33) 14

Comparando K3 = 0.2214 < 0.263, entonces tiene la forma aplastada


que la curva normal, es decir la distribucin es platikrtica.
Estadstica Aplicada a la Educacin - 165 -

EJERCICIOS 6.1.

1. Las calificaciones de 40 estudiantes sobre una prueba de aptitud son las siguien-
tes:
27.8 43.0 28.7 19.1 45.7 33.5 16.9 43.6 24.7 9.7
35.0 35.0 13.4 11.8 17.0 48.8 40.6 38.6 32.0 16.4
28.4 27.2 19.8 21.0 39.5 44.6 25.5 34.1 0.6 15.4
19.2 11.8 3.9 33.4 27.9 32.5 0.2 13.5 3.5 31.0
Agrupar en una tabla de distribucin de frecuencias y calcule: Recorrido o Rango,
Recorrido Intercuartlico, Recorrido Interdecil, Rango Semi Intercuartil, Desviacin
Media, Desviacin Media Absoluta, Varianza, Varianza por mtodo (abreviado y
codificado), Desviacin estndar, Error estndar, Correccin Sheppard, Medidas de
dispersin relativa: (CA, RR, RIR), Coeficiente de Variacin, Coeficiente de asime-
tra en funcin de los cuartiles, Kurtosis: Kurtosis en funcin de cuantiles.

2. Los siguientes datos corresponden al nmero de inasistencias a clases durante un


semestre por una muestra de 25 estudiantes.
3633738353653765376635386
Agrupar en una tabla de distribucin de frecuencias y calcule: Recorrido o Rango,
Recorrido Intercuartlico, Recorrido Interdecil, Rango Semi Intercuartil, Desviacin
Media, Desviacin Media Absoluta, Varianza, Varianza por mtodo (abreviado y
codificado), Desviacin estndar, Error estndar, Correccin Sheppard, Medidas de
dispersin relativa: (CA, RR, RIR), Coeficiente de Variacin, Coeficiente de asime-
tra en funcin de los: cuartiles, Kurtosis: Kurtosis en funcin de cuantiles.
- 166 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 167 -

7
PROBABILIDADES

7.1. EXPERIMENTO ALEATORIO( ).

Un experimento aleatorio es cualquier experimento u operacin, cuyo resultado


no puede predecirse con exactitud antes de realizar el experimento.
Ejemplo:
1 : Lanzar una moneda y observar la cara superior.
2 : Elegir un presidente de un grupo de 50 personas.
3 : Un juego entre dos equipos de ftbol de Escuela Profesional de Odontologa
y Medicina Humana, desde el punto de vista del resultado (goles) el fenme-
no es evidentemente aleatorio.
4 Seleccin de un alumno de acuerdo a su rendimiento acadmico.
:

ESPACIO MUESTRAL ( ).- Un espacio muestral es el conjunto de todos los


resultados posibles de un experimento aleatorio.
Simblicamente: = {w/w es el resultado individual de }

Ejemplo:
l q
1 : 1 = cara, sello l
3 : 3 = Gana, Empata, Pierde q
- 168 - V. Ibaez Q.

l
2 : 2 = P1 , P2 , P3 ,L , P50 q 4 : l q
4 = Sobresaliente, bueno, regular, malo

EVENTOS.- Se llama evento a cualquier subconjunto del espacio muestral, y se


denota con letras maysculas: A, B, C, D, E, F, etc.

SUCESO.- Se llama suceso a todo elemento de un espacio muestral y lo denota-


mos por: w, x, y, etc.

Ejemplo:
1 : A = lcaraq 3 : l
C= Empate q
m
2 : B = x 15 x 50
+
r 4 : D = {Sobresaliente}, E = {bueno},
F = {Regular}, G = {Malo}

7.2. CONCEPTOS DE PROBABILIDAD.- Las probabilidades es una disciplina


abstracta que se usa como modelo para hacer deducciones relativas a eventos
que posiblemente puede ocurrir.

Definicin.- Existen tres tipos de probabilidad y stos dependen de la probabili-


dad que se va a trabajar (probabilidad clsica - apriori, probabilidad relativa - aposterior
y probabilidad subjtiva).

A. Probabilidad Clsica - APRIORI (prob. objetiva).- La probabilidad de un


evento es la razn entre el nmero de casos favorables y el nmero total de casos
posibles. Es posible conocer el resultado con anterioridad, es decir, sin llevar a cabo
el experimento y slo basado en un razonamiento lgico.
N ( ) = n : Es el nmero total de casos posibles (nmero de elementos del
espacio muestral).
N ( A ) = nA : Es el nmero de elementos que tiene el evento A (nmero de suce-
sos favorables) casos de ocurrencia del evento A.
N ( A ) nA
A P(A) = =
N( ) n
Observaciones:
a) 0 P ( A ) 1 0% P(A) 100%
b) P(A) = 0, si A es un evento imposible.
c) P(A) = 1, si A es un evento seguro.
l q
d) = w1 , w2 ,L , wk , esto se puede deducir
Estadstica Aplicada a la Educacin - 169 -

Pclw qh = 1 , l q Pclw qh
k r <n

i A = w1 , w2 , w3 ,L , wr , r < n , P( A ) = i
i =1 i =1

Ejemplo:
S se lanza una moneda tres veces.
a) Calcular la probabilidad de que ocurran 2 caras.
b) Calcular la probabilidad de que ocurran al menos 2 caras.
c) Calcular la probabilidad de que ocurran a lo ms 2 caras.

SOLUCIN:

1ra. Lanzada 2da. Lanzada 3ra. Lanzada RESULTADO

C = CCC
C
S = CCS
C
C = CSC
S
S = CSS
C = SCC
C
S = SCS
S
C = SSC
S
S = SSS

l
= CCC ,CCS , CSC , CSS , SCC , SCS , SSC , SSS , N ( ) = n = q
a) Sea el evento A: Ocurren dos caras. Entonces A = {CCS,CSC,SCC}, n A = 3
nA 3
P( A ) =
= = 0.375
n 8
b) Sea el evento B: Ocurran al menos dos caras.
Entonces B = {CCC,CCS,CSC,SCC}, por lo tanto se tiene que nB = 4 .
nB 4
P( B ) =
= = 0 .5
n 8
c) Sea el evento C: Ocurran a lo ms dos caras.
Entonces C = {CCS,CSC,CSS,SCC,SCS,SSC,SSS}, entonces nC = 7 .
nC 7
P( C ) = = = 0.875
n 8
- 170 - V. Ibaez Q.
Ejemplo: En una seccin de primer grado asisten 20 alumnos con chompa y 30
sin chompa, se selecciona por sorteo un alumno de dicha seccin. Hallar la probabi-
lidad de que dicho alumno est con chompa.

Solucin:
l
= 1 ,2 ,3 , L ,5 0 q , entonces sea el evento D: Se seleccione un alumno con
chompa. nD = 20 , P ( D ) =
nD 20
= = 0 .4 0 40%. La probabilidad de seleccio-
n 50
nar un alumno con chompa es 40%.

EJEMPLO:
En una muetra aleatoria de 120 pacientes, se encontr que 30 de ellos tienen
cncer. Cul es la probabilidad de que un paciente elegido al azar?:
a) Tenga cncer?
b) No tenga cncer?

SOLUCIN:
de a) = 120, entonces el evento F: Paciente con cncer, nF = 30 , n = 120
nF 30 1
P( F ) = = = = 0.25 25%. La probabilidad de que un paciente tenga
n 120 4
cncer es de 25%.

de b) Encontrar la probabilidad del paciente sin cncer.

Sabemos que la suma de eventos complementarios es la unidad, entonces:


P( A A ) = P( A ) + P( A ) = 1 , en este caso:
F = Paciente con cncer, P(F) = 0.25
F = Paciente no tiene cncer, entonces ch
P F =?

P( F ) + P( F ) = 1 , 0.25 + P( F ) = 1, entonces P( F ) = 1- 0.25 = 0.75 75%


Rpta: La probabilidad de que un paciente no tenga cncer, es de 75%.

EJEMPLO:
Consideremos el experimento de lanzamiento de dos dados. Calcular la probabi-
lidad de:
a) Obtener suma 7; b) Obtener suma 6; c) Obtener suma mayor que 5; d) Que el
resultado del primer dado sea mayor que el resultado del segundo.
Estadstica Aplicada a la Educacin - 171 -
SOLUCIN:

Dado 2

(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)


6

(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)


5

(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)


4

(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)


3

(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)


2

(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)


1

1 2 3 4 5 6 Dado 1

= {(1,1),(1,2),(1,3),.....,(6,6)}= n = 36 = 62= 36
a) Sea el evento G: Obtener suma 7. Entonces

G= mb D , D g D + D = 7r, n
1 2 1 2 G = 6 , P(G) =
nG 6 1
= = = 0167
n 36 6
.

b) Sea el evento H: Obtener suma 6. Entonces

H= mb D , D g D + D = 6r, n
1 2 1 2 H = 5 , P( H ) =
nH 5
= = 0139
n 36
.

c) Sea el evento I: Obtener suma mayor que 5. Entonces

I= mb D , D g D + D > 5r, n
1 2
n 26 13
1 = = 0722
n 36 18
. 2 I = 26 , P(I ) = I =
d) Sea el evento J: El primer dado sea mayor que el segundo dado. Entonces

J = mb D , D g
1 2 r
D1 > D2 , n J = 15 , P(J ) = J = = = 0417
.
n 15 5
n 36 12

B. Probabilidad de Frecuencia Relativa - Aposteriori (Emprico aposteriori).-


Es la razn entre el nmero de veces en la cual ocurren un determinado evento con
respecto al nmero total de casos ocurridos. Para que esto suceda el experimento
debe ser bien definido, adems repetitivo, es decir realizar un gran cantidad de prue-
- 172 - V. Ibaez Q.
bas o experimentos. Los resultados se obtienen despus de varios experimentos u
observaciones de llevar a cabo el experimento.

nA
P(A) = Lm con n A n , donde n es suficientemente grande.
n n
Nmero de veces que ocurri el evento A
P(A) =
Nmero total de veces que se repiti el experimento

Observaciones:
a) 0 P ( A ) 1 0% P(A) 100%
b) n A n = 0 , n A = 0 , P(A) = 0, el evento A no ocurre, es nulo imposible.
c) n A n = 1 , n A = 1 , P(A) = 1, el evento A es cierto o seguro.

EJEMPLO:
La distribucin de nmero de alumnos, segn sexo y por colegio es como sigue:
Colegio
Sexo A B C TOTAL
Hombres 30 15 23 68
Mujeres 19 10 10 39
TOTAL 49 25 33 107

Cul es la probabilidad de que un alumno seleccionado aleatoriamente?


a) Sea una mujer; b) Pertenece al Colegio A;
c) Sea una mujer y estudie en el Colegio A;
d) Sea un hombre y estudie en el colegio C.

SOLUCIN:
n() =n =107 total
nA 39
a) Sea el evento A: Sea una mujer, entonces n A = 39, P( A ) = = = 0.3645
n 107
36.45%
b) Sea el evento B: Pertenece al colegio A, entonces n B = 49,
nB 49
P( B ) = = = 0.4579 45.79%
n 107

c) Sea el evento C: Sea una mujer y estudie en el Colegio A, entonces nC = 19,


nC 19
P( C ) = = = 0.1776 17.76%
n 107
Estadstica Aplicada a la Educacin - 173 -

d) Sea el evento D: Sea un hombre y estudie en el Colegio C, entonces nD = 23,


nD 23
P( D ) = = = 0.2150 21.50%
n 107

C. Probabilidad Subjetiva (creencias).- Es la probabilidad asignado bajo un


criterio personal; basado en cualquier tipo de evidencia disponible o el grado de
fiabilidad asignada a una ocurrencia que no ha ocurrido anteriormente. Las probabi-
lidades subjetivas, se asignan a eventos que pueden suceder slo una vez o muy pocas
veces.
Observaciones:
a) P(A) = 0, el evento A no ocurrir.
b) P(A) = 1, el evento A si ocurrir.
c) 0 < P(A) < 1

EJEMPLO:
1) La probabilidad de que el hombre llegue a habitar la luna en los prximos 20
aos.
2) La probabilidad de que encuentre una cura para el SIDA en los prximos 5
aos.
3) La probabilidad de que una persona cuente el nmero de peces que existe en el
Lago titicaca, etc.

D. AXIOMAS DE PROBABILIDAD.
1) La probabilidad de un evento cualquiera, es siempre positiva P( A ) 0
2) La probabilidad de un evento siempre es positiva y debe estar:
0 P( A ) 1
3) La probabilidad de un evento cierto o seguro, es la probabilidad del espacio
bg
muestral P = 1 .
4) La probabilidad de un evento nulo o imposible, es cero P(A) = 0, entonces
A= .
FG U A IJ = P( A ), siempre que
k K
5) A1 , A2 , A3 ,L , Ak , P
H Ki =1
i
i =1
i

b g
Ai A j = , i j , es decir P A1 A2 L Ak = P( A1 ) + P( A2 )+L+ P( Ak )
6) Los eventos A y A son mutuamente excluyentes, y se debe cumplir:
P( A A ) = P( A ) + P( A ) = 1
- 174 - V. Ibaez Q.
7) Si los eventos A y B son mutuamente excluyentes, la probabilidad de ocu-
rrencia de A de B es: P( A B ) = P( A ) + P( B )
Cul es la probabilidad de extraer una carta espada un trbol de un
juego de casinos bien barajados?. Como una carta no puede ser al mismo
tiempo espada y trbol, estos dos sucesos son mutuamente exclusivos. Por
lo tanto el resultado es:
13 13 26 1
p( A B ) = + = = = 0 .5
52 52 52 2
Hay problemas de este tipo son poblaciones dicotmicas (con dos partes
definidas), es decir poblaciones si-no, o poblaciones de dos categoras en
las que los sucesos no solo son mutuamente exclusivos sino que tambin
son exahustivos

7.3. TEOREMA DE LA ADICIN (Suma de probabilidades).

a) Si A y B, son dos eventos cualquiera que pertenece al espacio muestral, enton-


ces A y B , entonces:
P( A B ) = P( A ) + P( B ) P( A B )

EJEMPLO:

Un escolar entra a una tienda de golosinas. La probabilidad de que compre cara-


melos es 0.7, la probabilidad de que compre galletas es 0.5 y la probabilidad de que
compre ambos (caramelos y galletas) es 0.3. Hallar la probabilidad de que compre
caramelos, o galletas o ambos.

SOLUCIN:
Sea el evento A: El nio compra caramelos es 0.7.
Sea el evento B: El nio compra galletas es 0.5
A B : El nio compra caramelos y galletas es 0.3.
P( A B ) = P( A ) + P( B ) P( A B ) = 0.7 + 0.5 0.3 = 0.9 90%. La probabili-
dad de que el nio compre caramelos o galletas o ambos es 0.9.

EJEMPLO:

De 100 pacientes examinados, 20 padecan de artritis, 32 padecan gastritis y 8


tenan ambos males. Hallar la probabilidad de seleccionar un paciente que padezca
de artritis o gastritis.
Estadstica Aplicada a la Educacin - 175 -

SOLUCIN: el espacio muestras es: = 100


Sea el evento A: Nmero de pacientes que sufren de artritis. n A = 20
Sea el evento B: Nmero de pacientes que sufren gastritis. n B = 32
A B : Pacientes que sufren de artritis y gastritis es 8.
20 32 8 44
P( A B ) = P( A ) + P( B ) P( A B ) = + = = 0.44 44%. La
100 100 100 100
probabilidad de que sufran los pacientes con artritis gastritis es 44%.

b) Si A, B y C son tres eventos cualesquiera, entonces A, B y C , entonces:


P( A B C ) = P( A ) + P( B ) + P( C ) P( A B ) P( A C ) P( B C ) P( A

7.4. TEOREMA DE LA PROBABILIDAD CONDICIONAL.


Sea A y B dos sucesos de un mismo espacio muestral ( ), donde P(B) > 0,
entonces la probabilidad condicional del suceso A, sabiendo que el suceso B ha suce-
dido u ocurrido, se define como:
P( A B )
P( A B ) = , P( B ) > 0
P( B )
Casos favorables de ocurrencia de A y B P( A B)
P( A B) = = , P(B) > 0
Casos posibles de ocurrencia B P(B)
Observacin:
a) 0 P( A B ) 1 ,
b g
b) P B =1

b g b g b g b g b g
c) P A1, A2 , A2 ,L, An B = P A1 B + P A2 B + P A3 B +L+P An B

F
= PG U A
n
I
BJ = Pb A B g
n

H i =1
i
K i =1
i

EJEMPLO:
En un Colegio X, se tiene 35 alumnos en tratamiento por causas diversas; de los
cuales 12 son masculinos, 23 son femeninos. Del total de alumnos 23 sufren enfer-
medad y 12 no presentan enfermedad. Si el Auxiliar del Colegio selecciona un alum-
no al azar de las que estn enfermos. Cul es la probabilidad de que el alumno
encontrada sea femenino?
- 176 - V. Ibaez Q.
SOLUCIN:
Sea el evento A: El alumno seleccionada presenta enfermedad.
B: El alumno encontrada es femenina.

Con Sin
Sexo Enfermedad enfermedad TOTA L
M as cu lino 8 4 12
Femenino 15 8 23
TOTA L 23 12 35

e j
P AB =
P( A B ) 15
P( B )
=
23
= 0.6522 65.22%

e j , Para que suceda A, tiene que haber sucedido u ocurrido primero B vice-
p AB

versa.

EJEMPLO:
De los pacientes de un hospital, el 40% son varones y el 5% son varones que
tienen enfermedad leve. Si se elige un paciente al azar. Cul es la probabilidad de
que tenga enfermedad leve, dado que es varn?.

SOLUCIN:
Sea el evento A: son los pacientes varones. P(A) = 0.40
B: Pacientes que presentan enfermedad leve.
A B : Pacientes varones con enfermedad leve. P( A B ) = 0.05.

e j
P BA =
P( A B ) 0.05
P( A )
=
0.4
= 0125
. 12.5%. La probabilidad de que tenga
enfermedad leve, dado que es varn, es de 12.5%.

7.5. REGLA DE MULTIPLICACIN.

La probabilidad de que ocurran los eventos A y B es igual a la probabilidad de la


ocurrencia de uno de ellos multiplicado por la probabilidad de que ocurra el segundo
evento, dado que el primero ha ocurrido o sucedido.

b g
P A B =
P( A B )
P( B )
, b g
P( A B ) = P( B ) P A B

b g
P B A =
P( B A )
P( A )
, b g
P( A B ) = P( A ) P B A
Estadstica Aplicada a la Educacin - 177 -

EJEMPLO:
La promocin de sexto grado de primaria de C.E. Enciniano est conformado
por 80 alumnos, 10 nios son provincianos y 20 son varones naciado en Puno. El
total de nios es 30. En ambos sexos hay tantos nacidos en Puno como en provincias.
Se sortear un pasaje como regalo de promocin Cul es la probabilidad de que
gene:
a) Un nio provinciano
b) Un nio nacido en Puno.
c) Una nia provinciana.
d) Una nia nacida en Puno.

SOLUCIN:
Sexo
Proceden cia N i o (N ) N o n i o (N ') TOTAL
Provin cian o (P) 30 10 40
N o Provin cian o (P') 20 20 40
TOTAL 50 30 80

El espacio muestral es n( ) = 80
Tenemos cuatro sucesos que ocurren en forma conjunta con su respectivo valor o
frecuencia, las probabilidades son:
n( N P ) 30 3
a) P( N P ) = = = = 0.375
n( ) 80 8
n( N P' ) 20 1
b) P( N P' ) = = = = 0.25
n( ) 80 4
n( N ' P ) 10 1
c) P( N ' P ) = = = = 0.125
n( ) 80 8

d) P( N ' P' ) = n( N ' P' ) = 20 = 1 = 0.25


n( ) 80 4

En el mismo ejemplo tenemos los sucesos nio (N), nia (N), provinciano (P),
no provinciano (P) a estos sucesos los conocemos como marginales y sus probabili-
dades son:
50 5 30 3
P( N ) = = = 0.625 P( N ' ) = = = 0.375
80 8 80 8
40 1 40 1
P( P ) = = = 0.5 P( P' ) = = = 0.5
80 2 80 2
- 178 - V. Ibaez Q.
La probabilidad condicional para nuestro ejemplo es:
n( P N ) 3 8 3
P( P N ) = = = = 0.6
n( N ) 58 5
Encontremos el mismo resultado, teniendo en cuenta la reduccin del espacio
muestral.:
30 3
P( P N ) = = = 0.6
50 5
n( P N' ) 1 8 1
En forma anloga para: P( P N' ) = = = = 0.33
n( N' ) 38 3
38 3 18 1 18 1
P( N P) = = = 075
. ; P( N' P) = = = 025
. ; P( P' N ) = = = 020
.
12 4 12 4 58 5

EJEMPLO:
Una urna contiene 5 bolas blancas y 6 negras; se extraen al azar sucesivamente y
sin reposicin 2 bolas. Cul es la probabilidad de que dos resulten blancas?.

SOLUCIN:
Sea el evento A1: La primera bola result blanca.
Sea el evento A2: La segunda bola result blanca.
A1 A2 : Ambas bolas sean blancas.

P( A1 A2 ) = P( A1 ) P A2 A1 = b g 5 4
=
20
11 10 110
= 0.1818 18.18%

5 4 3
P(A1 )=
11
P(A2 A1)=
10 P(A3 A2 )= L
9

7.6. TEOREMA DE LA PROBABILIDAD TOTAL.


Sea un espacio muestral particionado en A1 , A2 , A3 ,L , Ak , tal que
k

Ai A j = , i j y U A = ,
i =1
i
P( Ai ) > 0 , para i = 1,2,3,...,k. Entonces para

cualquier suceso B en el espacio muestra se tiene que:


Estadstica Aplicada a la Educacin - 179 -

P(B) = P(A1 )P(B A1 )+ P(A2 )P(B A2 )+ P(A3 )P(B A3 )+L+P(Ak )P(B Ak )

b gb g
k
P( B ) = P Ai P B Ai
i =1

A1 A2 A3 Ak

B
B A1 B A2 B A3 B Ak

PARTICIN DEL ESPACIO MUESTRAL

= A1 A2 A3 L Ak , adems Ai A j = i j , del diagrama B

b
B = B A1 A2 A3 L Ak g
b g
k
B = ( B A1 ) ( B A2 ) ( B A3 )L( B Ak ) = U B Ai
i =1

Ahora probabilidad conjunta, sabemos que cada sumando puede expresarse como:

b g
P( A Ai ) = P B Ai P( Ai ) = P( Ai ) P B Ai . Luego b g
b g b g
P( B ) = P B A1 P( A1 ) + P B A2 P( A2 )+L+ P B Ak P( Ak ) b g
EJEMPLO:
Supongamos que el JAE tiene 40 estudiantes, 20 estn en la especialidad de
electricidad, 15 estn en la especialidad de computacin y 5 estn en la especialidad
Agropecuaria, se sabe que 10 son de electricidad, 5 de computacin y 1 de
agropecuaria, que son hinchas del equipo de JAE. Se elige un estudiante al azar
Cul es la probabilidad de que sea del equipo de JAE?.
- 180 - V. Ibaez Q.
SOLUCIN:

A 1= 2 0 A 2= 1 5 A 3= 5
= 40
B
B A2
B A1 B A3
10 5 1

A1: Especialidad de Electricidad (20)


A2: Especialidad de Computacin (15)
A3: Especialidad de Agropecuaria (5)

B : Hinchas del equipo de JAE (16). Entonces se tiene que:

b g b g
P(B) = P( A1 )P B A1 + P( A2 )P B A2 + P( A3 )P B A3 = b g 20 10 15 5 5 1
+ + = 040
40 20 40 15 40 5
.

El 40% de los estudiantes de JAE, son del equipo de JAE.

7.7. TEOREMA DE THOMAS BAYES (1702 - 1761)

Si los eventos B1 , B2 , B3 ,L , Bk forman una particin del espacio muestral


y A un evento cualquiera que pertenece al mismo espacio muestral , entonces:

b
P Br A = g k
P( Br ) P( A Br )
de otra forma:

P( B ) P( A B )i i
i =1

Si los eventos A1 , A2 , A3 ,L , Ak forman una particin del espacio muestral


y B un evento cualquiera que pertenece al mismo espacio muestral , entonces:

b g
k k
P( Ar )P(B Ar )
P Ar B = k
, P( Ai )P(B Ai ) = P( Ai B)
P( A )P(B A )
i=1
i i
i=1 i=1
Estadstica Aplicada a la Educacin - 181 -
EJEMPLO:
Los docentes de la UNA-Puno, se clasifican de la siguiente manera: 15% tienen
doctorado, 60% son ingenieros y 25% son licenciados, el 60% de los doctores, 80%
de los ingenieros y el 40% de los licenciados son varones. Se elige al azar a un
profesor y resulta ser mujer. Cul es la probabilidad de que sea doctor?

SOLUCIN:
Sean los eventos:
A1: Doctores, P(A1) = 015
. , P(A1)P(B A1) = 0.15x0.6 = 0.09
A2: Ingenieros, P(A2 ) = 060
. , P(A2 )P(B A2 ) = 0.6x0.8 = 0.48
A3: Licenciados, P(A3 ) = 025
. , P(A3)P(B A3) =0.25x0.4 =0.10
B: La persona elegida sea una mujer.

Resolviendo mediante el diagrama de rbol, se tiene:

P( B A1 ) = 0.60
n
V ar
P(A1) = 0.15
Mujer P( B' A1 ) = 040
. = B'
res
cto P( B A2 ) = 0.80
Do n
P(A2) = 0.60 Var
Ingenieros
Muje
Lic
enc r P( B' A2 ) = 020
. = B'
iad
os
Varn P( B A3 ) = 0.40
P(A3) = 0.25

Muj
er
P( B' A3 ) = 0.60 = B'

b
Entonces P( A1 ) P B' A1 = 0.15x0.4 = 0.06 g

3
i=1
b g
P( Ai )P B' Ai = P( A1 )P(B' A1 )+ P( A2 )P(B' A2 )+ P( A3 )P(B' A3 )
= 015
. x0.4+0.60x0.20+0.25x0.6=0.33

Entonces: P B ' A1 = b g 0 .06


0 .33
= 0 .18 18%.
- 182 - V. Ibaez Q.
EJEMPLO:
En un Centro de Produccin pecuaria hay dos tcnicos especialistas en la elabo-
racin de quesos de 1 kg. El tcnico A produce el 45% del total de los quesos y el
tcnico B el 55%. La probabilidad de que el tcnico A produzca un queso con menor
peso a 1 kg. es de 3% y para el tcnico B es de 5%. Cul es la probabilidad de que un
queso elegido al azar entre la produccin total tenga un peso inferior a 1 kg. y elabo-
rado por el tcnico A?.

SOLUCIN:
Sea el evento A1 : El queso fue elaborado por el tcnico A.
A2 : El queso fue elaborado por el tcnico B.
B: El peso del queso tenga inferior a 1 kg.
P( A1 B ): P(elaborado por el tcnico A/el peso del queso debe ser inferior a 1kg).
P ( A 1 ) = 0.45 (Probabilidad de elaborar queso por el tcnico A).
P ( A 2 ) = 0.55 (Probabilidad de elaborar queso por el tcnico B)
P( B A1 ) = 0.03 (Probabilidad de elaborar un queso, con peso menor a 1 kg por
el tcnico A)
P( B A2 ) = 0.05 (Probabilidad de elaborar un queso, con peso menor a 1 kg por
el tcnico B).

b g
P B A1 =
P( A1 ) P( B A1 )
=
0.45x0.03
P( A1 ) P( B A1 ) + P( A2 ) P( B A2 ) 0.45x0.03 + 0.55x0.05
= 0. 33%

De otra forma:

P( B A1 ) = 0.03
P ( A 1 ) = 0.45

P( B' A1 ) = 0.97 = B'

P( B A2 ) = 0.05
P ( A 2 ) = 0.55

P( B' A2 ) = 095
. = B'

P( A1 ) P( B A1 ) = 0.45x0.03 = 0.0135

2
i =1
P( Ai )P( B Ai ) =P( A1 )P( B A1 ) + P( A2 )P( B A2 ) = 045x0.03+0.55x0.05=
. 0.041

P( B A1 ) = 0.0135 0.041 = 0.33 33%


Estadstica Aplicada a la Educacin - 183 -
EJEMPLO:
De los alumnos del primer aos de un colegio, se sabe que el 40% asisti a
centros primarios privados y el 60% asisti a centros estatales. El registro de notas
de colegio al final de ao, seala que el 30% de los alumnos que asistieron a centros
privados obtuvieron una nota mxima de 18 puntos; mientras que slo el 20% de los
que asistieron a centros estatales alcanzaron tal nota mxima. Al final de ao es
seleccionado un alumno del primer ao.
a) Hallar la probabilidad de que haya alcanzado la nota mxima de 18.
b) Si alcanz la nota mxima 18 Cul es la probabilidad de que provenga de un
centro estatal?.

SOLUCIN:
Sea el evento A1 : El alumno asisti a centro privados.
A2 : El alumno asisti a centro estatales.
B: El alumno obtuvo nota mxima de 18.
P ( A 1 ) = 0.40; P ( A 2 ) = 0.60, adems se conoce que:
P( B A1 ) = 0.30; P( B A2 ) = 0.2
a) La probabilidad que el alumno haya alcanzado una nota mxima de 18 puntos
es:
P( B ) = P( A1 ) P( B A1 ) + P( A2 ) P( B A2 ) = 0.4x0.3 + 0.6x0.2 = 0.2 24%
b) Si el alumno alcanz la nota mxima de 18 puntos, entonces la probabilidad de
que provenga de un centro estatal es:

b g
P B A2 =
P( A2 ) P( B A2 )
P( B )
=
P( A2 ) P( B A2 )
P( A1 ) P( B A1 ) + P( A2 ) P( B A2 )
=
0.6x0.2
0.24
= 50%

De otra forma:

P( B A1 ) = 0.3 = B
P ( A 1 ) = 0.4

P( B' A1 ) = 0.7 = B'

P( B A2 ) = 0.2 = B

P ( A 2 ) = 0.6
P( B' A2 ) = 0.8 = B'
- 184 - V. Ibaez Q.

P( B ) = P( A1 )P( B A1 ) + P( A2 )P( B A2 ) = 04x0.3+0.6x0.2


. = 0.24
0.6x0.2
P( B A2 ) = = 0.5 50%
0.24

EJERCICIOS 7.1.
1.- Un joven profesor egresado del Programa de Educacin a distancia presenta su
documentacin a las UGELs 3 y 4. La probabilidad de que lo contraten en la
UGEL 3 es 1/3 y la probabilidad de que lo contraten en la UGEL 4 es 1/2. Supo-
niendo que si lo contratan en una UGEL ya no lo contratan en la otra, Cul es la
probabilidad de que lo contraten en la UGEL 3 o en la UGEL 4?.

2.- La probabilidad de que un joven postulante ingrese a la Universidad Nacional del


Altiplano es 0.5 y la probabilidad de que ingrese a la Universidad Nacional de
San Agustn es 0.6. Si la probabilidad de que ingrese a ambas universidades es
0.4, Cul es la probabilidad de que no ingrese a Universidad alguna?.

3.- De 30 alumnos de un aula de educacin inicial 10 son de 4 aos y 20 de 5 aos. Se


selecciona por sorteo un alumno se le interroga por su edad y vuelve a su lugar, se
procede de igual forma con un segundo alumno y con un tercero. Cul es la
probabilidad de que los tres hayan contestado que tienen 5 aos?.

4.- De los estudiantes del Programa de Educacin a distancia 40% son varones y el
4% son varones que estudian Educacin Inicial. Si se selecciona un estudiante
por sorteo y este resulta ser varn, cul es la probabilidad de que estudie Educa-
cin Inicial?.

5.- De 40 alumnos de un aula de quinto ao de secundaria, 30 son mayores de 16


aos y 10 son de 16 o menos. Se selecciona por sorteo un alumno, sale del aula y
se le enva a su casa, de igual manera se procede con un segundo alumno, Cul
es la probabilidad de que ambos sean menores de 16 aos?.
6.- La probabilidad de que el alumno XYZ estudie para su examen final de estadsti-
ca es 0.7. Si estudia la probabilidad de que apruebe el examen es 0.9, en tanto que
si no estudia esta probabilidad es slo 0.5 Cul es la probabilidad de que XYZ
apruebe su examen final de Estadstica?.

7.- Basndose en el enunciado del ejercicio 6), calcule la probabilidad de que XYZ
haya estudiado, dado que aprob su examen final de Estadstica.
Estadstica Aplicada a la Educacin - 185 -

8
LA DISTRIBUCIN DE PROBABILIDAD
VARIABLE ALEATORIA. Una variable aleatoria X de un espacio muestral
discreto S, es una funcin de S en el conjunto de los nmeros reales . Una variable
cualquiera es toda caracterstica que est sujeta a medicin o conteo y representan
con las letras maysculas como X, Y, Z y pueden adoptar un conjunto de valores que
recibe el nombre de dominio de la variable.

Si una variable aleatoria puede asumir valores que se obtiene por conteo, toma el
nombre de variable discreta. Por ejemplo, si se arroja un dado en la cara superior
puede obtenerse cualquiera de los valores siguientes: 1,2,3,4,5,6. Si una variable
puede asumir cualquier valor real dado entre ciertos lmites, recibe el nombre de
variable continua. Por ejemplo, las estaturas de los estudiantes de un aula de primer
semestre, el peso de un nio al nacer, el peso vivo de los corderos al nacimiento, en
las medidas biomtricas: altura a la cruz, largo de cuello, permetro del torax todas
estas medidas estn dados en centmetros.

LAS DISTRIBUCIONES DE PROBABILIDAD

El propsito de esta unidad es estudiar las distribuciones de poblaciones, es decir,


distribuciones considerando a todos los individuos u observaciones que forman parte
de una poblacin.
- 186 - V. Ibaez Q.
Existen muchas distribuciones tericas de poblaciones, discretas y continuas, de
las cuales dedicaremos especial atencin a las distribucines de Bernoull, Binomial,
Poisson, dentro de las discretas y a las continuas: la distribucin normal, Ji-cuadra-
do, t-Student y distribucin F.

8.1. DISTRIBUCIN DE BERNOULLI.

Se denomina prueba o ensayo de Bernoull a todo experimento aleatorio que


consiste en efectuar una sola prueba con dos posibles resultados mutuamente
excluyentes, llamados xito (E) y fracaso (F). Entonces el experimento aleatorio ( i )
tiene el espacio muestral i ={E,F}.
La variable aleatoria (v.a.) Xi = 1, si i
resulta un xito (E), y
Xi = 0, si i resulta un xito (F).
La variable aleatoria Xi, as definida se llama una variable aleatoria de Bernoull.
en forma de esquema grfica se tiene:

Rx

i E 1 = X i (Exito)

F 2 = X i (Fracaso)

EJEMPLOS:
- En un nacimiento de un ser humano, el sexo es masculino o femenino.
- Una droga cura o no cura la enfermedad.
- Un estudiante asiste a clases o no asiste.
- Lanzar una moneda una sola vez para observar si resulta cara o sello.
- Una insecticida elimina o no elimina al insecto.
- Ejecutar un solo tiro para ver si da en el blanco o no.
- Un vendedor vende o no vende sus productos.
- Lanzar una sola vez un dado para ver la puntuacin obtenida no es un ensayo de
Bernoull, ya que tiene 6 posibles resultados y no 2.
- Una anestesia: anestecia o no anestecia al paciente.
Estadstica Aplicada a la Educacin - 187 -
TEOREMA. La variable aleatoria X es Bernoull con parmetros n = 1 y p. X =
B(1,p). Sea A evento de existe P(A) = p y P(Ac) = q q = 1 - p con p+q = 1
y se define X como el nmero de veces que ocurre A en un experimento.
Densidad discreta de Bernoull (forma puntual o individual), cuya frmula es:

R|FG1IJ p q
P(X = x)= f(x)= SH xK
x 1-x
, si x = 0,1
|T 0 c.o.c.
y para la Densidad discreta de Bernoull (forma acumulativa), est definida por:

P(X x) = F(x)=
FG 1IJ p q
H xK
x 1-x
, con x = 0,1
x 1

TEOREMA. Si X tiene distribucin de Bernoull de parmetro p, entonces:


a) E(X) = p
b) V(x) = pq.

8.2. DISTRIBUCIN BINOMIAL.

DEFINICIN. Se denomina experimento binomial a un nmero fijo de n


repeticiones independientes de un experimento aleatorio de Bernoull, y por tanto, se
caracteriza por:
1) Por ser un experimento aleatorio que consiste en efectuar n pruebas de
Bernoull repetitivas e independientes.
2) Los resultados de cada prueba son dos experimentos aleatorios mutuamente
excluyentes, xito (E) y fracaso (F).
3) La probabilidad de p de xito es invariante en cada una de las pruebas. El
espacio muestral del experimento binomial es el conjunto:
= mbw ,w ,L ,w g
1 2 k =EF r
DEFINICIN. Se denomina variable binomial a la variable aleatoria X definida
en como el nmero de xitos que ocurren en las n pruebas de Bernoull. Los
posibles valores de X son: 0,1,2,...,n.

TEOREMA. Si X es una variable aleatoria discreta (v.a.d.) es binomial con


parmetros n y p, X = B(n,p). Sea A evento de existe P(A) = p y P(Ac) = q
q = 1 - p con p+q = 1 y se define X como el nmero de veces que ocurre A en n
- 188 - V. Ibaez Q.
repeticiones independientes. Entonces, la funcin de densidad discreta binomial es:

R| FG nIJ p q ,
S| H xK
x n-x
si x = 0,1,2,...,n
P(X = x)= f(x) =
T0 c.o.c. cualquier otro caso

FG nIJ p q
H xK
x n-x
Si X es una variable aleatoria discreta y X = B(n,p), entonces f(x) = ,

si x = 0,1,2,3,...,n y

P(X x) = F(x) =
n
FG nIJ p q
H xK
x n-x
, si x = 0,1,2,...,n
x n

EJEMPLOS:
- Lanzar una moneda dos o ms veces para observar el nmero de caras o sellos
que resulten.
- Ejecutar dos o ms tiros para ver cuntos dan en el blanco o cuntos no dan.

TEOREMA. Si X ~ B(x; n,p), entonces:


a) E(X) = np
b) V(x) = npq.

OBSERVACIN:
1) Si p = 1/2, la distribucin binomial B(x;n,p) es simtrica.
2) Si p 1, la distribucin tiene asimetra negativa (cola a la izquierda).
3) Si p 0, la distribucin tiene asimetra positiva (cola a la derecha).

EJEMPLO:
De una seccin de Educacin Inicial, con 10 nias y 30 nios, se selecciona por
sorteo a 6 estudiantes Cul es la probabilidad de que exactamente 4 sean nias?

SOLUCIN:
Sea la variable:
X = El estudiante seleccionado es nia
10
p= 40 = 0.25 (probabilidad de seleccionar una nia)
q = 0.75 (probabilidad de seleccionar un nio).
n = 6 (nmero de estudiantes seleccionados)
x = 4 (nmero de nias seleccionadas)
Estadstica Aplicada a la Educacin - 189 -
Luego, reemplazando a la frmula binomial se tiene:

6! 1 FG IJ FG 3IJ
4 2

P( X = 4 ) =
2!4! 4 H K H 4K = 15x0.00391x0.5625 = 0.03299

La probabilidad de que en un grupo de 6 estudiantes seleccionados, haya 4 nias


es 0.03299 3.3%

Usando la Tabla Estadstica (Trminos individuales), se tiene:


n=6
X=4
p = 0.25, buscamos en la tabla estadstica y encontramos para P(X = 4) = 0.03299

EJEMPLO:
La probabilidad de un estudiante que ingresa a la universidad y logre graduarse
es 0.4. Cul es la probabilidad que de 5 estudiantes nuevos, se graduen 3 estudian-
tes?.

SOLUCIN:
n = 5; X = 3 graduados; p = 0.4; q = 1 - p = 1 - 0.4 = 0.6, entonces:
FG 5IJ p q 5!
H 3K
53
P( X = 3) = 3
= (0.4) 3 (0.6 ) 2 = 10 (0.4) 3 (0.6 ) 2 = 0.2304
3! 2 !
Usando la Tabla Estadstica (Trminos individuales), se tiene:
n=5
X=3
p = 0.4, buscamos en la tabla estadstica y encontramos para P(X = 3) = 0.2304

EJEMPLO:
Cul es la probabilidad de obtener al menos 4 caras al lanzar 6 veces una mone-
da?.

SOLUCIN:
al menos 4 caras, significa encontrar 4, 5 6 caras:
n = 6; p = 1/2; q = 1 - p = 1/2; X 4, entonces se realiza la siguiente operacin:

P ( X 4) =
6
FG 6IJ p q
H xK
x n x

x =4
- 190 - V. Ibaez Q.

FG6IJFG 1IJ FG 1IJ + FG6IJFG 1IJ FG 1IJ + FG6IJFG 1IJ FG 1IJ


4 2 5 1 6 0
22
P( X 4) =
H4KH 2K H 2K H5KH 2K H 2K H6KH 2K H 2K =
64
= 0.34375

Es ms fcil encontrar P(X 4) de la siguiente manera:


P(X 4) = 1 - P(X<4) = 1 - P(X 3) = 1 - 0.6563 = 0.3437

Usando la tabla estadstica, se tiene:


n = 6; X = 3; p = 0.5, entonces P(X 3) = 0.6563

EJEMPLO:
Se determina que un 25% de los nios expuestos a un determinado agente infec-
cioso contraern la enfermedad producida por dicho agente. Entre un grupo de 4
nios igualmente expuetos al agente infeccioso, Cul es la probabilidad de:
a) Que exactamente 2 nios se enfermen.
b) Que por lo menos un nio se enferme.

SOLUCIN:
Sea el evento A: Nios expuestos al agente infeccioso que contraen la enferme-
dad.
P ( A) = 41 = p; q = 1- 41 = 3
4

F4IF 1I F 3I
a) P( X = 2) = G J G J G J
2 2
FG IJFG IJ
4 3 1 9 54
H2KH 4K H 4K =
H KH K
=
2 16 16 256
= 0.2109375

Usando la tabla binomial en trminos individuales se tiene:


n = 4; X = 2; p = 0.25, entonces P(X = 2) = 0.2109

b) P ( X 1) =
F 4I
GH xJK p q
4
x n x
, pero P ( X 1) = 1 P ( X < 1)
x =1

FG4IJFG 1IJ FG 3IJ


0 4
175
= 1 P( X 0) = 1 P( X = 0) = 1
H0KH 4K H 4K =
256
= 0.68359

Usanod la tabla estadstica en trminos acumulativos, se tiene:


n = 4; X = 0; p = 0.25, buscando con stos valores encontramos que:
P(X 1) = 1 - P(X<1) = 1 - P(X=0) = 1 - 0.3164 = 0.6836
Estadstica Aplicada a la Educacin - 191 -
EJERCICIOS:
1. Usando la tabla de probabilidades Binomiales calcule:
a) P(X=8), con n = 20, p = 0.3; Rpta. 0.1144
b) P(X 10), con n = 20, p = 0.3 Rpta. 0.0479
c) P(X<5), con n = 10, p = 0.4. Rpta. 0.6331

8.3. DISTRIBUCIN DE POISSON.

El experimento Poissoniano se caracteriza por ser un fenmeno que se presente


en forma aleatoria e independientemente en el tiempo o espacio en el que slo intere-
sa la ocurrencia del fenmeno, un nmero contable de veces y no interesa la no
ocurrencia. La distribucin de Poisson, se aplica a problemas donde la variable
aleatoria es el nmero de eventos que ocurren en un intervalo de tiempo. El modelo
se hace tender n a infinito, es decir a un nmero muy grande y a p se hace tender
a cero, es decir, a un nmero muy pequeo, entonces se obtiene la distribucin de
Poisson, es decir: X = B(n,p) si n y p 0, entonces X ~P( ).

TEOREMA. Si X es una variable aleatoria discreta (v.a.d.) es de Poisson con


parmetro . X~p( ). Sea X una v.a.d. con parmetro > = y = E(X) =
, entonces la densidad discreta de Poisson (trminos individuales) es:

R| e x

P(X = x) = f(x) = S x ! , si x = 0,1,2,...


|T 0 c.o.c.
y en trminos acumulativos la distribucin de Poisson es:

e x
P( X x) = F ( x) = , si x = 0,1,2,3,...
x y x!
Donde:
e = La base de los logartmos naturales, e = 2.718281828
= np promedio de xitos que se presentan en unidad de medida.
x = Es cualquier nmero entero positivo.
La funcin de probabilidad debe cumplir f(x).
i) f(x) 0
ii) f ( x) = 1
- 192 - V. Ibaez Q.

EJEMPLOS:
- Nmero de errores por pgina de un diario.
- Nmero de remaches defectuosos en un avin.
- El nmero de bacterias en un centmetro cbico de agua.
- Nmero de llamadas que recibe una Central telefnica en el periodo de un
minuto.
- Nmero de fallas de un sistema en un da dado.
- Nmero de accidentes de trabajo que ocurren en una fbrica durante una sema-
na.
- La frecuencia de terremotos que ocurren en el Per en un intervalo de tiempo de
un ao.
- La distribucin de partculas sobre una placa reticular o sobre un espacio tri-
dimensional. El nmero de partculas de polvo encontrados en 1 m3 de aire.
- La distribucin del nmero de errores tipogrficos por pgina en textos gran-
des.
- La distribucin del nmero de partculas ALFA emitidas por una sustancia
radioactiva.

TEOREMA. Si X ~ P( ), entonces:
a) = E(X) =
b) 2 =V(X) =

EJEMPLO:
El nmero promedio de muertes por accidente es 2 por da. Determine la proba-
bilidad de que un da dado haya:
a) No ms de 3 muertos.
b) No menos de 3 muertos.
SOLUCIN:
X = Nmero de personas muertas.
= 2 ( promedio de muertes de personas por da).
x = 3 (Nmero de muertos de personas en un da).
De a)

P( X 3) =
3
FG e 2 IJ = e 2
2 x 2 0
e2 21 e2 22 e2 23
x =0 H x! K 0 ! +
1!
+
2!
+
3!
= 0.8571

La probabilidad de que un da dado haya como mximo 3 muertos de personas


por accidente es 85.71%.
Estadstica Aplicada a la Educacin - 193 -

De b) Usando la tabla de Poisson encontramos para: x = 3 y = 2 una probabi-


lidad de P(X 2) = 0.6767, entonces P(X 3) = 1 - P(X 2) = 1 - 0.6767 = 0.3233
La probabilidad de que haya 3 o ms muertes de personas por accidente en un da
es 32.33%.

EJEMPLO:
Suponga que el manuscrito de un texto de estudio tiene un total de 50 errores
enlas 500 pginas del material. Los errores estn distribuidos aleatoriamente a lo
largo del texto. Cul es la probabilidad de que:
a) Un captulo de 30 pginas tenga dos o ms errores.
b) Un captulo de 50 pginas tenga dos o ms errores.
c) Una (01) pgina seleccionada aleatoriamente no tenga errores.

SOLUCIN:
50 1 1
Sea el evento A: Cometer error de manuscrito, entonces P( A) = p = = , p =
500 10 10

la probabilidad es pequea y n es grande, pero = E(X)= donde es binomial,

entonces = np = n b g , entonces
1
10
n
= 10 .

a) n = 30, entonces
30
= 10 =3, y se quiere calcular P(X 2)= ?

P( X 2) = 1 P( X < 2) = 1 P( X 1) = 1
RSe 3 UV = 1RSe 3 + e 3 UV
1 3 x 3 0 3 1

T x! W T 0! 1! W
x=0

m r m
= 1 e3 +3e3 = 1 e3 (1+ 3) = 1 4e3 = 0800851726
. r
b) Un captulo de 50 pginas tenga 2 o ms errores.
se quiere calcular P(X 2)= ?
50 1
n = 50, entonces = 10 =5, y p=
10

P( X 2) = 1 P( X < 2) = 1 P( X 1) = 1
RSe 5 UV = 1RSe 5 + e 5 UV = 1(e
1 5 x 5 0 5 1
5
+ 5e5 ) = 16e5
T x! W T 0! 1! W
x=0

= 1 6 (0.006737946 ) = 0.959572318

Usando la tabla estadstica, se tiene x = 1, =5; P(X 1) = 0.0404


entonces P( X 2) = 1 P ( X 1) = 1 0.0404 = 0.9596

c) Una pgina seleccionada aleatoriamente no tenga errores.


- 194 - V. Ibaez Q.

n = 1, p=
1
10
entonces b g =0.1; =0.1 y se quiere calcular P(X=0) = ?
=1 1
10

0
e 0 .1 0 .10
P( X = 0) = = e 0 .1 = 0 .904837
x =0 0!
Usando la tabla, se tiene: n = 1, =0.1, x = 0, entonces P(X=0) = 0.9048

EJEMPLO:
Los alumnos de un Colegio, ingresan en las maanas a razn de 30 alumnos por
minuto. Determinar la probabilidad de que ingresen:
a) Por lo menos 2 alumnos en un segundo.
b) A lo ms 3 alumnos en 2 segundos.

SOLUCIN:
Sea la variable: X = Nmero de alumnos que ingresan por las maanas.
= 0.5 (Promedio de alumnos que ingresan en un segundo).
x = 2 (Nmero de alumnos que ingresan en un segundo).

a) La probabilidad de que ingrese en un segundo por lo menos 2 alumnos es:


P( X 2 ) = 1 P( X 1 ) = 1 0.910 = 0.090
b) La probabilidad de que ingresen a lo ms 3 alumnos en un segundo es:
P( X 3 ) = 0.998
Usando la tabla estadstica, se tiene: = 0.5; X = 3, entonces:

MANEJO DE TABLAS
1) Usando la tabla de probabilidaes de Poisson, calcular:
a) P(X=0) con = 0.1 Rpta: 0.9048
b) P(X 2) con =5 Rpta: 0.95957
c) P(X>7) con = 20 Rpta: 0.9992

NOTA:
1) P( X a ) = 1 P( X a 1). Ejm: P(X 9) = 1- P(X < 9)= 1- P(X 8)
2) P( X > a ) = 1 P( X a ). Ejm: P(X > 9) = 1- P(X 9)
3) P(a X b) = P( X b) P( X a 1), Ejm: P(2 X 3)= P( X 3) P( X 1)
4) P ( X < a ) = P ( X a 1) . Ejm: P(X < 9) = (X 8 )
Estadstica Aplicada a la Educacin - 195 -

8.4. DISTRIBUCIN NORMAL.

Esta curva tiene importancia en estadstica en la distribucin y han participado


varios matemticos (Abraham de Moivre, Pierre S. Laplace y Karl Gauss). De Moivre
fue el primero en formularlo, pero Gauss la hizo popular a tal punto que a veces se le
llama Distribucin Gausiana.

DEFINICIN. Se dice que la variable aleatoria (v.a.) se distribuye normalmente


Gaussiana, si su funcin de densidad est definida por:

1 G
F
1 x IJ
2

f ( x) = e 2H K , < x < +
2
Donde:
= Desviacin estndar.
= Promedio de la poblacin.
= 3.1416
x = Cualquier valor directo de la variable de inters.
e = 2.7183.

Esta densidad tiene dos parmetros ( < < + ) y varianza 2 > 0 .

34.13% 34.13%

13.59% 13.59%

2.15% 2.15%
0
3 2 1 +1 +2 +3
68.26%
95.44%
99.74%
0.5 0.5

1.0

c h
N , 2 , se lee la v.a. est distribuido normalmente con media y varianza

2 .
- 196 - V. Ibaez Q.
En cualquier distribucin normal aproximadamente:
1) 68.26% del rea bajo la curva, se halla a una 1 de la media hacia cualquier direccin
( 1 ).
2) 95.44% del rea bajo la curva, se halla a dos (2 ) de la media ( 2 ).
3) 99.74% del rea bajo la curva, se halla a tres (3 ) de la media ( 3 ).

PROPIEDADES DE LA DISTRIBUCIN NORMAL. La distribucin normal


tiene varias propiedades importantes:

1) z

f ( x)dx = 1 ; 2) f ( x ) 0 , x ; 3) Lm
x
f ( x ) = 0 y Lm f ( x ) = 0
x

4) f ( x + ) = f ( x ) , la densidad es simtrica alrededor de .


5) El valor mximo de f ocurre en x = .
6) Los puntos de inflexin de f estn en x =
7) En la distribucin normal coinciden: = Mediana = Moda
8) Si X ~ N ( , 2 ), entonces: E(X)= , V ( X ) = 2 .

IMPORTANCIA:
- Muchas distribuciones tienden a la normal como binomial, Poisson, t-Student, etc.
- Ciertas variables que son bsicas en estadstica inferencial, se distribuye
normalmente: , t-Student, F, etc.
2

- An en el caso de algunas variables aleatorias que no estn distribuidas


normalmente ni aproximadamente normal, se puede convertir en un distribucin
normal mediante transformaciones matemticas.

LA DISTRIBUCIN NORMAL ESTANDARIZADA.


Puesto que cada combinacin diferente de y generara una distribucin
de probabilidad normal diferente (todas simtricas y mesokrticas), entonces
resultara dificultoso el trabajo de inferencia estadstica, si se trabaja con tales
valores; cuando tratamos con distribuciones normales proporcionan una media
0 y 1 , este detalle no obliga a convertir la media en cero ( = 0) y la
varianza en la unidad ( =1). En un caso particular de la distribucin normal, se
determina haciendo un cambio de variable. Esta conversin de la distribucin
X ~ N( , 2 ) a otra distribucin Z~N(0,1), porque ya existe una tabla de uso prctico
y directo de la distribucin normal con = 0 y 2 = 1.
Sea X una variable aleatoria que se distribuye normalmente con media y 2 .
Entonces mediante la transformacin lineal, se tiene:
Estadstica Aplicada a la Educacin - 197 -

x-
Z= , esto es la estandarizacin de la variable x, donde el recorrido es:

< z < + . Para definir la funcin de densidad de Z, se tiene:
x-
Z= , entonces Z = x - , x = Z + x, dx = dz , luego reemplazando:

1 1
1 Z2 1 Z2
f ( z) = e 2 ,
/ f ( z) = e 2 < Z < +
/ 2 2
Resulta la Funcin de Densidad de la variable Estandarizada.

f(Z)
1
= = 04
.
2

-1 0.2 +1

-1 0 +1 Z

CARACTERSTICAS:
1) Z se distribuye en forma Normal estndar (0,1), E(Z) = 0, V(Z) = 1.
2) Los puntos de inflexin estn entre (1).
3) La media, moda y la mediana coinciden y son iguales a cero.
4) La forma es acampanada, simtrica con respecto al eje Y; asinttica al eje Z y
continua en todos los nmeros reales (R).
5) P(Z 0) = P(Z 0) =0.5

f(x)

34.13% 34.13%
2.15%
13.59%
13.59% 2.15%
3 2 1 0 + 1 +2 +3
0 X

f(Z)

0.4 = 1 2

-3 -2 -1 0 1 2 3 Z
68.26%
95.44%
99.74%
- 198 - V. Ibaez Q.
Resumiendo.
1. La distribucin normal estndar tiene una media igual a cero ( = 0), una
desviacin estndar igual a 1 ( = 1), y un rea total debajo de la curva igual
a 1 hay una proporcin fija de cosas entre una lnea vertical u ordinaria en
cualquier punto y otra ordenada levantada en cualquier otro punto.
2. En est distribucin hay 2 parmetros independientes: y 2 , puede ser
algn nmero real y 2 puede ser algn nmero real no negativo, siempre
positivo. Para alguna densidad funcin normal, y 2 son fijados, as hay
una distribucin normal diferente para cada par de y 2 .
3. Ya se dijo anteriormente que la variable al azar normal estndar es por lo
general representado por Z, para diferenciarlo de otras variables.
4. Cuando el valor deseado esta normalmente distribuido con un promedio ( )
y una variancia ( 2 ), entonces el valor deseado puede ser estandarizado por
x y
la frmula: z = z= , donde que Z es el nmero de la desviacin

estndar, X y es proveniente del promedio, entonces Z es llamado algunas
veces como la desviacin estndar.

EJEMPLO:
Los calificativos del examen de ingreso a la Escuela Profesional X, estn
distribuidos normalmente con una media de 79 y una desviacin estndar de 9. Si
en total se presentaron 15 postulantes al examen. Calcular el nmero de casos y
el porcentaje de estos que corresponden a los siguientes puntajes.
a) Mayor que 90; b) Menor que 75; c) Entre 69 y 81.

SOLUCIN:
= x= 79; = s = 9; X = 90.
a) Mayor que 90: Se debe estandarizar stos estadsticos, ya que los valores no
existen en la tabla Z.
Estandarizamos

0.5 P ( 0 Z 1.22 )

0.11123
644744
8

79 90 X 0 1.22 Z
Estadstica Aplicada a la Educacin - 199 -

F X -79 > 90 -79 I = P(Z > 11) = P(Z > 1.22)


P GH 9 9 K
J 9

P(Z > 1.22)= 0.5 - P(0 Z 1.22)= 0.5 -0.38877 = 0.1112

Para encontrar el porcentaje, multiplicamos la probabilidad por 100, entonces:


0.11123x100 = 11.12% ~ 11%
Para conocer el nmero de calificativos que corresponde a 11%, se resuelve usando
la regla de tres directa:
15 (postulantes) 100%
11%
X 11%, entonces X = 15100% = 1.65 2 casos (el nmero de casos)

Usando la tablas de Z acumulativas, se pueden encontrar de la siguiente forma:


P(X > x) = 1- P(X x) = 1- F(Z)= 1-0.88877 = 0.11123

b) Menor que 75, de igual forma se estandariza, porque con los valores grandes
no se puede encontrar en la tabla Z.
F X -79 < 75 -79 I = P(Z < - 4 ) = P(Z < -0.44)
P GH 9 9 K
J 9

Estandarizamos

0.32997

75 79 X -0.44 0 Z

P(Z < -0.44) = 0.5 - P(0 Z 0.44 ) = 0.5 - 0.17003 = 0.32997 ~ 0.33

El porcentaje que le corresponde a 0.33x100 = 33%. Para conocer el nmero de


calificativos que corresponde a 33%, se resuelve usando la regla de tres directa:
15 (postulantes) 100%
33%
X 33%, entonces X = 15100% = 4.95 5 casos (el nmero de casos)

Usando la tablas de Z acumulativas, se pueden encontrar de la siguiente forma:


P(Z < -z) = 0.32997
- 200 - V. Ibaez Q.

c) Entre 69 y 81. Como stos valores son altos entonces, se estandariza de la


siguiente forma:
F 69 -79 X -79 81-79 I = P(-1.11 Z 0.22)
P GH 9 9 9 K
J
Estandarizamos
0.45356

69 79 81 X -1.11 0 0.22 Z

por simetra.
P(-1.11 0 )+ P(0 0.22 )

P(0 111
. )+ P(0 0.22 ) = 0.36650 + 0.08706 = 0.45356
El porcentaje que le corresponde a 0.45356x100 = 45.36% ~ 45%. Para conocer
el nmero de casos que corresponde a 45%, se resuelve usando la regla de tres
directa:
15 (postulantes) 100%
45%
X 45%, entonces X = 15100% = 6.75 7 casos (el nmero de casos)

Usando la tablas de Z acumulativas, se pueden encontrar de la siguiente forma:


P(Z1 Z Z2 )= F(Z2 )- F(Z1 )= F(0.58706)- F(0.1335)= 0.45356

EJEMPLO:
Los puntajes obtenidos en un test psicotcnico estn distribuidos normalmente
con una media de 60 y una desviacin estndar de 10.
a) si el puntaje minimo para aprobar es 48. Cul es el porcentaje de fracasos?.
b) Si han de aprobar el 80% de los estudiantes, Cules debe ser el puntaje mnimo
aprobatorio?.

SOLUCIN:
a) Sea X la variable normal que expresa los puntajes obtenidos, cuya media y
desviacin estndar son respectivamente:
= x= 60; = s = 10;
Como X = 48 es el puntaje mnimo aprobatorio, la probabilidad de no aprobar
es:
Estadstica Aplicada a la Educacin - 201 -

P(X < 48) = ?


FG X - 60 < 48 - 60IJ = PFG Z < -12 IJ = P(Z < -1.2)
P
H 10 10 K H 10 K
P(Z < -1.2) = 0.11507 = 11.507%

Rpta: El porcentaje de desaprobados (fracasos) es 11.5%.

b) Sea x el puntaje aprobatorio, se pide hallar x, sabiendo que:


b g
P X x = 80% = 0.80

FG X-60 x-60IJ = 080


P
H 10 10 K . PbZ zg = 080
. ,1 F( z ) = 080
. , F( z ) =0.20

Como F(-0.84) = 0.20045; comparando con z = -0.84, entonces:


X - 60
= 0.84 , entonces x = 51.6 ~ 52
10
Para que aprueben el 80% de los estudiantes, el puntaje mnimo aprobatorio
debe ser aproximadamente 52.

EJEMPLO:
Cul es la probabilidad de encontrar una muestra promedio igual o mayor a 12.5
kg. en un Jardn con 20 nios de 3 aos de edad, con un promedio general de 11
kg. y varianza de 5?.

SOLUCIN:
Estandarizamos

0.00135

11 12.5 X 0 3.0 Z

= x =11 kg.; 2 = 5; n = 20, P(X 12.5)=?

2x = 5
20
= 0.25 = 0.5
F X -11 12.5-11I = PeZ 30. j = 05. P(0 Z 3.0)=0.5-0.49865=0.00135
P GH 0.5 0.5 JK
- 202 - V. Ibaez Q.
Rpta: La probabilidad de encontrar una muestra de promedio igual o mayor a
12.5 es 0.00135 0.135%.

EJEMPLO:
Qu porcentaje de nios tienen un largo de cara comprendido entre 7.4 cm. y 7.8
cm. con un promedio de 7.0 cm. y desviacin estndar de 0.8 cm?.

SOLUCIN:
= x=7.0 cm.; = 0.8
F7.4-7 X -7 7.8-7I = P(0.5 Z 10. )= P(0 Z 0.5)+P(0 Z 1.0)
P GH 0.8 0.8 0.8 JK
Estandarizamos
0.4672

7.0 7.4 7.8 X 0 0.5 1.0 Z

= 0.5 P(0 0.5 ) + 0.5 P(0 1.0 ) = (0.5 - 0.19146)+ (0.5 - 0.34134)

= 0.30854 + 0.15866 = 0.4672

Rpta: El porcentaje de nios que tienen un largo de cara comprendido entre 7.4
y 7.8 cm. es 0.30854 - 0.15866 = 0.14988 ~ 14.98%

EJEMPLO:
En un hato de vacas lecheras de la raza Brown Swiss, se encontr el promedio
general de produccin de 8 litros y su desviacin estndar es 2.2. Cul es la
proporcin de vacas lecheras que tengan una produccin entre 4.2 y 9.5 litros?.

SOLUCIN:
= x= 8 litros; = s = 2.2
FG 42. 8 x 8 95. 8IJ = P(-1.73 Z 0.68)= P(-1.73 Z 0)+P(0 Z 0.68)
P
H 22. 22. 22. K
por simetra se tiene:
P(0 Z 1.73)+ P(0 Z 068
. )=0.45818+0.2517 =0.70993
Estadstica Aplicada a la Educacin - 203 -

Estandarizamos
0.25175

0.45818

4.2 8 9.5 X -1.73 0 0.68 Z

Pero:
P(0 Z 1.73)+ P(0 Z 068
. )=(0.5-0.45818)+(0.5-0.2517)=0.04182+0.24825=0.29007

1 - 0.29007 = 0.70993, entonces 1 - 0.70993 = 0.29007

Rpta: La proporcin de vacas lecheras, cuya produccin oscila entre 4.2 y 9.5
litros es 0.2901 29.01%, es decir hay 29.01% de vacas, cuya produccin
de leche estn comprendidos entre 4.2 y 9.5 litros.

8.5. LA DISTRIBUCIN JI-CUADRADA ( 2 ).

En 1876 Frederick R. Helmert hizo algunos de los primeros estudios sobre la


distribucin terica de Ji-cuadrada. El smbolo usual usado para representar la
variable al azar de Ji-cuadrado es equis al cuadrado ( ).
2

=1
=3
=4

=5

ch
=6
f 2

=2

0 1 2 3 4 5 6 7 8 9 2

DEFINICIN.
Sea la variable aleatoria X que se distribuye como una distribucin de Ji-cuadra-
da, con v grados de libertad, y se denota como: X ~ 2v , si su funcin de densidad de
probabilidad est dado por:
- 204 - V. Ibaez Q.

R| 1
x v
1

f ( x ) = S FG v IJ 2
v
e 2 X2 , x>0

|| H 20K
2

T c. o . c.

a) La media de E(X) es (x1 ) = E(X)= v


b) La varianza de V(X) es V(X) = 2v l.q.q.d.

CARACTERSTICAS:
- La distribucin Ji-cuadrada es un caso particular de la distribucin gamma,
cuando = v 2 y = 1 2 .
- La variable Ji-cuadraa no puede ser negativa, porque es la suma de valores
positivos.
- La distribucin es de tipo contnuo, su forma y posicin depende del nmero de
grados de libertad (g.l.).
- Cuando los grados de libertad (g.l.) son pequeos, la distribucin es asimtrica
hacia la derecha. A medida que aumentan los grados de libertad tiende a la
distribucin normal.
- Existe una distribucin para cada grado de libertad.
- La funcin de densidad f( 2 ) para 2 depende solamente de un parmetro
llamado grados de libertad.
- El grfico de f( ), no es simtrico, ms bien es oblicuo o aplanado (sesgado),
2

hacia la derecha; pero se aproxima a la simetra cuando los grados de libertad


se incrementan.
- El mximo valor de f( ) es cuando 2 = 2 si > 2.
2

MANEJO DE TABLAS.

EJEMPLO:
S 20 .975 ,4 entonces quiere decir la distribucin de Ji-cuadrada con = 0.975 y 4
grados de libertad.
20.975,4 = 0.484 . Para graficar se levanta una lnea vertical en 2 = 0.484 , la misma
que divide a la curva de la distribucin de chi cuadrado en dos partes: una a la
Estadstica Aplicada a la Educacin - 205 -
derecha de 0.484 que corresponde al
97.5% del rea de la curva y la otra a la =09
. 75
izquierda de 0.484 que corresponde al
2.5% del rea. El valor 0.484 se
denomina valor crtico. Los valores 0.025
crticos son usados para determinar la regin
de rechazo de la Ho. Aqu la probabilidad

de que una variable al azar de con 4


2

grados de libertad tenga un valor ms grande 209754


. , =0484
.
que 0.484 es igual a 0.975 97.5%.

El valor crtico es identificado por dos valores: el primero por el rea bajo la
curva a la derecha del valor crtico y el segundo por los grados de libertad.
2 , = L 20 .975 ,4 = 0.484 El valor a dado es el que se usa para calcular en la
tabla.
Ejemplo Encontrar 0.05,4 = 3141
2
.
0.95
Aqu 5 % del rea est a la
derecha de la lnea vertical en 31.41 =0975
.
y 95 % del rea est a la izquierda
de sta lnea. Esta distribucin tiene
un promedio de 20 y una variancia
de 40, y la grfica tiene un valor . , = 3141
200520 .
mximo en 18 ( - 2 = 18).

Ejemplo: Encontrar:
a. 20.95,15 = 7.261 =095
.
c. El promedio = x = = 15 0.05
d. La variancia =
c h
2 = S 2 = 2 = 2( 15 ) = 30
e. El valor mximo de
c h
f 2 = 2 = 15 2 = 13 209515
. , =7261
.

EJEMPLO:
Dada una distribucin con 15 grados de libertad, hallar el valor que separe
2 2

las siguientes reas bajo la curva .


2
- 206 - V. Ibaez Q.

a) 1% superior c) El 5% inferior e) e
P 12 152 2 = 095
2
.
2
j
b) 90% superior d) El 1% inferior

SOLUCIN:
a) P( 15 2 ) = 0.01 entonces P( 15 30.60 ) = 0.01 = 30.60
2 2 2

2 ) = 0.90 entonces P( 15 8.55 ) = 0 .90 = 8.55


2 2
b) P( 15
2

2 ) = 0.05 entonces P( 15 ) = 1 P( 15 ) = 0.95


2 2 2 2
c) P( 15
2

P( 15
2
2 ) = 1 P( 15
2
7.26 ) = 0.95 2 = 7.26
d) P( 15 2 ) = 0.01 entonces P( 15 ) = 1 P( 15 ) = 0.99
2 2 2 2 2

P ( 125 2 ) = 1 P ( 125 5 .2 3 ) = 0 .9 9 2 = 5 .2 3

e) e
P 12 15
2
2
2
j
2 = 0.95
Para el lmite Superior:
P( 15
2
2 ) = 0.05 entonces P( 15
2
25 ) = 0 .05 2 = 25.0

Para el lmite Inferior:


P( 15
2
2 ) = 0.95 entonces P( 15
2
7 .26 ) = 0.95 2 = 7 .26

8.6. LA DISTRIBUCIN t-Student.

DEFINICIN:
Una variable aleatoria X tiene una distribucin t de Student con "n" grados de
libertad, y se escribe x ~ t n , si su funcin de densidad de probabilidad esta dado
por:
f(x)

FG 1 n + 1IJ
H 2 2 K FG1 + X IJ
1
2 ( n +1 )
2
f(x) =
F 1 I
G nJ n
H nK , < x < +
H2 K 0 X
Estadstica Aplicada a la Educacin - 207 -

DEFINICIN:
Sea Z una variable aleatoria con distribucin N(0,1) y u una variable aleatoria
con distribucin 2n ( u ~ 2n ) donde Z y u son independientes, entonces la distribu-
cin de la variable aleatoria es:
Z
t= ~ t ( n ) ; se denomina distribucin t con n grados de libertad.
u
n
a) El promedio o media es E(t) = 0
n
b) La varianza es: V(t) =
n-2

CARACTERSTICAS:
- La variable t toma valores positivos negativos, ya que la variable normal Z
puede tomar tanto valores positivos como negativos.
- La distribucin t es continua y simtrica alrededor de su valor esperado
(t = 0), E(t) = 0.
- Tiene como nico parmetro a los grados de libertad n, asociados con la
variable en el denominador de la razn de t.
2

- Es unimodal, es decir que tiene una sola forma de presentacin.


- Es asinttica al eje horizontal de las x y simtrico con respecto a cero E(t) = 0.
- A medida que aumenta los grados de libertad n , entonces t tiende a una
distribucin normal, con frecuencia la aplicacin de esta distribucin es para
X ~ N ( 1, 2 ) , entonces:

(X) n 1
~ t n 1
cX h
n
1 n 2
i X
i =1

La relacin entre tn y F1,n puede ser demostrado para un:

2
t2 = ; donde 2 ~ 12 y u ~ 2n
un
Por lo tanto t 2n y F1,n , se expresa como t 2n = F1 ,n
- 208 - V. Ibaez Q.

MANEJO DE TABLAS:

1. Encontrar lo siguiente:

a) t0.01,10 = 2.764
b) t0.99,10 = -t1-0.99 =-t0.01,10 = -2.764
c) t0.025,7 = 2.365
d) t0.97,7 = -t1-0.075,7 =-t0.025,7 = -2.365
e) t0.005,23 = 2.807
f) t0.995,23 =-t1-0.995,23 =-t0.005,23 =-2.807

2. Use la tabla t para encontrar.

a) p(t>2.145 s =14) = 0.025 t0.025,14 = 2.145


b) p(t<2.518 s =21) = 1 - 0.010 = 0.99 t0.99,21 = 2.518
c) p(t<-1.782 s =12) = 0.050 -t0.05,12= -1.782
d) p(t>-1.363 s =11) = 1 - 0.0 = 0.9 -t0.9,11 = -1.363
e) p(-2.120 t 2.120 s =16)= 1 - 0.05 = 0.95, aqu 2 = con 16 grados de
libertad = 2 = 0.05/2 =0.025, luego (0.025+0.025 = 0.05), luego 1 - 0.05 =
0.95
f) p( t 2.831 si = 21 ) = 0.005+0.005=0.01 t0.005,21 = 2.831

8.7. LA DISTRIBUCIN F (Fisher Snedecor, 1924).

DEFINICIN:

Una variable aleatoria X tiene una distribucin F con v1 grados de libertad en


el numerador y v2 grados de libertad en el denominador, y est distribuido como
X ~ F(v1 , v2 ) , si su funcin de densidad de probabilidad est dado por:
Estadstica Aplicada a la Educacin - 209 -

R| FG 1 n + 1 n IJ n 1 1 1
n1 1

| H2 2 K
n1 n2
2
1 2 1 n22 X 2
f( x ) = S F 1 I F 1 I
, x>0
|| GH 2 n JK GH 2 n JK bn g
1 1
n1 + n2
1 2 2 + n1 X 2 2

T 0 c. o . c.

b g
f X F (2,10) F (10,10)

F (10,2)

0 X

DEFINICIN:
Si u1 y u2 dos variables aleatorias independientes, cada uno con distribucin

Ji-cuadrado ( ) central forman la base de una distribucin F. Entonces:


2

u1 ~ 2n1 U|V u1 n1
u2 ~ 2n2 |W F=
u2 n2
~ F( v1 ,v2 )

Se denomina Distribucin F con v1 y v2 grados de libertad para numerador y


denominador.
n2
a) La media de la distribucin es: E(F) = , n2 > 2
n2 2

IJ FG n2 2
K,n 2n22 1 +
H n1
>4
bn 2g bn 4g
b) La varianza de la distribucin es: V(F)= 2 2
2 2
- 210 - V. Ibaez Q.
CARACTERSTICAS:
- La variable F solamente toma valores no negativos (de cero a infinito), tanto
el numerador como denominador son valores elevados al cuadrado.
- Los nicos parmetros de la distribucin son v1 y v2 .
- Para los valores pequeos de v1 y v2 la distribucin es asimtrica hacia la
derecha; pero a medida que ellos aumentan sta tiende a la distribucin normal.
- R.A. Fisher elabor primeramente la distribucin de Z, que ms tarde se trans-
form en la distribucin de F. La relacin entre las distribuciones F y Z es:
F = e 2 z , done: e = es la base de los logaritmos naturales, cuyo valor es 2.71828;
luego por ejemplo si Z = 2, entonces F vale F=(2.1783)2(2) = F =(2.1783)4 =
54.598 ~54.6. Aqu tanto F como Z dependen de los grados de libertad. Ejem-
plo de algunos valores de Z con = 0.05 a la derecha de la curva:

1
2 1 2 3 4 1 y 2 = son los grados de
1 2.5421 2.6479 ... ... del numerador y denominad
2 1.4592 1.4722 ... ... con 1 = 1 y 2 = 1, enton
3 .. .. Z = 2.5421
4 .. ..

- Snedecor, aplicando la transformacin de F= e 2 z , ha calculado la tabla de Z


de Fisher y Yates, como tabla de F. Ejemplo de algunos valores de F con =
0.05, a la derecha del valor crtico:
1
2 1 2 3 4 El valor de 161 se obtiene as:
1 161 200 ... ... 1 = 1, 2 = 1, entonces Z= 2.5421
2 18.51 19 ... ... F = e2z = ( 2.7183)2( 2.5421) = ( 2.7183)5.0842 = 1
3 10.13 ..
4 7.71 .. F = 161

- El valor promedio de la distribucin de F es 1. El promedio es localizado a la


derecha de la moda (el valor donde la curva alcance su punto ms alto).
Estadstica Aplicada a la Educacin - 211 -
Manejo de las Tablas de "F"

F ,1 ,2
G.L. del denominador 2do.
G.L. del numerador 1.
V a l o r d e para determinar el valor crtico

A. Area bajo la Curva a la Derecha:.

1. Encontrar : F0.05,5,8 = 3.687


2. Encontrar: F0.05,8,5 = 4.818

Nota: Observar que el nmero de los grados de libertad asociado con el


numerador y denominador debe ser mantenido en correcto orden. Por lo
visto en los dos ejemplos dados 3.687 es completamente diferente de 4.818.

3. Encontrar y graficar:
F0.05,2,6 = 5.143
5%
F0.01,2,6 = 10.925
1%

4. Encontrar y graficar:
F0.05,10,15 = 2.544 0 5.143 10.925
F0.01,10,15 = 3.805

Aqu se ha podido preguntar: Qu valor de F tiene al 5% del rea a su


derecha, cuando
1 =10 y 2 = 15?
5%
F0.05,10,15= 2.544 1%

0 1 2 2.544 3 3.805 4

Rpta: Cuando 1 =10 y 2 = 15, el rea a la derecha de 2.544 es 0.05


tambin, la cola superior perteneciente a 2.544 es 0.05.
- 212 - V. Ibaez Q.
INTERPRETACIN: Se puede interpretar stos nmeros, como que si
1 = 10 y 2 = 15, la probabilidad de conseguir una proporcin o razn
de la variancia tan grande como 2.544 o ms grande que 2.544 es solamente
0.05 (5%), similarmente la probabilidad de lograr una razn de la variancia
tan grande como 3.805 o ms grande que 3.805 es solamente 0.01 cuando
1 = 10 y 2 = 15.

5. Encontrar y graficar: 5%
1%

F0.05,10,7 = 3.637
F0.01,10,7 = 6.620
0 3.637 6.620

Expresado en probabilidades:
p(0 < F < 3.637; si 1 = 10 y 2 = 7) = 0.05
p(0 < F < 6.62; si 1 = 10 y 2 = 7) = 0.01
p(3.637< F < 6.62; si 1 =10 y 2 = 7) = 0.04 4%.

B. Area Bajo la Curva a la Izquierda:

99%
1. Encontrar y graficar:
F0.99,10,15 = Aqu no hay en la tabla para
= 0.99, por consiguiente se har uso
de la propiedad 4 de F (1 - 0.99 =
1%

0.01, por consiguiente = 0.01). 0 0.219

1 1
F0.99 ,10 ,15 = = = 0.219
F0.01,15,10 4.558
2. Encontrar:
1 1 5% 5%
a) F0 .95 ,10 ,7 = = = 0.319
F0 .05,7 ,10 3135
.
1%
1%
1 1
b) F0 .99 ,10 ,7 = = = 0.192
F0 .01,7 ,10 5.20 0.192 0.319 3.637 6.620
Estadstica Aplicada a la Educacin - 213 -
Luego el procedimiento para hallar los puntos crticos del extremo izquierdo es:

a) Si F tiene 1 = numerador y 2 = denominador (grados de libertad), se hallan


los valores para F con a conocida Ejemplo = 0.05 = 0.01 del lado
derecho, pero F con los grados de libertad invertido; o sea la del denominador
( 2 ) va primero y la del numerador ( 1 ) va en segundo lugar:

Normal G.L. invertido Valor recproco

F0991012
. , , F0.01,12,10 1
2 1
1 2 F0.011210
, ,
1 - 0.99 = 0.01

b) Una vez obtenido el valor de F del rea bajo la curva de la derecha se toma el
valor recproco de dicho nmero, y se tiene el rea bajo la curva del lado
izquierdo, a alfa deseada

Ejemplo 3: Se tiene F, con una distribucin de F con 1 = 12, 2 = 20 con =


0.05
a) F0.05,12,20 = 2.278 (lado derecho)
b) F0.95,12,20 = 1/F0.05,20,12
5% 5%
= 1/2.544
= 0.393 (lado izquierdo)

0.393 2.278
- 214 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 215 -

9
INFERENCIA ESTADSTICA
9.1. ESTIMACION

Es una de las primeras reas generales de la inferencia estadstica, y la segunda


son las pruebas de hiptesis. La inferencia estadstica es un proceso por el cual se
llega a inferencias respecto a una poblacin, en base a resultados que se obtienen de
muestras tomadas de la poblacin en referencia. La diferencia de la estimacin con
una prueba de hiptesis, es que una estimacin en si, es una inferencia que se hace en
los primeros de un experimento, donde no hay mucha informacin disponible, con los
cuales se ofrece una aproximacin del parmetro correspondiente a la poblacin, de
la cual se extrajo la muestra; en cambio una prueba de hiptesis se realiza cuando se
dispone de mayor informacin de la situacin experimental.

Estimacin: Posible en los primeros estados de un experimento.

Inferencia
Estadstica

Prueba de Hiptesis: Requiere de alguna previa informacin experimental.

Tanto las estiamciones como las pruebas de hiptesis, requieren de muestras. Para
encontrar los estimados de parmetros desconocidos dos tipos de estimados hay:
- 216 - V. Ibaez Q.
A. Estimacin Puntual.

De una poblacin se puede obtener un sin nmero de muestras y de cada una


de ellas un valor prximo al parmetro desconocido de la poblacin; si usamos un solo
valor del conjunto de todos los posibles valores muestrales, el procedimiento recibe el
nombre de ESTIMACION PUNTUAL.

Procedimiento:
Sea un parmetro desconocido de una distribucin de variables aleatorias X:
1. De la distribucin de X, seleccionamos una muestra aleatoria de tamao n,
con valores x1 , x 2 , L , x n .
2. En base a los valores muestrales seleccionados, calculamos mediante algn
mtodo pre concebido un nmero como $ , el cual es un punto en la escala de
los nmeros reales (estimacin puntual).
3. $ se acepta como un estimador de .

En general, un estimador $ es un funcin de los n valores muestrales


independientes. Las estimaciones obtenidas de tal funcin varan de una muestra a
otra, de manera que $ es un estadstico con una distribucin muestral terica. En la
inferencia estadstica es conveniente trabajar con buenos estimadores, para
identificarlos se aplican cuatro propiedades o criterios.

Propiedades de un buen estimador.


a) CONSISTENCIA.- En general, un estimador consistente es el que tiende a
tener una mayor probabilidad de acercarse al parmetro de la poblacin a
medida que el tamao de la muestra crece. Esto es:
$ es un estimador consistente del parmetro si para todo nmero positivo
arbitrariamente pequeo se tiene:
P ( $ - ) 1, cuando n

Algunos estadgrafos como la media y varianza muestral son estimadores


consistentes puesto que tienden acercarse a los correspondientes valores de la
poblacin a medida que aumenta el tamao de la muestra. Cuando se usa una muestra
pequea, la consistencia tiene poca importancia, a menos que se alcance el lmite de
probabilidad que define la consistencia.
Estadstica Aplicada a la Educacin - 217 -
b) INSESGAMIENTO.- Un estimador es insesgado si su valor esperado es
idntico al parmetro de la poblacin que se estima. Esto es: Si $ es un estimador

insesgado de , entonces E($ ) = .


La media y proporcin muestral, la diferencia de medias y proporciones
muestrales son estimadores insesgados. Sin embargo, la varianza muestral es un
estimador sesgado de la varianza poblacional. El sesgo puede ser una funcin de las
observaciones muestrales y/o del parmetro o simplemente una constante:
Si E($ ) < entonces el sesgo es Negativo.

Si E($ ) > entonces el sesgo es Positivo.

Puede ocurrir que el estimador para muestras pequeas sea sesgado, pero para
muestras grandes se convierte en insesgado. Esto es:
Sea E($ ) = b, entonces, si n , E($ ) = .
Estos estimadores se denominan Asintticamente Insesgados. Por lo general,
se desea que el sesgo desaparezca en las muestras grandes. Si existe an un sesgo con
muestras grandes, se acostumbra eliminar el sesgo con un factor de correccin.

c) EFICACIA.- Si se utilizan dos estadgrafos como estimadores de un


parmetro, el ms eficaz es aquel cuya distribucin muestral tenga menor
desviacin estndar. Esto es: Un estimador $ 1 es ms eficiente que otro

estimador $ 2 para , si V($ 1 ) < V($ 2 ) , es decir $ 1 es estimador de


varianza mnima.

d) SUFICIENCIA.- Un estimador es suficiente si aporta tanta informacin como


sea posible acerca del parmetro contenido en la muestra, de modo que
cualquier otro estimador proporcione escasa informacin adicional. Ejemplo:
Se toma una muestra de 30 observaciones con el fin de estimar la media
poblacional ( ). Puede utilizarse como estimadores, el promedio de la
primera y onceava observacin o el promedio de las 10 primeras como
estimador de . Pero estos no son estimadores suficientes, porque no
contienen toda la informacin disponible de de la muestra. En cambio la media
muestral calculada con las 30 observaciones es estimador suficiente porque si
tiene en cuenta todas las observaciones al obtener el valor del estimador x .
- 218 - V. Ibaez Q.
B. ESTIMACION DE PARAMETROS POR INTERVALOS DE CONFIANZA

Definicin.- Un intervalo aleatorio, es un intervalo con lmites finitos infinitos,


donde por lo menos uno de los extremos es una variable aleatoria. En forma general,
un intervalo de confianza para el parmetro , se expresa en la forma siguiente:
i) Escoger una probabilidad (1 - ) cercano a 1.
ii) Encontrar dos nmeros $ 1 y $ 2 que dependan de los valores de la muestra de tal
manera que la probabilidad de que incluyan el valor desconocido del parmetro sea
igual a (1 - ).

P($ 1 $ 2 ) = 1 -
Donde $ 1 y $ 2 son funciones de las variables aleatorias X1, X2, ..., Xn, cuyos valores
son $ 1 y $ 2 que resulta al reemplazar en la funcin los valores x1, x2, ..., xn
Los extremos del intervalo < $ 1 , $ 2 > $1 $ 2 son variables aleatorias, por lo
que se llaman, intervalos aleatorios. Los extremos del intervalo < $ 1 , $ 2 > se llaman
lmites inferior y superior de confianza del 100(1 - )% para .
El nmero (1 - ) se llama el nivel de confianza, su eleccin depende del
investigador y sus valores ms utilizados son:
Si = 0.10 entonces 1 - 0.10 = 0.90
= 0.05 entonces 1 - 0.05 = 0.95
= 0.01 entonces 1 - 0.01 = 0.99
= 0.02 entonces 1 - 0.02 = 0.98
< $ 1 , $ 2 > = 0.95, es un intervalo de confianza del 95% de confianza para ; es
decir de las muestras que podemos obtener cerca del 95% producirn intervalos que
incluyan el valor ; mientras que el 5% no se encuentra.

9.2. INTERVALOS DE CONFIANZA PARA LA MEDIA CON VARIANZA


( ) CONOCIDA
2

Sea X1,X2,.....,Xn de una muestra aleatoria obtenida de una poblacin


normal con N( , 2 ) con media ( ) con varianza ( 2 ) conocida. Entonces
X ~ N( , 2 n) .
Estadstica Aplicada a la Educacin - 219 -

X -
Z = , es exactamente (o aproximadamente)
n
normal N(0,1), entonces Z es una cantidad pivotal

El Intervalo Confidencial (IC), estandarizado es::

P(X - Z n X + Z n ) = 1 -
14 422
443 14422 44 3
LI LS

Esto es, si X es estimador de , se tiene la probabilidad (1 - ) de que el


intervalo (aleatorio o estimador) X - Z
2
n , X + Z
2
n contenga al parmetro

. En resumen, un intervalo de confianza para , se construye en la prctica de la


siguiente manera:
1) Se extrae una muestra aleatoria de tamao n de la poblacin en estudio.
2) En base a la distribucin muestral de X se determina la cantidad pivotal.
3) Se selecciona un coeficiente de confianza (1 - ), obtenemos el valor apropiado
Z
de mediante el uso de la Tabla Z.
2

4) Se construye el intervalo de confianza, sumando y restando a X el valor de



Z . , esto es:
2 n

P(X - Z X + Z ) = 1 -
2
n 2
n
f (Z )

2 2
1

Z 0 Z Z
2 2
- 220 - V. Ibaez Q.
En el caso de poblacin finita (Muestreo sin reemplazo)

Cuando la poblacin es finita de tamao N y el tamao de la muestra constituye


ms del 5% del tamao de la poblacin, se debe usar el factor de correccin de
poblacin finita para modificar la desviacin estndar de las frmulas. El intervalo
confidencial (IC) para con coeficiente de confianza (1- ) esta dado por:
F N n N n I= 1 -
GH
P X - Z
2
n N 1
X + Z
2
n N 1 JK
Z2 2 2 N
n= , donde E = Z 2 N n
Z + E ( N 1)
2
2
2 2
n N 1
Si la muestra aleatoria de tamao n es escogida al azar sin reposicin de una
poblacin finita de tamao

9.3. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL ( )

CON VARIANZA POBLACIONAL ( ) DESCONOCIDA


2

1) Muestras grandes cuando n > 30 y la varianza poblacional es desconocida.

Sea X1,X2,.....,Xn de una muestra aleatoria extrada de una poblacin


N( , 2 ) con varianza 2 desconocida. Entonces X ~ N( , 2 n) . Si la
poblacin no es normal pero el tamao de la muestra es suficientemente grande
(n>30), se utiliza la desviacin estndar s de la muestra, como estimacin puntual
de la desviacin estndar ( ) de la poblacin. Entonces, utilizando el teorema
central del lmite, se concluye que el intervalo de confianza del (1- )x100% para
es:

X -
Z =
n
Donde: x = n se sustituye por el error estndar estimado $ x = s n .
Estadstica Aplicada a la Educacin - 221 -

X-
Z=
$ x = s n
Para encontrar el Intervalo Confidencial (IC), estandarizamos:
s s
P(X - Z . X + Z ) = 1 -
14243
2
n 144244
2
3n
LI LS

Cuando la poblacin es finita de tamao N y el tamao de la muestra constituye


ms del 55 del tamao de la poblacin, el intervalo de confianza con coeficiente de
confianza (1- ) para la media de una poblacin normal de varianza desconocida
es:

F s Nn s Nn I
GH
P X- Z .
2
n N 1
X + Z
2
n N 1
=1- JK
2) Muestras pequeas cuando (n 30) y la varianza poblacional es
desconocida.

Sea X1, X2,...,Xn una muestra aleatoria de tamao n escogida de una


poblacin normal N( , 2 ) donde la varianza ( 2 ) es desconocida y sean la media
y la varianza muestrales respectivas:
n
( Xi ) 2
cX h
n n n

X X
2
i i X 2
i i=1
n
X= i=1
, s =
2 i=1
= i=1
n n 1 n 1
El intervalo de confianza, se obtiene reemplazando en la frmula anterior Z por
2

el valor t
2
de la distribucin t-Student con (n -1) grados de libertad y por la
desviacin estndar de la muestra S. f (t )

X - 2 2
t =
S n 1

t 0 t t
,( n 1 ) ,( n1 )
2 2
- 222 - V. Ibaez Q.
El intervalo confidencial es el siguiente:

P(X- t ,( n1 ) S n X + t ,( n1) S n ) = 1 -
144 2
2443 144 4 2
2444 3
LI LS

[LI, LS] es un intervalo aleatorio que debe contener con 100(1- )% de nivel de
confianza; cuando la muestra es pequea, varianza desconocida y poblacin normal.
Muestras grandes darn intervalos de confianza de longitud ms cortas, por lo tanto
ms precisos.

Error de Estimacin y mximo Error de estimacin.

X -
Z 2 Z 2 , -Z X - Z
n 2
n 2
n


X - Z
123 2
n E = X- denominamos Error de Estimacin y
E= X -


E 0 = Z 2 es mximo Error de estimacin.
n
Con esta notacin, un IC para la media resulta: P(X - E 0 X + E 0 ) = 1 -
S
Donde: E0 = Z 2 E0 = t 2
n n
Tamao de Muestra.
FG IJ FG Z IJ 2

H K
2
E Z 2
n
n Z 2
E
n
H E K
F Z IJ
n=G
2
2
Z 2 2 2
H E K =
E2
Si el muestreo es con o sin reemplazamiento en una poblacin infinita (con
sustitucin en una poblacin finita de tamao N), la media poblacional de una
distribucin normal de varianza desconocida cuando las muestras son pequeas es:
F Nn Nn I
GH
P X - t ,( n 1) .
2
s
n N 1
X + t ,( n 1)
2
s
n N 1 JK = 1 -
Estadstica Aplicada a la Educacin - 223 -
EJEMPLO
Las calificaciones de 40 estudiantes sobre una prueba de aptitud son las siguientes:

27.8 33.5 28.4 44.6 35.0 48.8 19.2 32.5


43.0 16.9 27.2 25.5 35.0 40.6 11.8 0.2
28.7 43.6 19.8 34.1 13.4 38.6 3.9 13.5
19.1 24.7 21.0 0.6 11.8 32.0 33.4 3.5
45.7 9.7 39.5 15.4 17.0 16.4 27.9 31.0

a) Construir un IC del 95% para el verdadero prueba de aptitud.


b) Qu puede decirse con una probabilidad de 0.95 acerca del posible tamao del
error de estimacin, si el promedio muestral es usado para estimar el verdadero
aptitud de la prueba.

SOLUCION:
40

X i
27.8 + 43.0 + L + 3.53 + 31.0 1014.33
X= i=1
= = = 25.358
n 40 40

FG X IJ
40 2

40

X 2
i
H K
i=1
i

32390.8409
( 1014.33 )2
n 40
S2 = i=1
= = 1710053123
.
n 1 39
S = 13.0769 S = 13.0769
n = 40
1- = 1 - 0.05 = 0.95

FG 130769
. 130769
. IJ =0.95
H
P 25.358-(1.96)
40
25.358 + (1.96)
40 K
Pb21.305 29.41g = 0.95 (21.305,29.41)

Hay un 95% de confianza de que la media de poblacin de la prueba de aptitud,


est en un punto cualquiera comprendido entre 21.305 y 29.41 y un 5% estar fuera
de este intervalo. Tambin se puede decir, que de 100 intervalos aleatorios 95% de
stos contienen a , en tanto 5% no los contienen.
- 224 - V. Ibaez Q.
Como obtener los valores de Z.

ESTIMACION INTERVALICA:
Nivel de Confianza 0.0027 0.01 0.02 0.04 0.0455 0.05 0.1 0.2
1 99.73% 99% 98% 96% 95.45% 95% 90% 80%
Z 2 3.000 2.575 2.327 2.054 2.000 1.960 1.645 1.280

0.025 0.025
0 .95

P Z Z 2 = 0.95 + 0.025
Z = 1.96 0 Z = 1.96 Z

= 0.975 Z 2 = 1.96
2 2

Error de Estimacin.
13.0769
X - Z X - (1.96) , X - 4.0
n 2
40
Con una probabilidad de 0.95 de confianza, el error de estimacin no exceder a
4.0526, el mximo error de estimacin ser de 4.0526 el error de estimacin ser
menor o igual que 4.0526.

EJEMPLO
Un grupo escogido al azar de 50 estudiantes mujeres de un CENECAPE para
secretarias, aprenden taquigrafa por un mtodo nuevo. Al finalizar el ciclo se les
someti a una prueba de dictado y se encontr que en promedio escriban 120 palabras
por minuto con un desviacin tpica de 11 palabras. Cul es el intervalo de confianza
al 95% para el promedio de palabras por minuto que se obtendra si se aplicar este
nuevo mtodo a todas las alumnas del CENECAPE?.

SOLUCION:
FG IJ
n = 50, X = 120, S = 11, entonces el IC es.
H
P X Z 2
n
X + Z 2
nK= 1

FG 11 11 IJ
Como S entonces P 120 ( 196
. )
H 50
120 + ( 196
. )
50 K
= 0.95
Estadstica Aplicada a la Educacin - 225 -

Z0.05 2 = Z0.025 = 196


. (Tabla Z) , por consiguiente el IC. es:
b
P 116 .9509556 123.0490444 = 0 .95 g (117, 123)

Hay un 95% de confianza de que la media de poblacin se encuentre en el intervalo


117 y 123 en el dictado de palabras que escriben por minuto las secretarias de un
CENECAPE y un 5% estar fuera de este intervalo. Tambin se puede decir, que de
100 intervalos aleatorios 95% de stos contienen a , en tanto 5% no los contienen.

EJEMPLO.
Una muestra aleatoria de 25 calificaciones arroj una media de 15 puntos con una
desviacin tpica de 3 puntos. Cul es el intervalo de confianza al 95% para estimar
la media de las calificaciones si se supone que la poblacin esta normalmente
distribuda?.

SOLUCION: como n es pequeo entonces:


n = 25 calificaciones Grados de libertad (g.l.) = n - 1 = 25 -1 = 24
X = 15 puntos, 1- = 1 - 0.05 = 0.95
S = 3 puntos

En la tabla t-Student se encuentra el valor de:


t 2,( n1) = t0.05 2,( 251) = t0.025,24g.l. = 2064
. , luego el intervalo confidencial es:

FG S S IJ
H
P X t 2 ,( n1 )
n
X + t 2 ,( n1 )
n K
= 1

FG 3 3 IJ
H
P 15 ( 2.064 )
25
15 ( 2.064 )
25 K
= 0.95

b g
P 13.76 16.24 = 0.95

Esto quiere decir que hay 95% de confinza, de que la media de la poblacin ( )
de calificaciones, est en un punto cualquiera dentro de los valores 13.76 puntos y
16.24 puntos y que si se hiciera un nuevo muestreo, el 95 % de todos los intervalos
que se podran lograr en la forma descrita, incluiran a la media de la poblacin ( ).
- 226 - V. Ibaez Q.
9.4. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS
MEDIAS ( 1 2 ), CONOCIDA AMBAS VARIANZAS

Sean X1,X2,.....,Xn1 de una muestra aleatoria extrada de una poblacin


N( 1 ,12 ) y Y1,Y2,.....,Yn2 otra muestra aleatoria extrada de una poblacin
N( 2 ,22 ) .

Poblacin 1 ( N1 ) Poblacin 2 ( N2 )
n1 n2
Parmetros Parmetros
x1 y1
1 2
X1 x2 X2 y2
2
1 S12 M 22 S22 M
xn1 yn2

Deseamos comparar las medias de las dos poblaciones 1 y 2

n1 n2

Xi Y i
El estimador de: 1 es X1 = i=1 , 2 es X2 = i=1

n1 n2

( Xi ) 2 ( Yi ) 2
X2i n1
Yi2 n2
El estimador de. 12 es S12 = , 22 es S22 =
n1 1 n2 1

a) En consecuencia, si deseamos saber acerca de la diferencia ( 1 2 ) , lo

comparamos por intermedio de su estimador (X 1 X 2 ) . Si X1 y X2 son las medias


Estadstica Aplicada a la Educacin - 227 -
de las muestras y si n1 y n2 son mayores que 30, se puede establecer un intervalo de
confianza para ( 1 2 ) considerando la distribucin muestral (X 1 X 2 ) , la
estadstica es:
X1 X 2 ( 1 2 )
Z= ~ N(0,1)
12 22
+
n1 n 2
es normal estndar si X e Y son normales o aproximadamente normales estndar
si se aplican las condiciones del teorema central del lmite.
P(-Z Z Z ) = 1 -
2 2

F I
GPG X X -Z + X X +Z + JJ = 1 -
2
1
2
2
2
1
2
2 es el
GH 144442444 n n J
1 2 1 2 1 2
n n
K
2 2

43 1 2
1444 424444 3 1 2
LI LS

intervalo de confianza del 100(1- )% para ( 1 2 ) .

EJEMPLO.
Un grupo de 50 estudiantes de la UNA realizan un trabajo y obtuvieron los
siguientes resultados: X1 = 89, desviacin estndar de 7. Otro grupo de 60
estudiantes de la UANCV realizan el mismo trabajo y obtuvieron un promedio de
X2 = 87 y desviacin estndar de 5.

a) Construir un intervalo de confianza (IC) del 95% para la diferencia de medias


entre mediciones obtenidas por alumnos de la UNA y UANCV.

SOLUCION:
Datos:
X1 = 89 X2 = 87 1- = 1 - 0.05 = 0.95

n1 = 50 n2 = 60 Z0.05 2 = Z0.025 = 196


. (Tabla Z)
S1 = 7 S2 = 5

Reemplazando en la frmula tenemos:


- 228 - V. Ibaez Q.

F I = 0.95
GH
P 89 87 - (1.96)
49 25
+
50 60
1 2 89 87 + (1.96)
49 25
+
50 60 JK
b
P -0.316340792 1 2 4.31634 = 0.95 g
Hay 95% de confianza que la diferencia verdadera de ( 1 2 ) , est en algn
punto comprendido entre -0.316, 4.316 mediciones, y que al repetir el experimento,
el 95% de los intervalos construdos, incluirn a la diferencia verdadera de las medias
de poblacin.

b) Obtener un IC del 95% para la suma de medias de las mediciones obtenidas


conjuntamente por ambos grupos de alumnos.
F I = 0.95
GH
P 89 + 87 -(1.96)
49 25
+ 1 + 2 89 + 87 + (1.96)
50 60
49 25
+
50 60 JK
b
P 173.683659 1 + 2 178.3163408 = 0.95 g
FG Z IJ c
2
h
n=
HEK + 22
2
Tamao de muestra: 1

EJEMPLO.
Un pedagogo investigador opina que la cantidad de informacin que requiere un
Director de Escuela depende del tipo de escuela y zona donde opera. Suponga que en
un muestra de n1 = 35 escuelas de la zona 14, cuyos Directores fueron entrevistados
el nmero promedio de informes recibidos durante un trimestre fue de 6 con una
desviacin estndar de 1.8, mientras que en otra muestra de n2 = 36 escuelas de otra
zona el promedio de informes recibidos en el trimestre fue de 4 con una desviacin
estndar o tpica de 1.4. Sugiere estos datos que el nmero promedio de informes
recibidos por los Directores de estas dos zonas es diferente?. Use = 5%.

SOLUCION.
X1 = 6 X2 = 4 1- = 1 - 0.05 = 0.95

n1 = 35 n2 = 36 Z0.05 2 = Z0.025 = 196


. (Tabla Z)
S1 = 1.8 S2 = 1.4

Reemplazando en la frmula tenemos:


Estadstica Aplicada a la Educacin - 229 -

F I
GH
P 6 - 4 - (1.96)
. 2 14
18
35
+
. 2
36
1 2 6 - 4 + (1.96)
. 2 14
18
35
+
. 2
36 JK = 0.95

b
P 1.2484808 1 2 2.75151592 = 0.95 g
b g
P 1 1 2 3 = 0.95

9.5. INTERVALO DE CONFIANZA SOBRE LA DIFERENCIA EN MEDIAS


DE DOS POBLACIONES NORMALES CON VARIANZAS
POBLACIONALES 12 y 22 DESCONOCIDAS.

Sean X1,X2,.....,Xn1 de una muestra aleatoria extrada de una poblacin


N( 1 ,12 ) y Y1,Y2,.....,Yn2 otra muestra aleatoria extrada de una poblacin
N( 2 ,22 ) , donde 1 , 2 y 12 y 22 son desconocidas. Entonces, los
estimadores muestrales se calculan a partir de los datos, con los siguientes
estimadores:
n1 n2

Xi Y i
1 es X1 = i=1 , 2 es X2 = i=1

n1 n2

( Xi ) 2 ( Yi ) 2
X 2
i
n1
Y i
2

n2
12 es S12 = , 22 es S 22 =
n1 1 n2 1
En este caso, cuando las medias y varianzas son desconocidas se pueden
presentarse tres casos, muy importantes a saber.

CASO I: Tamaos muestrales pequeos ( n1 + n2 30 ) y varianzas

12 = 22 =
2
poblacionales desconocidas, pero iguales

Se toman muestras aleatorias de tamao n1 y n2 de X e Y, respectivamente;


denotnse con X1 y X2 las medias de muestras y con S12 y S22 las varianzas de
S12 y S22 son estimaciones de la varianza comn , podemos
2
muestra. Puesto que
- 230 - V. Ibaez Q.

obtener un estimador confinado o amalgamado de como:


2

( n1 1 )S12 + ( n2 1 )S22 , entonces es un estimador puntual de la varianza


S P2 =
n1 + n2 2

comn
2
desconocida. Para desarrollar el Intervalo confidencial (IC) para
( 1 2 ) , ntese que la distribucin de la estadstica es:
X1 X2 ( 1 2 )
t=
F1 1I
S G + J
~ t (n1 + n2 2 )g.l.

Hn n K
2
P
1 2

Por consiguiente el intervalo confidencial ser de la siguiente forma:


P(-t ,( n1 +n2 2 ) t t ,( n1 +n2 2 ) ) = 1 -
2 2

Por tanto, un intervalo de confianza de dos lados del 100(1- )% relativo a las
diferencias en las medias ( 1 2 ) es:

F I
GH
P X1 X2 -t,n1+n22 SP
2
1 1 1 1
+ 1 2 X1 X2 + t,n1+n22SP +
n1 n2 2
n1 n2
=1- JK
Un intervalo confidencial inferior de un lado del 100(1- )% en ( 1 2 ) es:

1 1
X1 X2 - t ,n1 +n2 2 S P + 1 2
2
n1 n 2

Un intervalo confidencial superior de un lado del 100(1- )% en ( 1 2 ) es:

1 1
1 2 X1 X2 + t ,n1 +n2 2 S P +
2
n1 n 2

f (t )

2 2
1

t 0 t t
,( n1 + n2 2 ) ,( n1 + n2 2 )
2 2
Estadstica Aplicada a la Educacin - 231 -

EJEMPLO.

Se estudia el contenido de nicotina en los cigarrillos de dos marcas A y B,


obtenindose los siguientes resultados: A: 17, 20, 20, 23 y B: 18, 20, 21, 22, 24; con
= 0.05. Encontrar el intervalo confidencial al 95%.

SOLUCION: Como n A + n B 30, 4 + 5 30 , entonces se usa distribucin t-


Student.
4

X i
80 X2i nX2 = 1618 4( 20)2 = 18 = 6
= 20 , SA =
2
Para la Marca A. XA = i=1
=
4 4 n-1 3 3
5

Y i
105 Yi2 nY2 = 22255(21)2 = 20 = 50. ,
Para la Marca B XB = = = 21, SB =
i=1 2

5 5 n-1 4 4

t 2 ,( n A +nB 2 ) = t 0.025,(4+5-2) = t 0.025,7 = 2.365 (Se obtiene de la t)

Entonces, se tiene la informacin siguiente:


XA = 20 XB = 21 1- = 1 - 0.05 = 0.95
nA = 4 nB = 5 nA - 1 = 4 - 1 = 3 g.l.
2 2
S =6 A S =5B
nB - 1 = 5 - 1 = 4 g.l.

Luego el intervalo de confianza es el siguiente:


F FG 1 + 1 IJ X X +t FG 1 + 1IJIJ = 1 -
GH
P XA XB -t,n1+n22 S2P
2
Hn n K
A B
A B A B ,n +n 2
2 1 2
S2P
H n n KK
1 2

F FG IJ
3(6)+(4)(5) 1 1 3(6)+(4)(5) 1 1 FG IJIJ =0.95
GH
P (20-21)-(2.365)
7 H K
+ A B (20-21)+(2.365)
4 5 7
+
4 5 H KK
b
P -2.69641037 A B 4.69641037 = 0.95 g
Comprobando, si las varianzas son homogneas o no.
- 232 - V. Ibaez Q.

F = F0.025,(4,3) = 15101
. F0.95,(3,4) = 6.591
,( n2 1,n1 1 )
2

1 1 1
F = = = 0066
. ; F0.05,(4,3) = = 01097
.
1 ,( n2 1,n1 1 ) F0.025,(4,3) 15101
. 9.117
2

Luego el Intervalo Confidencial para 12 22 es:

LM 6 . 1 2
6
.
1
= 0.95
OP
N 5 6.591 Q
1
P 2
2 5 0.1097

LM
P 0 .182
12 OP
10 .939 = 0 .95 , entonces el intervalo cubre a 1, por
N 22 Q
12 = 22 =
2
consiguiente se cumple que

CASO II: Tamaos muestrales pequeos ( n1 + n2 30 ) y varianzas

poblacionales desconocidas y 12 22 .
En muchas situaciones no es razonable suponer que 12 = 22 . Cuando esta
suposicin es injustificada, an sera posible encontrar un intervalo de confianza de
100(1- )% en ( 1 2 ) empleando el hecho de que la estadstica es:

FG S + S IJ2 2 2

Hn n K
1 2
X1 X 2 ( 1 2 )
t* = , donde v = 2
FG S IJ FG S IJ
2 2
~ t (v) 1 2
2 2
2
S S 2
+
H n K Hn K
1 2
1 2
n1 n 2
1
+ 2

n1 + 1 n2 + 1

Entonces: P(-t t * t ) = 1 -
,v ,v 2 2
Estadstica Aplicada a la Educacin - 233 -

F I
GH
P X1 X2 t,v
2
S12 S22 S2 S2
+ 1 2 X1 X2 +t,v 1 + 2 = 1 -
n1 n2 2
n1 n2 JK
f (t )

2 2
1

t 0 t t
,v ,v
2 2

EJEMPLO.
Un fabricante de radio est desarrollando un nuevo modelo de radio y para este fin
se pueden utilizar dos tipos de esquemas transistorizados. El fabricante selecciona
una muestra de esquemas transistorizados del primer tipo de tamao 13 y otra del
segundo tipo de tamao 15. Los datos muestrales respecto a la vida de cada esquema
son los siguientes:
X1 = 1400 h, S1 = 30 h, n1 =13

X2 = 1500 h, S2 = 17 h, n2 =15

Construir un intervalo de confianza del 90% para la diferencia de vida media de


cada tipo de esquema.

SOLUCION:
Primeramente vamos a probar si las varianzas son homogneas o no.
n1 + n2 30 , entonces 13 + 15 30, 28 30 .
1- = 1 - 0.10 = 0.90, /2 = 0.10/2 = 0.05, n1 - 1 =13 -1 =12, n2 - 1 =15 -1 =14

F = F0.05,(14,12 = 2.637
,( n2 1,n1 1 )
2

1 1 1
F = = = = 0394632991
.
1 ,( n2 1,n1 1) F0.05,(n11,n2 1) F0.05,(12,14) .
2534
2
- 234 - V. Ibaez Q.

Luego el Intervalo Confidencial para 12 22 es:


LM
12 OP
8.2121 = 0.90 , como el intervalo no cubre el punto 1,
N Q
P 122896087
.
22

entonces las varianzas poblacionales son distintas o heterogneas, es decir 12 22 .


El intervalo de confianza del 90% para ( 1 2 ) es el siguiente:

F I
GH
P X1 X 2 t ,v
2
S12 S 22
+
n1 n 2
S2 S2
1 2 X1 X2 + t ,v 1 + 2
2
n1 n 2 JK = 1 -

FG S + S IJ
2 2
2
FG 900 + 289 IJ 2

Pero v = H n n K H 13 15 K
1 2

783179616
.
2= 2 = 2 = 19.42 ~ 19
FG S IJ FG S IJ FG 900IJ FG 289 IJ
1 2
2 2 2 2
2 2 365.5502355
Hn K Hn K
1

1
+
2

2
H 13 K + H 15 K
n1 + 1 n2 + 1 14 16

Entonces t 2 ,v = t 0.10 2, 19 = t 0.05,19 = 1729


. , este valor se encuentra en la
Tabla de t-Student.
Por tanto, el intervalo de confianza del 90% para ( 1 2 ) es:
b
P -116.265234 1 2 - 83.7347652 = 0.90 g
CASO III: Tamaos muestrales grandes ( n1 + n2 > 30 ) y varianzas
poblacionales desconocidas.
En este caso la estadstica t = X1 X2 tiene distribucin aproximadamente

FG 2
normal, esto es X1 X2 ~ N 1 2 , S1 + S2 , entonces el estadstico es:
2
IJ
H n1 n2 K
X1 X2 ( 1 2 )
Z= ~ N(0,1)
S12 S22
+
n1 n 2

P(-Z Z Z ) = 1 -
2 2
Estadstica Aplicada a la Educacin - 235 -

F I
GH
P X1 X2 -Z
2
S12 S22 S2 S2
+ 1 2 X1 X2 +Z 1 + 2 = 1 -
n1 n2 2
n1 n2 JK
es el intervalo de confianza del 100(1- )% para ( 1 2 )

9.6. INTERVALO DE CONFIANZA SOBRE ( 1 2 ) PARA OBSERVA-


CIONES EN PARES (pareados, emparejados).

Un procedimiento comnmente utilizado que da como resultado dos muestras


no independientes es el denominado prueba antes y despus. Las mediciones se
hacen sobre la muestra de sujetos tanto antes como despus de la introduccin de
algn fenmeno, es decir hay dos mediciones en la misma unidad experimental, las
dos mediciones dentro del mismo par pueden no ser independientes.
Ejemplos: Frecuencia respiratoria de un atleta antes de correr y despus de
realizado la carrera, el peso vivo (kg) de animales antes del destete y despus del
destete, etc.
Sean X1,X2,.....,Xn1 de una muestra aleatoria extrada de una poblacin
N( 1 ,12 ) e Y1,Y2,.....,Yn2 otra muestra aleatoria extrada de una poblacin
N( 2 ,22 ) , de modo que las observaciones estn emparejadas, estoes, la muestra
est formado por los pares: (X1,Y1), (X2,Y2), (X3,Y3), ....., (Xn,Yn). Considernse
las n diferencias D1 = X1 -Y1, D2 = X2 -Y2, ...... , Dn = Xn -Yn. En estas condiciones
la media de las diferencias D, es D es:

D = E ( D ) = E ( X Y ) = E ( X ) E ( Y ) = 1 2 , D ~ N
Cov(X,Y)
2D = V ( D ) = 12 + 22 21 2 , = 0
1 2
La media y la varianza de la muestra de n diferencias D1,D2, ...., Dn esta dada
por:

Di
n

D2i
d D i i
cD
n

i D h 2

n
D= i=1
, S2D = i=1
= i =1
n n 1 n 1
- 236 - V. Ibaez Q.

D ~ N( D , 2D n) , cuando hallamos un estimador de la diferencia entre


dos medias poblacionales ( D = 1 2 ) se pueden presentarse dos casos:

CASO I: TAMAO MUESTRAL PEQUEO ( n 30 ).

D - D
La estadstica de prueba es: t= ~ t (n-1)
SD n

P -t ,( n 1 ) t t ,( n 1 ) = 1 -
2 2

El intervalo de confianza del 100(1- )% en ( D = 1 2 ) es:

LM
P D t ,( n1)
SD S
D D + t ,( n1) D = 1 -
OP
N 2
n 2
n Q
CASO II: TAMAO MUESTRAL GRANDE ( n > 30 ).

Cuando n>30, la distribucin de t de Student se aprxima a la


distribucin N(0,1). El intervalo confidencial para ( D = 1 2 ) con coeficiente
de confianza 1- esta dado por:

D- D
Z= ~ N(0,1)
SD n

P -Z Z Z = 1 - , El intervalo confidencial es el siguiente:


2 2

LM SD
D D - Z
SD OP = 1 -
N
P D + Z
2
n 2
n Q
LM SD S
D D + Z D
OP = 1 -
N
P D - Z
2
n 2
n Q
Estadstica Aplicada a la Educacin - 237 -
EJEMPLO.
Veinte estudiantes de Educacin fueron divididas en 10 parejas, teniendo cada
miembro de la pareja aproximadamente el mismo cociente de inteligencia. Uno de
cada pareja se selecciona al azar y se asigna a una seccin que utiliza videos. El otro
miembro se asigna a una seccin que cuenta con profesor. Al finalizar el ciclo ambos
grupos se presentan al mismo examen, obtenindose los resultados siguientes:

2
Pareja Con video (V) Con profesor (P) D = V- P D
1 15 16 -1 1
2 12 10 2 4
3 17 17 0 0
4 11 14 -3 9
5 18 17 1 1
6 15 16 -1 1
7 16 18 -2 4
8 13 12 1 1
9 14 15 -1 1
10 10 11 -1 1
Total 141 146 -5 23

Suponiendo que la caracterstica en estudio es normal, obtener el intervalo de


confianza del 95% para la diferencia real en el promedio de calificaciones de los dos
procedimientos de enseanza.

SOLUCION:

2
Pareja Co n v id eo (V) Co n p ro fes o r (P) D = V-P D
1 15 16 -1 1
2 12 10 2 4
3 17 17 0 0
4 11 14 -3 9
5 18 17 1 1
6 15 16 -1 1
7 16 18 -2 4
8 13 12 1 1
9 14 15 -1 1
10 10 11 -1 1
To tal V= 141 P = 146 D =i -5 D 2
i = 23

Obteniendo los promedios de cada grupo:


- 238 - V. Ibaez Q.

10 10

V i
141
P i
146
XV = i=1
= = 14.1 , XP = i=1
= = 14.6 ,
n 10 n 10

D = XV XP = 141
. 146
. = 05
.
n

D i
( 1 ) + ( 2 )+L+( 1 ) + ( 1 ) 5
Otra forma: D= i=1
= = = 0.5
n 10 10


n
D 2
i
d Di i 23
(-5 ) 2
S 2D = i=1 n
= 1 0 = 2 0 .5 = 2 .2 7 8
n 1 9 9
SD = 1.509230856
t 2 ,( n1 ) = t 0.05 2 ,( 101 ) = t 0.025,9 = 2.262 (Se obtiene de la tabla de t-Student).
D0 0.5
tD = = = 104764
.
SD n 150923085
. 10

Calculando el intervalo de confianza de 95% se tiene:


LM
P -0.5 (2.262)
1.509230856
D 05
. + (2.262)
1.509230856 OP
N 10 10
= 0.95
Q
P -1.5795637 D 0.579563708 = 0.95

9.7. INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA


POBLACION NORMAL.

Suponga que X se distribuye normalmente con media desconocida y varianza

2 desconocida. Sea X1,X2,.....,Xn una muestra aleatoria de tamao n y S la


varianza de muestra, se tiene:

(n -1)S2
=
2
~ (n-1)
2
, es Ji-cuadrada con (n-1) grados de libertad (g.l).
2
Estadstica Aplicada a la Educacin - 239 -

(n -1)
(X i X) 2
X 2

( X i ) 2
i
= n -1 n =
2
2
Para desarrollar el intervalo de confianza (IC), partimos de la siguiente forma:

P 2
LM 2 2
OP = 1
N
1 ,( n 1 )
2 2
,( n 1 )
Q
El intervalo de confianza de dos lados del 100(1- )% en 2 es:

LM (n -1)S OP
PM PP
2
(n -1)S 2
22
= 1 (mtodo de dos colas)
MN
2

1 ,( n 1 )
2 2
,( n 1 )
Q
Si el grado de libertad n de una distribucin es mayor que 30, esto es n>30, se
usar las siguientes aproximaciones para calcular:
2 y 2
,( n 1 ) 1 ,( n 1 )
2 2

2 1 LM
= Z + 2n 1 ,
OP 2

2 1 LM
= -Z + 2n 1
OP 2


2
,( n 1 ) 2 2 N Q
1 ,( n 1 )
2 2 N
2 Q
Donde Z 2 es la abscisa de una distribucin N(0,1) que deja a su derecha un rea
que representa una probabilidad igual a 2 .

9.8. INTERVALO DE CONFIANZA PARA LA RAZON DE DOS VARIANZAS


DE DOS DISTRIBUCIONES NORMALES.

Sean X e Y son variables aleatorias normales con medias 1 y 2 desconocidas

y varianzas 12 y 22 desconocidas, respectivamente. Deseamos encontrar un


intervalo de confianza del 100(1- )% respecto al cociente 12 22 . Sean dos
muestras aleatorias de tamaos n1 y n2 tomadas de X e Y, y sea que S12 y S 22 denotan
- 240 - V. Ibaez Q.
las varianzas de las muetras. Para determinar el intervalo de confianza, notamos que
la distribucin de muestreo de:
( Xi )2
S12 12 X 2

F = 2 2 ~ F(n1 1, n 2 1) , donde 12 es estimado por S12 =
i
n1 ,
S2 2 n1 1

( Yi ) 2
Y i
2

n2
22 es estimador por S22 =
n2 1

Es F con ( n1 -1) y (n2 - 1) grados de libertad.

Cuando dos varianzas poblacionales 12 y 22 son iguales, su razn es igual a 1.


Entonces el intervalo confidencial de F ser:

LMS 12 S12
OP
PM PP = 1
2
1 1
1
. 2 2
MNS 2 S2 F
2

Q
2 F
1 ,( n1 1,n2 1 ) ,( n1 1,n2 1 )
2 2

1
F =
Pero: ,( n 1 1 , n 2 1 ) F
2
,( n 2 1 ,n 1 1 )
2

Por tanto, el intervalo de confianza de 100(1- )% para la razn de 12 22 es:

LMS 2
2 S2
OP
PM PP = 1
1 1
1
. 12 12
MNS 2 S2 F
2

Q
2 F
1 ,( n1 1,n2 1 ) ,( n1 1,n2 1 )
2 2

EJEMPLO.
Se dividi en dos grupos una clase de Estadstica Inferencial II de 40 alumnos.
Cada grupo utiliz durante un ciclo un mtodo de enseanza diferente. Al final del
ciclo los alumnos se sometieron a una misma prueba de rendimiento obtenindose los
siguientes resultados: n1 =19, S12 =280, n2 =21, S22 =200. Suponer que los datos
Estadstica Aplicada a la Educacin - 241 -
constituyen muestras aleatorias independientes extradas de poblaciones
normalmente distribuidas. Puede afirmarse que las varianzas poblacionales son
iguales?. Use = 0.10.

SOLUCION.
1 - =1 - 0.10 = 0.90, =0.10, 2 = 0.10/2 = 0.05.
n1 - 1 =19 - 1 = 18
n2 - 1 =21 - 1 = 20 entonces: F ,( n 1,n 1 ) = F0.05,(18,20) = 2.15 F0.90,(18,20) = 1811
.
2 1 2

1 1
F1 ,( n 2 1,n1 1 ) = = = 0.456621004; F0.10,(20,18) = 0.55208
2
F0.05,(20,18) 2.19

Por tanto, el intervalo de confianza 100(1- )% para 12 22 es.


LM 280 1 2

280 1 OP
= 0 .90 ,
N 200 1.811 Q
1
P 2
2 200 0.552

LM
P 0.773
12 OP
2.535 = 0.90
N 22 Q
(0.773, 2.535), como el intervalo cubre el punto uno, esto es, 1 (0.773, 2.535),
entonces podemos afirmar de que presumiblemente las varianzas sean iguales.

EJEMPLO.
Dos secciones de una clase de matemticas de una Universidad con 25 estudiantes
cada una, hicieron el mismo examen. La seccin N 1, obtuvo una calificacin media
de 7.2 con una desviacin tpica de 0.9; en la seccin N 2, la media fue de 8.2, con
una desviacin tpica de 0.5. Encuentre el Intervalo de confianza al 95% para la
calificacin promedio de notas?.

SOLUCION:
X1 = 7.2 S1 = 0.9 n1 =25,
X 2 = 8.2 S2 = 0.5 n2 =25
- 242 - V. Ibaez Q.

( n1 1 )S12 + ( n2 1 )S22 (24)(0.81) + (24)(0.25)


S2P = = = 0.53
n1 + n2 2 48

t 2 ,(n1 + n 2 2 ) = t 0.05 2,22 = t 0.025,48 = 2.014 , El intervalo de confianza del 95%


para ( 1 2 ) es:

F I
GH
P (-1) - (2.014)
2(0.53)
25
1 2 (-1) + (2.014)
2(0.53)
25 JK = 0.95

b
P -1.4147 1 2 0.585292 = 0.95 g
9.9. INTERVALO DE CONFIANZA PARA UNA PROPORCION
POBLACIONAL

Sean X1,X2,.....,Xn una muestra aleatoria extrada de una poblacin Bernoulli


de parmetro P.
N

X i
X Nmero de casos favorables
Parmetro: P = i =1
= =
N N N
n

x i
x Nmero de xitos en la muestra
Estimador: p$ = i =1
= =
n n n
Donde p$ es el estimador puntual de la proporcin de la poblacin que pertenece
LM PQ OP
a esta clase, p$ ~ N P, n .
N Q
a) El intervalo de confianza para P en el caso de muestras grandes (n > 30).
Cuando n es suficientemente grande, la distribucin es:
p$ - P
Z= ~ N ( 0,1 ) es aproximadamente normal estndar.
$ p)
p(1- $
n
Para construir el intervalo de confianza en P, se tiene:
P(-Z Z Z ) = 1 -
2 2
Estadstica Aplicada a la Educacin - 243 -

LM $ $ O
$ P
PMp-Z P =1-
p(1- p) $ p)
p(1-
$ P p+Z
$
MN144244 n 3P

n3 144244
Q
2 2

LI LS

Por tanto, el Intervalo de Confianza del 100(1- )% para el parmetro P es


aproximadamente dado por:

LM
P p$ Z
$ p)
p(1- $ OP
N 2
n Q
OBSERVACION: Cuando el muestreo es sin reemplazamiento en una poblacin
finita de tamao N y el tamao de la muestra constituye ms de 5% del tamao de la
poblacin, resulta adecuado usar el factor de correccin por poblacin finita.
Entonces el intervalo de confianza 100(1- )% para el parmetro P, esta dado por:

LM $ $ N-n
p(1-p) FG IJ $ $ N-n
p(1-p) FG IJ OP = 1 -
$
MN
P p-Z
2
n N-1 H K
P p+
$ Z
2
n N-1 H K PQ
OBSERVACION: Si se utiliza p$ como estimador de P, se puede tener una
confianza de (1- ) de que el error de estimacin sea menor que una cantidad
especificada e, cuando el tamao de la muestra es dado por:
$$
Z 2 2 pq
n= , q$ = 1- p$
e2
Cuando la poblacin es finita de tamao N, se puede tener una confianza de (1- )
de que el error de estimacin sea menor que una cantidad especificada e.
$ p)N
Z2 2 p(1- $
n= 2
$ $ + e (N -1)
Z 2 pq 2

OBSERVACION: Como 0 < p$ < 1 y 0 < 1- p$ < 1 , entonces se tiene:

LM
P p$ -
Z
P p$ +
Z OP = 1 -
MN 4n PQ
2 2

4n
- 244 - V. Ibaez Q.

Z 2 2 F Z I 0.25
n=G
2

El tamao de la muestra esta dado por: n =


H e JK
2

4e 2
EJEMPLO.
El departamento de Oftalmologa de EsSalud, desea saber la proporcin de
estudiantes cuyo ojo derecho es el ojo dominante. Para ello se escogi una muestra de
400 estudiantes, habiendo encontrado que 280 estudiantes tienen el ojo derecho
dominante. Estime la proporcin de la poblacin total, cuyo ojo derecho es el
dominante por medio de un intervalo de confianza del 95%.

SOLUCION:
280
1- = 1 - 0.05 = 0.95, p$ =
400
= 0.7 , q$ = 1- p$ = 1- 0.7 = 0.3

Muestra: n = 400.

El valor de Z se encuentra en la Tabla de la siguiente manera:


Z 2 = Z0.05 2 = Z0.025 = 196
.

como P Z < Z 2 = 1 = 1 0.025 = 0.975 Z 2 = 196
.
2
Luego el intervalo de confianza del 95% se tiene:
LM (0.7)(0.3)
P 0.7 + (1.96)
(0.7)(0.3) OP = 0.95
N Q
P 0.7 - (1.96)
400 400

0.7 0.044909241
RS L = 0.7 0.044909241 = 0.6550
I

TL = 0.7 + 0.044909241 = 0.7449


S

Luego, P 0.655 P 07449


. = 0.95 0.655 P 0.7449

EJEMPLO.
Hay una poblacin que consiste de los 5 profesores del departamento de Lengua y
Literatura de la UNA. El estado civil de cada uno de ellos se da a continuacin:
Profesor Estado Civil
A Casado
B Soltera
C Casado
D Soltero
E Soltero
Estadstica Aplicada a la Educacin - 245 -
a) Determinar la proporcin de miembros casados de esta poblacin.
b) Seleccionar todas las muestras de 2 elementos de esta poblacin y calclese la
proporcin de miembros casados en cada muestra (Use la seleccin sin
reemplazamiento).
$ y la desviacin estndar
c) Calclese la Media E(p) p$ de las 10 proporciones
muestrales calculadas en b).

FG
$$ N n
pq IJ
d) Muestrse que: p$ =
H
n N 1 K
SOLUCION:
a) La proporcin de miembros casados de esta poblacin es: P = 2 = 0.40 . Es decir
5
el 40% de los profesores se casado.
FG IJ
b) El total de muestras de n = 2 miembros ser: 5 = C52 = 5! = 10 , tendremos 10
H 2K 2 ! 3!
muestras de tamao 2. Dichas muestras se presentan a continuacin:

$ es:
c) La media E(p)

Muestras posibles Proporcin muestral


n=2 p$ = x / n, x:0,1,2,.. N casados
1) (A,B) 1/2 = 0.50 = p$ 1
2) (A,C) 2/2 = 1.00 = p$ 2
3) (A,D) 1/2 = 0.50 = p$ 3 p$ 1 + p$ 2 +L+p$ 10
$ =
E(p)
4) (A,E) 1/2 = 0.50 = p$ 4 10
5) (B,C) 1/2 = 0.50 = p$ 5 05 . + 10 . + 05
. +L+05
. +0
=
6) (B,D) 0/2 = 0.00 = p$ 6 10
7) (B,E) 0/2 = 0.00 = p$ 7 4
p$ 8 = = 040 .
8) (C,D) 1/2 = 0.50 = 10
9) (C,E) 1/2 = 0.50 = p$ 9
10) (D,E) 0/2 = 0.00 = p$ 10

Por consiguiente cumple:

$ = P 0.40 = 0.40 .
E(p)
Ahora hallemos la desviacin estndar de la proporcin p$ es:
- 246 - V. Ibaez Q.

p$ =
p$ 2
d p$ i 2
n
=
c p$ - E p$ h
2

=
( 0.5 0.4 )2 +L+( 0.0 0.4 )2
n n 10

=
2 .5 4 bg 2
10
=
0.9
= 0.3
10 10
d) Este resultado debe coincidir con la frmula siguiente: Datos P = 0.4, Q = 0.6
n = 2, N = 5
PQ N n FG IJ
(0.40)(0.60) 5 2 FG IJ
p$ =
n N 1
=
H 2 51 K= 0.09 = 0.3
H K
9.10. INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS
PROPORCIONES POBLACIONALES.

La estimacin puntual de (P1 - P2) se obtiene, tomando una muestra 1 de la


poblacin Binomial 1 y una muestra 2 de la poblacin Binomial 2.

Poblacin Binomial 1 Poblacin Binomial 2

muestra 1 muestra 2
Parmetro x1 Parmetro y1
P1 P2
p$ 1 x2 p$ 2 y2
M M
xn yn

n1

x
n2

x1 +x2+L+xn i=1 x $ y1 + y2 +L+yn i=1 i y i y


p$1 = = = p2 = = =
n1 n1 n1 n2 n2 n2

x y
Entonces la diferencia es: p$ 1 p$ 2 = , as tenemos la estimacin puntual de
n1 n2

b g
(P1 - P2) es p$ 1 p$ 2 . Conceptualizamos de la siguiente manera:
Sean X1,X2,.....,Xn1 una muestra aleatoria extrada de una poblacin Binomial
B(n1, p1) y Y1,Y2,.....,Yn2 una muestra aleatoria extrada de una poblacin Binomial
Estadstica Aplicada a la Educacin - 247 -
B(n2, p2). Supomgamos que ambas poblaciones son independientes.

Denotacin de las proporciones muestrales de cada muestra:


n1

x i
x Nmero de xitos de la muestra 1
p$ 1 = i =1
= =
n1 n1 n1

n1

y
j =1
j
y Nmero de xitos de la muestra 2
p$ 2 = = =
n2 n2 n2

x y
Entonces p$ 1 = y p$ 2 = son estimadores independientes de P1 y P2,
n1 n2
respectivamente. Adems, bajo la suposicin de que se aplica la aproximacin normal
a la Binomial, la estadstica es:

Z=
p$ 1 p$ 2 P1 P2 b g ~ N(0,1), se distribuye aproximadamente
p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2

en forma normal estndar. q$ 1 = 1 p$ 1 y q$ 2 = 1 p


$ 2 , entonces se tiene:
P(-Z Z Z ) = 1 -
2 2

LMb g
P p$1 p$ 2 -Z
p$1q$1 p$ 2q$ 2
+ b g b g p$ q$ p$ q$
P1 P2 p$ 1 p$ 2 + Z 1 1 + 2 2
OP = 1 -
N 2
n1 n2 2
n1 n2 Q
Por tanto, el intervalo de confianza del (1- )100% para la diferencia de
proporciones (P1 - P2) esta dado aproximadamente por:

P1 P2
LMbp$ p$ g Z p$ 1q$ 1 p$ 2 q$ 2
+
OP
N 1 2
2
n1 n2 Q
EJEMPLO.
En la Facultad de Ciencias de la Educacin de la UNA, se desea determinar la
opinin de los estudiantes y profesores en relacin al calendario acadmico propuesto
para el ao siguiente. Una muestra aleatoria de 100 estudiantes y 50 profesores di los
siguientes resultados:
- 248 - V. Ibaez Q.

Opinin Estudiantes Profesores


Favorecen al Calendario Acadm. Propuesto 63 30
Se oponen al calendario 37 20
Hay prueba de una diferencia en la actitud hacia el calendario acadmico
propuesto entre los dos grupos?.

SOLUCION:
63 30
p$ 1 = = 0.63 y p$ 2 = = 0.6 , q$1 =10.63=0.37 y q$2 =1-06
. = 04
.
100 50
37 20
1- = 1 - 0.05 = 0.95 q$ 1 = =0.37 y q$ 2 = = 04
. ,
100 50
Z 2 = Z0.05 2 = Z0 .025 = 196
. (Se obtiene de la Tabla Z)

Por tanto, el intervalo de confianza de 95% para (P1 - P2) es:


LMb
P 0.6306 g (0.63)(0.37) (0.6)(0.4)
+ b g
P1 P2 0.6306
OP
(0.63)(0.37) (0.6)(0.4)
+
N Q
. -(1.96) . +(1.96) = 0.95
100 50 100 50

. 0165512687
P 003 . P1 P2 003
. +0165512687
. = 0.95 -0.1355 P1 P2 01955
.

Como el intervalo de confianza cubre el cero (-0.1355, 0.1955), entonces podemos


afirmar que no hay evidencia de una diferencia en la actitud hacia el calendario
acadmico propuesto entre los dos grupos en estudio.

9.11.DETERMINACION DEL TAMAO DE LA MUESTRA PARA


ESTIMAR PROMEDIOS DE LA POBLACION (n).

Uno de los objetivos de la investigacin es la inferencia estadstica, pero para


iniciar un trabajo de investigacin surge la interrogante de preguntarse. De qu
tamao debe ser la muestra a considerarse en el estudio?. De acuerdo a los estudios
realizados por diferentes autores indican que la muestra no debe de ser demasiado
grande, porque es costoso, se requiere tiempo y esfuerzo, ni tampoco pequea porque
se pierde la confiabilidad, producindose resultados falsos o sesgados. La muestra
debe ser de tamao adecuado. La ecuacin para determinar el tamao de muestra es:
Para poblacin infinita:
Estadstica Aplicada a la Educacin - 249 -

n0 =
dZ i S
2
2
2

donde:
2
n0 = Tamao de la muestra deseada.
Z 2 = Nivel de confianza que se desea tener (90%, 95% 99%).
S = Desviacin estndar de la muestra.
= Error admisible con respecto al promedio real de la poblacin.
Mientras mayor sea la variancia de la poblacin ( 2 ), mayor es el tamao de
la muestra, siempre que Z y permanezcan fijas. Si el muestreo se realiza en
poblaciones altamente variables, las muestras debern ser ms grandes, si es que se
quiere tener alta confianza en sus resultados estimativos, lo cual significa invertir ms
dinero, tiempo y ms esfuerzo. Intervalos estrechos de confianza (valores pequeos de
) necesitan muestras ms grandes; en la mayora de los casos prcticos, no se conoce
la variancia de la poblacin, por lo que es necesario hacer una estimacin de S2, el
mismo que es un buen estimador de 2 . Si se desconoce la variancia se puede estimar
por:
a. Tomando una muestra piloto o sondeo. Para sto se selecciona una muestra
piloto (sondeo) de la poblacin en estudio y as estimar S2.
b. Referencia de estudios previos. En estudios previos de temas similares se
puede encontrar alguna referencia de la S2. En estos casos es factible
utilizar variancias de las muestras de estudios previos o investigaciones
realizadas anteriormente para estimar 2 .
c. Revisin de literatura. En stas revisiones se puede descubrir que otros
investigadores reportan estudios similares al que se propone hacer y se
puede proporcionar estimaciones satisfactorios de la 2 .
d. Experiencia de investigadores. A veces se recurre a investigadores con
experiencia que puede sugerir variancias refentes al tema que se piensa
investigar.

EJEMPLO.
Se desea encontrar un tamao de muestra necesaria para estimar el peso promedio
de una poblacin de 1540 recin nacidos, con margen de confianza del 99% y un
error admisible de 90 gramos en relacin al promedio real de la poblacin.Un
estudio similar en recin nacidos encontraron una desviacin estndar de 500
gramos.
- 250 - V. Ibaez Q.

SOLUCION:
N = 1540 (poblacin finita)
n=?
S = 500 gramos
Z 2 = Z0.99 2 = Z0.495 Z = 2.58 (Este valor se encuentra en la Tabla Z)
= 90 gramos
n .
2054444
. )2 ( 500 )2
( 258 n= 0 = =1812636
.
n0 = = 2054444
. n
1+ 0 1+
.
2054444
902 N 1540
n = 182 nios.

El tamao de muestra necesaria para estimar el peso promedio de 1540 recin


nacidos, bajo las condiciones establecidas es de 182 nios. En el caso de que se
presentar muestras muy grandes y no hay disponibilidad de recursos, en la
prctica es conveniente para una desviacin estndar dada estimar varios tamaos
de muestra, para diferentes valores de Z (1.65, 1,96, 2.58) y error ( ), de modo
que se disponga de diferentes alternativas que permitan tomar una adecuada
muestra (n) y decisin que est de acuerdo a la disponibilidad de recursos.
Estadstica Aplicada a la Educacin - 251 -

10
PRUEBAS DE HIPOTESIS
Muchos problemas requieren decidir si se acepta o rechaza un enunciado acerca
de algn parmetro. El enunciado suele llamarse hiptesis, y el procedimiento de
toma de decisiones en torno a la hiptesis recibe el nombre de prueba de hiptesis.
Este es uno de los aspectos ms tiles de la inferencia estadstica, puesto que muchos
tipos de problemas de decisin pueden formularse como problemas de prueba de
hiptesis.

10.1. Hiptesis estadsticas.

Se denomina hiptesis estadstica a cualquier afirmacin o conjetura que se hace


acerca de la distribucin de una o ms ppoblaciones. La afirmacin o conjetura puede
referirse bien a la forma o tipo de distribucin de probabilidad de la poblacin o al
valor o valores de uno o ms parmetro de la distribucin conocida.

EJEMPLOS:
- Un agricultor de la sierra puede establecer la hiptesis de que la duracin
promedio de las lluvias es de 90 das.
- Un mdico puede conjeturar que la incidencia de diabetes en pacientes
femeninos es de 3%.
- Una enfermera puede hipotetizar de que un programa de educacin pre-
operatoria hace que el paciente entre en cierta confianza al quirfano.
- La proporcin de objetos defectuosos producidos por cierto proceso nunca es
superior al 8%.
- 252 - V. Ibaez Q.

Hiptesis Simple y Compuesta.


Se denomina hiptesis SIMPLE a cualquier hiptesis estadstica que especifica
completamente la distribucin de la poblacin.

EJEMPLO:
- El ingreso mensual promedio de los empleados de cierta ciudad es =S/. 500,
suponiendo que los ingresos mensuales se distribuyen segn la normal con =S/.
30.0 (ES UNA HIPTESIS SIMPLE). Si una hiptesis no especifica completamente
la distribucin de la poblacin, entonces es una HIPTESIS COMPUESTA.

EJEMPLO:
El ingreso promedio mensual es 500 <500 >500, con una =S/.
30 que se supone que se distribuye segn la normal, entonces la hiptesis referente a
la media es una hiptesis COMPUESTA.

10.2. HIPOTESIS NULA Y ALTERNATIVA

a. Hiptesis nula (H0). Se denomina hiptesis nula (H0:) a la hiptesis que es


aceptada provisionalmente como verdadera y cuya validez ser sometida a
comprobacin experimental, algunos autores consideran como la hiptesis de
ninguna diferencia.

EJEMPLO:
El rendimiento acadmico de estudiantes del grupo control (GC) y los
rendimientos de estudiantes del grupo experimental (GE) son similares:
H0: GC = GE (no hay diferencia en el rendimiento)

b. Hiptesis Alterna (Ha). Es por lo general la hiptesis que contradice a la H0:, en


algunos casos se representa por H1:, a la hiptesis que se acepta en caso de que la
hiptesis nula H0: sea rechazada, a esta hiptesis se llama como hiptesis de
investigacin.

EJEMPLO:
Ha: GC GE (Si hay diferencia en el rendimiento de los estudiantes)
Si se asume que 0 es un valor del parmetro desconocido de una poblacin
cuya distribucin se supone conocida, entonces son hiptesis nulas y alternativas,
Estadstica Aplicada a la Educacin - 253 -
respectivamente las siguientes afirmaciones:
1) H 0 : = 0 vs. H a : 0 (Prueba bilateral de dos colas)
2) H 0 : 0 vs. H a : > 0 (Prueba unilateral de cola a la derecha)
3) H 0 : 0 vs. H a : < 0 (Prueba unilateral de cola a la izquierda)

c. Prueba de una hiptesis. Para tomar decisiones estadsticas, se requieren de las


dos hiptesis: La hiptesis nula y la hiptesis alternativa referidas a un parmetro
. La prueba de una hiptesis estadstica es un proceso que nos conduce a tomar
la decisin de aceptar o rechazar la hiptesis nula H0, en contraposicin de la
hiptesis alternativa Ha. La aceptacin de una hiptesis significa que los datos de
la muestra no proporcionan evidencia suficiente para refutarla, en cambio el
rechazo de la hiptesis significa que los datos de la muestra lo refutan.

d. Tipos de prueba de hiptesis. El tipo de prueba depende bsicamente de la


hiptesis alternativa Ha:. Las hiptesis se plantearn de la siguiente forma:
Prueba de una cola, se denomina a toda prueba de hiptesis donde la alternativa
Ha,: es unilateral. Si la alternativa Ha: es bilateral, la prueba se denomina prueba
de dos colas.

ERRORES QUE SE PUEDE COMETER AL TOMAR UNA DECISION.

La decisin para aceptar o rechazar la hiptesis nula, se basa en una estadstica de


prueba calculada a partir de los datos en una muestra aleatoria. Cuando se toma una
decisin utilizando la informacin en una muestra aleatoria, esta decisin est sujeta
a error. Pueden producirse dos tipos de errores cuando se prueba hiptesis.
a) Error Tipo I: Es aquel que consiste en rechazar la hiptesis nula H0: siendo este
verdadero. En trminos de probabilidad es:
l q l
= P error tipo I = P rechazar H 0 H 0 es verdadera q
b) Error Tipo II: Es aquel que consiste en aceptar la hiptesis nula H0: siendo este
falso. En trminos de probabilidad es:
l q l
= P error tipo II = P aceptar H 0 H 0 es falsa q
Para una mejor visualizacin en forma esquemtica, se presenta en la tabla
siguiente:
- 254 - V. Ibaez Q.

Decisiones en la prueba de Hiptesis.


H0 es Verdadera H0 es falsa
Aceptacin de H0 Decisin Correcta Error del tipo II
Prob.: 1 - Prob.:
Rechazo de H0 Error del tipo I Decisin correcta
Prob: Prob: 1 -

La probabilidades de ocurrencia de los errores de tipo I y de tipo II tienen smbolos


especiales. Algunas veces es ms conveniente trabajar con la potencia de la prueba,
donde
l
Potencia = 1- = P rechazar H 0 H 0 es falsa q
Advirtase que la potencia de la prueba es la probabilidad de que una hiptesis
nula falsa se rechace correctamente. Debido a que los resultados de una prueba de
hiptesis estn sujetos a error, no podemos probar o desaprobar una hiptesis
estadstica. Sin embargo, es posible designar procedimientos de prueba que controlen
las probabilidades de error y a valores adecuadamente pequeos. La
probabilidad del error de tipo I a menudo se llama nivel o tamao de significacin
de la prueba. En general, la probabilidad del error de tipo I est controlada por la
localizacin de la regin crtica. Por consiguiente, suele ser sencillo en la prctica
para el analista fijar la probabilidad del error de tipo I en (o cerca de) cualquier valor
deseado. Puesto que la probabilidad de rechazar en forma errnea H0: est controlada
directamente por el que toma las decisiones, el rechazo de H0: simpre es una
conclusin fuerte.

La probabilidad del error de tipo II es tambin una funcin del tamao de la


muestra como del grado al que es falsa la hiptesis nula H0: es comn considerar a la
decisin de aceptar H0: como una conclusin dbil, a menos que sepamos que es
aceptablemente pequea. Por tanto, en vez de decir que aceptamos H0:, preferimos
la terminologa no se rechaza H0:. El no rechazar H0: implica que no hemos
encontrado la evidencia suficiente para rechazarla, esto es, para hacer un enunciado
fuerte. De tal modo, no rechazar H0: no necesariamente significa que hay una alta
probabilidad de que sea verdadera. Esto puede implicar que se requieran ms datos
Estadstica Aplicada a la Educacin - 255 -
para llegar a una conclusin fuerte. Lo anterior puede tener importantes
implicaciones para la formulacin de hiptesis.

En trabajos de investigacin al probar una hiptesis, se puede cometer dos tipos de


errores. El error tipo I, cuando se rechaza una hiptesis nula que es verdadera,
representando por y el error tipo II cuando se acepta una H0 que es falsa
representado por . El primer error por lo general est bajo el control del
investigador ( =0.05, 0.01).

Cmo se conoce, si se est cometindose el error tipo I o el II?. No se puede


saber. Como no se puede conocer los valores verdaderos de la poblacin, con raras
excepciones. Si no se conoce stos valores cmo se puede saber si los estadsticos
de la muestra se han aproximado o no al valor real del parmetro de la poblacin?
Porque si se conociera el valor del parmetro de la poblacin, se sabra cuando
cometemos o no un error, ya que se conociera los valores de la poblacin, la inferencia
estadstica dejara de existir.

Entonces, no se puede saber que experimentos dan resultados confiables y cules


no?. Si se puede saber, si se vuelve a repetir el experimento y si se obtiene resultados
parecidos al anterior, se tendr ms confianza de no estar cometiendo un error tipo I.
En experimentos con 5% de significacin, aproximadamente 1 de 20 estudios donde
se rechaza la H0. se comete un error tipo I. Si =0.001, el riesgo de cometer el error
tipo I es de 1 en 1000; sin embargo mientras menos error del tipo I se comete, hay
mayor riesgo de cometer el error tipo II.

Error Tipo II ( ). ( 0 = puede ser 1 , 2 , 3 ,etc).


H0: = 0 y la Ha: 0 , con = 0.05, donde la muestra se supone que est
normalmente distribuida con conocida.
2

Aqu la regin de rechazo, consta de todos los valores de x , iguales o mayores a


0 + 1.96( n ) e iguales o menores a 0 1.96( n ) . Si la H0 es falsa, la
distribucin de la muestra verdadera. Si = 1 , la distribucin de la muestra de la

x , queda centrada en 1 . La regin de rechazo y regin de aceptacin quedan


fijados por la Ha y .
- 256 - V. Ibaez Q.
Si el valor del promedio calculado de la muestra cae en la regin de aceptacin
cuando = 1 , entonces la H0 ser "aceptada", cometindose el error de tipo II. La
aproximacin en este caso es igual a la parte del rea bajo la curva delx centrado
sobre 1 , que coincide con el rea bajo la curva de la x centrado sobre 0 , que se
encuentra entre los valores lmites o crticos de x . Si la H0 es falsa, depende del
verdadero valor de , y en la prctica no se conoce nunca el valor verdadero de
cuando la H0 es falsa, por lo tanto tampoco se sabe el valor real de .

En la siguiente figura se da algunas


alternativas para , cuando la H0 es = 0025 = 0025
falsa y los correspondientes valores de 2 . 1 2 .

, donde los valores diversos de , 0.95


estn trazados en lneas verticales
(lmite inferior y superior). Aqu los 1442443 14444
-1.96
204444 31.96
144244 3
diferentes valores de estn todos Valores lmites o crticos que determinan las R.R. y la R.A.
R.R. R.A. R.R.

localizados sobre el mismo eje de x


(lnea horizontal), luego todas las correspondientes curvas tienen la misma linea x ,
donde hay un nmero infinito de curvas para diferentes hiptesis de H0: = 0 . Los

promedios ( xs ) que estn localizados cerca de 0 , dan valores ms grandes que


y las que estn alejados dan valores menores.

10.3. PROCEDIMIENTO DE LA PRUEBA DE HIPTESIS

El procedimiento general de la prueba de una hiptesis de parmetro se resume


en los siguientes pasos:

1. Formular la hiptesis:
H 0 : = 0 vs. H a : 0 (Prueba bilateral de dos colas)
H 0 : 0 vs. H a : > 0 (Prueba unilateral de cola a la derecha)
H 0 : 0 vs. H a : < 0 (Prueba unilateral de cola a la izquierda)
Estadstica Aplicada a la Educacin - 257 -
2. Seleccionar el nivel de significacin ( ). Se puede usar un valor pequeo
para , como 10%, 5%, u 1%. Con frecuencia a se le llama nivel de
significancia. Si el valor calculado a travs de los datos disponibles es igual o
mayor a y se rechaza la hiptesis planteada,se dice que los resultados de la
muestra son significativos (P 0.05).

3. Seleccin del estadstico deseado. Depende del parmetro que est probndose
en la hiptesis. As, una hiptesis sobre el promedio de la poblacin, entonces
el estadstico pertinente es el x . En suma se desea saberse si se utilizar una
medida de tendencia central, una medida de dispersin, u otra medida.

4. Determinar la prueba estadstica a usar. Depende del parmetro sobre el que


se realiza la hiptesis y depende de la distribucin de la muestra. Si el muestreo
se hace en una poblacin normalmente distribuida, con variancia conocida, la
prueba estadstica a usarse para verificar la H0 sobre la media de la poblacin
es "Z" Z = ( x 0 ) ( n ) , donde x es el promedio de la muestra de
tamao n. Si el muestreo se hace en una poblacin normalmente distribuida
con variancia desconocida, el estadstico de prueba a usarse para verificar una
hiptesis sobre la media de la poblacin es t t = ( x 0 ) ( s n ) , donde
S es la desviacin estndar de la muestra. Aqu sigue una distribucin con (n-
1) grados de libertad; tambin se puede usar otras pruebas como Ji-cuadrado
( 2 ), de Fisher, Binomial, Poisson, etc.

5. Determinar la regin de rechazo y aceptacin para H0.


a. Regin de rechazo (RR). Si el valor calculado del estadstico de prueba es
igual a cualquier valor que compone la regin de rechazo, la H0 se rechaza.
b. Regin de aceptacin (RA). Si el
valor calculado a travs de la prueba

estadstica es igual a cualquier valor = 25
.% = 25
.%
2 2
de la regin de aceptacin, la H0 no
se rechaza. As por Ejemplo: con el
estadstico de prueba Z con dos
colas, donde =0.05, la regin de 144244
31444424444 314 4244 3
RR
.. RA
.. RR
..
rechazo est a ambas colas de la
curva 0.025 y la regin de aceptacin est al centro con 95% del rea de
la curva, se dice que un valor calculado de Z es significativo, cuando se
- 258 - V. Ibaez Q.

llega a rechazar la H0.

6. Anlisis estadstico. Conlleva tabular y procesar estadsticamente los datos


recopilados, obteniendo as un valor real calculado que se compara con el valor
crtico de ste, llamado tambin valor tabular porque se encuentra en tablas
pre-elaboradas.

7. Decisin estadstica. Conlleva a rechazar o no rechazar la H0 una vez


comparada el valor calculado con el valor tabular al nivel de significacin
propuesto.
- Si el valor calculado es mayor (>) al valor tabular, se rechaza la H0.
- Si el valor calculado es menor o igual ( ) al valor tabular, no hay evidencia
para rechazar la H0.

8. Conclusin. Si se rechaza la H0, se concluye que los datos son compatibles con
la Ha, y sino, se rechaza la H0, quiere decir que los datos son compatibles con
la H0, y decimos que la media de la poblacin puede ser igual a , si es que
se prob H0: = 0 . El investigador puede dar por finalizado su investigacin
o bien tomar otra decisin como reunir ms datos e informacin para tomar
una decisin ms concluyente. La desicin estadstica no debe interpretarse
como definitiva, sino que junto a las dems informaciones forman un grupo
importante para el investigador.

10.4. DCIMA DE HIPOTESIS CON UNA SOLA MEDIA DE LA


POBLACION

Cuando el valor de la varianza ( ) poblacional es conocido.


2

Sea X la media de una muestra aleatoria de tamao n seleccionada de una


poblacin con media ( ) y varianza ( ) supuestamente conocida: Si la poblacin
2

es normal N( , 2 ) , entonces la distribucin de la estadstica X es exactamente


normal X ~ N( , 2 n) para cualquier valor de n (n 2).
Estadstica Aplicada a la Educacin - 259 -
1. HIPTESIS ESTADSTICA: Existen tres formas de plantear las hiptesis
estadsticas, elegimos la que nos interesa.

a) H 0 : = 0 b) H 0: 0 c) H 0: 0
Ha: 0 Ha: < 0 H a: > 0
14243 14243 142 43
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin: , los ms usuales son: 1%, 5%, 10%


( =0.01, = 0.05, = 0.10).
3. La distribucin de probabilidad elegida para este caso, es la distribucin
normal con funcin pivotal o funcin estandarizada es:

X -
Z =
n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a ) RA H o : - Z 2 Zo Z 2 b ) RA H0 : Z 0 Z c ) RA H0 : Z0 Z
a) RR Ho : Zo < -Z 2 Zo > Z 2 b ) RR H0 : Z 0 < Z c ) RR H0: Z0 > Z
5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal de
paso 3).

X- 0
Z0 = x : media muestral,
n
0 : es la media supuesta de la poblacin;
: desviacin estndar poblacional.
6. Si Z0 pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:

7. Conclusin. Una vez tomada la decisin de aceptar o rechazar la hiptesis, se


debe concluir e interpretar en base al problema objeto de estudio.
- 260 - V. Ibaez Q.
EJEMPLO.
El promedio de calificaciones del examen de admisin a la universidad fue de 500
puntos y la desviacin estndar de 40 puntos; hubo 16 estudiantes del Colegio A que
obtuvieron un promedio de 485 puntos. Podrn considerarse las calificaciones de los
estudiantes del Colegio A como significativamente menores que la calificacin
promedio total ?. Usar = 0.05.

SOLUCION:
1. Hiptesis estadstica: H0: = 500 versus Ha: < 500.
2. Nivel de significancia: = 0.05.

3. Distribucin elegida: Distribucin normal, con funcin pivotal: Z = X -


n
4. Regin de Aceptacin y Rechazo:
a ) RA H0: Z0 Z = 164
.
0.05
0.95
b ) RR H0 : Z0 < Z = 164
.
Z=-1.64 0

5. Valor Experimental:
X - 0 485 500
Z0 = = = 15
.
n 40 16
6. Como Z0 = -1.5 pertenece a RA H 0 : , entonces rechazamos la Ha:
7. Conclusin: Las calificaciones de los estudiantes del Colegio A, no pueden
considerarse significativamente menores que la calificacin del promedio
total.

EJEMPLO.
Se calcula que los estudiantes de una Universidad Estatal gasta en promedio 1,500
mensuales con una desviacin estndar de 300. Se toma una muestra aleatoria de 36
estudiantes de la Facultad X y sus gastos fueron 1,600. Estos datos apoyan la idea de
que los estudiantes de la Facultad X gastan ms que el estudiante promedio?. Use
= 0.05.
SOLUCION:
1. Hiptesis estadstica: H0: = 1500 versus Ha: > 1500.
2. Nivel de significancia: = 0.05.

3. Distribucin normal, con funcin pivotal: Z = X -


n
Estadstica Aplicada a la Educacin - 261 -
4. Regin de Aceptacin y Rechazo:
0.05
a ) RA H 0 : Z0 Z = 164
. 0.95

b) RR H 0 : Z0 > Z = 164
. 0 Z=1.64
5. Valor Experimental:
X - 0 1600 1500
Z0 = = = 2 .0
n 300 36
6. Como Z0 = 2.0 pertenece a RR H 0 : , entonces rechazamos la H0:
7. Conclusin: Los estudiantes de la Facultad X gastan significativamente ms
que el estudiante promedio.

10.5. PRUEBA DE HIPTESIS SOBRE LA MEDIA DE UNA POBLACIN


NORMAL CON VARIANZA ( 2 ) DESCONOCIDA.

Si la poblacin no tiene distribucin normal y si la varianza es desconocida, para


probar la hiptesis acerca de la media de la poblacin, y si el tamao de la muestra
es grande, entonces se define.
Sea X1, X2,...,Xn una muestra aleatoria seleccionada de una poblacin
N( , 2 ) donde y 2 son desconocidas, y se estimarn mediante los siguientes
estadgrafos.
n
( X i )2
cX h
n n n

X X
2
i i X i
2
i=1
n
X= i=1
, s2 = i=1
= i=1
n n 1 n 1
A1) Para muestras grandes (n>30).

1. Hiptesis Estadstica

a) H 0 : = 0 b) H 0: 0 c) H 0: 0
Ha: 0 Ha: < 0 H a: > 0
14243 14243 142 43
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).


3. Estadgrafo de Contraste, elegida para este caso, es la distribucin normal con
funcin pivotal o funcin estandarizada es:
- 262 - V. Ibaez Q.

X -
Z =
S n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a ) RA H o : - Z 2 Zo Z 2 b ) RA H0 : Z 0 Z c ) RA H0 : Z 0 Z
RR Ho : Zo < -Z 2 Zo > Z 2 RR H 0 : Z 0 < Z RR H0 : Z 0 > Z

5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal de


paso 3).

X- 0
Z0 =
S n
6. Si Z0 pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:

7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo


al tenor del problema.

Los valores crticos en la poblacin normal se pueden obtener directamente que


est resumido en la siguiente tabla:
0.10 0.05 0.01 0.002 0.005
Para una prueba de una cola: Zc 1.2817 1.645 2.327 2.575 2.88
Para una prueba de dos colas: Zc 1.645 1.96 2.575 2.81 3.08

A2) Para muestras pequeas (n 30).


Si la poblacin tiene distribucin normal N( , 2 ) donde y 2 son
desconocida, para n 2, la estadstica de prueba acerca de la media es:
Estadstica Aplicada a la Educacin - 263 -

X -
t= , cuya distribucin es t-Student con n - 1 grados de libertad.
S n

1. Hiptesis Estadstica

a) H 0 : = 0 b) H 0: 0 c) H 0: 0
Ha: 0 Ha: < 0 H a: > 0
14243 14243 142 43
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).


3. Estadgrafo de Contraste, elegida para este caso, es la distribucin normal con
funcin pivotal o funcin estandarizada es:

X -
t = ~ t ( n 1)
S n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

t2,(n1) t2,(n1) t t,(n1) 0 t 0 t,(n1) t


0
0 0
0 RR/Ho: RR/Ho:
RR/Ho: RR/Ho: RA/Ha: RA/Ha:
RA/Ha: Valor Valor
Valor Valor crtico
crtico crtico crtico

a) RA Ho: -t 2,(n1) t c t 2,(n-1) b) RA H0: t c t ,( n1) c) RA H0: tc t,(n1)


RR Ho: tc <-t 2,(n-1) tc > t 2,(n-1) RR H 0: t c < t ,( n1) RR H0: tc > t,(n1)

5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal de


paso 3).

X - 0
tc =
S n
6. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:

7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo


al tenor del problema.
- 264 - V. Ibaez Q.

EJEMPLO.
Se hizo un estudio de una muestra de 25 expedientes de enfermos crnicos
atendidos como pacientes externos. El nmero medio de consultas por paciente
fue de 4.8 y la desviacin estndar de la muestra fue de 2. Es posible concluir a
partir de stos datos que la media de la poblacin es mayor que 4 visitas por
paciente?. Suponer que la probabilidad de cometer un error de tipo I es de 0.05
Cules son los supuestos que se deben cumplir?.

SOLUCION: n = 25 x = 4.8 s = 2
1. Hiptesis: H0: 4 versus Ha: > 4
2. Nivel de Significacin: = 0.05
t0.05,24= 1.71 (una cola)
3. Estadgrafo de Contraste: Como n = 25, es decir es (n 30), entonces se usar:

X - 0
t=
S n 1
= 005
.
0.95
4. Regin de Rechazo y aceptacin:
RA H0 : t c t0.05,( 24 ) = 171
. 0 t 0.05,24 = 171
.

RR H 0 : tc > t 0.05,( 24 ) = 171


. tc =2

5. Clculo del Valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.
x 0 4 .8 4 5x 0.8
tc = = = =2
s n 2 25 2
6. Decisin: Como tc = 2 > t0.05, 24 =1.71 cae en la regin de rechazo, entonces se
rechaza la H0. y se acepta la Ha.
7. Conclusin: Los expedientes de enfermos crnicos atendidos como pacientes
externos de la poblacin superan a 4 visitas por paciente.

Intervalo de Confianza: t 2 ,( n1 ) = t 0 .025,24 = 2.064


FG 2 2 IJ
H
P 4.8 ( 2.064 )
25
4.8 + ( 2.064 )
25 K
= 0.95

b g
P 3.97 5.63 = 0.95
Estadstica Aplicada a la Educacin - 265 -
Hay un 95% de confianza de que la media de la poblacin este comprendido
entre (3.97, 5.63) y un 5% est fuera de este intervalo. Otra forma de interpretar es que
de 100 intervalos aleatorios en 95% de stos contienen a , en tanto que 5% est
fuera de este intervalo confidencial.

EJEMPLO.
Una muestra de 25 estudiantes de Enfermera de primer ao tuvo una calificacin
media de 77 en una prueba para medir su actitud hacia el paciente moribundo. La
desviacin estndar de la muestra fue de 10. Proporcionan estos datos evidencia
suficiente como para indicar, a un nivel de significacin de 0.05 que la media de
la poblacin es menor que 80? Qu supuestos se deben cumplir?.

SOLUCION: n = 25 x = 77 s = 10
1. Hiptesis: H0: 80 versus Ha: < 80
2. Nivel de Significacin: = 0.05
3. Estadgrafo de Contraste: Como n = 25, es decir es (n 30), entonces se usar:
X - 0
t = ~ t n 1
S n
4. Regin de Rechazo y aceptacin:
RA H0 : t c t0.05,( 24 ) = 171
.
RR H0: tc < t0.05,( 24 ) = 171
.
5. Clculo del Valor experimental. Se obtiene reemplazando valores en la funcin
pivotal.
x 0 77 80 3
tc = = = = 15
.
s n 10 25 2
6. Decisin: Como tc =-1.5 t0.05, 24 =-1.71 cae en la regin de aceptacin,
entonces se rechaza la Ha. y se acepta la H0.
7. Conclusin: Las calificaciones de los estudiantes de enfermera no pueden
considerarse significativamente menores que la calificacin del promedio
total.
Intervalo de Confianza: t 2 ,( n1 ) = t 0 .025,24 = 2.064
FG 10 10IJ
H
P 77 ( 2.064 )
25
77 ( 2.064 )
25K= 0.95

b
P 72.87 8113
. = 0.95 g
- 266 - V. Ibaez Q.

EJEMPLO.
La longitud de 14 nios varones recin nacidos son: 51, 55, 56, 59, 61, 71, 53, 52,
60, 63, 68, 53, 50.5, 59. Es posible concluir con base en estos datos que la media
de la poblacin no es de 50 cm.?. Sea la probabilidad de cometer un error tipo I
igual a 0.10 y encuentre el intervalo confidencial del 95%. Interprete los
resultados encontrados.

SOLUCION:
1. Hiptesis: H0: = 50 cm. versus Ha: 50 cm.
2. Nivel de Significacin: = 0.01
3. Estadgrafo de contraste: Funcin pivotal con n =14, es decir es (n 30),
entonces se usar:
X - 0
t = ~ t n 1 =5% =5%
S n 2 2

4. Regin de Rechazo y aceptacin: 1 = 090


.
RA H 0 : - 1.77 t c 177
.
t00513 . =50
. , =177 . , =177
t00513 .
RR H 0 : tc < 177
. t c > 177
.
5. Clculo del Valor experimental. Se obtiene reemplazando valores en la funcin
pivotal.
x 0 57 .96 50 7 .96
tc = = = = 4 .74
s n 6.28326 14 1.679
6. Decisin: Como tc = 4.74 > t0.05,13 =1.77 cae en la regin de rechazo, entonces
se rechaza la H0. y se acepta la Ha.
7. Conclusin: Se puede concluir que existe evidencia suficiente para firmar que
los nios recin nacidos es diferente en la longitud.

Intervalo de Confianza: t 2 ,( n 1 ) = t 0 .05 ,13 = 2 .16

FG S S IJ
H
P X t 2 ,( n 1 )
n
X + t 2 ,( n 1 )
n K
= 1

b
P 57.96 ( 2.16 )( 1679
. ) 57.96 + ( 2.16 )( 1679
. g
) = 0.95
b
P 54 .33 61.587 = 0 .95g
Estadstica Aplicada a la Educacin - 267 -

VALORES DE P.

ste representa el nivel de significacin ms pequeo que conducir al rechazo de


Ho:. En consecuencia, si P = 0.04 se presenta en los diferentes paquetes estadsticos,
la salida del valor P, la hiptesis nula se rechazara en el =0.05, pero no en el
=0.01. En general, si P es menor o igual que , rechazaramos Ho:, en tanto que
si P supera a no rechazaramos Ho:.
Si Zo es el valor calculado de la estadstica de prueba Z, entonces el valor de P
es:

R|2 1 c Z h para una prueba de dos colas.


P = S1 b Z g para una prueba de cola superior.
0

|T bZ g para una prueba de cola inferior.


0
0

En general tomar la decisn, en los siguientes casos:


p rechazar la H : o

p > no rechazar la H : o

EJEMPLO:
1) Zo = -2.28 (Ejemplo anterior)

c h
P = 21 Z0 = 21 228 c h
. = 21(05
. +048870
. ) = 00226
. < = 005
.
(Tabla Z sin acumular)

0 z

c h .c
P = 2 1 Z0 = 2 1 228 h
= 2 1 (098870
. ) = 00226
. < = 005
.
(Tabla Z acumulado)

0 z
- 268 - V. Ibaez Q.
2) Zo = 2.72 (Ejemplo anterior)

c h
P = 21 Z0 = 21 272
. = 21(05 c h
. +049674
. ) = 000652
. < = 001
.
(Tabla Z sin acumular)

c h
P = 2 1 Z0 = 2 1 272
. c h
= 2 1 099674
. = 000652
. < = 001
.
(Tabla Z acumulado)

10.6. PRUEBA DE HIPTESIS PARA LA VARIANZA DE UNA POBLACIN


NORMAL.
Sea X1, X2,...,Xn una muestra aleatoria seleccionada de una poblacin
N( , 2 ) , con media y varianza 2 , parmetros desconocidos, y sea la media
y la varianza muestral.
n
( Xi ) 2
cX h
n n n

X X
2
X 2
i=1
i i i
n ,
X= i=1
, s =
2 i=1
= i=1

n n 1 n 1
Entonces para resolver este tipo de problemas, se usa la ecuacin de Ji-cuadrada
con (n-1) grados de libertad.
( n 1)S 2
2 = 2 = Ji-cuadrada calculada
20
n = Tamao de la muestra S2= Variancia de la muestra
20 = Variancia hipottica de la poblacin. g.l. = Grados de libertad.

12 2,n1 = Valor crtico inferior 2 2 ,n1 = Valor crtico superior

PARA MUESTRAS PEQUEAS ( n 30 )


Esta estadstica se utiliza para probar hiptesis acerca de una varianza, si se
supone verdadera la hiptesis nula H 0 : 2 = 20 , la estadstica es:
( n 1)S2 ( n 1)s2
2 = ~ 2( n 1) , su valor 2c = , que resulta de la muestra aleatoria,
02
20
se utiliza para la prueba de Ho:
Estadstica Aplicada a la Educacin - 269 -
1. Hiptesis Estadstica

a) H0: 2 = 20 b) H 0: 2 20 c) H 0 : 2 20

Ha : 2 20 H a : 2 < 20 H : 2 > 2
14244 3 14243 1a42430
Unilateral a la izquierda Unilateral a la derecha
Bilaterales

2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).


( n 1)S 2
3. Estadgrafo de Contraste: = ~ 2( n 1)
2

20
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

b) c)
a)
R.C.
R.C.
R.C.

R.C.
2 2 1 1
1

0 2
1 ,( n 1)
2
2
2
,( n1)
X
0 12,(n1) X
0 2,( n1)
X

R.R./H o: Aceptar R. R. /H o : R.R./Ho: Aceptar Ho: Aceptar Ho: R.R./Ho:


Ho:

a) RA Ho : 12 2,(n-1) 2c 2 2,(n-1) b) RA H 0 : 2c 12 ,( n 1) c) RA H0: 2c 2,( n1)

RR Ho: c2 < 12 2,(n-1) c2 > 2 2,(n-1) RR H 0 : 2c < 12 ,( n 1) RR H0: 2c > 2 ,( n1)

5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.
( n 1)S2
2c =
20

6. Si 2c pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:

Si 2c pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:

7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo


al tenor del problema.
- 270 - V. Ibaez Q.

R.C. R.C.
R.C. R.C.
2 2 2 2
1 1

0 2 2 0 2 2
2
,( n1) 1 ,(n1)
2
X 1 ,(n1) ,( n1) X
2 2

R.R./Ho: Aceptar R.R./Ho: R.R./Ho: R.R./Ho:


Aceptar
Ho: Ho:

144444
4244444
43Se cambia
144444
42444444
3
Seusala Tabla 2 ACUMULATIVAS Se usa la Tabla P 2>2c =p, noacumulativa

EJEMPLO:
Una muestra de 25 administradores de hospitales grandes particip en un estudio
para investigar la naturaleza y el grado de frustracin y tensin emocional asociado
con el trabajo. A cada participante se le hizo una prueba con el fin de estimar el grado
de tensin emocional que experimentaba como resultado de los deberes y
responsabilidades asociados a su trabajo. La variancia de los resultados obtenidos fue
de 30. Es posible concluir a partir de estos datos que la variancia de la poblacin es
mayor que 25?. Sea = 0.05.

SOLUCIN:
1. Hiptesis. H0: 250 Ha: >250
2 2

2. Nivel de significacin: = 0.05


(n1)S2 2
3. Estadstico de contraste: 2 = ~ (n1)
2 = 0.05
1 = 0.95
4. Regin de rechazo y aceptacin:
REGION DE
RA H o : c2 02 .05 ,24 = 36 .40 ACEPTACIN

RR H o : 2c > 02.05,24 = 36.40 0.05,24 = 3640 2


.

5. Clculo del valor experimental. Se reemplaza los valores en la funcin pivotal.


( n 1 )S 2 24 x 30
2c = = = 28 .80
20 25

6. Estadstica de Decisin: Como 2c = 28.80 20.05,24 = 36.40 cae en la regin de


aceptacin, entonces se acepta la Ho: y se rechaza la hiptesis Ha:
Estadstica Aplicada a la Educacin - 271 -

Intervalo Confidencias (IC): Si n 30


LM ( n 1)S 2
2
( n 1 )S2 OP = 1 ; LM 720 720 OP
MN PQ N12.401
Q
= 0.95
P P 2
2
1 2 ,( n 1 ) 2 2 ,( n 1 ) 39.364

. 2 1829
P( 5806 . ) = 095
.

Para muestras grandes (n>30): Cuando la poblacin de base no es


necesariamente normal pero n es grande, entonces podemos utilizar la siguiente
definicin. Si X1, X2, ..., Xn es una muestra aleatoria de una poblacin con varianza
2 , la desviacin estndar S de la muestra tiene una distribucin aproximadamente

normal con media E(s) y varianza V(s) 2 2n , si n es grande. Entonces la


distribucin de:
S
Z=
2n
1. Hiptesis Estadstica

a) H0: 2 = 20 b) H 0 : 2 20 c) H 0 : 2 20

Ha : 2 20 H : 2 < 2 H : 2 > 2
14244 3 1a42430 1a42430
Unilateral a la izquierda Unilateral a la derecha
Bilaterales

2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).


S
3. Estadgrafo de Contraste: Z =
2n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a ) RA H o : - Z 2 Z c Z 2
RR Ho : Zc < Z 2 Zc > Z 2
5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin
pivotal.
S 0
Zc =
0 2n
- 272 - V. Ibaez Q.

6. Si Zc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:


Si Zc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Realizar la interpretacin en base al tenor del problema.

EJEMPLO
Se registraron los valores de la capacidad vital de una muestra de 10 pacientes con
obstruccin crnica severa de las vas respiratorias. La varianza de las 10
observaciones fue de 0.75. Probar la hiptesis nula que indica que la varianza de
la poblacin es de 1.0. = 0.05

1. Hiptesis. H0: =1.0 Ha : 1.0


2 2

2. Nivel de significacin: = 0.05


( n 1)S 2
3. Estadstico de contraste: 2 = ~ (2n 1)
2
4. Regin de rechazo y aceptacin:
2 = 0.025
2 = 0.025
1
a) RA Ho : 2
1 2,(n-1) 2
c
2
2,(n-1)

RR Ho: < 2 2
c2 > 2 2,(n-1)
c 1 2,(n-1)
: 144424443 1442443
20 .975 , 9 = 2 .70 20.025,9 = 19.0

5. Clculo del valor experimental. R .R . R . A. R .R .

Se obtiene reemplazando valores en la funcin pivotal.


( n 1)S2 (10 1)0.75
2c = = = 6.75
20 10.

6. Estadstica de Decisin: Como c = 6.75 pertenece a la regin de aceptacin,


2

entonces se rechaza hiptesis Ha:, es decir 2.70 6.75 19.0, entonces se


acepta la hiptesis Ho:, esto implica entonces que =1.0.
2

7. Conclusin: Como c = 6.75 pertenece a la RA (Regin de Aceptacin),


2

entonces no se rechaza la Ho: y conclumos que los valores de la capacidad


vital en los pacientes con obstruccin crnica es severa en las vas
respiratorias.

Intervalo Confidencias (IC): Si n 30


LM 9x0.75 9 x0.75 OP P( 0.3553 2 2.5 ) = 0.95
N 19
Q
= 0.95 ;
2
P
2.70
Estadstica Aplicada a la Educacin - 273 -
Intervalo Confidencial (IC): Si n >30
LM OP
( n 1)S ( n 1)S2
PM PP = 1
2
2

MN 2 Z + 2n 1
1
2
2 1
2
Z 2 + 2n 1
2

Q
1 2
Donde: 2 2 ,( n 1) = Z 2 + 2 n 1
2
1 2
12 2,( n1) = Z 2 + 2n 1
2

10.7. PRUEBA DE HIPTESIS PARA LA IGUALDAD DE VARIANZAS DE


DOS POBLACIONES NORMALMENTE DISTRIBUIDAS (prueba de
hiptesis de la razn de dos varianzas).

Sean S12 y S 22 las varianzas de dos muestras aleatorias independientes de


tamaos respectivos n1 y n2 , escogidos de dos poblaciones normales con varianzas
respectivas 12 y 22 , entonces se define de la siguiente manera:
Sea X1, X2,...,Xn una muestra aleatoria seleccionada de una poblacin
N(1 , 12 ) , y Y1, Y2,...,Yn u una muestra aleatoria seleccionada de una poblacin
N(2 , 22 ) . La estadstica

S12 12
F= 2 2 , tiene distribucin de probabilidad F con grados de libertad
S2 2
(n1 - 1) y (n2 - 1). Esto es F~F(n1 -1)(n2 -1). Si se supone verdadera la hiptesis nula
Ho: 1 = 2 12 22 = 1, la estadstica de prueba es:
2 2

S12 12
F= ~ F(n1 1, n 2 1) ,
S22 22
- 274 - V. Ibaez Q.
1. Hiptesis Estadstica

a) H0: 12 = 22 b) H0: 12 22 c) H0: 12 22


Ha : 12 22 Ha: 12 < 22 Ha : 12 > 22
14244 3 14243 14243
Unilateral a la izquierda Unilateral a la derecha
Bilaterales

2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).


S12
3. Estadgrafo de Contraste: F =
S22
, con S12 > S22

n1
( Xi )2
cX Xh
n1 n1 n1

Xi X
2
i
2
i i=1
n1
X1 = i=1
, s12 = i=1
= i=1

n1 n1 1 n1 1
n2
( Yi ) 2
dY Y i
n2 n2 n2

Y Y
2
j j
2
j j=1

n2
s22 = =
j=1 j=1 j=1
X2 = ,
n2 n2 1 n2 1
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

b) c)
a)
R.C.
R.C. R.C.

R.C.
2 2 1 1
1

0 F F 2,( n1 1)( n2 1) 0 F1,(n11)(n21) F


0 F,(n11)(n2 1) F
1 ,(n11)(n2 1)
2
F
R.R./H o: Aceptar R. R. / Ho : R.R./Ho: Aceptar Ho: Aceptar Ho: R.R./Ho:
Ho:

a ) RA H o : F1 2,(n1 -1)( n 2 1) Fc F 2,( n1 1) (n2 -1) b) RA H0: Fc F1,( n11)(n2 1) c) RAH0: Fc F,(n11)(n21)

RR H o : Fc < F1 2,(n1 -1)(n2 -1) Fc > F 2,(n1 -1)(n2 -1) RR H0: Fc < F1,(n1 1)( n2 1) RRH0: Fc >F,(n11)(n21)

1
F = F1 ,( n 1)( n 1) =
Recuerde que: 1 2 2 1 2
F ,( n 2 1)( n1 1)
2
Estadstica Aplicada a la Educacin - 275 -
5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin
pivotal.
S12
Fc =
S22
6. Si Fc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si Fc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo
al tenor del problema.

Intervalo Confidencial (IC)


LMS2
1

12

OP
S12
=1-
MNS F PQ
1
P F
2
2 ,( n 1,n 1) 22 2 ,( n11,n2 1) S22
2 2 1

EJEMPLO.
Se compar la eficacia de dos analgsicos con base en el tiempo transcurrido desde
su administracin hasta el momento del cese del dolor. 30 pacientes recibieron el
medicamento 1 y otros 13 el medicamente 2. Las varianzas de las muestras son s12 =

64 y s22 = 16. Probar la hiptesis nula que indica que las varianzas de las dos
poblaciones representadas son iguales. Use = 0.05 y encuentre el IC al 95%.

SOLUCION:

1. Hiptesis: H0: 12 = 22 versus Ha: 12 22

2. Nivel de Significacin: = 0.05


S12 12
3. Estadgrafo de Contraste: F = ~ F( n1 1 ),( n2 1 )
S22 22
4. Regin de rechazo y aceptacin de la H0:

RA H o : 0.41 Fc 2.97
RR H o : Fc < 0.41 Fc > 2.97
- 276 - V. Ibaez Q.

1 1
F1 = F1 ,( n1 1 )( n 2 1 ) = = = 0.41
2 2
F0.025,12 ,29 2.43
F0.025,29,12= 2.97 (lmite superior)
1 1
F0 .025 ,29 ,12 = = = 0.41 (lmite inferior)
F0 .975 ,12 ,29 2.43
5. Clculo del valor experimental:
S12 64
Fc = = =4
S22 16
6. Decisin: Como Fc=4.0 > Ft=2.97, cae en la regin de rechazo, entonces se
rechaza la Ho: y se acepta la Ha:
7. Conclusin: Se puede concluir que existe evidencia suficiente para afirmar que
los dos analgsicos acta en forma diferente en los dos poblaciones.

EJEMPLO:
Se analizaron los valores de ndice cardaco (litros/minuto/M2) en dos grupos de
pacientes despus de una operacin de reemplazo de vlvula. Los tamaos de las
muestras y las varianzas fueron las siguientes: n1 = 16, s12 =3.75, n2 = 10, s22 =1.8.
Proporcionan stos datos la evidencia suficiente para indicar que existe una
diferencia en las varianzas de las poblaciones?. Use = 0.05 y encuentre el IC al 95%.

SOLUCION:

1. Hiptesis: H0: 12 = 22 versus H a: 12 22


2. Nivel de Significacin: = 0.05

S12 12
3. Estadgrafo de Contraste: F = ~ F( n1 1 ),( n 2 1 )
S22 22
4. Regin de rechazo y aceptacin de la H0:
RA H o : 0.32 Fc 3.77
RR H o : Fc < 0.32 Fc > 3.77
1 1
F1 = F1 0 . 05 ,15 ,9 = = = 0 .32
2 2
F0 .025 ,9 ,15 3.123
Estadstica Aplicada a la Educacin - 277 -

F0.025,15,9= 3.769

5. Clculo del valor experimental: R.C.


R.C.
2 2
1
S2 3.75
Fc = 12 = = 2.08
S2 180. 0
F0.975,15,9 = 032
. F0.025,15 ,9 = 3769
. F

6. Decisin: Como Fc=2.08 cae en la regin de aceptacin, entonces se acepta la


Ho: y se rechaza la Ha:
7. Conclusin: Se puede concluir que el ndice cardaco (litros/minuto/M2) de las
dos poblaciones son indiferentes en el reemplazo de vlvulas en los dos grupos
de pacientes.

Intervalo Confidencial (IC)

LM
P 2.08x0.32
12
2.08x3.769 = 0.95
OP
N 22 Q
P(0.67, 7.84)

10.8. PRUEBA DE HIPTESIS DE DOS MEDIAS POBLACIONALES INDEPEN-


DIENTES DE 12 Y 22 VARIANZAS CONOCIDAS.

Sean X1 y X2 los promedios de dos muestras aleatorias independientes de


tamaos n1 y n2 seleccionadas de dos poblaciones independientes, con medias 1 y

2 y con varianzas 12 y 22 supuestas conocidas. Si las dos poblaciones son


normales, entonces las estadsticas X1 y X2 tienen distribucin normal c
N 1 , 12 n1 h
y c h
N 2 , 22 n2 para n1 2 y n 2 2, luego la estadstica

X1 X2 ~ N ( 1 2 , 12 n1 + 22 n 2 ) . Matemticamente se puede definir de


la siguiente forma: Sean X1, X2, ...., Xn1 una muestra aleatoria seleccionada de una
c h
poblacin N 1 , 12 y Y1, Y2, ..., Yn2 una muestra aleatoria seleccionada de una

poblacin Nc , h donde
2
2
2
2
1
y 22 conocidas. Suponiendo que las poblaciones son
independeintes.
- 278 - V. Ibaez Q.

1. HIPTESIS ESTADSTICA:

a) H0: 1 = 2 b) H0: 1 2 c) H0: 1 2


Ha: 1 2 Ha: 1 < 2 Ha : 1 > 2
14243 14243 14243
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin: , los ms usuales son: 1%, 5%, 10%


( =0.01, = 0.05, = 0.10), que es fijado por el experimentador.
3. La distribucin de probabilidad elegida para este caso, es la distribucin
normal con funcin pivotal o funcin estandarizada es:

Z =
c X - X h - b g ~ N (0,1)
1 2 1 2

12 22
+
n1 n 2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a ) RA H o : - Z 2 Zo Z 2 b ) RA H 0 : Z0 Z c) RA H0: Z0 Z
RR Ho : Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z

5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal de


paso 3).

Z0 =
cX 1 - X2 h
2
2
+ 2
1
n1 n2

6. Si Z0 pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:


Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:

7. Conclusin. Una vez tomada la decisin de aceptar o rechazar la hiptesis, se


debe concluir e interpretar en base al problema objeto de estudio.
Estadstica Aplicada a la Educacin - 279 -

INTERVALO CONFIDENCIAL (IC):


LM OP
MNc h c h
12 22 2 2
Pr X1 X2 Z + 1 2 X1 X2 +Z 1 + 2 =1
2
n1 n2 2
n1 n2 PQ
OBSERVACIN: Cuando las hiptesis son de la forma:

0 1 -2 = d0
a) H: b) H:0 1 2 d0 c) H0: 1 2 d0
H: 1 2 d0 H:a 1 2 <d0
1442443 H: 1 2 >d0
1a44 2443 1a44 2443
Bilaterales Unilateral alaizquierda Unilateral a la derecha

La estadstica de prueba o contraste es: Z =


cX - X h - d
1 2 0
~ N ( 0,1) , cuya
2
2
1
+ 2
n1 n 2
distribucin es exactamente o aproximadamente normal N(0,1), segn sean las dos
poblaciones normales o no.

EJEMPLO:
Un estudio sobre peso de quesos de la zona de Melgar-Ayaviri, se muestreo en el
establo A a 35 quesos obtenindose un promedio de 0.984 kg y en el segundo
establo B, se encontr una muestra de 40 quesos con un promedio de 1.060 kg. Los
pesos de los quesos se supone que estn aproximadamente distribuidos con
2A = 0.44 y 2B = 072
. . Se puede concluir que la media de la poblacin en peso de
quesos del Establo A es inferior al Establo B. Use =0.05.
SOLUCION:
1. HIPTESIS: H 0: A B
Ha: A < B
2. Nivel de significacin: = 0.05
3. Estadgrafo de contraste:

Z =
c X - X h - b g
1 2 1 2


2 2
+ 1 2
n1 n 2
- 280 - V. Ibaez Q.
4. Establecer la Regin de rechazo y aceptacin:
RA H 0 : Z0 Z 2 = 0 .0 5
1 - 0 .0 5
RR H 0 : Z 0 < Z 2
Z = Z0.05 = 1645
. 0 z

5. Clculo del valor experimental (se obtiene reemplazando a la funcin pivotal).

Z0 =
cX A - XA h = 0.984 1.060 = 0.4347

2 2
0.44 0.72
+
+ 1 2
n1 n 2 35 40

6. Estadstica de decisin:
Si Z0 = -0.4347 > Z0.05 = -1.645, cae en la regin de aceptacin ( RA H 0 : ),
entonces aceptamos H0: y rechazamos la Ha:
7. Conclusin. Se puede concluir que el peso promedio de queso de ambos establos
no difieren o es uniformente en la produccin de quesos.

INTERVALO CONFIDENCIAL (IC):


b
Pr 0076
. 196 g
. (017484687
. ) A B 0076
. +196 b
. (017484687
. ) = 095
. g
Pr 0.419 A B 0.2667 = 095
.

10.9. PRUEBA DE HIPTESIS DE MEDIAS DE DOS POBLACIONES NORMALES


INDEPENDIENTES DE VARIANZAS 12 y 22 DESCONOCIDAS.

Si las muestras aleatorias independientes de tamao n1 y n2 se seleccionan de


dos poblaciones cuyas distribuciones son no normales con varianzas 12 y 22
desconocidas, entonces, siempre que los tamaos de las muestras sean grandes n1>30
y n2 >30, los parmetros 12 y 22 se estiman por S12 y S 22 . Entonces, sean X1, X2,
c
...., Xn1 una muestra aleatoria seleccionada de una poblacin N 1 , 12 y Y1, Y2, ..., Yn2 h
una muestra aleatoria selecciona de una poblacin N 2 , 22 donde c h 1 , 2 , 12
y 22 son desconocidas. Los parmetros 1 , 2 , 12 y 22 se estiman mediante los
siguientes estadsticos:
Estadstica Aplicada a la Educacin - 281 -

n1
( Xi ) 2
cX h
n1 n1 n1

X X
2
i i X 2
i i=1
n1
X1 = i=1
, s =
2 i=1
= i=1

n1 1 n1 1
1
n1

n2
( Yi ) 2
dY Y i
n2 n2 n2

Y Y
2
j j
2
j j=1

n2
s22 = =
j=1 j=1 j=1
X2 = ,
n2 n2 1 n2 1

CASO I: Tamao de muestra grandes (n1+n2>30) (n1 > 30 y n2 > 30).

1. HIPTESIS ESTADSTICA:

a) H 0: 1 = 2 b) H0: 1 2 c) H0: 1 2
H : 1 2 Ha: 1 < 2 Ha : 1 > 2
1a42 43 14243 14243
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin:


3. Estadgrafo de contraste, elegida para este caso, es la distribucin normal con
funcin pivotal o funcin estandarizada es:

Z =
c X - X h - b g ~ N(0,1)
1 2 1 2
2 2
S S
+ 1 2
n1 n 2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a ) RA H o : - Z 2 Z o Z 2 b ) RA H 0 : Z0 Z c) RA H0: Z0 Z
RR Ho: Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z
- 282 - V. Ibaez Q.
5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin
pivotal de paso 3).

Z0 =
cX 1 - X2 h
2 2
S S
1
+ 2
n1 n 2

6. Si Z0 pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:


Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:

7. Conclusin. Una vez tomada la decisin de aceptar o rechazar la hiptesis, se


debe concluir e interpretar en base al problema objeto de estudio.

INTERVALO CONFIDENCIAL (IC):


LMc c OP
Pr X1 X2 Z
MN h 2
S12 S22
n1 n2 2
h
S2 S2
+ 1 2 X1 X2 + Z 1 + 2 = 1
n1 n2 PQ
EJEMPLO:
Setenta (70) pacientes que sufren de epilepsia se dividieron al azar en dos grupos
iguales. El grupo A recibi tratamiento que inclua dosis diarias de Vitamina D.
El grupo B recibi el mismo tratamiento con la excepcin de que a este grupo se
le di un placebo en lugar de la vitamina D. El nmero medio de ataques
convulsivos observados durante el periodo de tratamiento en los dos grupos de
XA =15 y XB = 24 . Las varianzas de las muestras fueron SA = 8 y SB = 12 . Estos
2 2

datos proporcionan evidencia suficiente para indicar que la vitamina D es efectiva


para disminuir el nmero de ataques convulsivos?. Sea =0.05 y encuentre el
intervalo confidencial al 95%.

SOLUCIN:
1. Hiptesis estadstica: Ho: A = B versus Ha: A B
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de contraste: La funcin pivotal o funcin estandarizada es:

Z =
cX A h b
- X B - A B g ~ N( 0,1)
2 2
S S
A
+ B
nA n B
Estadstica Aplicada a la Educacin - 283 -
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.
RA H 0 : - 1.96 Z C 1.96 2 2
RR H 0 : Z C < 1.96 Z C > 1.96 1 -
5. Clculo del valor experimental. Z 2 = 1.96
0 Z 2 = 1.96 Z

Zc =
cX A - XB h= 15 - 24
=
9
= 11.91
2
S S2 8 12
+
20
A
+ B
nA nB 35 35 35

6. Decisin: Como Zc = -11.91 > Z0.05=-1.96 cae en la regin de rechazo entonces


se acepta Ha: y se rechaza la Ho:
7. Conclusin. Se puede concluir que existe evidencia suficiente para afirmar que
la vitamina D es efectiva para disminuir el nmero de ataques convulsivos en
los pacientes que sufren epilepsia.

INTERVALO CONFIDENCIAL (IC):


Pr 9 ( 1.96 )( 0.7559 ) A B 9 + ( 1.96 )( 0.7559 ) = 0.95
Pr( 10.48 A B 7.52 ) = 0.95

CASO II: A) n1+n2 30 (n1 30, n2 30) y Varianzas desconocidas, pero iguales
12 = 22 = 2
1. HIPTESIS ESTADSTICA:

a) H 0: 1 = 2 b) H 0 : 1 2 c) H 0: 1 2
H : 1 2 H a : 1 < 2 H : >
1a42 43 14243 1a421 432
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin:


3. Estadgrafo de contraste, elegida para este caso, es la distribucin t-Student
con funcin pivotal:

c X - X h - b g ~ t
1 2 1 2

( n 1)S + ( n 1)S F 1 1 I
t = ( n1 + n2 2 )

GH n + n JK
2 2
1 1 2 2
,
n +n 2
1 2 1 2

tiene distribucin de t-Student con (n1 + n2 - 2) grados de libertad, en donde la varianza


- 284 - V. Ibaez Q.
comn o combinada es:
( n1 1)S12 + ( n 2 1)S22
S2c =
n1 + n 2 2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

t2,(n1+n22) 0 t 2,(n1+n22) t t,(n1+n2 2) 0 t 0 t,(n1+n22) t

RR/Ho: RR/Ho: RR/Ho:


RR/Ho: RA/Ha:
RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a)RA Ho: -t 2,(n1+n22) tc t 2,(n1+n22) b) RA H0: tc t,(n1+n2 2) c) RAH0: tc t,(n1+n22)


RR Ho: tc <-t 2,(n1+n22) tc >t 2,(n1+n22) RR H0: t c < t,(n1+n2 2) RR H0: tc > t,(n1+n22)

5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.
X1 - X 2 X1 - X 2
=
FG IJ
tc =
( n1 1)S12 + ( n 2 1)S22 1 1 S2c S2c
+
n1 + n 2 2
+
n1 n 2H K n1 n 2

6. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:


Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Una vez tomada la decisin de aceptar o rechazar la hiptesis, se
debe concluir e interpretar en base al problema.

INTERVALO CONFIDENCIAL (IC):

LMc h
Pr X1 X2 t
1 1
+ 12 X1X2 +t c h 1 1
Sc + =1
OP
N Q
Sc
,(n1+n22) n1 n2 ,(n1+n22) n1 n2
2 2

EJEMPLO:
Se realizaron los valores medios de la velocidad de conduccin de un nervio motor
en 10 personas internadas en el Centro de Control de envenenamientos en el Hospital
Regional Manuel Nuez Butrn - Puno, con diagnstico de envenenamiento con
metilmercurio. Se hicieron tambin determinaciones similares en 15 personas
aparentemente sanas. Las medias y desviacin estndar son las siguientes: Individuos
Estadstica Aplicada a la Educacin - 285 -

envenenados XE =55, S E = 6 e individuos normales XN =63 , S N = 5 . Proporcionan


estos datos evidencia suficiente para indicar que las medias de las poblaciones
representadas por las muestras son diferentes?. Sea =0.05 y calcule el IC al 95%.

SOLUCIN:
Primeramente se debe probar si la varianzas es: 12 = 22 = 2 12 22 .

1. Hiptesis: H0: 12 = 22 versus Ha: 12 22

2. Nivel de Significacin: = 0.05


S 2E
3. Estadgrafo de Contraste: F = ~ F( n E 1 ),( n N 1 )
S 2N
4. Regin de rechazo y aceptacin de la H0:

RA H o : F Fc F
1- ,( n E 1 )( n N 1 ) ,( n E 1 )( n N 1 )
2 2

RR H o : Fc < F Fc > F
1- ,( n E 1 )( n N 1 ) ,( n E 1 )( n N 1 )
2 2

1 1
F0.975,9 ,14 = = = 0.26 ; F0.025,9,14= 3.209
F0.025,14 ,9 3.798

R.C.
R.C.
5. Clculo del valor experimental:
2 2
1
S2 36
Fc = 2E = = 144
.
S N 25 0 0.26 3.209 F
6. Decisin: Como Fc=1.44 cae en la regin aceptacin, entonces se acepta la Ho:
y se rechaza la Ha:

7. Conclusin: Estamos en condiciones de realizar el contraste de promedios, una


vez comprobado que las varianzas son homogneas ( 2E = 2N = 2 ).

PROCEDIMIENTO:
1. Hiptesis estadstica: Ho: E = N Versus Ha: E N
2. Elegir el nivel de significacin: = 0.05
- 286 - V. Ibaez Q.
3. Estadgrafo de contraste, elegida para este caso, es la distribucin t-Student
con funcin pivotal:

cX - X h - b g ~ t
1 2 1 2

( n 1)S + ( n 1)S F 1 1 I
t = ( n1 + n2 2 )

GH n + n JK
2 2
1 1 2 2
,
n +n 2
1 2 1 2

4. Establecer la Regin de decisin, 2 2


determinando la regin crtica de la 1-
prueba.
0 t
RA H o : - 2.069 t c 2.069 RR/Ho: RR/Ho:
RA/Ha:
RR H o : t c < -2.069 t c > 2.069 . 69 t00. 252, 3 =206
t00. 252, 3 =20 . 9

5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.
55-63 -8 8
= = =362
tc =
( n1 1)S12 +( n2 1)S22 1 1FG IJ FG 1 + 1 IJ 22098
.
.

n1 + n2 2
+
H
n1 n2 K 2930
.
H10 15K
( nE 1)S2E + ( nN 1)S2N 9x36 + 14x25
S2c = = = 29.30
nE + nN 2 23
6. Decisin: tc = -3.62 cae en la regin de rechazo, entonces se rechaza la Ho: y
se acepta Ha:

7. Conclusin. Existe evidencia suficiente para afirmar que las poblaciones son
diferentes, es decir existe diferencia entre las personas internadas en el centro
de control de envenenamiento frente a las personas aparentemente sanos.

INTERVALO CONFIDENCIAL (IC):

Pr 8 ( 2.069 )( 2.2098 ) 1 2 8 + ( 2.069 )( 2.2098 ) = 095


.
Pr 12.57 E N 3.43 = 0.95
Estadstica Aplicada a la Educacin - 287 -

CASO II: B) Muestras pequeas (n1+n2 30; n1 30, n2 30) Varianzas


desconocidas, pero distintas ( 12 22 ).

1. HIPTESIS ESTADSTICA:

a) H 0: 1 = 2 b) H 0 : 1 2 c) H 0: 1 2
H : 1 2 H a : 1 < 2 H : >
1a42 43 14243 1a421 432
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin:


3. Estadgrafo de contraste, elegida para este caso, es la distribucin t-Student
con funcin pivotal:

c X - X h - b g ~ t
1 2 1 2

FG S + S IJ
t = (g)
2 2 ,
Hn n K
1 2

1 2

tiene distribucin de t-Student con g grados de libertad, siendo:

FG S + S IJ 2 2 2

Hn n K
1 2

g= 2,
FG S IJ FG S IJ
1 2
2 2 2 2

Hn K Hn K
1 2

1
+ 2

n1 1 n2 1

Welch, B-L, y si g no es entero se aproxima al menor entero mayor.

4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

t 2,(g) 0 t 2,(g) t t,(g) 0 t 0 t ,( g ) t


RR/Ho: RR/Ho:
RR/Ho: RR/Ho: RA/Ha:
RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a) RA Ho : - t 2,(g) t c t 2,(g) b) RA H 0 : t c t ,( g ) c) RA H0: t c t,(g)


RR Ho: t c < -t 2,(g) t c > t 2,(g) RR H 0 : t c < t ,( g ) RR H0: t c > t ,(g)
- 288 - V. Ibaez Q.

5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.
X1 - X2
tc =
FG S 2
S22 IJ
Hn +
K
1

1 n2

6. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:


Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:

7. Conclusin. Una vez tomada la decisin de aceptar o rechazar la hiptesis, se


debe concluir e interpretar en base al problema.

INTERVALO CONFIDENCIAL (IC):

F I
GH
P X1 X2 t ,g
2
S12 S22 S2 S2
+ 1 2 X1 X2 + t ,g 1 + 2 = 1 -
n1 n2 2
n1 n2 JK
OBSERVACIN: Cuando las hiptesis de contraste son de la forma:

a) H0: 1 -2 = d0 b) H0: 1 2 d0 c) H0: 1 2 d0


Ha: 1 2 d0 Ha : 1 2 < d0 Ha : 1 2 > d0
1442443 1442443 1442443
Bilaterales Unilateral a la izquierda Unilateral a la derecha

Los estadgrados de contraste son dados por:

X1 - X2 d 0
FG S + S IJ
i) Z0 = (caso de muestras grandes)
2 2

Hn n K
1 2

1 2

X1 - X2 d 0
FG IJ
ii) t = ,
( n1 1)S + ( n 2 1)S22 1 1
2
+
H K
1
n1 + n 2 2 n1 n 2
caso de muestras pequeas y varianzas desconocidas, pero iguales.
Estadstica Aplicada a la Educacin - 289 -

X1 - X 2 d 0
iii) t = , para el caso de muestras pequeas y varianzas
2 2
S S
+ 1 2
n1 n 2
desconocidas, pero distintas.

EJEMPLO.
Un investigador esta interesado en saber si los nios nacidos prematuramente
con acidosis metablica tarda y los nios prematuros que no tienen dicha enfermedad
difieren en lo que respecta a las concentraciones en la orina de cierta sustancia
qumica. Las concentraciones medias, desviacin estndar y el tamao de la muestra
para ambos grupos son las siguientes:

Muestra n X s
Con la condicin 15 8.50 5.5
Sin la condicin 14 4.80 2.9
Qu puede concluir el investigador con base en estos resultados?. Sea =0.05
y encuentre el intervalo confidencial al 95%.

SOLUCIN:
Primeramente se debe probar si la varianzas es: 12 = 22 = 2 12 22 .

1. Hiptesis: H0: 12 = 22 versus Ha: 12 22


2. Nivel de Significacin: = 0.05

S 12
3. Estadgrafo de Contraste: F = ~ F( n 1 1 ),( n 2 1 )
S 22
4. Regin de rechazo y aceptacin de la H0:

RA H o : F Fc F
1- ,( n E 1 )( n N 1 ) ,( n E 1 )( n N 1 )
2 2

RR H o : Fc < F Fc > F
1- ,( n E 1 )( n N 1 ) ,( n E 1 )( n N 1 )
2 2

1 1
F0.975,14 ,13 = = = 0.332 ; F0.025,14,13=3.082
F0.025,13,14 .
3012
- 290 - V. Ibaez Q.

5. Clculo del valor experimental:


R.C.
R.C.
( 5.5 )2 30.25 2 2
Fc = = = 359
. ~ 3.60 1
( 2 .9 )2 8.41 Regin de Aceptacin
(R.A.)
0 0.332 3.082 F

6. Decisin: Como Fc=3.60 cae en la regin rechazo, entonces se acepta la Ha: y


se rechaza la Ho:
7. Conclusin: Existe evidencia suficiente para afirmar que existe diferencia
entre 12 12 . Entonces, se prosigue a efectuar la prueba de la diferencia de
promedios.

PROCEDIMIENTO:
1. Hiptesis estadstica: Ho: 1 = 2 Versus Ha: 1 2
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de contraste, elegida para este caso, es la distribucin t-Student
con funcin pivotal:

c X - X h - b g ~ t
2 2
1-
1 2 1 2

FG S + S IJ
t = (g) t
2 2 -2.079 0 2.079
,
Hn n K
1 2 RR/Ho: RR/Ho:
RA/Ha:
1 2 t 2 ,21 t 2 ,21

4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.


RA H o : - t 2 ,( 21 ) = 2.079 t c t 2 ,( 21 ) = 2.079
RR H o : t c < -t 2 ,( 21 ) = 2.079 t c > t 2 ,( 21 ) = 2.079

5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.

FG S + S IJ
2 2
FG 30.25 + 8.41IJ
2
2

H n K H 15 14 K
1 2
n 6.85068
g= = = = 215
FG S IJ FG S IJ FG 30.25IJ FG 8.41IJ
1 2
2 2 2 2 . ~ 21 ,
2 2 0.31825
Hn K +Hn K H n K +H n K
1 2

1 2 1 2

n1 1 n2 1 14 13
Estadstica Aplicada a la Educacin - 291 -

X1 - X 2 8.5-4.8 .
37
= = = 2.287
. I
FG S + S IJ FG 30.25 + 841
tc =

H n n K 15 14 JK
2 2 .
16178
1

1
2

2
H
6. Decisin: Como tc = 2.29 cae en la regin de rechazo, entonces se rechaza la
H0: y se acepta la Ha:
7. Conclusin. Existe evidencia suficiente para afirmar que hay diferencia entre
los nios nacidos prematuramente tarda y los nios prematuros que no tienen
dicha enfermedad.

INTERVALO CONFIDENCIAL (IC):


Pr 0.3355 1 2 7.06447 = 0.95

10.10. PRUEBA DE LA DIFERENCIA ENTRE DOS MEDIAS CON


OBSERVACIONES APAREJADAS PAREADOS EMPAREJA-
DOS.

Sea (X1,Y1), (X2,Y2), (X3,Y3), ....., (Xn,Yn) una muestra aleatoria de n


datos emparejados o apareados, donde X1,X2,.....,Xn1 de una muestra aleatoria
extrada de una poblacin N( 1 ,12 ) e Y1,Y2,.....,Yn2 otra muestra aleatoria
extrada de una poblacin N( 2 ,22 ) . A este procedimiento a veces se denomina
prueba antes y despus. Las mediciones se hacen sobre la muestra de sujetos
tanto antes como despus de la introduccin de algn fenmeno.
Ahora, considernse las n diferencias D1 = X1 -Y1, D2 = X2 -Y2, ...... , Dn =
Xn -Yn, como una muestra aleatoria seleccionada de una poblacin de diferencias D
= X - Y, cuya distribucin es normal N ( D , 2D ) , con

D = E ( D ) = E ( X Y ) = E ( X ) E ( Y ) = 1 2 , D ~ N
Cov(X,Y)
2D = V ( D ) = 12 + 22 21 2 , = 0
1 2
La media y la varianza de la muestra de n diferencias D1,D2, ...., Dn esta dada
por:
- 292 - V. Ibaez Q.

D i
n

D i
2

d D i i
2

cD D h
n

i
2

n
D= i=1
, S D2 = i=1
= i =1
n n 1 n 1

D ~ N( D , 2
D n) , cuando hallamos un estimador de la diferencia entre
dos medias poblacionales ( D = 1 2 ) se pueden presentarse dos casos:

CASO I: TAMAO MUESTRAL GRANDE ( n > 30 ).

Cuando n>30, la distribucin de t de Student se aprxima a la distribucin N(0,1).

1. Hiptesis Estadstica

a) H 0 : D = 0 b) H 0: D 0 c) H 0: D 0
Ha: D 0 Ha: D < 0 H : >0
14243 14243 1a42D43
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).


3. Estadgrafo de Contraste, elegida para este caso, es la distribucin normal con
funcin pivotal o funcin estandarizada es:
D - ( 1 2 )
Z = ~ N (0,1)
SD n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a ) RA H o : - Z 2 Z o Z 2 b ) RA H 0 : Z0 Z c ) RA H0: Z0 Z
RR Ho: Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z

5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal de


paso 3).
Estadstica Aplicada a la Educacin - 293 -

D
Z0 =
SD n
6. Estadstica de Decisin: Si Z0 pertenece a RA H 0 : , aceptamos H0: y
rechazamos la Ha:
Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo
al tenor del problema.

INTERVALO CONFIDENCIAL (IC):

LM SD S
D D + Z D
OP = 1 -
N
P D - Z
2
n 2
n Q
CASO II: Tamao de muestra pequeo (n 30).
1. Hiptesis Estadstica

a) H 0 : D = 0 b) H 0: D 0 c) H 0: D 0
Ha: D 0 Ha: D < 0 H : >0
14243 14243 1a42D43
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).


3. Estadgrafo de Contraste, elegida para este caso, es la distribucin normal con
funcin pivotal o funcin estandarizada es:
D - ( 1 2 )
t = ~ t ( n 1)
SD n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

t2,(n1) t2,(n1) t t,(n1) 0 t 0 t,(n1) t


0
0 0
0 RR/Ho: RR/Ho:
RR/Ho: RR/Ho: RA/Ha: RA/Ha:
RA/Ha: Valor Valor
Valor Valor crtico
crtico
crtico crtico

a) RA Ho: -t 2,(n1) t c t 2,(n-1) b) RA H0: t c t ,( n1) c) RA H0: tc t,(n1)


RR Ho: tc < -t 2,(n-1) tc > t 2,(n-1) RR H 0: t c < t ,( n1) RR H0: tc > t,(n1)
- 294 - V. Ibaez Q.
5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal de
paso 3).

D
tc =
SD n
6. Estadstica de Decisin: Si tc pertenece a RA H 0 : , aceptamos H0: y
rechazamos la Ha:
Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Realizar la interpretacin en base al punto 4) y concluir de acuerdo
al tenor del problema.
El intervalo de confianza del 100(1- )% en ( D = 1 2 ) es:

LM
P D t ,( n1)
SD S OP
D D+ t ,( n1) D = 1 -
N 2
n 2
n Q
EJEMPLO.
Veinte estudiantes de matemtica I de la Facultad de Ingeniera Estadstica e
Informtica de la UNA fueron divididas en 10 parejas, teniendo cada miembro de la
pareja aproximadamente el mismo cociente de inteligencia. Uno de cada pareja se
selecciona al azar y se asigna a una seccin que utiliza videos. El otro miembro se
asigna a una seccin que cuenta con profesor. Al finalizar el ciclo ambos grupos se
presentan al mismo examen, obtenindose los resultados siguientes:

2
Pareja Con video (V) Con profesor (P) D = V- P D
1 15 16 -1 1
2 12 10 2 4
3 17 17 0 0
4 11 14 -3 9
5 18 17 1 1
6 15 16 -1 1
7 16 18 -2 4
8 13 12 1 1
9 14 15 -1 1
10 10 11 -1 1
Total 141 146 -5 23
Estadstica Aplicada a la Educacin - 295 -
Suponiendo que la caracterstica en estudio es normal, obtener el intervalo de
confianza del 95% para la diferencia real en el promedio de calificaciones de los dos
procedimientos de enseanza.

SOLUCION:

2
Pa re ja Co n v id e o (V) Co n p ro fe s o r (P) D=V-P D
1 15 16 -1 1
2 12 10 2 4
3 17 17 0 0
4 11 14 -3 9
5 18 17 1 1
6 15 16 -1 1
7 16 18 -2 4
8 13 12 1 1
9 14 15 -1 1
10 10 11 -1 1
T o tal V= 141 P = 146 D = i -5 D 2
i = 23

1. Hiptesis Estadstica: H 0 : D = 0 Vs. H a : D 0


2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de Contraste:
D - ( 1 2 )
t =
SD n
4. Establecer la Regin de rechazo y aceptacin:
RA Ho: -t 2,(n1) tc t 2,(n-1)
2 2
RR Ho: tc <-t 2,(n-1) tc > t 2,(n-1) 1-

-t 0.025,9 = - 2 . 2 6 2 0 -t 0.025,9 = 2 . 2 6 2 t
0
RR/Ho: RR/Ho:
RA/Ha:
t 2,(n1) t 2,( n1)

5. Clculo del valor experimental.


10 10

Vi 141 Pi
146
XV = i=1
= = 141
. XP =
, i=1
= = 14.6 ,
n 10 n 10

D = XV XP = 141
. 146
. = 05
.
- 296 - V. Ibaez Q.

D i
( 1 ) + ( 2 )+L+( 1 ) + ( 1 ) 5
Otra forma: D= i=1
= = = 0.5
n 10 10

D
d D i 2
i
i
2

cD Dh
n

i
2
23
(-5) 2
S2D = i=1 n
= i =1
= 10 = 205
.
= 2.27777778
n 1 n 1 9 9
SD = 1.509230856
t 2 ,( n1 ) = t 0.05 2 ,( 101 ) = t 0.025,9 = 2.262
D -0.5
tc = = = 1047
.
SD n 1.50923085 10
6. Estadstica de Decisin: Si tc = 1.047 cae en la regin de aceptacin, entonces
se acepta la H0: y rechazamos la Ha:
7. Conclusin. Se puede concluir que los estudiantes tienen el mismo cociente de
inteligencia.
Calculando el intervalo de confianza de 95% se tiene:
LM
P -0.5 (2.262)
1.509230856
D 0.5 + (2.262)
1.509230856 OP = 0.95
N 10 10 Q
P -1.5795637 D 0.579563708 = 0.95

10.11. PRUEBA DE HIPTESIS: PROPORCIN DE UNA SOLA POBLACIN P.

Sean X1,X2,.....,Xn una muestra aleatoria de tamao n, seleccionada de una


poblacin Bernoulli B(1,p), donde el parmetro desconocido p es la proporcin de
xitos en la poblacin:
N

X i
X Nmero de casos favorables
Parmetro: P = i =1
= =
N N N
n

x i
x Nmero de xitos en la muestra
Estimador: p$ = i =1
= =
n n n
Donde p$ es el estimador puntual de la proporcin de la poblacin que pertenece
Estadstica Aplicada a la Educacin - 297 -

LM PQ OP
a esta clase, p$ ~ N P,
N n
.
Q
LM PQ OP
CASO I: Tamao de muestra grande (n > 30), p$ ~ N P,
N n
.
Q
1. HIPTESIS ESTADSTICA:

a) H 0 : p = p 0 b) H 0: p p 0 c) H 0: p p0
H a : p p0 H a : p < p0 H : p>p
14243 14243 1a42430
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin:


3. Estadgrafo de contraste, elegida para este caso, es la distribucin normal con
funcin pivotal o funcin estandarizada es:
$ p0
p- p (1 p0 ) FG IJ
Z=
p0 (1 p0 )
, ), p$ ~ p0 , 0
~ N(01
n H K
n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a ) RA H o : - Z 2 Zo Z 2 b ) RA H 0 : Z0 Z c) RA H0: Z0 Z
RR Ho: Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z

5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.
p$ - p 0
Z0 =
p 0 (1 p 0 )
n
6. Si Z0 pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
- 298 - V. Ibaez Q.
7. Conclusin. Una vez tomada la decisin de aceptar o rechazar la hiptesis, se
debe concluir e interpretar en base al problema objeto de estudio.

INTERVALO CONFIDENCIAL (IC):


LM O
$ P
P Mp$ - Z P =1-
$ p)
p(1- $ $ p)
p(1-
P p$ + Z
MN144244 n 3P

n3 144244
Q
2 2

LI LS

Por tanto, el Intervalo de Confianza del 100(1- )% para el parmetro P es


aproximadamente dado por:

LM
P p$ Z
$ p)
p(1- $ OP
N 2
n Q
OBSERVACION: Cuando el muestreo es sin reemplazamiento en una poblacin
finita de tamao N y el tamao de la muestra constituye ms de 5% del tamao de la
poblacin, resulta adecuado usar el factor de correccin por poblacin finita.
Entonces el intervalo de confianza 100(1- )% para el parmetro P, esta dado por:

LM $ $ N-n
p(1-p) FG IJ $ $ N-n
p(1-p) FG IJ OP = 1 -
$
MN
P p-Z
2
n N-1 H K
P p+
$ Z
2
n N-1 H K PQ
OBSERVACION: Como 0 < p$ < 1 y 0 < 1- p
$ < 1 , entonces se tiene:

LPMp$ - Z
P p$ +
Z OP = 1 -
MN 4n 4n PQ
2 2

CASO II: Tamao de muestra pequea (n 30)


A) Para ambas colas o bilateral.
Si p$ < p0 entonces se calcula:

P = P X x p = p0 =
k
FG nIJ p (1 p )
H xK
x nx
o 0
x=0
Estadstica Aplicada a la Educacin - 299 -

y si p$ > p0 entonces se calcula:

P = P X x p = p0 =
k
FG nIJ p (1 p )
H xK
x nx
o 0
x=0

Se rechaza Ho: si P 2 , en caso contrario no se rechaza.

B) Para la cola derecha (unilateral).

P = P X x p = p0 =
n
FG nIJ p (1 p )
H kK
k nk
o 0 ,
k=x

se rechaza Ho: si el valor de P es menor o igual que el nivel de significacin .


C) Para la cola izquierda (unilateral). Sea x la cantidad de xitos en una muestra
aleatoria de tamao n.

P = P X x p = p0 =
x
FG nIJ p (1 p )
H kK
k nk
o 0
k=0

se rechaza Ho: p = po, si el valor de P


EJEMPLO:

En una muestra de 150 pacientes admitidos a un hospital de urgencias con cierto


diagnstico, 128 de ellos presentaron vmitos. Proporcionan estos datos la evidencia
suficiente para indicar, al nivel 0.01 de significacin, que la proporcin de la
poblacin es menor que 0.92?. Calcule el Intervalo Confidencia al 99%.

SOLUCION:
4
1. HIPTESIS ESTADSTICA: H0 : P 0.92 versus Ha : P < 0.92
p0
4
p0

2. Nivel de significacin: = 0.01


3. Estadgrafo de contraste. n = 150, x = 128 presentaron vmitos.
p$ - p0
ZC = ~ N( 0,1 )
p0 ( 1 p0 )
n
- 300 - V. Ibaez Q.
4. Establecer la Regin de rechazo aceptacin:

= 0.01
1-
RA H o : Z C Z 0 .01 = 2 .327 Z0.01 = 2327
. 0 z
RR H o : Z C < Z 0 .01 = 2 .327 Zc = -3.16

5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.
p$ - p0 0 .85 0 .92 0 .07
ZC = = = = 3.16
p0 (1 p0 ) ( 0.92 )( 1 0 .92 ) 0.02215
n 150

128
p$ = = 0.85 q$ = 1 - 0.92 = 0.08
150

6. DECISION: Dado que Zc=-3.16 < -Z0.01= -2.327 cae en la regin de rechazo,
entonces rechazamos la H0: y se acepta la Ha:
7. Conclusin. Se puede afirmar que es evidente que los pacientes admitidos a un
hospital de urgencias que presentaron vmitos es inferior al 92%.

Intervalo Confidencial (IC):


b
P 0.92 - (2.327)(0.02215) p$ 0.92+(2.327)(0.02215 = 0.99 g
b g
P 0.868 p$ 0.9715 = 0.99

EJEMPLO:
Antes del inicio de un programa de inmunizacin contra la rubeola en una rea
metropolitana, una encuesta revel que 150 integrantes de una muestra de 500 nios
de primaria habian sido inmunizados contra esta enfermedad. son compatibles estos
datos desde el punto de vista el 50% de los nios de primaria de dicha rea habian sido
inmunizados contra rubeola?. Use = 0.05

SOLUCION:
1. Hiptesis: H 0 : p = 0.50 versus H a : p 0.50
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de contraste, elegida para este caso, es la distribucin normal con
funcin pivotal.
Estadstica Aplicada a la Educacin - 301 -

p$ - p 0 x - np0
Z0 = Z0 =
p 0 (1 p 0 ) np0 q 0
n
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

2 2
1-
RA H o : - Z 2 Zo Z 2 Z 2 = 196
.
0 Z 2 = 196
. z
0
RR H o : Z 0 < Z 2 Z 0 > Z 2 RR/Ho:
RA/Ha:
RR/Ho:
Valor Valor
crtico crtico

5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin


pivotal.
p$ - p0 0.3 050
. 0.2 150
Z0 = = = = 8.94 p$ = . , q$ =1-0.3= 0.70
= 03
p0 (1 p0 ) (05
. )(05. ) 0.02236 500
n 500
6. DECISION: Dado que Z0=-8.94 cae en la regin de rechazo, es decir Z0=-
8.94<-Z0.025=-1.96 Z0= +8.94 >Z0.025=+1.96 y rechazamos la H0:
7. Conclusin. En conclusin podemos afirmar que el 50% de los nios de
primaria de dicha rea haban sido inmunizado contra rubeola, que
estadsticamente es significativa.

10.12. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE DOS


PROPORCIONES.

Usos de la prueba.
- Se usa cuando los tamaos de muestras (n1 y n2) son relativamente grandes, por lo que el
procedimiento basado en la aproximacin normal a la binomial se emplea ampliamente
en la prctica.
- En caso de muestras pequeas la prueba de Z es inapropiado en este caso se usar el
procedimiento que se basa en la aproximacin Hipergeomtrica.
- Se usa esta prueba en los estudios mdicos y biolgicos para comparar dos proporciones
(p1 y p2).

RESTRICCION:
- La prueba de hiptesis para la diferencia de dos proporciones, solo se puede
trabajar con datos contadas (cuantitativo discreto), ms no as con datos
cuantitativos contnuos.
- 302 - V. Ibaez Q.

Sean X1, X2, ..., Xn1 una muestra aleatoria tomada de una poblacin Bernoull
B(1,p1) y Y1, Y2, .., Yn2 una muestra aleatoria tomada de una poblacin Bernoull
B(1,p2) donde los parmetros desconocidos p1 y p2 son las proporciones de xitos
poblacionales respectivos. Supongamos que las poblaciones son independientes
yseanlas proporciones de xito muestrales:
n1

X i
X1 Nmero de xitos de la muestra 1
p$ 1 = i =1
= =
n1 n1 n1

n2

y
j=1
j
X 2 Nmero de xitos de la muestra 2
p$ 2 = = =
n2 n2 n2
La estadstica de prueba en la cual se basan los criterios de decisin es la variable
$ 1 p$ 2 que tiene una aproximacin normal cuando las muestras son
aleatoria p
grandes. Para n1 y n2 suficientemente grandes, la variable aleatoria:

Z=
p$ 1 p$ 2 p1 p 2b g ~ N(0,1), se distribuye aproximadamente
p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2

en forma normal estndar. q$ 1 = 1 p


$ 1 y q$ 2 = 1 p$ 2 .
Si la hiptesis nula Ho: p1 = p2 es verdadera para un nivel de significacin ,
entonces p1 = p2=p, la variable aleatoria es:
p$ 1 p$ 2 p$ 1 p$ 2
Z=
FG IJ
= ~ N(0,1),
p$ 1q$1 p$ 2 q$2 1 1
+
n1 n2
$$
pq +
n1 n 2 H K
Para calcular
p$ 1 p$ 2 p$ 1 p$ 2
Z0 =
FG 1 + 1 IJ FG 1 + 1 IJ
=
$$
pq
Hn n K 1 2
$ (1 $ )
Hn n K
1 2
Estadstica Aplicada a la Educacin - 303 -
se debe estimar el valor de p (valor comn de los parmetros p1 y p2). Cuya
estimacin insesgada de p es:
X1 + X 2 n1p$ 1 + n 2 p$ 2 n p$ + n 2 p$ 2
p$ = = , $ = 1 1
n1 + n 2 n1 + n 2 n1 + n 2
que es un estimador combinado de la proporcin de la poblacin cuando Ho: es
VERDADERA.

1. HIPTESIS ESTADSTICA:

a) H0: p1 =p2 = p b) H 0 : p1 p 2 c) H 0 : p1 p 2
H : p1 p2 H a : p1 < p 2 H : p >p
1a42 43 14243 1a421 432
Bilaterales Unilateral a la izquierda Unilateral a la derecha

2. Elegir el nivel de significacin:


3. Estadgrafo de contraste, elegida para este caso, es la distribucin normal con
funcin pivotal o funcin estandarizada es:

Z =
b p$ - p$ g - bp p g ~ N( 0,1)
1 2 1 2

p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

a) 2 2 b) c)
1- 1- 1-

Z 2 0 Z 2 z Z 0 z 0 Z z
0 RR/Ho: 0 0 RR/Ho:
RR/Ho: RR/Ho:
RA/Ha: RA/Ha: RA/Ha: Valor
Valor Valor Valor
crtico crtico
crtico crtico

a ) RA H o : - Z 2 Zo Z 2 b ) RA H 0 : Z0 Z c ) RA H0: Z0 Z
RR Ho: Zo < -Z 2 Zo > Z 2 RR H 0 : Z0 < Z RR H0: Z0 > Z
5. Clculo del valor experimental. Se obtiene reemplazando valores en la funcin
pivotal de paso 3).

p$ 1 - p$ 2 p$ 1 =
X1 U|
Z0 =
FG 1 + 1 IJ ,
n1
X2
p$ = 1 V|
X + X 2 n1 p$ 1 + n 2 p$ 2
n1 + n 2
=
n1 + n 2
$$
pq
Hn n K
1 2
p$ 2 =
n1 |W
- 304 - V. Ibaez Q.

6. DECISIN: Si Z0 pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:


Si Z0 pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
7. Conclusin. Una vez tomada la decisin de aceptar o rechazar la hiptesis, se
debe concluir e interpretar en base al problema objeto de estudio.

OBSERVACIN: Cuando las hiptesis de contraste son de la forma:

a) H0: p1 -p2 = p0 b) H0: p1 p2 p0 c) H0: p1 p2 p0


Ha: p1 p2 p0 Ha : p1 p2 < p0 Ha : p1 p2 > p0
1442443 1442443 1442443
Bilaterales Unilateral a la izquierda Unilateral a la derecha

El estadgrafo de contraste est dado por:

Z0 =
bp$ - p$ g - p
1 2 0

p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2
INTERVALO CONFIDENCIAL (IC):

LMb g
P p$1 p$2 -Z
$1$1 pq
pq $$
b gb g $ $ pq
pq $$
+ 2 2 P1 P2 p$1 p$2 + Z 1 1 + 2 2 = 1 -
OP
N 2
n1 n2 2
n1 n2 Q
Por tanto, el intervalo de confianza del (1- )100% para la diferencia de
proporciones (P1 - P2) esta dado aproximadamente por:

P1 P2
LMbp$ p$ g Z p$ 1q$ 1 p$ 2 q$ 2
+
OP
N 1 2
2
n1 n2 Q
EJEMPLO.
Un alumno que realiza su tesis de grado en Veterinaria, cree que los cerdos
criollos de la regin de Puno estn infestados con Cisticercosis en un 15% ms que los
cerdos de la regin del Cusco. Para comprobar la suposicin el alumno hace un
seguimiento al azar de 98 cerdos sacrificados en la regin de Puno y 118 en la regin
del Cusco, encontrando 64 cerdos con est enfermedad en Puno, y 60 en el Cusco.
Con los datos disponibles se podr corroborar la sospecha del alumno?

SOLUCION:
1. Hiptesis: H0: PP - PC 0.15
H0: PP - PC > 0.15
Estadstica Aplicada a la Educacin - 305 -

2. Nivel de significacin: = 0.05


3. Estadgrafo de Contraste.

Z0 =
bp$ - p$ g - p
1 2 0

p$ 1q$ 1 p$ 2 q$ 2
+
n1 n2

4. Regin de rechazo y acptacin:


RA H 0 : Z 0 Z 2
RR H 0 : Z 0 > Z 2

5. Clculo del valor experimental o Anlisis estadstico:


64 64
p$ P = = 0.65306 q$ P = 1 = 0.34694
98 98
60 60
p$ C = = 0.50847 q$ C = 1 = 0.49153
118 118

Z0 =
bp$ -p$ g - p
P C 0
=
(065306
. 050847
. ) 015
.
=
000541
.
=008128
.
p$ Pq$ P p$Cq$C .
00023119 +0002118
. .
0066558
+
nP nC
Z= -0.08

6. Estadstica de decisin: No hay evidencia para rechazar la H0, porque ZC = -


0.08 Z t=-1.65, entonces se acepta la H0. y se rechaza la Ha.

7. Conclusin: La proporcin de cerdos con cisticercosis no es 15% ms en Puno


que en el Cusco, por lo que la suposicin del alumno no es verdadera, siendo la
proporcin iguales en ambas regiones.
- 306 - V. Ibaez Q.
Estadstica Aplicada a la Educacin - 307 -

11
ANLISIS DE REGRESIN
Los mtodos de regresin, se utiliza para analizar datos que provienen de experi-
mentos que no fueron diseados, este es el caso del estudio de fenmenos no contro-
lados o de registros histricos. Los mtodos de regresion se usan para determinar la
mejor relacin funcional entre las variables, mientras que la correlacin se utili-
zan para medir el grado de asociacin de las distintas variables. En pocas palabras,
regresin es la CANTIDAD DE CAMBIO de una variable asociado a un cambio
nico de otra variable. El principal objetivo del anlisis de la regresin es el de
realizar predicciones. La regresin permite determinar si existe relacin entre las
variables en estudio (X e Y), para lo cual se utiliza el comportamiento de una varia-
ble (X = independiente), para predecir el comportamiento de otra variable (Y = de-
pendiente). Las dos caractersticas son medibles.

Usos de la Regresin:
- Para conocer el rendimiento de matemticas de un estudiante, en base en el
puntaje obtenido en una prueba de aptitud en dicha materia.
- Para ver si la variable (Y) depende de otra (X), estimando por consiguiente la
medida de dicha relacin o asociacin.
- Para determinar la forma de la curva de la regresin.
- Para conocer el error real implicado en un experimento, despus que haya sido
descontado el efecto de una variable relacionada.
- Sirve de base para el anlisis estadstico.
Como se manifest el objeto principal de la regresin es el de realizar prediccio-
nes como:
- Predecir el tiempo meteorolgico basado en los datos del pasado.
- 308 - V. Ibaez Q.
- Predecir la estimacin de la matrcula escolar en los prximos aos.
- Predecir los recursos financieros.
- Predecir la produccin de lana/ao, basado en los aos anteriores.
- Predecir la infraesctructura educativa (aulas, mobiliario, material didctico,
etc).

11.1. REGRESIN LINEAL SIMPLE.

Consideremos una variable dependiente Y con una sola variable indepen-


diente X. Representemos una muestra aleatoria de tamao n de (X,Y) por el
conjunto de pares de datos: {(xi,yi)/i = 1,2,...,n}. La relacin entre variables es
aquel que se considera nicamente dos variables, a estas designamos por Y y
X, donde Y es la variable dependiente variable de respuesta y X la
variable independiente predictor. El modelo de regresin lineal consiste en
especificar la forma de la relacin lineal, es decir:
Yi = 0 + 1X i + i , i = 1,2,..., n

Donde:
Yi = Variable dependiente.
Xi = Variable independiente.
0 = Parmetro desconocido que indica la ordenada donde la lnea de
regresin lo intersecta.
1 = Parmetro desconocido que indica la pendiente de la lnea de mejor
ajuste, llamada tambin coeficiente de regresin poblacional.
i = Error de perturbacin que puede tomar valores positivos o negativos.

Propiedades del modelo:


a) Toda perturbacin aleatoria tiene de media cero, es decir:
( i ) = 0 , i = 1,2,...,n.
b) Todas las perturbaciones aleatorias tienen la misma varianza
(homoscedasticidad).
V( i ) = 2i i = 1,2,...,n.
c) Las perturbaciones son independientes entre s:
cov( i , j ) = 0, i j
Estadstica Aplicada a la Educacin - 309 -

Yi

E(Y) = 0 + 1Xi
Yj

UV
W j

UV
.

W i

Yi

X1 X2 X3 X4 Xi

Suposiciones en regresin

Diagrama de dispersin.
Una vez recolectada la serie de n observaciones bidimensionales, cada par
de valores (X,Y) en el plano cartesiano o rectngular est representado por un punto,
y habra tantos puntos como parejas de observaciones que tenga. Esta representacin
da origen a una nube de puntos que se denomina DIAGRAMA DE DISPERSION
ESPARCIMIENTO; este diagrama puede tener diferentes formas; esta es la forma
ms usual para detectar si la funcin es lineal, exponencial, potencial, cuadrtica,
etc. al cual el experimentador ajustar su informacin recopilada, de tal forma que
describa adecuadamente la relacin entre las variables en estudio.
Eje Y

Eje Y

Eje Y

Eje Y

Eje X Eje X Eje X Eje X


Lineal positiva Lineal negativa No Lineal Ninguna relacin
- 310 - V. Ibaez Q.

11.2. Estimacin de la ecuacin de regresin.

Para estimar los parmetros desconocidos ( 0 y 1 ), se utiliza uno de los


mtodos ms conocido que es el METODO DE MINIMOS CUADRADOS. Este
mtodo consiste en encontrar los valores 0 y 1 de la ecuacin de regresin muestral,
de manera la suma de los cuadrados de todos los residuos i (suma de cuadrados de
los errores: SCE) alrededor de la lnea de regresin sea mnima. Para estimar los
parmetros se partir del modelo original, que est expresada en la siguiente ecua-
cin:
Yi = 0 + 1X i + i , i = 1,2,..., n
i = Yi 0 1X i
b
2i = Yi 0 1X i elevando al cuadrado. g 2

= bY g
n n
1 X i
2 2
i i 0 aplicando sumatoria.
i =1 i =1

Para encontrar las Ecuaciones Normales se usan las derivadas parciales con
respecto a los parmetros desconocidos 0 y 1 , entonces tenemos:
n n
2i 2i
a) i=1
=0 y b) i=1
=0
0 1
En resumen de a) y b) se tiene las Ecuaciones Normales:
n n
n$ 0 + $ 1 X i = Yi
i =1 i =1

n n n
$ 0 X i +$ 1 X i2 = X i Yi
i =1 i =1 i =1

El objetivo de estas ecuaciones normales es despejar los parmetros 0 y 1 ,


esto se consigue de la siguiente forma:

$ 0 = Y $ 1X
Estadstica Aplicada a la Educacin - 311 -

c hc h
n n
X i X Yi Y X Y nXY
i i
$ 1 = i =1
= i =1

cX h
n n

X
2
i X 2
i nX 2
i =1 i =1

La recta de regresin estimada es: $ = $ + $ X


Yi 0 1 i

Donde $ es el estimador para la media de la observacin Yi, la cual corres-


Yi
ponde al valor Xi de la variable de prediccin.

$ = ( Y $ X) + $ X = Y + $ X $ X = Y + $ ( X X)
Yi 1 1 i 1 i 1 1 i

$ Y = $ (X X)
Yi 1 i

Esta es otra forma expresar la recta de regresin. Observar que la recta de


regresin contiene al punto ( x , y ) cuyos componentes son las medias X y de Y,
respectivamente.

Interpretacin del coeficiente de regresin $ 1


El valor constante $ 0 de la ecuacin de regresin muestral, es la ordenada

con el origen. El valor de la pendiente $ 1 es el cambio en $ cuando Xi cambia


Yi
una unidad de medicin.
Si $ 1 >0, entonces, la tendencia lineal es creciente, es decir, a mayores valo-
res de X corresponden mayores valores de Y. Tambin, a menores valores de X co-
rresponden menores valores de Y.
Si $ 1 <0, entonces, la tendencia lineal es decreciente, es decir, a mayores
valores de X corresponden menores valores de Y. Tambin, a menores valores de X
corresponden mayores valores de Y.
Si $ 1 =0, entonces, Y$ i = $ 0 , luego, Y permanece estacionario para cualquier
valor de X. Es decir, no hay regresin. Esta misma interpretacin es vlida para la
pendiente $ 1 en la ecuacin de regresin poblacional.
- 312 - V. Ibaez Q.
Grficamente se puede representar de la siguiente manera:

Yi
i = Yi Y$ i

Y (X,Y)

U|
U|
V| U| $ = $ + $ X
E(Y) 0 1 i

U| ||
W
i

U| V| U| $ tg ( ) =
$ 1
= $ 1
W
11

V| V|
1

W
|| |V Y
9
UV W
1


W S c X, Y h
R
U| Y$ i Y = $ 1 X i
8
Y
UV UV T 1 42 43
10

W UV W
V| Y$ || ||
5
7 i

W
1
Y2 UV 6

V| Y
i

|| ||
UV UV W 4

Y1 W
||
1

W 2

R
$ S
T0
W W W
X1 X2 X3 X4 X X5 X Xi

Esta grfica es una representacin que permite visualizar mejor la interpreta-


cin de los parmetros estimados, la variable dependiente (Y) y la variable indepen-
diente (X), los errores o perturbacin, los valores de los errores se deben compensar
con los puntos que estn encima de la recta de regresin y los puntos que estn
debajo de la recta de regresin, el promedio de la variable (X) con el promedio de la
variable (Y) coinciden en un punto por donde pasa la lnea de regresin estimada.

TABLA DE ANALISIS DE VARIANZA PARA REGRESION LINEAL SIMPLE


(en trminos de observaciones y desviaciones).

F. De V. G.L. Suma de Cuadrados (S.C.) C.M. Fobs.


LM FGX IJFGYIJ OP n n

$ M XY H KH K P =$ x y i i
n n
SCR CMR
MM PP
i=1 i=1
Regresin 1 1 i i 1 i i
ni=1 i=1 1 CME
N Q
LM F Y I OP L F XIF YI O
M GH JK PP$ MMXY GH JKGH JK PP =y $ xy
n 2 n n

n i n i i n n SCE
n - 2 MY
PP MMN PP
2 i=1 i=1 i=1 2
Error
MM n2
i 1 i i i 1 i i
i=1 n n i=1 i=1 i=1

N Q Q
FGY IJ n 2

Total n- 1 H K n

Y i
2 i=1
i
= y2i
n

i=1 n i=1
Estadstica Aplicada a la Educacin - 313 -
11.3. PRUEBA DE HIPTESIS.

PRUEBA DE HIPTESIS PARA ( 1 ).

1. Hiptesis Estadstica: H 0 : 1 = 0
H a : 1 0
2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).
3. Estadgrafo de Contraste, elegida para este caso, la prueba t-Student y cuya
funcin pivotal.

$ 1 1
t= ~ t ( n2)
s. e($ ) 1

4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

2 2
1-

t 2 ,( n 2 ) 0 t 2 ,( n 2 ) t

RR/Ho: 1 RR/Ho:
RA/Ha:
Valor Valor
crtico crtico

RA H o : - t 2 ,( n 2 ) t c t 2,(n-2)
RR H o : t c < -t 2,(n-2) t c > t 2,(n-2)
5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal.

$ 1 1 s.e.($ ) = s2
tc =
s. e($ )
, 1
FGX IJ n 2
1
n

X
H K
2
i
i=1
i

i=1 n
6. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:
Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
- 314 - V. Ibaez Q.
7. Conclusin. Realizar la interpretacin en base al paso 4) y concluir de acuerdo
al tenor del problema.
INTERVALO CONFIDENCIAL (IC) PARA ( 1 ).

Pr $1 t ,(n2)s.e.($1) 1 $1 + t ,(n2)s.e.($1) = 1 ;
2 2

EJEMPLO:
Se llev a cabo un experimento para estudiar el efecto de cierto medicamento
para disminuir la frecuencia cardiaca en adultos. La variable independiente es la
dosis en miligramos del medicamento, y la variable dependiente es la diferencia
entre la frecuencia cardiaca ms baja despus de la administracin del medica-
mento y un control antes de administrarlo. Se reunieron los siguientes datos:
Dosis (mg) "X" 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50
Reduccin del ritmo cardiaco (latido/min.) 10 8 12 12 14 12 16 18 17 20 18 20 21

a) Trazar el diagrama de dispersin, b) Obtener la ecuacin de regresin, c) graficarla


en el diagrama de dispersin la ecuacin estimada, d) Realice el ANVA y e) los
intervalos confidenciales.
SOLUCIN:

X = 26, Y =198, XY = 4425. , X


i i i i i
2
. , Yi2 = 3226
= 63375
a) Diagrama de dispersin.

D IA G R A M A D E D IS P ER S I N P A R A L A FR EC U EN C IA C A R D IA C A

23

21
LATIDOS/MINUTO (Y)

19

17

15

13

11

5
0 0 .2 0 .4 0 .6 0 .8 1 1 .2 1 .4 1 .6 1 .8 2 2 .2 2 .4 2 .6 2 .8 3 3 .2 3 .4 3 .6 3 .8 4

D O S IS (mg ) (X )

b) Obtener la ecuacin de regresin.


Estadstica Aplicada a la Educacin - 315 -

13

XY nXY
i i
. 13(2)(1523076923
4225 . )
$1 = i=131 = = 4087912088
.
. 13(4)
X
63375
i
2
nX2
i=1

$ 0 = Y $ 1 X = 1523
. 4.087912088x2 = 7.054945054
Entonces, el modelo de regresin estimado es: $ = $ + $ X , reemplazando
Yi 0 1 i

se tiene: Y$i = 7.054945054 + 4.087912088 X i

c) Obtener la grfica de la ecuacin de regresin estimada.

Recta de regresin lineal ajustada para la Frecuencia


Cardaca

24 Y$i = 7.054945054 + 4.087912088 X i


22
20
LATIDOS/MINUTO

18
16
14
12
10
8
6
4
2
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00
DOSIS (mg)

d) Anlisis de varianza (ANOVA).

Grados de libertad (G.L.)


GLreg. = p - 1 = 2 - 1 = 1
GLerror = n - 2 = 13 - 2 = 11
GLtotal = n - 1 = 13 - 1 = 12
Sumas de Cuadrados (S.C. = S.S).
- 316 - V. Ibaez Q.

d X Y X Y n i
n
SSRm = $ 1 xi yi = $ 1 i i i i
i =1
= 4.087912088(442.5-(26)(198)/13)
= 190.087912
n =13
( Yi )2
n
1982
SSTm = Yi 2 i =1
= 3226 = 210.3076923
i =1 n 13
SSE = SSTm SSRm = 2103076923
. 190087912
. = 2021978022
.

Tabla de Anlisis de Varianza para la Frecuencia Cardaca


F. de V. G.L. S.S. M.S. Fc. Signif
Regresin 1 190.087912 190.08791 103.41 **
Error 11 20.219780 1.83816
Total 12 210.307692 17.52564100

e) PRUEBA DE HIPTESIS PARA ( 1 ).

1. Hiptesis Estadstica: H 0 : 1 = 0
H a : 1 0
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de Contraste, elegida para este caso, la prueba t-Student y cuya
funcin pivotal.

$ 1 1
t= ~ t ( n2)
s. e($ ) 1

4. Establecer la Regin de 2 2
decisin, determinando la re- 1-
gin crtica de la prueba.
t002511
. , =2201
. 0 t0.025,11 = 2201
. t

RR/Ho: 1 RR/Ho:
RA Ho : - 2.201 t c 2.201 Valor
RA/Ha:
Valor
crtico crtico
RR Ho : t c < -2.201 t c > 2.201
Estadstica Aplicada a la Educacin - 317 -
5. Valor experimental. Se obtiene reemplazando valores en la funcin pivotal.
$ 1 1 4.087912088 0
tc = = = 10169
. ,
s. e( $ 1 ) 0.40199085

s2 = CME = MSE = 1838161838


.
s2 1838161838
.
s.e.( $ 1 ) = = = 0.40199085
X i2 d X ii
2
n 11375
.

6. Estadstica de decisin: Si tc = 10.17 > t0.025,11 = 2.201, entonces cae en la


regin de rechazo, y se rechaza H0: y se acepta la Ha:
7. Conclusin. Se puede interpretar que 1 es diferente de cero, es decir el
modelo tiene pendiente positiva.

INTERVALO CONFIDENCIAL (IC) PARA ( 1 ).


Pr 4.087912088 ( 2.201 )( 0.40199085 ) 1 4.087912088 + ( 2.201 )( 0.40199085 ) =

Pr 3.2031 1 4.97269 = 0.95


Se puede interpretar; de 100 muestras que se toma en el 95% el parmetro estimado
$ 1 estar comprendido entre el intervalo (3.2067, 4.97269) y tan slo el 5% de las
muestras estar fuera del intervalo o no contendr en el intervalo.

SALIDA DEL SAS.


The REG Procedure
Dependent Variable: Y
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 1 190.08791 190.08791 103.41 <.0001
Error 11 20.21978 1.83816
Corrected Total 12 210.30769
Root MSE 1.35579 R-Square 0.9039
Dependent Mean 15.23077 Adj R-Sq 0.8951
Coeff Var 8.90164

Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t| 95% Confidence Limits
Intercept 1 7.05495 0.88757 7.95 <.0001 5.10141 9.00848
X 1 4.08791 0.40199 10.17 <.0001 3.20314 4.97269

Covariance of Estimates
Variable Intercept X
Intercept 0.7877836449 -0.32319329
X -0.32319329 0.1615966451
- 318 - V. Ibaez Q.

EJERCICIOS:
Para cada uno de los siguientes ejercicios: a) trazar el diagrama de dispersin, b)
Estimar la ecuacin de regresin, c) graficarla en el diagrama de dispersin la ecua-
cin estimada, d) anlisis de varianza (ANVA) y e) los intervalos confidenciales.
1.- Las calificaciones de un grupo de estdiantes en su reporte de medio aos (X) y en
los exmenes finales (Y) fueron los siguientes:

X 77 50 71 72 81 94 96 99 67
Y 82.00 66.00 78.00 34.00 47.00 85.00 99.00 99.00 68.00

2.- A un grupo de 20 estudiantes de un curso de computacin para principiantes se


les aplic una prueba de aptitud computacional con un puntaje X, y otra de apro-
vechamiento final con un puntaje Y (medida como un examen de conocimiento).
Los resultados fueron los siguientes:
X 4 16 20 13 22 21 15 20 19 16 18 17 8 6 5 20 18 11 19 14
Y 19 19 24 36 27 26 25 28 17 27 21 24 18 18 14 28 21 22 20 21

3.- Los datos siguientes hacen referencia al nmero de horas invertidas para preparar
un examen (X) y la calificacin recibida en este ltimo (Y) (esta ltima expresa
en decenas).

X 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8
Y 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9

4.- Se pregunt a 10 estudiantes de una muestra la distancia recorrida y el tiempo que


utilizaron para llegar a la Universidad el da anterior. Los datos reunidos se tie-
nen en la tabla siguiente:

Reco rrid o (X) 1 3 5 5 7 7 8 10 10 12


T iemp o (Y) 5 10 15 20 15 25 20 25 35 35

5.- Se recolectaron los siguientes datos a partir de un estudio de la relacin entre la


inteligencia y el nmero de hijos por familia.

N de nios en la familia 1 2 3 4 5 6 7 8 9 10
Inteligencia de todos los nios de la familia 105 102 104 100 97 101 95 93 97 88
Estadstica Aplicada a la Educacin - 319 -

11.4. CORRELACIN.
Coeficiente de correlacin de Pearson.
La correlacin viene del latn cum: con y relatus: relacionado, la correlacin
lineal permite medir si hay asociacin entre dos variables o medir la intensidad de
dicha asociacin. Para ello es importante que la muestra bivariado sea tomada al
azar, tanto para la variable X como para la variable Y.
El coeficiente de correlacin de Pearson, se ajusta al tipo de informacin cuanti-
tativa, esto con la finalidad de detectar y medir la asociacin entre variables o de
razn. Los valores del coeficiente de correlacin oscilan entre +1 y -1, y se explica de
la siguiente manera:
a) El valor de r = +1, indica una correlacin positiva perfecta o correlacin direc-
ta, cuando al aumentar disminuir el valor de la variable independiente, au-
menta disminuye tambin el valor de la variable dependiente (pendiente po-
sitiva).
b) El valor de r = -1, exprsa una correlacin inversa o relacin negativa perfecta:
cuando al aumentar disminuir el valor de la variable independiente, disminu-
ye aumenta el valor de la variable dependiente (pendiente negativa).
c) El valor de r = 0, indica la ausencia absoluta de correlacin, es decir las dos
variables no estn correlacionadas o relacionadas.
El coeficiente de correlacin queda definido por.

X Y nXYi i
rxy = i =1

LM X
n
nX 2
OP LM Y
n
nY 2
OP
N QN Q
2 2
i i
i =1 i =1

Los rangos que del coeficiente de correlacin, se pueden interpretarse haciendo


uso de las siguientes expresiones:
r = 0.2 a r = 0.3 coeficiente de correlacin muy bajo.
r = 0.4 a r = 0.5 coeficiente de correlacin bajo.
r = 0.6 a r = 0.7 coeficiente de correlacin alto.
r = 0.8 a r = 1.0 coeficiente de correlacin muy alto.
- 320 - V. Ibaez Q.
PRUEBA DE HIPTESIS PARA LA CORRELACIN.

1. Hiptesis Estadstica: H 0: = 0
Ha: > 0
(ausencia de correlacin entre las variables)
(existencia de correlacin entre las variables en forma directa).
2. Elegir el nivel de significacin: , ( =0.01, = 0.05, = 0.10).
3. Estadgrafo de Contraste.

r - r n -2 1- r 2
t= = , Sr =
Sr 1- r 2 n-2
4. Establecer la Regin de decisin, determinando la regin crtica de la prueba.

2 2
1-

t 2 ,( n 2 ) 0 t 2 ,( n 2 ) t

RR/Ho: 1 RR/Ho:
RA/Ha:
Valor Valor
crtico crtico

RA H o : - t 2 ,( n 2 ) t c t 2,(n-2)
RR H o : t c < -t 2,(n-2) t c > t 2,(n-2)

5. Si tc pertenece a RA H 0 : , aceptamos H0: y rechazamos la Ha:


Si tc pertenece a RR H 0 : , rechazamos H0: y aceptamos Ha:
6. Conclusin. Realizar la interpretacin en base al paso 4) y concluir de acuerdo
al tenor del problema.

PRUEBA DE HIPTESIS (cuando el valor hipottico es diferente de cero)

En sta prueba de hiptesis es probar si H 0 : = 0 , donde 0 es diferente de


cero, para lo cual se utiliza un procedimiento diferente. Fisher sugiere la transforma-
cin de r en z, como sigue:
Estadstica Aplicada a la Educacin - 321 -

1 1+ r
Zr = ln
2 1 r
Donde ln es el logaritmo natural. Es posible demostrar que Z , sigue una distri-
r
bucin aproximadamente normal, con:

FG
1 1+ IJ 1
E ( Z r ) = = Z = ln
2 1 H,
K V(Z r ) =
n3

Para probar la hiptesis nula (Ho:) que indica que es igual a un valor diferen-
te de cero, la estadstica de prueba es.

Z r Z
Zc =
1 n3

que sigue una distribucin aproximadamente normal con N(0,1).


En algunas situaciones, los datos disponibles para el anlisis no cumplen con las
suposiciones necesarias para el uso de los procedimientos estudiados. La prueba de
hiptesis respecto al coeficiente de correlacin de la poblacin. En tales circunstan-
cias es conveniente utilizar la tcnica de correlacin de rango de Spearman.
INTERVALO DE CONFIANZA PARA
Para encontrar el intervalo de confidencial, se utiliza la transformacin de Fisher
del (1- )x100, para . Este procedimiento se calcula con la siguiente frmula para
el intervalo de confianza:

Pr tanh( Z r E 0 ) tanh( Z r + E 0 ) = 1
Donde:

1 1+ rFG IJ Z 2
Z r = ln
2 1 r H K
, E0 =
n3

eX e X
tanh( x) = , tanh: Tangente hiperblica
eX + e X
- 322 - V. Ibaez Q.
11.5. COEFICIENTE DE DETERMINACIN: R2 r2
El coeficiente de determinacin, R2, es el valor cuadrado del coeficiente r de
Pearson, y representa la proporcin de la varianza explicada por una variable respec-
to a la varianza total. Se conoce con el nombre de determinacin porque se suele
considerar como medida del grado de influencia de una variable frente a otra varia-
ble. El coeficiente de determinacin mide la proporcin de la variacin que se expli-
ca por la variable independiente en el modelo de regresin, y est definido por:

Varianza Explicada SSRm


R2 = r2 = x100 = x100
Varianza Total SSTm

El valor complementario del coeficiente de determinacin, 1-R2, recibe el nom-


bre de coeficiente de no determinacin coeficiente de alineacin, que indica la
varianza de una variable no explicada por otra.
~2 )
COEFICIENTE DE DETERMINACIN AJUSTADO ( R

El coeficiente de determinacin ajustado, se puede expresar con las siguientes


frmulas:

~ MSE
R2 = 1
MSTm
EJEMPLO:
Calcular el coeficiente de correlacin de Pearson r y coeficiente de determina-
cin R2 con el ejemplo anterior que corresponde al estudio del efecto de cierto medi-
camento para disminuir la frecuencia cardaca en adultos.

El coeficiente de correlacin queda definido por.

rxy =
XY (X )(Y ) n
i i i i
=
. (26)(198) 13
4425
=09507
.
X (X ) n Y (Y )
2
i i
2
i
2
i
2
n . (26)2 13)(3226(198)2 13)
(63375

= 0.9507
Se ha encontrado una correlacin positiva y alta, es decir existe una directa
asociacin entre la variable dosis (mg) y reduccin del rtmo cardaco (lati-
dos/minutos) en personas adultas.
Calculamos el Coeficiente de Determinacin R2.
Estadstica Aplicada a la Educacin - 323 -

SSRm 190.08791
R2 = = x100 = 90.39%
SSTm 210.30769

Calculamos el Coeficiente de Determinacin Ajustada:

~ MSE 183816
.
R2 = 1 = 1 = 89.51%
MSTm 17.525641

Probar la hiptesis para 0


1. Hiptesis Estadstica: H 0: = 0
Ha: > 0
(ausencia de correlacin entre las variables)
(existencia de correlacin entre las variables en forma directa).
2. Elegir el nivel de significacin: = 0.05
3. Estadgrafo de Contraste.

r n-2
t= ,
1- r 2
4. Establecer la Regin de rechazo y aceptacin.

RA Ho : - 2.201 t c 2.201
RR Ho : t c < -2.201 t c > 2.201
5. Clculo del valor experimental.

r n-2 3153
.
t= = = 10.167
1- r 2 0.310112
6. Decisin:
Como tc =10.167 > t0.025,11 =2.201, cae en la regin de rechazo, entonces se
acepta la Ha: y se rechaza la H0:.
- 324 - V. Ibaez Q.
7. Conclusin:
Se puede concluir que existe diferencia significativa entre la variable do-
sis (mg) y reduccin del rtmo cardaco (latidos/minutos) en personas adul-
tas.
Calcular el intervalo confidencial para .

1 1+ r FG IJ Z 2 196
. 196
.
Zr = ln
2 1 r H K
= 18390097
. , E0 = = =
n 3 10 316227766
.
= 0619806
.

Pr tanh( Zr E0 ) tanh( Zr + E0 ) = 1

Pr tanh( 18390097
. 0.619806 ) tanh( 18390097
. + 0.619806 ) = 0.95

Pr tanh ( 1.2192033 ) tanh ( 2 .458816 ) = 0 .95

e1.2192033 e1.2192033 3.0890248


tanh( 12192033
. )= = = 0.839419
e1.2192033 + e 1.2192033 3.67995576
e2.45881616 e2.45881616 1160542698
.
tanh( 2.45881616 ) = 2.45881616
= = 098547
.
e2.45881616
+e 1177649928
.
Pr 0.8394 0.98547 = 0.95
EJERCICIOS:
En cada uno de los siguientes ejercicios
a) Elaborar un diagrama de dispersin.
b) Calcular el coeficiente de correlacin de la muestra
c) Probar Ho: = 0 al nivel de significacin de 0.05 y sacar conclusiones.
d) Construir el intervalo de confianza del 95 por ciento para .
1. Se espera que, por lo general, el nmero de horas de estudio (X) en la preparacin
de un examen tenga una correlacin directa (positiva) con la calificacin (Y) al-
canzada en tal examen. En la tabla siguiente se presentan las horas de estudio as
como las calificaciones obtenidas por diez estudiantes seleccionados al azar de un
grupo.
Estadstica Aplicada a la Educacin - 325 -

Estudiante 1 2 3 4 5 6 7 8 9 10 TOTAL
Horas de estudio (X) 10 6 15 11 7 19 17 3 13 17 118
Calificacin en el examen (Y) 51 36 67 63 44 89 80 26 50 85 591

2. Los datos muestran el aumento en la rapidez de lectura (Y), y el nmero de sema-


nas que se asisti a un curso para mejorarla (X), para ocho estudiantes:
X 3 5 2 8 6 9 3 4
Y 80 110 50 190 160 230 70 110

3. El conjunto de 25 puntuaciones siguientes fue seleccionado aleatoriamente de la


lista de clases de un profesor. Sean X y Y las puntuaciones promedio prefinales
(Y) del examen final, respectivamente (la mxima calificacin final posible fue
de 75 puntos).
Estudiante 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
X 75 86 68 83 57 66 55 84 61 68 64 76 71 73 78 71 86 71 96 96 59 81 58 90 92
a) Trace el diagrama de dispersin para estos datos; b) trace la recta de regresin,
y estima su ecuacin, c) Estime el valor del coeficiente de correlacin lineal, d)
Trace la grfica de la recta de mejor ajuste cmo se le compara con la estimada?;
e) Calcule el coeficiente de correlacin lineal Cmo se le compara con la estima-
cin?; f) Contraste la significacin de r al nivel = 0.01; g) encuentre la
estimacin por intervalo de confianza de 95% para el valor verdadero de (rho);
h) Calcule la desviacin estndar de los valores de Y con respecto a la recta de
regresin; i) Calcule la estimacin por intervalo de confianza de 95% para el
valor verdadero de la pendiente 1 ; j) Contraste la significacin de la pendiente
al nivel = 0.05; k) Estime la calificacin promedio que obtendrn en el exa-
men final todos los estudiantes que tuvieron una media prfinal a 85 (invervalo de
confianza de 95%); l) Utilice un intervalo de confianza de 95% para predecir la
calificacin que recibir una alumna en su examen final, si se sabe que su prome-
dio previo al final es 78.

4. Una muestra aleatoria simple de 15 nios aparentemente sanos, con edades entre
6 meses y 15 aos, proporcion los siguientes datos sobre la edad, X, y el volu-
men del hgado por unidad de peso corporal (ml/kg), Y.
X 0.5 0.7 2.5 4.1 5.9 6.1 7.0 8.2 10.0 10.1 10.9 11.5 12.1 14.1 15.
Y 41 55 41 39 50 32 41 42 26 35 25 31 31 29 23
- 326 - V. Ibaez Q.

11.6. REGRESIN LINEAL MLTIPLE


Muchos problemas de regresin involucran ms de una variable regresiva.
Tales modelos de regresin se denominan regresin mltiple. La regresin mltiple
es una de las tcnicas estadsticas ms ampliamente utilizadas en la actualidad. En
esta oportunidad se presenta las tcnicas bsicas de la estimacin de parmetros; la
estimacin de parmetros es mediante el Mtodos de los Mnimos Cuadrados, se
realizar la estimacin del intervalo de confianza y de la verificacin de la suficiencia
del modeo para la regresin mltiple. Se presentar tambin algunos de los problemas
encontrados con frecuencia en el uso prctico de la regresin mltiple, incluyendo la
construccin del modelo y la seleccin de variables y la dependencia casi lineal entre
los regresores. El modelo de regresin que involucra ms de una variable regresora
se llama modelo de regresin mltiple; como un ejemplo, supngase Y, la variable de
dependientey X1 y X2 son las variables independientes. Un modelo de regresin
mltiple que podra describir esta relacin es:

Y = 0 + 1 X 1 + 2 X 2 +

Donde:
Y = Representa la variable dependiente.
X1 y X2 = Son las variables independiente o regresoras.
0 ,1 , 2 = Son los parmetros desconocidos que ser estimado.
= Es el error residual o perturbacin.
Este es un modelo de regresin lineal mltiple con dos regresores. El trmino
"lineal" se emplea debido a que la ecuacin anterior es la funcin lineal de los
parmetros desconocidos 0 ,1 , 2 . Ntese que el modelo describe un plano en el
espacio bidimensional X1 y X2. El parmetro 0 define la ordenada al origen del
plano. Algunas veces llamamos a 1 y 2 coeficientes de regresin parciales, porque
1 mide el cambio esperado en Y por cambio unitario en X1 cuando X2 se mantiene
constante, y 2 mide el cambio esperado en Y por cambio unitario en X2 cuando X1
se mantiene constante.

En general, la variable dependiente o variable de respuesta Y puede relacionarse


con k-variables independientes. El modelo es:
Estadstica Aplicada a la Educacin - 327 -

Yi = 0 + 1 Xi1 + 2 Xi2 +L+ k Xik + i ; Y = X +


Se denomina modelo de regresin lineal mltiple con k-variables
independientes. Los parmetros j , j = 0,1,K , k , se llaman coeficientes de regresin.
Este modelo describe un hiperplano en el espacio k-dimensional de las variables
regresoras Xi. El parmetro j representa el cambio esperado en la respuesta Y por
cambio unitario en Xj todas las variables independientes restantes Xi (i j) se
mantienen constantes. Los parmetros j , j = 1,K , k , se denominan algunas veces
coeficientes de regresin parciales, porque ellos describen el efecto parcial de una
variable independiente cuando las otras variables independientes en el modelo se
mantien constantes.

Estimacin de parmetros.
El mtodo de Mnimos Cuadrados puede utilizarse para estimar los coeficientes
de regresin. Supngase que se dispone n>k observaciones, y djese que Xij denote la
observacin isima o el niel de la variable Xj.
Podemos escribir el modelo, en trminos de las observaciones como:

Yi = 0 + 1 X i 1 + 2 X i 2 + L + k X ik + i
k
= 0 +
j =1
j X ij + i i = 1 ,2 , . . . . , N

Se estima por el mtodo de mnimos cuadrados para encontrar las siguientes


ecuaciones normales.
N N N N
N$0 + $1Xi1 + $2Xi2 + L + $k Xik = Y i
i=1 i=1 i=1 i=1
N N N N N
$0Xi1 + $1Xi21 + $2Xi1Xi2 + L + $k Xi1Xik = X Y i1 i
i=1 i=1 i=1 i=1 i=1 (3)
M M M M M M M M M M M
M M M M M M M M M M M
N N N N N
$ X + $ X X + $ X X + L + $ X2
0 ik 1 ik i1 2 ik i2 k ik = X Y ik i
i=1 i=1 i=1 i=1 i=1

Ntese que hay p = k+1 ecuaciones normales, una para cada uno de los
coeficientes de regresin desconocidos. La solucin para las ecuaciones normales
sern los estimadores de mnimos cuadrados ordinarios de los coeficientes de regresin,
- 328 - V. Ibaez Q.

$ 0 , $ 1 ,K , $ k .

Es ms simple resolver las ecuaciones normales si ellas se expresan en notacin


matricial. Daremos ahora un desarrollo matricial de las ecuaciones normales que es
similar al desarrollo de la ecuacin (3). El modelo en trminos de las observaciones,
se puede escribir en notacin matricial como: Y = X +
Si asignamos a X i 0 = 1 , entonces extendiendo en forma general para k-
variables X tenemos:

LMY OP 1 LM X 10 X11 X12 L X1k OP LM1 X11 X12 L X1kOP


Y =M P X =M P =M P
Y X X21 X22 L X2k 1 X21 X22 L X2k
MM M PP MM M P M M P
1 20

NY Q N Nx1 NX N0
M M
XN1 XN2
M
P MM
L X Q N1Nk
M M
XN1 XN2 L X Q
P
Nk N( k+1)

LM OP 0 LM OP 1

=M P =M P

MM M PP MM M PP
1 2
y
, adems se sabe que: Y = X +
N Q k ( k +1 ) x 1 N Q N Nx 1

Propiedades:
a) E( ) = 0, E( Y ) = X, Y = E( Y ) + , = Y E( Y )

b) Var ( ) = E E ( ) E ( ) ' = E ( ' ) = I N


2

Para estimar el parmetro , utilizamos el mtodo de los mnimos cuadrados,


es decir se debe minimizar el error de la siguiente forma:
N


i =1
2
i =' = Y E ( Y ) ' Y E ( Y )

= ( Y X )' ( Y X )
= ( Y' ' X ' )( Y X )
= ( Y' Y Y1
'2
X3 ' X ' Y + ' X ' X
( Y ' X )' = ' X ' Y

= ( Y' Y ' X ' Y ' X ' Y + ' X ' X


= Y' Y 2' X ' Y + ' X ' X
Estadstica Aplicada a la Educacin - 329 -
NOTA: Por propiedad se sabe que:

a) ( a' X ) = a , ( X ' Y )'


= X' Y
X

b) ( X ' AX ) = 2 AX , ( ' X ' X )


= 2 X ' X
X
Simplificando se tiene que X ' X$ = X ' Y , que son las ecuaciones normales de
mnimos cuadrados. Para resolver las ecuaciones normales, multiplquense ambos
lados de la ecuacin X ' X$ = X ' Y por la inversa de X'X. De tal modo, el estimador de
mnimos cuadrados de es:

( X ' X )1 X ' X$ = ( X ' X )1 X ' Y , $ = ( X ' X )1 X ' Y

Es fcil ver que la forma matricial de las ecuaciones normales es idntifica a


la de la forma escalar. Al escribir completa la ecuacin X ' X$ = X ' Y obtenemos:

LM N OP L Y O
PPLM$$ OP MM PP
N N N N
Xi1 Xi2 L Xik
MM i=1 i=1 i=1
i

L X X M P MX YP
0 i=1
N N N N N

MMX X X X PPM M P=M P


2

PPMMN$ PPQ MM M PP
i1 i1 i1 i2 i1 ik 1 i1 i
i=1 i=1 i=1 i=1 i=1

MM M M M M

PQ MMNX YPPQ
N N N N N

MNX X X X X L X 2 k
ik ik i1 ik i2 ik ik i
i=1 i=1 i=1 i=1 i=1

Cuando X ' X es de rango completo, la solucin de X ' X$ = X ' Y para $


$ ( X' X )1 X' Y . Por otro lado si ( X ' X )1 no existe, la solucin de
puee ser escrito como =
X ' X$ = X ' Y puede se escrito en trminos de una inversa generalizada de X ' X . Este
es el caso de modelo de rango no completo. Por la naturaleza de X mostrada
anteriormente la matriz X ' X es cuadrada de orden (k+1), con los elementos que son
suma de cuadrados y productos, como se presenta a continuacin:
- 330 - V. Ibaez Q.

LM X N N

X X X X
N
OX X P
N
LMX YOP L O
N

MM PP MM Y. PP
2
L
MM P
i0 i0 i1 i0 i2 i0 ik i0 i

L X X P
i =1 i =1 i =1 i=1 i=1

X' Y = MX Y P = MX Y P
N N N N N

X' X = M X X X P,
2 N

MM M PP MM PP
X X
MM M M P
i0 i1 i1 i1 i 2 i1 ik
i=1 i=1 i=1 i=1
y i1 i
i1 i
i=1
M M
P i =1

MMX X L X P MMX YPP MMNX YPPQ


N
N N N N N

i=1N i 0 ik X X X X
i=1
ik i1
i=1
ik i2
PQ i=1
2
ik
N Q i =1
ik i i=1
ik i

As X ' X es la matriz de suma de cuadrados y productos de los Xs observados


y X'Y es el vector de suma de productos de los Xs observados e Ys.
Adems, se sabe que las expresiones puede tomar la forma siguiente:
X 2
i0 = N, X i0 X i1 = X i1 = X .1
X i 0 = 1, i =1,2 ,...., N ,
X i1 iY = Yi = Y .

LM N X X L X OP LM N X L O
X X PP
i1 i2 ik
X .1 .2 X.k
MX X X X 2
L P M
X X X X X X 2
L
X' X = MX P M X X PP
i1 i1 i1 i2 i1 ik .1 i1 i1 i2 i1 ik

MM M X X X L P M = L
2 2
i2 i1 i2 i2 X X i2 ik
X X X X .2 i1 i2 i2 i2 ik

MNX
M M M PP M M M M M PP
ik Xi1Xik Xi2 Xik L Xik2 Q MNX .k i1Xik
X i2 Xik L
X Xik2 Q
El modelo de regresin ajustado es: Y$ = X$ . En notacin escalar, el modelo ajustado es:
k
y$i = $ 0 + $ j xij , i = 1,2 ,.., N
j =1

ANALISIS DE REGRESION: Hiptesis: H 0: = 0 vs. H a : 0


TABLA DE ANALISIS DE VARIANZA: FORMA MATRICIAL.

F. de V. G.L. Suma de Cuadrados Cuadrados Medios Fobs.

SSRm
SSRm = b$ ' X ' Y NY 2
M SRm
Regresin r-1 = MSR m
r 1 M SE
SSE
Error resid. N - r SSE = Y ' Y b$ ' X ' Y rN
= MSE

Total N-1 SSTm = Y ' Y NY 2


Estadstica Aplicada a la Educacin - 331 -
EJEMPLO:
En un estudio diseado para descubrir qu factores podran estar relacionados
con el peso al nacer, se obtuvieron los siguientes datos en 10 nios recin naci-
dos.

Peso al nacer Calificacin de condicin Orden


en gramos (Y) socioeconmica (X1) de nacimiento (X2)
1361 8 4
1588 7 3
1815 4 4
2087 5 3
2268 5 2
2404 4 2
3402 3 2
3629 3 1
3765 2 1
4083 1 1

a) Estimar la ecuacin de regresin ajustada, b) Construir la Tabla de ANOVA,


c) Encontrar los intervalos confidenciales para bi (betas) e interpretar.

SOLUCIN:
a) Estimar la ecuacin de regresin mltiple.
N

X i1 X i2 10 42 23

X ' X = X i1 X 2
i1 X Xi1 i 2 = 42 218 114
X i 2 X X X 2 23 114 65
i1 i2 i2

10 42 23
Yi 26402 42 218 114

X ' Y = X i1Yi = 93361 det( X ' X ) = 23 114 65 = 2006
,
X i 2Yi 51354 10 42 23
42 218 114

A11 A21 A31 117 108 226 a11 a12 a13


Adj ( X ' X ) = A12 A22 A32 = 108 121 174 X ' X = a21 a22 a23
,
A13 A23 A33 226 174 416 a31 a32 a33
- 332 - V. Ibaez Q.

A11 = a22 a33 a32 a23 = 1174 A21 = a12 a 32 a 32 a13 = 108
A12 = a 21 a33 a31 a 23 = 108 A22 = a11a33 a31a13 = 121
A13 = a21a32 a31a22 = 226 A23 = a11a23 a21a13 = 174

A31 = a21a32 a31a22 = 226


A32 = a11 a 32 a31 a12 = 174
A33 = a11a22 a21a12 = 416
117 108 226 0.58524427 0.53838480.1126620
Adj(X' X) 1
(X' X)1 = = 108 121 174 = 0.053838480.06031904 0.08673978

det(X' X) 2006
226 174 416 0.112662010.08673978 0.20737787

0.58524427 0.5383848 0.11266201 26402 4639.55932


= ( X ' X )1 X 'Y = 0.05383848 0.06031904 0.08673978 93361 = 244.432203
0.11266201 0.08673978 0.20737787 51354 422.932203

Y = 4639.55932 244.432203 X i1 422.932203 X i 2

b) Tabla de ANOVA
Grados de libertad (GL.)
GLreg = p - 1 = 3 - 1 = 2
GLerror = N - p = 10 - 3 = 7
GLtotal = N - 1 = 10 - 1 = 9

Sumas de Cuadrados (SS):


26402 2

] 93361 10 26402 =8247389


SSRm = ' X'Y NY 2 = [4639.55932 244.432203 422.932203 .51
10
51354

2
26402
SSTm = Y 'Y NY 2 = 78536258 10 = 8829697.6
10
SSE = 8829697.6 - 8247389.51 = 582308.09
Estadstica Aplicada a la Educacin - 333 -

Tabla de Anlisis de Varianza para la Frecuencia Cardaca


F. de V. G.L. S.S. M.S. Fc. Signif
Debido a Regresin 2 8247389.510 4123694.7550 49.57 **
Error residual 7 582308.090 83186.8700
Total 9 8829697.600 981077.5111

Clculo del Coeficiente de Determinacin:

SSR m 8247389 .51


R2 = x 100 = ( 100 ) = 93.41 %
SSTm 8829697 .6

~2 )
COEFICIENTE DE DETERMINACIN AJUSTADO ( R

~ MSE 83186.87
R2 = 1 = 1 = 9152
. %
MSTm 981077.51

INTERVALO CONFIDENCIAL (IC) PARA ( i ).

LM OP
Pr $ i t ,( Nr ) V($ i ) i $ i + t ,( Nr ) V($ i ) = 1
N 2 2 Q
V ( $ i ) = ( X ' X )1 MSE

SALIDA DEL SAS.


The REG Procedure
Model Crossproducts XX XY YY

Variable Intercept X1 X2 Y
Intercept 10 42 23 26402
X1 42 218 114 93361
X2 23 114 65 51354
Y 26402 93361 51354 78536258

XX Inverse, Parameter Estimates, and SSE


Variable Intercept X1 X2 Y
Intercept 0.5852442672 -0.053838485 -0.112662014 4639.559322
X1 -0.053838485 0.0603190429 -0.086739781 -244.4322034
X2 -0.112662014 -0.086739781 0.2073778664 -422.9322034
Y 4639.559322 -244.4322034 -422.9322034 582308.09322

Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 8247390 4123695 49.57 <.0001
Error 7 582308 83187
Corrected Total 9 8829698
- 334 - V. Ibaez Q.

Root MSE 288.42134 R-Square 0.9341


Dependent Mean 2640.20000 Adj R-Sq 0.9152
Coeff Var 10.92422

Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t| 95% Confidence Limits
Intercept 1 4639.55932 220.64596 21.03 <.0001 4117.81454 5161.30411
X1 1 -244.43220 70.83610 -3.45 0.0107 -411.93295 -76.93145
X2 1 -422.93220 131.34350 -3.22 0.0147 -733.51024 -112.35417

Covariance of Estimates
Variable Intercept X1 X2
Intercept 48684.639043 -4478.65504 -9372.000361
X1 -4478.65504 5017.7524056 -7215.610897
X2 -9372.000361 -7215.610897 17251.115709

EJERCICIOS:
Obtener la ecuacin de regresin para cada uno de los siguientes conjuntos de
datos.
1. Un investigador reuni los siguientes datos sobre 15 nios.

Calificacin de Orden de Edad de la madre al


inteligencia (Y) nacimiento (X1) nacimiento del producto (X2)
110 1 25
115 1 24
120 1 22
118 1 24
110 2 20
108 2 20
105 2 20
104 3 24
98 3 25
99 4 30
98 4 24
100 5 29
90 5 30
93 5 30
90 6 28
Estadstica Aplicada a la Educacin - 335 -

12
DISEOS EXPERIMENTALES

12.1. DISEO COMPLETAMENTE AL AZAR (DCA)

El Diseo Completamente al Azar, es aquel en el cual los tratamientos son


asigandos en forma aleatoria a las unidades experimentales, o viceversa, sin
ninguna restriccin; por lo tanto, se considera que es un diseo eficiente cuando
las unidades experimentales de los que se dispone son muy homogneas. Debido
a su simplicidad, el Diseo Completamente al Azar es usado frecuentemente.

CARACTERISTICAS:

a) Los tratamientos se distribuyen en forma aleatoria en todas las unidades expe-


rimentales, y el nmero de repeticiones o unidades por tratamiento puede ser
igual o diferente.
b) Este diseo es til cuando las unidades experimentales tienen una variabili-
dad uniformemente repartida.
c) El diseo completamente al azar proporciona el mximo nmero de grados de
libertad para la estimacin del error experimental; adems, no requiere esti-
mar datos faltantes, es decir, el diseo puede analizarse con diferente nmero
de repeticiones por tratamiento.
- 336 - V. Ibaez Q.
MODELO ESTADISTICO LINEAL.
En este diseo el valor de cada unidad experimental Yij se aplica segn el si-
guiente Modelo Estadstico Lineal.

Yij = + i + ij , i = 1,2 , ...., t


j = 1,2 , .... , r
Donde:
Yij = Es una observacin en la j-sima unidad experimental, sujeto al i-simo trata-
miento.
= Es el efecto de la media general o constante comn.

i = Es el efecto del i-simo tratamiento.

ij = Efecto verdadero de la j-sima unidad experimental (replica), sujeta al i-simo


tratamiento (error experimental).

ESQUEMA DEL DISEO

Repeticiones Tratamientos (i)


(j) 1 2 3 .... t Total
1 Y11 Y21 Y31 .... Yt1 Y.1
2 Y12 Y22 Y32 .... Yt2 Y.2
3 Y13 Y23 Y33 .... Yt3 Y.3
. .... .... .... .... .... ....
. .... .... .... .... .... ....
. .... .... .... .... .... ....
r Y1r Y2r Y3r .... Ytr Y.r
Total (t) Y1. Y2. Y3. .... Yt. Y..
Total (r ) n1. n2. n3. .... nt. n..

VENTAJAS:

a) Es simple de planificar.
b) El nmero de repeticiones puede variar de tratamiento a tratamiento.
c) Existe ms grados de libertad para estimar el error experimental.
d) Es flexible en cuanto al nmero de repeticiones y tratamientos.
e) Es til cuando las unidades experimentales tienen una variablidad uniforme
repartida.
Estadstica Aplicada a la Educacin - 337 -
f) Cuando se pierde alguna parcela experimental se puede considerar que se
tena diferente nmero de repeticiones por tratamiento.
g) El Error Experimental puede obtenerse separadamente para cada tratamiento
para comprobar la suposicin de Homogeneidad del Error.

DESVENTAJAS:
a) Es ms apropiado para pequeo nmero de tratamientos y para un material
experimental homogneo y uniformemente distribudo.
b) No se puede controlar el Error Experimental, por lo tanto, no es un Diseo
muy preciso.
c) Cuando se tiene diferente nmero de repeticiones por tratamiento, es necesario
calcular un Error estndar por cada pareja de medias si se quiere comparar sus
diferencias.

ANALISIS DE VARIANZA.
Es una tcnica matemtica que nos permite descomponer una Fuente de Varia-
cin Total en sus Componentes atribuibles a Fuentes de Variacin conocida.

Diseo Completamente al Azar con igual nmero de repeticiones por tratamiento.

TABLA ANVA: Frmulas:

F. de V. G.L. S.C. C.M. C.M.E.


Modelo I Modelo II

t
Y i .2 Y2 SC trat . t
i2
Tratamientos t-1 .. 2 + r 2 + r 2
i=1 ri N t 1 i =1 t 1
ri
t t
Yi .2
Error Experimental N - t Y r 2
ij
S C erro r
2 2
i =1 j =1 i =1 i N t

ri
t
Y ..2
Total N-1 Y
i =1 j =1
ij
2

N

CM error Y..2
CV = .100 , TC = , Y.. = Gran Total
Y.. N
- 338 - V. Ibaez Q.

OBSERVACION:
a) MODELO I: Llamado modelo de anlisis de variancia o de efectos fijos. Este
modelo supone que los ti de una determinada subpoblacin son una cantidad fija,
una variable no aleatoria.
b) MODELO II:Llamado modelo de componentes de variancia o de efectos al azar.
Los tratamientos considerados dentro de un experimento se asumen como una
muestra al azar extrada desde una poblacin de tratamientos.

PROCEDIMIENTO DE HIPOTESIS:
i) La Hiptesis a probarse es:
Ho: i = 0
Ha: no todos los i = 0
ii) Nivel de Significancia: = 005
. = 001
.
CM trat .
iii) Estadstica de Prueba: Fc =
CM error
iv) Regla de Decisin:
a) Si Fc Fnn21, , entonces se acepta la Ho:
b) Si Fc > Fnn21,0.05 , se rechaza la Ho, representndose por un asterisco (*), lo
cual significa que la prueba es significativa.
c) Si Fc > Fnn21,0.01 , se rechaza la Ho, representndose por dos asteriscos
(**); lo cual significa que la prueba es altamente significativa.

EJEMPLO:
Se someti a cuatro gurpos de estudiantes a diferentes tcnicas de enseanza y se
les examin al final de un periodo especfico. Debido a las deserciones de los
grupos experimentales (por enfermedad, transferencias, etc.) el nmero de estu-
diantes vari de grupo a grupo. Presentan los datos mostrados en la siguiente
tabla la evidencia suficiente para indicar una diferencia en el rendimiento medio
para las cuatro tcnicas de enseanza?.
Estadstica Aplicada a la Educacin - 339 -

1 65 87 73 79 81 69 454
Grupos

2 75 69 83 81 72 79 90 549
3 59 78 67 62 83 76 425
4 94 89 80 88 351
a) Determinar los grados de libertad de cada una de las fuentes; b) determinar las
sumas de cuadrados de cada fuente de variacin; c) Hllar los cuadrados medios
respectivos; d) Hallar el valor del estadstico de la prue ba F; e) Calcular el valor
crtico para F basado en grados de libertad de las fuentes de variacin del trata-
miento y del error, y calcule el coeficiente de variacin del experimento. Use =
0.05.

PROCEDIMIENTO DE CLCULO:
a) Grados de Libertad:
GLtrat. = t -1 = 4 - 1 = 3
GLerror = N - t = 23 - 4 = 19
GLtotal = N - 1 = 23 - 1= 22

b) Suma de Cuadrados:
Y..2 17792
TC = = =1376017826
.
N 23
4
Y2 4542 5492 4252 3512
i) SCTrat. = r TC = 6 + 7 + 6 + 4 TC =138314369
. 1376017826 = 71258644
i.
. .
i=1 i

4 ri

ii) SCTotal =Yij TC=65 +87 +L+76 TC=1395111376017826


. =19092174
2 2 2 2
.
i=1 j=1

iii) SCError Exptal = SCtotal - SCtrat = 1909.2174 -712.58644 = 1196.63096

iv) CM trat = SCtrat = 712.58644 = 237.5288


t 1 3

SCError Exp. 1196.63096


Error Exp. = = = 62.9805768
v) CM
19 19
CM Trat . 237.5288
vi) Fc = = = 3.77
CM Error Exp. 62.9805768
- 340 - V. Ibaez Q.
TABLA DE ANALISIS DE VARIANZA
F. de V. G.L. S.C. C.M. Fc Pr > F
Entre grupos 3 712.58644 237.52881 3.77 0.028
Dentro de grupos 19 1196.63095 62.98058
Total 22 1909.21739

CM Error 62.980576
CV = ( 100 ) = ( 100 ) = 10.26%
Y .. 77.3478
La prueba F de la tabla de ANOVA nos muestra que la Fc = 3.77>F3,19,0.05=3.13,
entonces se acepta la hiptesis alterna (Ha:), es decir existe diferencia estadstica en
el el rendimiento medio entre los cuatro procedimientos de enseanza.

SALIDA DEL SAS.


The ANOVA Procedure
Class Level Information
Class Levels Values
Tratamiento 3 A B C D
REP 8 1 2 3 4 5 6 7
Number of observations 23

Dependent Variable: RDTO


Sum of
Source DF Squares Mean Square F Value Pr > F
Tratamiento 3 712.5864390 237.528813 3.77 0.0280
Error 19 1196.630952 62.980576
Corrected Total 22 1909.217391

R-Square Coeff Var Root MSE TIEMPO Mean


0.373235 10.26019 7.936030 77.34783

EJERCICIOS: Calcular el ANOVA e intreprete los resultados.


1.- La siguiente contiene el nmero de palabras escritas por minuto por cuatro secre-
tarias de la Universidad en cinco ocasiones diferentes, usando la misma mqui-
na. Calcular si difieren las velocidades de escritura de las 4 secretarias.
A 82 79 75 68 65
B 55 67 84 77 71
Secretarias
C 69 72 78 83 74
D 87 61 82 61 72
2.- En cuatro preparatorias de cierta comunidad los estudiantes del noveno grado
realizaron un examen de habilidades bsicas. En la tabla aparecen muestras
Estadstica Aplicada a la Educacin - 341 -
aleatorias de sus calificaciones:
Escuela A 20 21 22 24
Escuela B 24 21 22 25
Escuela C 16 21 18 13
Escuela D 19 20 21 20
Con un nivel de significacin de 0.05. es posible concluir que las calificacio-
nes promedios difieren en las distintas escuelas?

3.- 26 nios con la misma aptitud de lectura fueron divididos en tres grupos para
comparar la efectividad de tres mtodos de enseanza de lectura. A cada grupo se
le ense durante un tiempo determinado, utilizando uno de los tres mtodos.
Todos los alumnos fueron examinados al trmino del periodo de instruccin. Los
resultados del examen se tienen en la tabla siguiente. Es suficiente la evidencia
para rechazar la hiptesis de igualdad en efectividad de lso tres mtodos de ins-
truccin?. Utilice nivel de significacin de 0.05 y calcule el ANOVA.

MTODOS
I II III
45 45 44
51 44 50
Puntajes 48 46 45
en el 50 44 55
examen 46 41 51
48 43 51
45 46 45
48 49 47
47 44
TOTAL 428.00 402.00 388.00

4.- Tres grupos de estadstica elemental estuvieron a cargo de maestros distintos, al


final se plante un examen comn, cuyas calificaciones aparecen en la tabla.
A 75 91 83 45 82 75 68 62 47 95 38 79
MAESTROS B 90 80 50 93 53 87 76 58 82 98 78 64 80 70 33 79
C 17 81 55 70 61 43 89 73 73 93 58 81 70
Sea = 0.05. Usar el Diseo Completamente al Azar.
5. Se someti a 4 grupos de estudiantes a diferentes tcnicas de enseanza y se les
examin al final de un perio especfico. Debido a las deserciones de los grupos
experimentales (por enfermedad, traslado, etc) el nmero de estudiantes vari de
grupo a grupo Presentan los datos mostrados a continuacin evidencia suficien-
te para idicar una diferencia en el rendimiento medio para las cuatro tcnicas de
enseanza?.
- 342 - V. Ibaez Q.

TCNICA
1 2 3 4
65 75 59 94
87 69 78 89
73 83 67 80
79 81 62 88
81 72 83
69 79 76
90

Proporcionan estos datos la suficiente evidencia para indicar, a un nivel de sig-


nificacin de 0.01, que hay una diferencia entre las tcnicas de enseanza?. Usar
Diseo Completamente al Azar.

6. Se realiz un estudio para conocer cunto tiempo, en segundos, tardan los estu-
diantes avanzados de arte, msica y educacin fsica en terminar cierta tarea que
requiere habilidades motoras bsicas. De cada de las disciplinas se escogieron al
azar siete personas. Los resultados son los siguientes:

PRO GRA M A S
N r o a lu m n o A rt e M s ic a E d u c . F s ic a
1 17 24 25
2 21 18 24
3 25 19 25
4 16 22 21
5 19 23 22
6 22 20 28
7 18 21 19

Es posible concluir que los tres programas difieren en cuanto a habilidades


motoras bsicas?. Sea = 0.01. Usar diseo completamente al azar.
Estadstica Aplicada a la Educacin - 343 -

12.2. DISEO BLOQUE COMPLETO AL AZAR (DBCA)

CARACTERISTICAS:
Este diseo es uno de los ms ampliamente conocidos y difundidos de los diseos
experimentales, tambin se conoce como Diseo Bloque Completamente Aleatorizado,
y se caracteriza porque los tratamientos se distribuyen en forma aleatoria, a un grupo
de unidades experimentales denominado bloque, la finalidad es que las unidades
experimentales dentro de un bloque sean lo ms homogneas posibles, es decir el
nmero de unidades experimentales en cada bloque debe ser igual al nmero de
tratamientos que se quiere estudiar.
Los bloques pueden estar formados por reas homogneas de un terreno, grupo
de animales que puedan manipularse en forma uniforme (misma raza, misma edad,
mismo peso, etc.)
En resumen, en este diseo de bloques completos al azar los tratamientos son
aleatoriamente asignados a las unidades experimentales (homogneos) dentro de cada
estrato o subgrupo o bloque. De esta forma, el proceso de aleatorizacin de los
tratamientos ha sido restringido a las unidades dentro de cada bloque. Desde el punto
de vista de la variabilidad de los datos, se han introducido una variabilidad artificial
por estudiar distintos tratamientos.
La variabilidad natural existente entre las unidades experimentales puede ser
subdividida por el hecho de haber agrupado las unidades experimentales en grupos
heterogneos (bloques) pero conformados por unidades homogneas. As, parte de lo
que es la variabilidad natural de las unidades puede ser atribuda a algo ahora conocido
(bloques) y otra parte seguir siendo variabilidad natural de las unidades
experimentales.
Los bloques o repeticiones puede ser das, observadores, animales, corrales,
pacientes, colegios, clones, laboratorios, estufas, cmaras de crecimiento, etc. As
este diseo podra ser usado para controlar una fuente de variacin en el material
experimental y no solamente la variacin entre bloques en un campo.

VENTAJAS:
1) Precisin: este diseo ha resultado ms preciso que el diseo completamente al
azar, para la mayora de los tratamientos experimentales. La eliminacin de la
suma de cuadrados de bloques desde la suma de cuadrados del error usualmente
resulta en un decrecimiento en el cuadro medio del error a pesar de la prdida de
grados libres para estimar este error. Permite ganar mayor precisin en el
experimento, principalmente cuando existe diferencias significativas entre bloques.
Flexibilidad: no existe una restriccin en relacin al nmero de tratamientos y
de repeticiones, sin embargo, el aumento en el nmero de tratamientos conlleva a
- 344 - V. Ibaez Q.
la prdida de la homogeneidad dentro de bloques.
2) Es un diseo bastante usado por su adaptabilidad, recomendndose generalmente
ms de tres bloques y por lo menos dos tratamientos por bloque.
3) Es factible realizar el anlisis experimental, cuando por alguna causa se hubiera
perdido algn bloque. Adems si el resultado de una unidad experimental no se
llegara a registrar (prdida de la unidad experimental), existen tcnicas estadsticas
simples para poder estimar el resultado.

DESVENTAJAS:
1) La desventaja de este diseo es que no es adecuado a gran nmero de tratamientos
y para los casos en que el bloque contenga considerable variabilidad.
2) Cuando existe prdida de muchas unidades experimentales, el anlisis estadstico
se complica seriamente y muchas veces no es posible analizarlo.
3) No es recomendable utilizar este diseo cuando se verifica que existe interaccin
entre bloques y tratamientos.

MODELO ADITIVO LINEAL.

EL Modelo estadstico Lineal aditivo en el DBCA es el siguiente:

Yij = + i + j + ij ; i = 12
, ,L, t (t = tratamientos)
j = 12
, ,L, r (r = bloques)
Donde :
Yij = Variable de respuesta observada en la unidad experimental ubicada en el j-
simo bloque que recibe el tratamiento "i".
= Constante para toda observacin, es la media de la poblacin.
i = Es el efecto del tratamiento i, el cual es igual a ( i ), es decir, a la
diferencia entre el promedio poblacional del tratamiento y la media poblacional
.
j = Es el efecto del bloque j, el cual es igual a ( j ), es decir a la diferencia
entre el promedio poblacional del bloque y la media poblacional .
ij = Trmino que representa el error de su respectiva Yij se considera variable
aleatoria distribuida en forma normal e independiente con media cero y
variancia constante, es es: ij ~ D N I (0, 2
e ).
Estadstica Aplicada a la Educacin - 345 -
t b

En modelo I (o efectos fijos) estn sujetos a la restriccin:


i =1
i = 0,
j =1
j =0

En modelo II (o efectos al azar) son variables aleatorias i ~ (0, ), j ~ (0, 2 )


2

HIPOTESIS: Modelo I Modelo II

H0: i = 0 H0:2 = 0
Respecto a tratamientos:
Ha: i 0 Ha:2 0

H0: j = 0 H0: 2 = 0
Respecto a bloques:
Ha : j 0 Ha : 2 0

ANALISIS DE VARIANZA

Tabla de Anlisis de Varianza del Diseo Bloque Completamente al Azar (DBCA)


Frmulas.

F. de Variacin G.L. S.C. C.M. Fc. CME(II)

r Y . j2 Y ..2

SC bloque CM bloque
Bloques r-1 2e + t 2
j =1 t tr r 1 CM error

t
Yi .2 Y..2

SC tratam . CM trat .
Tratamientos t-1 2e + r 2
i =1 r rt t 1 CM error

dY i
t r
2 SCerror
Error experimental (t-1)(r-1) Yi . Y. j + Y.. 2e
(t 1)(r 1)
ij
i =1 j =1

t r
Y ..2
Total tr - 1
i=1 j=1
Y ij2
tr

Y..2 CMerror
TC = , SCerror = SCtotal (SCtrat. + SCbloque ), CV.= x100
tr Y..
- 346 - V. Ibaez Q.

EJEMPLO
Supongamos que, en el mbito de la psicologa educativa, realizamos una investigacin
para examinar la influencia que ejerce la metodologa de trabajo empleada en el aula
(tratamientos) sobre el rendimiento presentado por un grupo de nios en la asignatura
de Ciencias Naturales. No obstante, se considera que una posible variable extraa,
capaz de contaminar los resultados del estudio, es el nivel de motivacin de los
sujetos (grupos o bloques). Con el objeto de controlar dicha variable se utiliza un
diseo bloque completo al azar. Se dividen los nios en cuatro bloques, de tres sujetos
cada uno, en funcin de las puntuaciones que obtienen en una prueba destinada a
medir su nivel de motivacin con respecto al aprendizaje, a saber: I (nivel de
motivacin bajo, II (nivel de motivacin medio-bajo), III (nivel de motivacin medio-
alto y IV (nivel de motivacin alto). A continuacin, a cada uno de los sujetos que
configuran cada bloque se le somete a una de las tres siguientes metodologas de
trabajo A: metodologa basada en medios audiovisuales, B: metodologa basada en el
contacto directo con la naturaleza y C: metodologa tradicional. La informacin se
presenta a continuacin:

Nivel de M etodologa de trabajo


M otivacin A =1 B=2 C=3 Total
I 4 14 2 20
II 7 12 4 23
III 8 15 5 28
IV 12 19 5 36
Total 31 60 16 107

PROCEDIMIENTO DE CLCULO:
a) Grados de Libertad:
GLbloque = r - 1 = 4 - 1 = 3
GLtrat. = t -1 = 3 - 1 = 2
GLerror = (r-1)(t-1) = 6
GLtotal = tr - 1 = 12 - 1= 11
b) Suma de Cuadrados:
Y..2 1072
TC = = = 954.08333
tr 12
4 Y2 202 + 232 + 282 + 362
i) SCBloque = t TC = TC = 1003 95408333 = 4891667
.j
. .
i =1 3
Estadstica Aplicada a la Educacin - 347 -
3
Y2 312 + 602 +162
ii) SCTrat . = r TC = TC = 120425
. 954083333 = 25016667
i.
. .
i=1 4
3 4

iii) SCTotal = Yij TC = 4 +7 +L+5 TC =1269TC = 314916667


2 2 2 2
.
i=1 j=1

iv) SCError Exptal = SCtotal - SCtrat - SCbloue


= 314.916667-250.16667-48.91667 = 15.8333

TABLA DE ANALISIS DE VARIANZA


F. de V. G.L. S.C. C.M. Fc Sign.
Entre bloques 3 48.91667 16.30556 6.18 *
Entre metodologas 2 250.16667 125.08334 47.40 **
Error Exptal. 6 15.83333 2.63889
Total 11 314.91667

CM Error 2.63889
CV = ( 100 ) = ( 100 ) = 18.21%
Y .. 8.92

La prueba F de la tabla de ANOVA nos muestra para la fuente de variacin


bloque Fc = 6.18>F3,6,0.05=4.76, entonces se acepta la hiptesis alterna (Ha:), es decir
existe diferencia estadstica en el el rendimiento del nivel de motivacin. Asimismo
se ha encontrado diferencia estadstica altamente significativa para la metodologa
empleada en el aula, es decir ejerce una influencia significativa en el rendimiento de
los nios en la asignatura de Ciencias Naturales Fc = 47.40>F2,6,0.01=10.93

EJERCICIOS:

01. La siguiente tabla indica las calificaciones obtenidas por nueve estudiantes de
tcnico agropecuario seleccionadas al azar en los exmenes finales de tres mate-
rias distintas. Probar la hiptesis nula segn la cual los estudiantes de enfermera
que constituyen la poblacin de la cual se extrajo la muestra tienen un aprovecha-
miento igual en las tres materias, contra la hiptesis alternativa de que su aprove-
chamiento es mejor por lo menos en una de las materias. Sea = 0.05.
- 348 - V. Ibaez Q.

MATERIA
Estudiante Fundamentos Fisiologa Anatoma
1 98 95 77
2 95 71 79
3 76 80 91
4 95 81 84
5 83 77 80
6 99 70 93
7 82 80 87
8 75 72 81
9 88 81 83

02. Diecisis individuos con sobrepeso participaron en un anlisis para comparar cuatro dietas para reduccin
de peso. Los individuos formaron grupos de acuerdo con el peso inicial y a cada uno de los cuatro sujetos
de cada grupo se le asign, al azar, una de las cuatro dietas de reduccin de peso. Al terminar el perodo
experimental se consider la prdida de peso en libras como sigue:

Pes o RGIM EN
in icial (lib ras ) A B C D
150 a 174 12 26 24 23
175 a 199 15 29 23 25
200 a 225 15 27 25 24
M s d e 225 18 38 33 31

Despus de eliminar las diferencias debidas al peso inicial, estos datos proporcionan suficiente evidencia
para indicar una diferencia en los efectos de la dieta? Sea = 0.05. Realice el ANVA para DBCA.

03. Un equipo de remotivacin en un hospital psiquitrico efectu un experimento para comparar cinco
mtodos para remotivar a los pacientes. Estos ltimos se agruparon de acuerdo con el nivel inicial de
motivacin. A cada paciente de los cinco grupos se le asign, al azar, uno de los cinco mtodos. Al final del
periodo experimental, un equipo, formado con un psiquiatra, un psiclogo, una enfermera y un trabajador
social, evalu a los pacientes. Ningn miembro del equipo supo el mtodo asignado a cada paciente. El
equipo asign a cada paciente una calificacin como medida de su nivel de motivacin. Los resultados son
los siguientes:

Nivel incial MTODO DE REMOTIVACIN


de motivacin A B C D E
Nulo 58 68 60 68 64
Muy bajo 62 70 65 80 69
Bajo 67 78 68 81 70
Promedio 70 81 70 89 74

Proporcionan estos datos la evidencia suficiente que indique una diferencia en


los puntajes medios entre los mtodos? Sea = 0.05. Calcule el ANVA de DBCA.
Estadstica Aplicada a la Educacin - 349 -

13
EXPERIMENTOS FACTORIALES
Los Experimentos Factoriales son arreglos de tratamientos que permiten aplicar
de una sola vez una serie de estmulos o tratamientos que consideramos que inter-
vengan en la respuesta dada por una unidad experimental.
Los arreglos factoriales son de importancia prctica, ya que permiten el estudio
de un estmulo como tal y su respuesta combinatoria respecto de otras condiciones
generadas por la interaccin con otros factores, dando as informacin ms comple-
ta, aun cuando los efectos interaccionales no sean significativos. En las ciencias
agropecuarias normalmente se usan combinaciones hasta de tres factores debido prin-
cipalmente a la interpretacin fisiolgica de las interacciones. Los arreglos de trata-
mientos pueden ser estudiados en el contexto de los diseos bsicos, considerando
las caractersticas de las unidades experimentales con las que se trabaje.
Los Experimentos Factoriales no constituyen un diseo en s, sino que debe
arreglarse a cualesquiera de los diseos conocidos como: diseo completamente al
azar, diseo bloques completos, cuadrados latino, etc.
Su utilidad radica en que es posible estudiar simultneamente ms de un factor.
Ejemplo estudiar varias razas de los animales y el sexo de los mismos para determi-
nar sus incrementos de pesos; estudiar diversas variedades y su respuesta a las dife-
rentes formas de abonamiento, etc. Adems es importante porque nos permite com-
parar los niveles de cada factor entre s y adems las interacciones que puedan resul-
tar como consecuencia de las combinaciones de los niveles de cada factor.

Ventajas de los Experimentos Factoriales.


1. Permite estudiar los efectos principales, efectos simples as como de los efec-
tos de la interaccin.
2. Todas las unidades experimentales intervienen en la determinacin de los
efectos principales, efectos simples y de la interaccin.
3. Permite ganar mayor precisin en el experimento.
- 350 - V. Ibaez Q.

Desventajas de los Experimentos Factoriales.


1. Se requiere mayor nmero de unidades experimentales que en los experimen-
tos simples en los cuales se estudia nicamente un solo factor; as que en un
experimento factorial con 4 niveles del A, y 5 niveles del factor B, repetidos 5
veces para cada combinacin de tratamientos, se requerir 100 unidades
experimentales para estudiar solamente 2 factores, mientras si se quisiera
estudiar mayor nmero de factores el nmero de unidades experimentales
sera an mayor.
2. Como en los experimentos factoriales deben de combinarse todos los niveles
de los factores en estudio, algunas de estas combinaciones resulta de poco
inters del investigador.
3. El anlisis estadstico es mas complicado en comparacin con los experimen-
tos simples.

ELECCION DE LOS FACTORES.

FACTOR.
Es una clase de tratamiento que interviene en el experimento, es as que en los
Experimentos Factoriales, todo factor proporciona varios tratamientos; ejemplo de
factores: Razas de animales, variedades de alfalfa, dosis de nitrgeno, profundidad
de labranza, raciones alimenticias, dosis de una hormona, etc. A los Factores se les
simboliza generalmente por las primeras letras maysculas del alfabeto (A, B, C, D,
etc).

NIVELES DE UN FACTOR.
Son los diversos tratamientos que pertenecen a un determinado factor; y se acos-
tumbra a simbolizar un nivel cualquiera por la letra que representa el factor y el valor
del respectivo sub ndice. Ejemplo: el factor dosis de la hormona estilbestrol simbo-
lizado por A tiene 4 niveles en el experimento: a1 = 2cc, a2 = 3cc, a3 = 4cc, a4 = 5cc.

TIPOS DE FACTORES.
Los factores que se estudian en los experimentos se clasifican en:
Factor fijo:
Los niveles o tratamientos son fijados por el experimentador de acuerdo a su
inters. Son muy usuales en la experimentacin. Ejemplos:
- Factor Nitrgeno: 50, 70, 90 kg de N/ha.
- Factor temperatura: 10, 15, 18, 20 grados centgrados.
- Alimento: con ingrediente nuevo, sin ingrediente.
- Tres variedades de trigo: V1, V2, V3, etc.
Estadstica Aplicada a la Educacin - 351 -

Factor al azar:
Los niveles o tratamientos son seleccionados al azar de la poblacin de niveles,
constituyendo una muestra los que estn en el experimento. Ejemplo:
- Los aos en los que se cultivan ciertas variedades de papa, trigo, etc. son con-
siderados como una muestra de aos antes y aos despus de lo establecido.

Factores Cualitativos.

Los niveles o tratamientos son cualidades o categoras, cuyos niveles correspon-


den a procedimientos o cualidades y no tienen un orden natural y cada nivel tiene un
valor intrnsico. Ejemplo: mtodos de enseanza de cierta asignatura, variedades o
linajes de un cultivo, pocas del ao, clases de lana, razas, variedades, tipos de hor-
mona, tipos de alimento, etc.

Factores Cuantitativos.

Son aquellos cuyos niveles corresponden a cantidades numricas de un factor


cuantitativo, ya sea igualmente espaciadas o no. Ejemplo: distanciamiento entre plantas
de algodn a 50 cm., 60 cm., 70 cm., niveles de pH en la elaboracin de cierto
alimento: 2.0, 2.5, 2.8, 3.0, diferentes dosis de una hormona, diferentes dosis de una
racin protica, diferentes dosis de un abono nitrogenado, etc.

TIPOS DE EXPERIMENTOS FACTORIALES.

Los experimentos factoriales arreglados para un determinado diseo, se diferen-


cian entre s por el nmero de factores y cantidad de niveles que se va a estudiar en
cada factor.
Un experimento factorial en el cual se estudia dos factores, y cada factor con dos
niveles, se simboliza como 2Ax2B 2x2. El nmero de combinaciones de tratamien-
tos que intervienen en este factorial es el producto de las cantidades de niveles de los
factores en estudio, en este experimento existirn 4 tratamientos.

Los modelos estadsticos lineal aditivo en los experimentos factoriales en los dife-
rentes diseos es el siguiente:

13.1. EXPERIMENTO FACTORIAL DE DOS FACTORES

Los modelos estadsticos lineal aditivo en los experimentos factoriales en los dife-
rentes diseos es el siguiente:
- 352 - V. Ibaez Q.

MODELO LINEAL ADITIVO BAJO EL DISEO COMPLETO AL AZAR DE DOS FACTORES:

Yijk = + i + j + ( ) ij + ijk ; i = 1,2,L, p ( Nivelesde factor A)


j = 1,2,L, q ( Nivelesde factor B)
k = 1,2,L, r (repeticiones)
Anlisis de varianza para un factorial de dos factores en un Diseo Completamente
al Azar (DCA).

F. de Variacin G.L. S.C. C.M. Fc.

a b Yij2. Y...2

SC tratam . CM tratam.
Tratamientos t-1
i =1 j =1 r abr t 1 CM error

t
Yi ..2 Y...2
SC CM ( A)
A a-1 ( A )

i =1 br abr a 1 C M error

b Y. 2j . Y...2

SC CM (B)
B b-1 ( B )

j =1 ar abr b 1 C M error

SC ( AB ) C M ( AB )
AB (a-1)(b-1) SCtratam. SC( A) SC( B)
( a 1)(b 1) C M error

a b r a b Yij2. SC error
Error experim. ab(r-1) Y r
i =1 j =1 k =1
2
ijk
i =1 j =1 ab ( r 1)

a b r
Y...2
(abr - 1) Y
2
Total ijk
abr
i =1 j =1 k =1

Y ...2 CM
TC = , CV .= erro r
x1 0 0
abr Y ...
Estadstica Aplicada a la Educacin - 353 -
MODELO ESTADISTICO LINEAL EN EL DISEO BLOQUE AL AZAR.

EL Modelo estadstico Lineal aditivo en el DBCA es el siguiente:

Yijk = + k + i + j + ()ij + ijk ; i = 12


, ,L, p ( Nivelesde factor A)
j = 12
, ,L, q ( Nivelesde factor B)
k = 12
, ,L, r ( Bloques)
Anlisis de varianza generalizado del factorial de dos factores en un DBCA:Frmulas.

F. de Variacin G.L. S.C. C.M. Fc.

t
Y i ..2 Y2
S C b lo q u e s CM
Bloques r-1 ... b lo q .

i =1 br abr r 1 CM erro r

a b Yij2. Y ...2 S C tr a ta m . CM tratam .


Tratamientos t-1
i =1 j =1 r abr t 1 CM error

t
Y i ..2 Y 2

S C CM
A a-1 ... ( A ) (A)

i=1 br abr a 1 CM erro r

b Y . 2j . Y ...2 CM (B)

SC
B b-1 ( B )

j=1 ar abr b 1 C M error

Yij2. a
X i2.. b X .2j. X ...2 S C ( AB ) C M ( AB )
AB (a-1)(b-1) r + br ar
i, j i =1 j =1
+
abr g l( AB ) C M error

SCerror
Error experimental (ab-1)(r-1) por diferencia (ab1)(r 1)

a b r
Y...2
Total (abr - 1) Yijk2 abr
i =1 j =1 k =1

Y...2 C M error
TC = , CV = x 100
abr Y...
- 354 - V. Ibaez Q.

EJEMPLO
De una poblacin de 2500, se escogieron al azar 48 clases de psicologa de cuarto
de secundaria para un experimento en el cual se buscaba determinar la eficiencia de
dos mtodos y dos tipos de ayudas diferentes, as como de sus interacciones. Estas
clases se dividieron aleatoriamente en cuatro combinaciones segn el mtodo y el
tipo de ayudas. Transcurrido un semestre, a todas las clases se les administr la
misma prueba de rendimiento en psicologa. Siendo la unidad de muestreo la cla-
se, como unidad de anlisis se toma la media de la clase, segn el criterio de la
puntuacin obtenida en la prueba de rendimiento. Los resultados se presentan a con-
tinuacin:

A: Mtodo Tradicional (1) Moderno (2)


B: Ayudas Conferencia (1) Instruccin (2) Conferencia (1) Instruccin (2)
1 2 9 10 21
2 5 12 13 25
3 6 14 14 31
4 7 15 16 33
5 4 10 10 22
6 6 13 13 26
7 7 14 14 32
8 8 16 17 34
9 4 10 11 22
10 6 13 13 30
11 7 14 15 32
12 10 17 17 35
Yij. 72 157 163 343 Y...= 735
Yi.. Y1..= 229 Y2..= 506
Y.j. Y.1.= 235 Y.2.= 500

SOLUCIN:
a) GRADOS DE LIBERTAD.
GLMTODO =a-1=2-1 = 1
GLAYUDA =b-1=2-1 = 1
GLMxA = (a-1)(b-1) = (2-1)(2-1) = 1
GLERROR EXP = ab(r-1) = 2x2x(12-1) = 44
GLTOTAL = abr - 1 = 2x2x12 -1 = 47
Estadstica Aplicada a la Educacin - 355 -

b) SUMA DE CUADRADOS:
2
Y ( 735 )2
TC = = = 11254.6875
abr 2 x 2 x12
a Yi2 229 2 + 5062
SC Mtodo = TC = TC = 1598.520833
i =1 br 2 x12
b=2 Y2j 2352 + 5002
SC Ayuda = TC = TC = 1463.020833
j =1 ar 2 x12
a=2 b=2 Y 2
722 +1572 +1632 + 3432
SCcomb( MxA ) = TC = TC = 32495625
ij
.
i =1 j =1 r 12

SCInt ( MxA ) = SCComb( MxA ) ( SCMtodo + SCAyuda )


= 3249.5625 ( 1598520833
. + 1463020833
. ) = 188.020834
a = 2 b = 2 r =12
SCTotal = Yijk2 TC = 2 2 + 52 + L + 32 2 + 352 TC
i =1 j =1 k =1

= 118758.73 TC = 14969 11254.6875 = 3714.3125

SCERROR = SCTOTAL SCMTODO SCAYUDA SCMxA


= 3714.3125 1598520833
. 1463020833
. 188.020834
= 464.75

TABLA DE ANALISIS DE VARIANZA PARA LA PUNTUACIN OBTENIDA


EN LA PRUEBA DE RENDIMIENTO

F. De V. G.L. S.C. C.M. Fc. Signif.


Mtodos (M) 1 1598.520833 1598.520833 151.34 **
Ayudas (A) 1 1463.020833 1463.020833 138.51 **
Interaccin (MxA) 1 188.020834 188.020834 17.80 **
Error Experimental 44 464.750000 10.562500
Total 47 3714.312500
- 356 - V. Ibaez Q.

CM error 10.56250
CV . = x100 = x100 = 2122
. %
Y 735 48
INTERPRETACIN:

Al anlisis de varianza (ANVA) del cuadro precedente, para la interaccin Mtodos


por Ayudas, existe diferencia estadstica altamente significativa (P 0.01), lo que
nos demuestra que estos factores no son independientes, anulando los efectos
prinicipales entre Mtodos y Ayudas, adquiere importancia los efectos simples para
nuestras conclusiones.

MTODO TABULAR PARA EL ANLISIS DE VARIANZA DE LOS


EFECTOS SIMPLES

Mtodos
m0 m1 Y.j.
a0 72 163 235
Ayudas
a1 157 343 500
Yi.. 229 506 735 = Y...

a) Suma de Cuadrados de M en aj:


2 Yij2 Y2j 722 + 1632 2352
SC( M dentro a0 ) = = = 3450416667
.
i =1 r ar 12 2x12
2 Yij2 1572 + 3432 5002
Y2j
SC( M dentro a1 ) = = = 14415
.
i =1 r ar 12 2x12

b) Suma de Cuadrados de A en mi:


2 Yij2 Yi2 72 2 + 157 2 229 2
SC( A dentro m0 ) = = = 3010416667
.
j= r br 12 2 x12

2 Yij2 Yi2 1632 + 3432 5062


SC( A dentro m1 ) = = = 1350.0
j= r br 12 2 x12
Estadstica Aplicada a la Educacin - 357 -

ANLISIS DE VARIANZA DE EFECTOS SIMPLES

F. De V. G.L. S.C. C.M. Fc. Signif.


M dentro de a0 1 345.041667 345.04167 32.67 **
M dentro de a1 1 1441.500000 1441.50000 136.47 **
A dentro de a0 1 301.041667 301.04167 28.50 **
A dentro de a1 1 1350.000000 1350.00000 127.81 **
Error Experimental 44 464.750000 10.56250

CONCLUSIONES:
M dentro a0: Existe diferencia significativa entre los niveles de m0 y m1 bajo los
niveles de a0, es decir hay diferencia significativa en los mtodos de
enseanza con la ayuda de conferencia de clase.
M dentro a1: Existe diferencia significativa entre los niveles de m0 y m1 bajo los
niveles de a1, es decir hay diferencia significativa en los mtodos de
enseanza con la ayuda de instruccin programada.
A dentro m0: Existe diferencia significativa entre los niveles de a0 y a1 bajo los niveles
de m0, es decir hay diferencia significativa con las Ayudas de clase con
el mtodo tradicional.
A dentro m1: Existe diferencia significativa entre los niveles de a0 y a1 bajo los niveles
de m1, es decir hay diferencia significativa con las Ayudas de clase con
los mtodos modernos
Otra forma de observar la interaccin de los dos factores (Mtodo con Ayudas), es
graficando con los promedios de la siguiente forma:

33.0
28.58
30.0

27.0
Puntuacin obtenida (Rdto

24.0

21.0
Mtodos 18.0

m0 m1 15.0 m1
12.0
13.58
a0 6.00 13.58 9.0
13.08

Ayudas m0
a1 13.08 28.58 6.0
6.00
3.0

0.0
a0 a1
AYUDAS
- 358 - V. Ibaez Q.
Claramente se puede observar que los dos factores en estudio interactan entre s,
esto ratifica que los factores son dependientes unos del otro, es decir los segmentos
no son paralelos en el plano cartesiano que se muestra en la grfica precedente.

13.2. EXPERIMENTO FACTORIAL DE TRES FACTORES

Existen experimentos con tres factores, se presenta interaccin de primer orden e


interaccin de segundo orden; el anlisis tiende a complicarse a medida que se detecte
significacin en las interacciones, por ejemplo, si existe interaccin de 3 factores se
analiza estos resultados por efectos simples; sino existe interacin de tres factores
solo interacciones de dos factores, se analizar mediantes efectos simples.

MODELO ESTADISTICO LINEAL EN EL DISEO COMPLETO AL AZAR.

Yijkl = + i + j + k + () ij + ( )ik + ( ) jk + ( )ijk + ijkl


i = 12
, ,L, a ( Nivelesde factor A)
j = 12
, ,L, b ( Nivelesde factor B)
k = 12, ,L, c ( Nivelesde factor C)
l = 12
, ,L, r (repeticiones)
Donde:
Yijkl = Es la variable respuesta de la l-sima observacin bajo el k-simo nivel de
factor C, en el j-simo nivel del factor B, sujeto al i-simo nivel de trata-
miento A.
= Constante, media de la poblacin a la cual pertenecen las observaciones.
i = Efecto del del i-simo nivel del factor A.
j = Efecto del j-simo nivel del factor B.
k = Efecto del k-simo nivel el factor C
( )ij = Efecto de la interaccin del i-simo nivel del factor A, con el j-simo nivel
factor B.
( ) ik = Efecto de la interaccin del i-simo nivel del factor A, en el k-simo nivel del
factor C.
( ) jk = Efecto de la interaccin del j-simo nivel del factor B, en el k-simo nivel del
factor C.
()ijk = Efecto de la interaccin del i-simo nivel del factor A, en el j-simo
nivel del factor B, sujeto al k-simo nivel del factor C.
Estadstica Aplicada a la Educacin - 359 -

ijkl = Efecto del error experimental, que esta distribudo como ijkl ~ D N I ( 0 , e2 )

Anlisis de varianza para un factorial de TRES factores en un Diseo Completamente


al Azar (DCA): Frmulas.

F. de Variacin G.L. S.C. C.M. Fc. CME(I)

a b c Yijk2 . Y....2
r
SC tratam . CM tratam.
Tratamientos t-1
i=1 j=1 k =1 abcr t 1 CM error

Yi ...2
a
Y....2
SC CM ( A)
A a-1 ( A )
2e + rbck2
i =1 bcr abcr a 1 C M error

b Y. 2j .. Y....2
acr abcr
SC CM (B)
2e + rack2
( B )
B b-1
j =1 b 1 C M error

Y..2k .
c
Y....2

SC C M (C )
C c-1 (C )
2e +rabk2
k =1 abr abcr c 1 C M error

a b Yij2.. Y....2 SC ( AB ) C M ( AB )
AB (a-1)(b-1) cr abcr SC
i=1 j =1
( A) SC( B)
( a 1)(b 1) C M error
2e + rck2

a c
Yi.2k. Y....2 SC ( AC ) C M ( AC )
AC (a-1)(c-1) br abcr SC ( A) SC(C)
( a 1)( c 1) C M error
2e + rbk2
i=1 k=1

b c Y. 2jk. Y....2 SC ( BC ) C M ( BC )
BC (b-1)(c-1) ar abcr SC
j=1 k =1
( B) SC(C)
( b 1)( c 1) C M error
2e + rak2

SCtrat . SC( A) SC( B) SC(C) SC(BC) CM ( ABC )


ABC (a-1)(b-1)(c-1) SC( AB) SC( AC) SC( BC) 2e + rk2
(a 1)(b 1)(c 1) CM error
a b c r
SCerror
Error exper. abc(r-1) Y
i =1 j =1 k =1 l =1
2
ijkl SCtrat .
abc(r 1) 2e

a b c r
Y....2
Total (abcr - 1) Y 2
ijkl
abcr
i =1 j =1 k =1 l =1
- 360 - V. Ibaez Q.

Y....2 C M error
TC = , CV = x 100
abcr Y....

MODELO ESTADISTICO LINEAL EN EL DISEO BLOQUE COMPLETO AL


AZAR.

Yijkl = + i + j + k + Bl + () ij + ( ) ik + ( ) jk + ( ) ijk + ijkl


i = 1,2,L, a ( Nivelesde factor A)
j = 1,2,L, b ( Nivelesde factor B)
k = 1,2,L, c ( Nivelesde factor C)
l = 1,2,L, r ( Bloque)

Donde:

Yijkl = Es la variable respuesta de la l-sima bloque al que se le aplic el i-simo


nivel del factor A, j-simo nivel del factor B, y k-simo nivel del factor C.
= Efecto de la media general.
B l = Efecto del del l-simo bloque.
i = Efecto del del i-simo nivel del factor A.
j = Efecto del j-simo nivel del factor B.
k = Efecto del k-simo nivel el factor C
( ) ij = Efecto de la interaccin del i-simo nivel del factor A y del j-simo nivel factor B.
( )ik = Efecto de la interaccin del i-simo nivel del factor A y del k-simo nivel del factor C.
( ) jk = Efecto de la interaccin del j-simo nivel del factor B y del k-simo nivel del factor C.
()ijk = Efecto de la interaccin del i-simo nivel del factor A y del j-simo nivel del
factor B y del k-simo nivel del factor C.
ijkl = Efecto aleatorio o error experimental en la obtencin de
Yijkl

Anlisis de varianza para un factorial de TRES factores en un Diseo Bloque Completo


al Azar (DBCA): Frmulas.
ANLISIS DE VARIANZA (ANOVA)
Fuentes de Variacin G. L. S.C. C.M. Fc
r
Y...2l Y2 SCbloques CMblo
Bloques r-1
l =1 br abcr
....
r 1 CM err
a b c
Yijk2 . Y 2

Tratamientos abc - 1 r

abcr
.... SCtratam. CM tr
i =1 j=1 k =1
abc 1 CM e
t
Y i ...2 Y ....2
Factor A a-1 bcr

abcr
SC( A ) CM (
a 1
i=1 CM er
b
Y . 2j .. Y ....2 S C( B )

CM (
Factor B b-1
j=1 acr abcr b1 CM er
c
Y ..2k . Y ....2 S C( C )

CM (
Factor C c-1
k =1 abr abcr c1 CM er

F Y Y I bSC + SC g SC
2

GH cr abcr JK
a b 2 CM(
ij .. .... ( AB )
Interaccin AxB (a - 1)(b - 1)

Estadstica Aplicada a la Educacin


i =1 j =1 (a1)(b1) A B CMe

FG Y Y IJ bSC + SC g SC
a c 2 2 CM ( A

H br abcr K
i .k . .... ( AC)
Interaccin AxC (a - 1)(c - 1)
i =1 k =1
(a 1)(c 1) A C CM e

F Y Y I bSC + SC g SC
2

GH ar abcr JK
b c 2 CM ( B
. jk . .... ( BC)
Interaccin BxC (b - 1)(c - 1)
j =1 k =1 (b1)(c1) B C CM e

F Y Y IbSC+SC+SC+SC +SC +SCg


a b c 2

GHr abcrJK
ijk.
2
..
SC(ABC) CM ( A
Interaccin AxBxC (a - 1)(b - 1)(c - 1)
i=1 j=1k=1
A B C AB AC BC
(a1)(b1)(c1) CM e

SCerror
Error Experimental SC Total - SC tratamientos - SC bloques
( abc 1)( r 1)
(abc - 1)(r -1)

a b c r
Y ....2
Y ijk2 l

- 361 -
Total abcr - 1
i=1 j=1 k =1 l=1 abcr
- 362 - V. Ibaez Q.

Y ....2 CM
TC = CV .=
error
, x1 0 0
abcr Y ....

EJEMPLO

Se pretende realizar un experimento con objeto de estudiar el efecto de la variable


sexo (Factor A), cantidad de dimensiones irrelevantes (Factor B) y clase de concepto
(Factor C), sobre una tarea de identificacin de conceptos. El factor A acta a dos
niveles (a1, varones y a2, hembras), el factor B a tres niveles (b1, una dimensin
irrelevante al concepto tal como el nmero; b2, dos dimensiones irrelevantes, nmero
y sombreado y b3, tres dimensiones irrelevantes, nmero sombreado y barra). El
factor C acta a dos niveles (c1, concepto conjuntivo, y c2, concepto disyuntivo). Las
dimensiones relevantes que fueron consideradas a fin de que el sujeto resolviera el
problema son forma y color. Se trata, por tanto, de averiguar si el concepto tringulo
rojo necesitaba menos cantidad de ensayos previos para ser identificado que el
concepto o tringulo rojo, o ambas cosas a la vez. Evidentemente, la identificacin
del concepto est en funcin de la cantidad de dimensiones irrelevantes que intervienen
y en funcin de la variable sexo. Una vez realizado el experimento, se obtuvieron los
datos que a continuacin se presentan en la correspondiente tabla (El experimento se
realiz mediante un diseo bloque al azar, siendo la variable de bloqueo la capacidad
de resolucin de problemas medido a travs de una prueba).

Factor A a1 a2
Factor B b1 b2 b3 b1 b2 b3
Factor C c1 c2 c1 c2 c1 c2 c1 c2 c1 c2 c1 c2 Y...j
I 10 10 5 6 40 32 15 12 8 27 27 25 217
II 16 13 7 10 41 43 15 21 13 28 41 41 289
III 20 15 7 13 46 47 15 26 22 38 47 57 353
IV 20 19 7 17 51 52 17 31 27 38 52 60 391
V 25 25 15 21 60 70 18 32 30 43 62 71 472
Yijk. 91 82 41 67 238 244 80 122 100 174 229 254 Y.... =1722
Yij.. 173 108 482 202 274 483
Yi.k. a1c1= 370 a1c2= 393 a2c1= 409 a2c2= 550
Y.jk. b1c1= 171 b1c2= 204 b2c1= 141 b2c2= 241 b3c1= 467 b3c2= 498
Yi... a1 = 763 a2 = 959
Y.j.. b1 =375 b2 =382 b3 =965
Y..k. c1 =779 c2 =943
Estadstica Aplicada a la Educacin - 363 -
a) GRADOS DE LIBERTAD.

GLBLOQUE = r - 1 = 5 - 1 = 4
GLtratamientos: abc - 1 = 2x3x2-1 = 11
GLA = a - 1 = 2 - 1 = 1
GLB = b - 1 = 3 - 1 = 2
GLC = b - 1 = 2 - 1 = 1
GLAxB = (a-1)(b-1) = (2-1)(3-1) = 2
GLAxC = (a-1)(c -1) = (2-1)(2-1) = 1
GLBxC = (b -1)(c - 1) = (3-1)(2-1) = 2
GLAxBxC = (a-1)(b-1)(c-1) = (2 - 1)(3 - 1)(2 - 1) = 2
GLERROR EXP = (r-1)(abc-1) = (4)(2x3x2-1) = 44
GLTOTAL = abcr - 1 = 2x3x2x5 - 1 = 59

b) SUMA DE CUADRADOS:
2
Y ( 1722 )2
TC = = = 4942140
.
abcr 2x3x2x5
r Y2
2172 +2892 + 3532 + 3912 + 4722
SCBloque = TC = TC = 3152266666
l
.
l=1 abc 2x3x2
a b c
Yijk2 912 +822 + 412 +672 + 2382 +2442 +802 +1222 +1002 +1742 + 2292 + 2542
SCtratam. = TC = TC =13753
i=1 j=1 k =1 r 5

SUMA DE CUADRADOS DE TRATAMIENTOS SE PARTE EN: FACTORES PRINCIPALES.

7632 + 959 2
2
a Yi
SC A = TC = TC = 640.266666
i =1 bcr 3x 2 x 5
b
3752 + 3822 + 9652
Y2j
SCB = TC = TC = 11467.30
j =1 acr 2x2x5
c Y2 k 779 2 + 9432
SCC = TC = TC = 448.266666
k =1 abr 2 x 3x5
- 364 - V. Ibaez Q.
SUMA DE CUADRADOS DE INTERACCIONES.

a b
Yij2.. 1732 +1082 + 4822 + 2022 + 2742 + 4832
SCComb.( AxB) = TC = TC = 1288720
.
i =1 j =1 cr 2x5

SCInt( AxB) = SCComb( AxB) ( SCA + SCB ) = 1288720


. ( 640266666
. +1146730
. ) = 779633334
.

a c
Y2 3702 + 3932 + 4092 +5502
SCComb.( AxC) = i.k . TC = TC = 132060
.
i=1 k =1 br 3x5

SCInt( AxC ) = SCComb( AxC ) ( SCA + SCC ) = 132060


. ( 640266666
. + 448266666
. ) = 23206666
.

b r
Y. 2jk . 1712 + 2042 +1412 + 2412 + 4672 + 4982
SCComb.( BxC ) = TC = TC = 1206980
.
j =1 l =1 ar 2x5

SCInt( BxC) = SCComb( BxC) ( SCB + SCC ) = 1206980


. (1146730
. + 448266666
. ) = 154233334
.

a =2 b=3 c=2 Yijk2 .


SCComb.( AxBxC ) = TC = SCtratam. = 13753
i =1 j =1 k =1 r
SCInt ( AxBxC ) = SCComb( AxBxC ) ( SCA + SCB + SCC + SCAxB + SCAxC + SCBxC )

La suma de cuadrados combinado corregido equivale a SCtratam.corregido


SCInter ( AxBxC ) = 13753 ( 640.266666 + 11467.30 + 448.26666 +
779.633334 + 232.066668 + 154.233334 )
= 31233332
.
a b c r
SCtotal = Yijkl2 TC = 102 +162 +L+ 602 + 712 TC = 67470 TC = 1804860
.
i =1 j =1 k =1 l =1

SCError exptal = SCtotal SCbloque SCTratam. = 1804860


. 3152266666
. 13753 = 1143333334
.
Estadstica Aplicada a la Educacin - 365 -

TABLA DE ANALISIS DE VARIANZA

F. De V. G.L. S.C. C.M. Fc. Signific.


Bloques 4 3152.266666 788.066667 30.33 **
Tratamientos 11 13753.000000 1250.272727 48.12 **
Factor (A) 1 640.266666 640.266666 24.64 **
Factor (B) 2 11467.300000 5733.650000 220.65 **
Factor (C) 1 448.266666 448.266666 17.25 **
AxB 2 779.633334 389.816667 15.00 **
AxC 1 232.066668 232.066668 8.93 *
BxC 2 154.233334 77.116667 2.97 n.s.
AxBxC 2 31.233332 15.616666 0.60 n.s.
Error Experimental 44 1143.333334 25.984849
Total 59 18048.600000

CM error 25.984849
CV . =
Y....
x100 =
b1722 60g X 100 = 17.76%

INTERPRETACION.

Se encontr diferencia estadstica altamente significativa para los factores: (A, B,


y C) (P 0.01), as mismo para las interacciones de primer orden se encontr
diferencia estadstica altamente significativa para la interaccin de A por B, y
significativa para la interaccin A por C, en cambio no se encontr diferencia
alguna para las interacciones B por C, tampoco para la interaccin de segundo
orden (A por B por C), esto quiere decir que los factores actan en forma
independiente o se deben al azar, por consiguiente las conclusiones se sacan de
los efectos principales significativos, y las interacciones que han resultado ser
significativas, para tal efecto se debe realizar los efectos simples para obtener las
conclusiones en el presente trabajo.
- 366 - V. Ibaez Q.

LA SALIDA DE RESULTADOS CON SAS

Class Level Information


Class Levels Values
A 2 1 2
B 3 1 2 3
C 2 1 2
BLOQUE 5 1 2 3 4 5
Number of observations in data set = 60
Dependent Variable: CAPACI
Source DF Sum of Squares Mean Square F Value Pr > F
Model 15 16905.26666667 1127.01777778 43.37 0.0001
BLOQUE 4 3152.26666667 788.06666667 30.33 0.0001
A 1 640.26666667 640.26666667 24.64 0.0001
B 2 11467.30000000 5733.65000000 220.65 0.0001
C 1 448.26666667 448.26666667 17.25 0.0001
A*B 2 779.63333333 389.81666667 15.00 0.0001
A*C 1 232.06666667 232.06666667 8.93 0.0046
B*C 2 154.23333333 77.11666667 2.97 0.0618
A*B*C 2 31.23333333 15.61666667 0.60 0.5527
Error 44 1143.33333333 25.98484848
Corrected Total 59 18048.60000000
R-Square C.V. Root MSE CAPACI Mean
0.936653 17.76144 5.09753357 28.70000000

Duncans Multiple Range Test for variable: CAPACI


Duncan Grouping Mean N BLOQUE
A 39.333 12 5
B 32.583 12 4
B 29.417 12 3
C 24.083 12 2
D 18.083 12 1
Duncans Multiple Range Test for variable: CAPACI
Duncan Grouping Mean N A
A 31.967 30 2
B 25.433 30 1
Duncans Multiple Range Test for variable: CAPACI
Duncan Grouping Mean N B
A 48.250 20 3
B 19.100 20 2
B 18.750 20 1
Duncans Multiple Range Test for variable: CAPACI
Duncan Grouping Mean N C
A 31.433 30 2
B 25.967 30 1
Estadstica Aplicada a la Educacin - 367 -

14
PRUEBAS NO PARAMTRICAS
14.1 EL CASO DE UNA MUESTRA SIMPLE

A. PRUEBA BINOMIAL.
Los fenmenos que se distribuyen segn esta ley son dicotmicas, entonces ca-
ben nicamente DOS valores posibles (variable discreta). Este es el caso del
lanzamiento de una moneda, cuyo resultado slo puede ser cara o sello. En
general, se aplica a todas aquellas variables que presenten dos valores, uno de
los cuales suele catalogarse como XITO y el otro como FRACASO. La ley
binomial suministra la probabilidad de que se den X xitos en N observaciones.
La funcin de distribucin suministra la probabilidad de que se observen X o
menos xitos de una serie de N mediciones u observaciones, la probabilidad
deseada es:

P Y k = i=k
FG NIJ p q P X x = i =0
FG NIJ p q
HiK H xK
N i N i x x N x
o

MTODO: Los pasos para usar la prueba binomial con Ho: p = 1/2.
1. Determinar el nmero (N) total de casos observados.
2. Determinar las frecuencias de las ocurrencias observadas en cada una de las
dos categoras.
3. El mtodo para encontrar la probabilidad de ocurrencia de los valores obser-
vados segn Ho:, o valores an ms extremos, depende del tamao de la
muestra:
Muestra pequea:
Si N 35 , la Tabla de probabilidad asociadas con valores tan pequeos (o ms
pequeos) que los valores observados k en la prueba binomial.
Muestra Grande:
- 368 - V. Ibaez Q.
Si N > 35 , entonces la informacin tiende a una distribucin normal distribui-
da con media cero (0) y desviacin estndar uno (1), en este caso, se debe
probar Ho: usando la ecuacin:
(Y 0.5) - Np
z=
Npq
Donde:
Y + 0.5, se usa cuando Y < Np
Y - 0.5, se usa cuando Y > Np
4. Si la probabilidad asociada con el valor observado de Y o valores an ms
extremos es igual o menor que , rechazar Ho:, de otro modo, no se rechaza
la Ho.

EJEMPLO:
En un proyecto de innovacin de la enseanza en la primaria con nuevos mto-
dos didcticos se evalo a 20 estudiantes que se les enseo una materia con el
mtodo tradicional y luego se implement un mtodo nuevo. La suposicin es
de que los alumnos respondan mejor con el mtodo antiguo.
M TODO
Tradicional Nuevo Total
Frecuencia 15 5 20
SOLUCIN:
1. Hiptesis Estadstica: Ho: p = q = 1/2
Ho: La proporcin de alumnos que se les enseo un tpico especfico con el
mtodo tradicional y luego con el mtodo nuevo respondieron a la eva-
luacin en forma igual a la proporcin de alumnos con ambos mtodos.
Ha: La proporcin de alumnos que se enseo un tpico especfico con el m-
todo tradicional y mtodo nuevo, respondieron a la evaluacin con el
mtodo tradicional que es mayor que la proporcin de alumnos a la eva-
luacin con el mtodo nuevo. (Ha: p > q).

2. Prueba estadstica. Se elige la prueba binomial debido a que los datos estn
en dos categoras discretas y el tamao de muestra es pequeo, adems:
x : Es la variable aleatoria que se distribuye como B(20, 1/2), que representa
el nmero de alumnos que responden a la evaluacin con el mtodo nevo.
p: Proporcin de casos favorables con el mtodo nuevo (xitos)
q. Proporcin de casos desfavorables con el mtodo tradicional (fracasos)
3. Nivel de significacin: Sea = 0.05, y N = 20
Estadstica Aplicada a la Educacin - 369 -
4. Distribucin muestral. La distribucin muestral est proporcionada por la
siguiente frmula:

P X x = i = 0
FG N IJ p q
H xK
x x N x

5. Regin de Rechazo (RR) y Regin de Aceptacin (RA):


RA.: P X 5 = 0.05 aceptar la Ho:
RR.: P X 5 < = 0.05 rechazar la Ho:
6. Clculo del valor de la prueba.

P X 5 =
5
FG 20IJ p q
H xK
N x
x
= 0.021
x=0

Usando la Tabla binomial es ms fcil encontrar el valor numrico, para esto


se necesita los siguientes datos: N = 20, x = 5 y p = q = 1/2 = 0.5, con estos
datos se busca en la tabla binomial acumulada para P X 5 = 0.0207
7. Decisin:
Como P X 5 = 0.0207 < = 0.05 , entonces se rechaza la hiptesis Ho:, es
decir existe diferencia significativa entre ambos mtodos de enseanza en el
proceso de aprendizaje de los alumnos de educacin primaria.

B. PRUEBA DE JI CUADRADA (una muestra simple)

La prueba Ji-cuadrada es adecuada para analizar datos como: El nmero de


categoras puede ser dos o ms. La tcnica es del tipo de bondad de ajuste en que
puede ser usada para probar si existe una diferencia significativa entre un nme-
ro observado de objetos o respuestas que caen en cada categora y un nmero
esperado basado en la Ho:. Es decir, la prueba Ji-cuadrada evala el grado de
correspondencia entre las observaciones observadas en cada categora.
Para comparar un grupo de frecuencias observado con uno esperado, debemos ser
capaces de establecer qu frecuencias deben ser esperadas. La hiptesis Ho: esta-
blece la proporcin de objetos que caen en cada una de las categoras en la pobla-
cin supuesta. Esto es, de la hiptesis nula podemos deducir cules son las fre-
cuencias esperadas. La tcnica Ji-cuadrada proporciona la probabilidad de que
las frecuencias observadas pudieran haber sido muestreadas de una poblacin
con los valores esperados proporcionados.
La hiptesis nula Ho: puede probarse mediante el siguiente estadstico:
- 370 - V. Ibaez Q.

2
c =
b e g
k
i i
2

~ (2k 1 )
i =1 ei
Donde:
i = el nmero observado de casos en la categora isima.
e i = el nmero esperado de casos en la categora isima cuando Ho: es
verdadera.
k = el nmero de categoras

PROCEDIMIENTO:
1. Prueba estadstica (Planteamiento de la hiptesis respectiva).
2. Nivel de significacin:
3. Prueba Estadstica: Cuando los datos en frecuencias en categoras discretas
(nominales o categricos y, en ocasiones, ordinales), se puede utilizar la prueba
Ji-cuadrada para evaluar la significacin de las diferencias entre los grupos
independientes.
4. Distribucin muestral. Esta dada con la frmula siguiente:
k
2c =
b e g
i i
2

~ (2k 1 )
i =1 ei
5. Regin de rechazo y aceptacin:
Si 2c 2tabla se acepta la Hiptesis Nula (Ho).
Si 2c > 2tabla se rechaza la Hiptesis Nula y se acepta la Ha.
6. Clculo de la prueba estadstica, segn la frmula arriba indicada.
7. Decisin. Es la parte crtica de un investigador, en el cual se tiene que interpre-
tar y sacar las conclusiones del problema en estudio.

Para usar la prueba de la bondad de ajuste de Ji-cuadrada para el caso de una


muestra, se requiere el procedimiento para usar la prueba incluye estos pasos:
1. Coloque las frecuencias observadas dentro de k categoras. La suma de las
frecuencias debe ser n, el nmero de observaciones independientes.
2. A partir de Ho: determine las frecuencias esperadas (la ei) para cada una de las
k celdas. Cuando k>2, y ms del 20% de las ei son menores que 5, combnese
categoras adyacentes cuando esto sea razonable, reduciendo por tanto el va-
lor de k e incrementando los valores de algunas de la ei. Cuando k = 2, la
Estadstica Aplicada a la Educacin - 371 -
prueba de la bondad de ajuste Ji-cuadrada para una muestra es exacta slo si
cada frecuencia esperada a 5 o ms grande.
3. Use la el estadstico de Ji-cuadrada para calcular el valor de .
2

4. Determine los grados de libertad, gl = k - np - 1, donde np es el nmero de


parmetros estimados de los datos y usados al calcular las frecuencias espera-
das.
5. Si la probabilidad es menor que o igual a , se rechaza la Ho.

Aunque las recomendaciones especficas dependen de la distribucin terica que


va a ser ajustada, las siguientes reglas resultan adecuadas:
1. Eljanse categoras y lmites de intervalo tales que las frecuencias esperadas
sean iguales a n/k.
2. Se debe escoger el nmero de categoras tal que las frecuencias esperadas
estn entre 6 y 10, con el valor ms bajo apropiado para N grandes (mayor que
200).

EJEMPLO:
Un profesor de Educacin, analiza el aprendizaje de sus alumnos en una seccin
y los clasifica en cuatro categoras de acuerdo a las calificaciones obtenidas en un
semestre. Tal como se presenta a continuacin:
Nmero de Estudiantes
Muy buenos Buenos Regulares Malos Total
9 12 19 10 50

SOLUCIN:
1. Hiptesis Nula (Ho:). La proporcin de alumnos en cada uno de las categoras
es indiferente.
Hiptesis alterna (Ha:). La proporcin de alumnos es diferente en cada uno de
las categoras en estudio.
2. Nivel de significacin: = 0.05 = 0.01
3. Prueba Estadstica: Se elige la prueba estadstica de Ji-cuadrado, ya que los
datos estn dados por lo menos en escala ordinaria, adems presenta catego-
ras k = 4.
4. Distribucin muestral.

2
c =
k
b e g
i i
2

~ (2k 1 )
i =1 ei
- 372 - V. Ibaez Q.
5. Clculo de Prueba Estadstica: Por informacin se tiene que:
n = 50 alumnos, k = 4 categoras
n 50
ei = = = 12.5
k 4
(9 -12.5) 2 (12 -12.5) 2 (19 -12.5) 2 (10 -12.5) 2
2c = + + +
12.5 12.5 12.5 12.5
= 4.88
6. Regin de rechazo y aceptacin:
Si 2c = 4.88 23 ,0 ,05 = 7 .82 , se acepta la Hiptesis Nula (Ho).

Si 2c = 4.88 > 23 ,0 ,05 = 7 .82 , se rechaza la Ho: y se acepta la Ha.

7. Decisin: Podemos afirmar que la proporcin de alumnos en cada uno de las


categoras es similar o se tiene un comportamiento indiferente.

14.2. DOS MUESTRAS INDEPENDIENTES

A. PRUEBA JI-CUADRADO PARA DOS MUESTRAS INDEPENDIENTES

En el anlisis de los datos de investigacin, el investigador necesita decidir si


varias muestras independientes pueden considerarse provenientes de la misma
poblacin. La hiptesis de investigacin es que las k poblaciones son diferentes
y la hiptesis estadstica que va a ser evaluada es Ho: Pob1 = Pob2 = ... = Pobk. El
investigador extrae una muestra de cada poblacin. Los valores de la muestra
casi siempre de alguna manera varan; por tanto, el problema es determinar si las
diferencias observadas en las muestras significan realmente diferencias en las
poblaciones respectivas o si son meramente el tipo de diferencias que se pueden
esperar entre las distintas muestras al azar de la misma poblacin.
Cuando los datos experimentales consisten en frecuencias en categoras discretas
(nominales o categricas y, en ocasiones, ordinales), puede utilizarse la prueba
Ji-cuadrada para evaluar la significacin de las diferencias etnre k grupos inde-
pendientes. La prueba Ji-cuadra para k muestras o grupos independientes es una
sencilla extensin de la prueba Ji-cuadrada para dos muestras independientes. En
general, la prueba es similar tanto para dos como para k muestras o grupos inde-
pendientes.
Estadstica Aplicada a la Educacin - 373 -

PROCEDIMIENTO:

1. Hiptesis Estadstica (Planteamiento de la hiptesis respectiva).


2. Nivel de significacin
3. Prueba Estadstica: Se elige la prueba de Ji-cuadrada observada, ya que los
datos presentan por lo menos en escala ordinal, y presentan categoras.
4. Distribucin muestral: La frmula de Ji-cuadrada se presenta a continuacin:

2c =
d
f c
ij eij i 2

~ (2 f 1)(c1) , ....... a)
i =1 j =1 eij

i . . j
eij =

..
f c ij2
=
2
c N ~ (2 f 1 )( c1 ) ................... b)
i =1 j =1 eij
Donde:
i. =Es el total observado por la i-sima fila.

.j = Es el total observado por la j-sima columna.

.. = Es el total general (tamao de muestra).


f = nmero de filas.
c = nmero de columnas.
5. Clculo de la prueba estadstica: Se realiza el procedimiento de clculod e la
prueba estadstica Ji-cuadrada.
6. Regin de rechazo y aceptacin:
Si 2c 2tabla se acepta la Hiptesis Nula (Ho).
Si 2c > 2tabla se rechaza la Hiptesis Nula y se acepta la Ha.
7. Decisin: Se tomar la decisin en base al clculo efectuado en el paso 5.
- 374 - V. Ibaez Q.

EJEMPLO:
1. Quinientos nios de escuela primara fueron clasificados en forma cruzada de
acuerdo con el grupo socioeconmico al que pertenecen y la presencia o ausen-
cia de cierto defecto en el lenguaje. Los resultados fueron los siguientes:

Defecto del GRUPO SOCIO-ECONMICO


lenguaje Alto Medio Alto Medio Bajo Bajo Total
Presente 8 24 32 27 91
Ausente 42 121 138 108 409
Total 50 145 170 135 500
Son compatibles estos datos con la hiptesis de que el defecto en el lenguaje no
est relacionado con el grupo socioeconmico?.

SOLUCIN:
1. Hiptesis Nula (Ho:). El defecto del lenguaje no est relacionado con el grupo
socio-econmico al que pertenecen.
Hiptesis alterna (Ha:). El defecto del lenguaje est relacionado con el grupo
socio-econmico al que pertenecen.
2. Nivel de significacin: = 0.05
3. Prueba Estadstica: Se elige la prueba estadstica de Ji-cuadrada, ya que los
datos estn dados por lo menos en escala ordinaria
4. Distribucin muestral.

2
c =
df c
ij eij i 2

~ (2 f 1)( c 1)
i =1 j =1 eij

5. Clculo de Prueba Estadstica: Por informacin se tiene que:


Defecto del GRUPO SOCIO-ECONMICO
lenguaje Alto ei1 Medio Alto ei2 Medio Bajo ei3 Bajo ei4 Total
Presente 8 9.10 24 26.39 32 30.94 27 24.57 91
Ausente 42 40.90 121 118.61 138 139.06 108 110.43 409
Total 50 145 170 135 500

gl. = (2-1)(4-1) = 3

(8-9.1)2 (24-26.39)2 (32-30.94)2 (27-24.57)2 (108-110.43)2


2c = + + + +L+ = 0765
.
9.1 26.39 30.94 24.57 110.43
Estadstica Aplicada a la Educacin - 375 -
6. Regin de rechazo y aceptacin:
Si 2c = 0.765 23 ,0 .05 = 7 .82 , se acepta la Hiptesis Nula (Ho).

Si 2c = 0.765 > 23 ,0 .05 = 7 .82 , se rechaza la Ho: y se acepta la Ha.

7. Decisin: Como 2c = 0.765 23 ,0 .05 = 7 .82 , se puede concluir que el


defecto del lenguaje no est relacionado con el grupo socio-econmico al que
pertenecen los nios, estas dos variables posiblemente se deben al azar.

B. Tabla de Contingencia de 2x2

Tal vez el ms comn de los usos de la prueba Ji-cuadrado sea el de evaluar si un


conjunto de frecuencias observadas en una tabla de contingencia de 2x2 pudieran
ocurrir siendo Ho: verdadera. Cuando aplicamos la prueba Ji-cuadrada a datos
donde tanto la r como la c son iguales a 2, entonces se debe utilizar la siguiente
ecuacin:

=
2
c
c
N AD BC N 2 h 2

, gl = 1
(A + B)(C + D)(A + C)(B + D)
Esta ecuacin es ms fcil de aplicar, en vista de que slo se requiere una divisin
en todo el clculo. Adems tiene la ventaja adicional de incorporar una correc-
cin para la continuidad, la cual mejora notablemente la aproximacin de la
distribucin muestra de la calculada a la distribucin de la Ji-cuadrada.
2

EJEMPLO:
Se quiere determinar si la proporcin de alumnos aprobados en el sexto grado en
un colegio particular es el mismo que en el colegio nacional. La informacin se
presenta a continuacin:
ALUMNOS
COLEGIO Aprobados Desaprobados TOTAL
Particular 2 8 10
Nacional 7 1 8
TOTAL 9 9 18

SOLUCIN:
1. Hiptesis Estadstica:
Ho: El nmero de alumnos desaprobados en un colegio nacional es igual al
nmero de alumnos aprobados en un colegio particular.
Ha: El nmero de alumnos en un colegio particular es mayor que al nmero de
alumnos en un colegio nacional.
- 376 - V. Ibaez Q.
2. Nivel de significacin: = 0.05.
3. Prueba Estadstica: Se usar la prueba Ji-cuadrada con correccin por
continuidad, y adems la informacin se encuentra en una tabla de contingencia
de 2x2.
4. Distribucin Muestral: Se utiliza la siguiente ecuacin:

=
2
c
c
N AD BC N 2 h 2

, gl = 1
(A + B)(C + D)(A + C)(B + D)
5. Clculo de la prueba estadstica:

=
2
c
c
N AD BC N 2 h
2

=
c
18 2x1-8x7 18 / 2 h = 5625
2

.
(A+B)(C+D)(A+C)(B+D) 9x9x10x8
6. Regin de rechazo y aceptacin: Luego gl. = (2-1)(2-1) = 1, luego
. , luego si c es mayor que a t = 3.841 entonces, se rechaza la
2
20.05,1 = 3841
2

H0.

7. Decisin: Como c = 5.625 es mayor a t = 3.841, entonces se rechaza la


2 2

H0. que el nmero de alumnos en un colegio particular es mayor que al nmero


de alumnos en un colegio nacional.

C. PRUEBA DE LA MEDIANA

CONDICIONES:
- Es un procedimiento para evaluar si dos grupos independientes difieren en
sus tendencias culturales.
- Proporciona informacin acerca de qu tan probable es que dos grupos inde-
pendientes (no ncesariamente del mismo tamao) hayan sido extrados de la
misma poblacin con la misma mediana.
- La hiptesis nula plantea que los dos grupos son de la misma poblacin y
tienen la misma mediana.
- La hiptesis alterna puede plantear que la mediana de una poblacin es dife-
rente de la otra poblacin (si es prueba bidireccional) o que la mediana de una
poblacin es superior que la de la otra poblacin (si es prueba unidireccional).
- La prueba puede utilizarse cuando las puntuaciones de los dos grupos se mi-
den en al menos una escala ordinal.
- Puede no existir una prueba alterna a la prueba de la mediana, an para datos
en escala de intervalo. Esto ocurre cuando una o ms de las observaciones
estn fuera de la escala y truncadas hacia el mximo (o mnimo) de las
observaciones previamente asignadas.
Estadstica Aplicada a la Educacin - 377 -
MTODO:
- Determinar primero las puntuaciones de la mediana para el grupo combinado
(es decir, la mediana para todas las puntuaciones en ambas muestras).
- Dicotomizar (dividir) ambos conjuntos de puntuaciones a partir de la media-
na combinada y presentar estos datos en una tabla de 2x2, de la siguiente
manera:
Prueba de la mediana: Formato para los datos.
GRUPO
I II Combinados
Nmero de puntuaciones combinadas por debajo de la mediana A B A+B
Nmero de puntuaciones combinadas por arriba de la mediana C D C+D
TOTAL m n N= m+ n

- Los grupos I y II son muestras de poblaciones cuyas medianas son las mismas,
esperaramos que alrededor de la mitad de las puntuaciones de cada grupo
estuviera por arriba de la mediana combinada y que la otra mitad estuviera
por debajo, es decir tanto las frecuencias A y C como B y D fueran iguales.
- Si el nmero total de casos en ambos grupos (m = n) es pequeo, se puede
utilizar la prueba exacta de Fisher para probar la Ho:
- Si el nmero total de casos es suficientemente grande, se puede utilizar la
prueba Ji-cuadrada con gl = 1 para evaluar la Ho:
- Para analizar datos divididos por la mediana, el investigador debe guiarse por
las siguientes consideraciones, a fin de realizar una buena eleccin entre la
prueba exacta de Fisher y la Ji-cuadrada para tablas de 2x2.
i) Cuando N = m + n es mayor que 20, utilice la corregida para la conti-
2

nuidad de la ecuacin siguiente:

=
2
c
c
N AD BC N 2 h 2

(A + B)(C + D)(A + C)(B + D)

ii) Cuando N = m + n = 20 o menor, utilice la prueba exacta de Fisher.


- Varias puntuaciones pueden caer extactamente en la mediana combinada. Si
esto sucede, el investigador tiene dos opciones:
i) Los grupos pueden ser dicotomizados en aquellas puntuaciones que ex-
ceden a la mediana y aquellas puntuaciones que no exceden.
ii) Si (m+n) es grande y slo pocos casos caen exactamente en la mediana
combinada, esos pocos casos pueden ser eliminados del anlisis.
- 378 - V. Ibaez Q.

EJEMPLO:
Existe una diferencia entre el nivel de salud mental de los alumnos de secunda-
ria de una rea rural y los de una rea urbana?. La informacin se presenta a
continuacin:
Calificaciones del nivel de salud mental de estudiantes de secundaria
Urbana 35 26 27 21 27 38 23 25 25 27 45 46 33 26 46 41
Rural 29 50 43 22 42 47 42 32 50 37 34 31

SOLUCIN:
1. Hiptesis estadstica: H 0 : MU = M R versus H a : MU M R
2. Nivel de significacion: = 0.05
3. Estadstica de prueba: Como se muestra en el siguiente anlisis, la estadstica
de prueba es , y se calcula con la frmula anterior para una tabla de contin-
2

gencia de 2x2.
4. Distribucin de la prueba estadstica: Cuando Ho: es verdadera y las suposicio-
nes se cumplen, sigue una distribucin semejante a la de Ji-cuadrada con
2

1 grado de libertad.
5. Regin de Aceptacin y Rechazo: Se rechaza Ho: si el valor de 3.841.
2

6. Clculo de la prueba estadstica: El primer paso para calcular la estadstica de


prueba es calcular la mediana comn de las dos muestras combinadas. Esto se
hace al arreglar las observaciones en orden ascendente y, dado que el nmero
total de observaciones es par, se obtiene la media de los dos valores centrales.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
21 22 23 25 25 26 26 27 27 27 29 31 32 33 34 35 37 38 41 42 42 43 45 46 46 47 50 50
Mediana = (33+34)/2 = 33.5

A continuacin se determinan para cada grupo el nmero de observaciones


que caen por encima y por debajo de la mediana comn. Las frecuencias resultantes
se arreglan en una tabla de 2x2, tal como se presenta en seguida.

Los datos estn ordenados en forma ascendente para ambos grupos.


Urbano 21 23 25 25 26 26 27 27 27 33 35 38 41 45 46 46
Rural 22 29 31 32 34 37 42 42 43 47 50 50
Estadstica Aplicada a la Educacin - 379 -

Calificaciones de nivel de salud mental de estudiantes de secundaria.


Urbana Rural TOTAL
Nmero de calificaciones arriba de la mediana 6 8 14
Nmero de calificaciones abajo de la mediana 10 4 14
TOTAL 16 12 28

=
2
c
c
N AD BC N 2 h
2

=
c
28 6x48x10 28 2 h =13125
2

.
(A+B)(C+D)(A+C)(B+D) (14)(14)(16)(12)
7. Decisin: Puesto que c = 1.3125 < 3.841, el valor crtico de Ji-cuadrada con
2

1 grado de libertad, entonces no es posible rechazar la hiptesis nula (Ho:) con


base en estos datos, es decir se concluye que las dos muestras probablemente se
extrajeron de poblaciones con medianas iguales.

14.3. LA PRUEBA DE U DE MANN-WHITNEY (Grupos independientes)

La prueba de Mann-Whitney puede utilizarse para evaluar si dos grupos inde-


pendientes fueron extrados de la misma poblacin, si de las variables en estudio se
han obtenido datos en, al menos, escala ordinal. sta es una de las pruebas no
paramtricas ms poderosas y constituye una opcin bastante buena a la prueba
paramtrica t de Student-Fisher cuando el investigador desea evitar los supuestos
de la prueba t o cuando las mediciones de la investigacin se encuentran en una
escala inferior a la de intervalo. Al igual que todos los ndices que vimos en las
medidas de asociacin para variables ordinales, la U de Mann-Whitney trabaja con
rangos, en lugar de las puntuaciones originales. Bsicamente, consiste con compro-
bar lo superior que es la suma de los rangos de un grupo frente a la suma de los
rangos del otro.

MTODO:
1. Se ordena los datos de menor a mayor, sin que pierdan su identidad, es decir al
que muestra pertenencia.
2. Se fijan los valores de: n1: Es el tamao de muestra ms pequea, y n2: Tamao de
muestra ms grande.
3. Si en caso se presentar valores con el mismo rango, se halla el rango ligado o
promedio de rangos.
4. Se determina el valor U, segn sea el caso en las dos formas siguientes:
- Contando el nmero de veces que un puntaje experimental precede a un puntaje
control. Si el valor de U es muy grande, tal que no se encontrar en la tabla
- 380 - V. Ibaez Q.
correspondiente su probabilidad asociada, entonces U, se transforma en U =
n1n2 - U
- Cuando no existe el valor U en la tabla, entonces se transforma; o bien se
puede intercambiar los grupos de tal manera que un puntaje control preceda a
un puntaje experimental.
n1 ( n1 + 1 ) n ( n + 1)
- Calculando: U = n1n2 + R1 U = n1n2 + 2 2 R2
2 2
Donde:
R1 : Es la suma de rangos de la muestra n1.
R2 : Es la suma de rangos de la muestra n2.

5. La agrupacin de valor observado U depende de tamao n2.


- Si n2 8, la tabla de Mann-Whitney correspondiente contiene las probabilida-
des de asociacin a la U calculada, para la prueba de una cola.
- Si la prueba es de dos colas, se duplica el valor de la probabilidad asociado a U
6. Si 9 n2 20, la tabla de Mann-Whitney proporciona valores crticos de U.
- Si n2>20, se utiliza la aproximacin a la distribucin normal Z.

FG n n IJ
U
H2K
1 2

Z= ~ N ( 0 ,1 )
n1n2 ( n1 + n2 + 1 )
12
Esta Z, se distribuye en forma normal aproximadamente con N(0,1), para la
prueba de dos colas se suplica la probabilidad asociada: 2xp(Zcalculada). Cuando la
proporcin de rangos promedio o rangos ligados es muy alta si la probabilidad p
obtenida, se aproxima cercano a o tiende hacia , entonces se corrigen los
puntajes que tienen rango promedio mediante la siguiente frmula Z.

FG n n IJ
U
H2K
1 2

Z=
FG n n IJ FG N N T IJ
~ N ( 0,1 )
3

H N ( N + 1)K H 12 K
1 2
i

Donde:

t3 t t 3
ti
T=
12
, Ti = i

12
, N = n1 + n2
t : Nmero de puntajes correspondiente a un rango promedio.
Estadstica Aplicada a la Educacin - 381 -

DECISIN:
P(Ucalculada) , se rechaza la Ho:
Cuando 9 n2 20, se busca el valor crtico en la tabla y se compara
Ucalculada Ucrtico, entonces se rechaza la Ho:

EJEMPLO:
Un cientfico social piensa que los profesores universitarios de Teologa tienen
una orientacin poltica ms conservadora que sus colegas de Psicologa. Una mues-
tra aleatoria de 11 maestros del departamento de Teologa y 14 del departamento de
Psicologa de una universidad local reciben un cuestionario de 50 puntos, que mide
el grado de conservadurismo poltico. Se obtuvieron los siguientes datos. Los puntajes
mayores indican un mayor conservadurismo. Use = 0.05.
Profesores: 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Teologa 36 42 22 48 31 35 47 38 40 43 32
Psicologa 13 25 40 29 10 26 43 17 12 32 27 32 42 35

SOLUCIN:
1. Hiptesis Estadstica:
Ho: Los profesores Universitarios de Teologa tienen la misma orientacin
que los profesores de Psicologa sobre el grado de conservadurismo polti-
co.
Ha: Los profesores Universitarios de Teologa tienen una orientacin poltica
diferente que los profesores de Psicologa sobre el grado de conservaduris-
mo poltico.
2. Nivel de significacin: = 0.05, n1 = 11, n2 = 14; N = n1 + n2 = 11 + 14 = 25
3. Prueba Estadstica: Los dos grupos de profesores constituyen dos grupos in-
dependientes, y los puntajes constituyen una medicin de escala ordinal. Por
estas razones la prueba de U de Mann - Whitney es la apropiada para analizar
los datos.
4. Distribucin Muestral: Como n1 > 10 n2 >10, entonces se usa la siguiente
ecuacin:
n1n2
U
Z= 2
n1n2 ( n1 + n2 + 1 )
12
La probabilidad asociada con la ocurrencia de Ho: de valores tan extremos
como una Z observada, puede determinarse utilizando la tabla de valores
- 382 - V. Ibaez Q.
crticos de la distribucin normal (Tabla Z).
5. Regin de rechazo: Si el valor observado de U tiene una probabilidad asocia-
da igual o menor que , entonces rechace la Ho: y se acepta la Ha: (p ).
6. Clculo de la prueba estadstica:
i) Se ordenan los datos de menor a mayor (ascendente).
ii) Se asignan los rangos de 1 hasta N = n1 + n2 = 11 + 14 = 25. En caso de
empate, asignar el rango promedio.
N V IX I VIII 3 II VI XI IV 5 11 X XII 6 XIV 1 8 9 III 2 XIII 10 VII 7 4
Teologa 10 12 13 17 22 25 26 27 29 31 32 32 32 35 35 36 38 40 40 42 42 43 43 47 48
Rango_Pre 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Rango_Prom 1 2 3 4 5 6 7 8 9 10 12 12 12 14.5 14.5 16 17 18.5 18.5 20.5 20.5 22.5 22.5 24 25

N Teologa Rango_Pre Rango_Prom Psicologa Rango_Pre Rango_Prom


1 36 16 16 13 3 3
2 42 20 20.5 25 6 6
3 22 5 5 40 19 18.5
4 48 25 25 29 9 9
5 31 10 10 10 1 1
6 35 14 14.5 26 7 7
7 47 24 24 43 23 22.5
8 38 17 17 17 4 4
9 40 18 18.5 12 2 2
10 43 22 22.5 32 12 12
11 32 11 12 27 8 8
12 32 13 12
13 42 21 20.5
14 35 15 14.5
R1 = 185 R2 = 140

iii) Se determina el valor de U, con las siguientes ecuaciones:


n1 ( n1 + 1 ) 11x12
U = n1n2 + R1 = 11x14 + 185 = 35
2 2
n2 ( n2 + 1 ) 14x15
U = n1n2 + R2 = 11x14 + 140 = 119
2 2
De estos dos resultados, se escoge el menor U = 35, U = 119
Reemplazando a la frmula Z, se tiene:
n1n2 11x14
U 35 42
Z= 2 = 2 = = 2.299
n1n2 ( n1 + n2 + 1 ) 11x14( 26 ) 18.2665
12 12
Estadstica Aplicada a la Educacin - 383 -
Como existen rangos promedios en ambos grupos independientes entonces, se
realiza la correccin, de la siguiente forma:

Rango
Agrupacin Valor tj (t3j t j ) 12
Promedio
1 32 12 3 2
2 35 14.5 2 0.5
3 40 18.5 2 0.5
4 42 20.5 2 0.5
5 43 22.5 2 0.5
5
t3j t j
j=1 12
=4

U nn
1 2 2 42
Z= = = 23028
FG n n IJFG N N t t IJ LM OP
.
3 5 3
11x14 253 25
H N( N 1)KH 12 12 K N 4
Q
1 2 j j

j=1
25x24 12

7. Decisin: Se busca el valor de -2.30 en la tabla de la distribucin Z, y encon-


tramos que la probabilidad es: P( Z 2.30 ) = 00107 . = 0.05,
p=0.0107 = 0.05, entonces se rechaza la hiptesis Ho: y se acepta la Ha:.
Para dos colas 2x0.0107 = 0.0214 = 0.05, entonces existe suficiente evi-
dencia para afirmar que los profesores universitarios de Teologa tienen una
orientacin poltica diferente que los profesores de Psicologa sobre el grado de
conservadurismo poltico.

14.4. EL CASO DE DOS MUESTRAS RELACIONADAS

A. La Prueba de cambio de McNEMAR

CONDICIONES:
- Se usa para la significacin de los cambios y se aplica a los diseos antes-
despus y se estudia al mismo sujeto.
- Cada pareja de datos (X,Y) es el sujeto antes y despus del tratamiento.
- Las mediciones se realizan, ya sea en escala nominal u ordinal.
- 384 - V. Ibaez Q.
MTODO:
1. Se ordenan los datos en una tabla de frecuencias de 2x2, de la siguiente
manera:
DESPUS

- +
ANTES
+ A B
- C D
Donde:

A: Denota el nmero de individuos cuyas respuestas fueron (+) en la primera


medicin y (-) en la segunda medicin.
D: Es el nmero de individuos quienes cambiaron de (-) a (+).
B: Es la frecuencia de individuos que respondieron (+) en ambas ocasiones.
C: Es el nmero de individuos que respondieron (-) en la primera y la segun-
da evaluacin.
C y B: significa que no hubo cambios.
A+D: Es el nmero total de respuestas que cambiaron.
Si el total es menor a 10, entonces usar la prueba binomial.
Si el nmero total de cambios es mayor a 10, usar la prueba de McNemar.

2. Se plantean las hiptesis nula (Ho:) que la probabilidad de cambio de (+) a (-


) es igual a la probabilidad de cambio de (-) a (+). En forma de simbologa se
puede denotar: H0: P(D) = P(A) = 12 versus H a : P(D) > P(A)
3. Nivel de significacin: = 0.05 o = 0.01.
4. Prueba estadstica a utilizar:
(A + D)
Se determina las frecuencias esperadas de cambio E=
2
.
(A + D)
2
, individuos que cambiaron de (+) a (-).
(A + D)
2
, individuos que cambiaron de (-) a (+).
Si E < 5, entonces se utiliza la prueba Binomial en lugar de Mcnemar.
Si E 5, entonces se utiliza la prueba de McNemar. Se calcula como la Ji-
cuadrada, cuya frmula es la siguiente:

2
=
c A D 1h 2

, con gl = 1
A+ D
c
Estadstica Aplicada a la Educacin - 385 -
5. Regin de rechazo y aceptacin:
R.A./H 0 : P( 2 12 ) > , entonces aceptamos la Ho:
R. R./H 0 : P( 2 > 12 ) , entonces rechazamos la Ho:
Otra forma de rechazar o aceptar es:
H 0: 12 < 1,2 , entonces se acepta la Ho:
H 0: 12 1,2 , entonces se rechaza la Ho:
6. Clculo de la Ji-cuadrado
7. Decisin:

EJEMPLO:
Supongamos que un psiclogo infantil est interesado en la iniciacin de los
nios en los contactos sociales. Ha observado que los nios recin llegados a una
guardera suelen inicar sus contactos personales con adultos, antes que con otros
nios. Predice que, con creciente familiaridad y experiencia, los nios iniciarn
cada vez ms contactos sociales con otros nios y no con adultos. Para probar esta
hiptesis, observa 25 nios en su primer da en la guardera, y clasifica su inicia-
cin en los contactos sociales de acuerdo con que haya sido con un adulto o con
un nio. Observa a cada uno de los 25 nios despus de un mes, haciendo la
misma clasificacin. De este modo, sus datos estn clasificados en la tabla si-
guiente. Sigue la prueba de su hiptesis. Forma de la tabla de cuatro entradas
para mostrar los cambios en los objetos de la iniciacin de los nios.

Objetos de iniciacin en el da 30.


DESPUS
Nio Adulto
objeto de iniciacin Adulto A B
en el primer da nio C D
SOLUCIN:
1. Hiptesis Estadstica:
Ho: Para cualquier de los nios que cambiaron, la probabilidad de que despla-
ce su objeto de iniciacin de un adulto a un nio (PA) es igual a la probabi-
lidad de que cambie su objeto de iniciacin de un nio a un adulto (P D) es
igual a un medio. Esto es: H0: PA = PD =1 2
Ha: H a : PA > PD
- 386 - V. Ibaez Q.
2. Nivel de significacin: = 0.05, y N = 25, nmero de nios observados en el
primero y trigsimo das en la guardera.
3. Prueba estadstica: Se escoge la prueba de Mcnemar para la significacin de
los cambios, porque usa dos muestras relacionadas, es el tipo antes-y-despus
y usa medicin nominal (clasificatoria).
4. Distribucin muestral: En la tabla de Ji-cuadrada se encuentra los valores
crticos(Anexo) para diferentes niveles de significacin. La distribucin
muestral 2 calculada est dada con la siguiente ecuacin; se aproxima muy
fuertemente a la distribucin de ji-cuadrada con gl = 1.

2
=
c A D 1h 2

, con gl = 1
A+ D
(1)

5. Regin de rechazo: Ya que Ha: predice la direccin de la diferencia, la regin


de rechazo es de una cola. la regin de rechazo est compuesta por todos los
valores de 2 (calculados con datos en los que A>D) tan grandes que tienen
una probabilidad de una cola asociada con su ocurrencia conforme Ho: de
0.05 o menos, o de otra forma se puede rechazar o aceptar las hiptesis:
H 0 : (1)
2
< 1,0.05
2
= 3841
. , entonces se acepta la Ho:

H 0 : 2(1) 1,0.05
2
= 3841
. , entonces se rechaza la Ho:
6. Clculo de la Ji-cuadrado
Se ordenan los datos en una tabla de frecuencias de 2x2, de la siguiente
manera: (Objetos de la iniciacin de los nios en el primero y trigsimo das
en la guardera).

Objeto de iniciacin en el trigsimo da


Nio Adulto
objeto de iniciacin Adulto 14 = A 4=B

en el primer da Nio 3=C 4=D

Nota: Contar (-)(-) debajo de la mediana.


Contar (+)(+) encima de la mediana.

2
=
c A D 1h = c 14 4 1h
2 2

=
92
= 4.5
A+ D 14 + 4
(1)
18
Estadstica Aplicada a la Educacin - 387 -
7. Decisin: Los datos de este estudio aparecen en en la tabla anterior, en el cual
muestra A = 14, es el nmero de nios que cambiaron de adulto a nio y D =
4, es el nmero de nios cuyos objetos cambiaron de nio a adulto. B = 4 y C
= 3 representan a los nios cuyos objetos estuvieron en la misma categora en
ambas ocasiones. Estamos interesados en los nios que mostraron cambio:
aqullos representados en las celdillas A y d.
Como 2(1) 45
. , y gl = 1, la probabilidad de ocurrencia conforme a Ho: es p <
0.025 (el valor de probabilidad dado en la tabla de valores crticos - Anexo es
dividido en dos porque se requiere una prueba de una cola y la tabla da valores
de dos colas). En vista de que la probabilidad confore a Ho: asociada con la
ocurrencia observada es p < 0.025, menor que = 0.05, el valor
observado 2 est en la regin de rechazo y se rechaza la Ho: para aceptar Ha:.
Con estos datos concluimo que los nios muestran una tendencia significati-
va a cambiar su objeto de iniciacin de adultos a nios despus de 30 das de
experiencia en la guardera.

B. Prueba de Rangos Asignados de WILCOXON

CONDICIONES:
- La prueba t de Wilcoxon, es la alternativa ms potente a la prueba paramtrica
t-Student Fisher para grupos relacionados o apareados, al utilizar no solo los
signos, sino tambin las cuantias ordinales de las diferencias.
- El mtodo de anlisis que sigue Wilcoxon es similar a la prueba de signos.
- La prueba de rangos asignados de Wilcoxon adjudica mayor peso a los pares
que muestran mayores diferencias entre las dos condiciones, ms que a los
pares cuy diferencia es pequea.
- La prueba de Wilcoxon, se aplica con bastante xito en las ciencias de la conducta.
- Cada par (Xi, Yi) corresponden a dos condiciones diferentes.
- Los puntajes deben ser medidos en forma cuantitativamente.
- Se encuentra la distribucin de las diferencias: d i = X i Yi
- Se debe utilizar para probar la hiptesis la mediana de las diferencias es igual
a una cierta cantidad.

MTODO:
- Calcular las diferencias entre las puntuaciones del par en los tratamientos (X,
Y) como di = Xi Yi .
- Asignar un rango sin tomar en cuenta el signo a las diferencias di, adjudicando
el rango 1 a la di ms pequea, el rango 2 a la siguiente, etc.
- 388 - V. Ibaez Q.
- Cuando se presentan el caso de los valores absolutos de las diferencias son
iguales al valor absoluto de cualquier otra diferencia.

X i Yi = X j Yj =L = X k Yk , di = d j =L = d k
El rango promedio se obtiene de la siguiente forma:
Rango(d i ) + Rango(d j )+L+Rango(d k )
Rango Promedio =
Nmero de rangos tomados
- Se asigna el valor de rango promedio a los rangos de la diferencia di al rango
de la diferencia dj:
di = d j =L = d k
Se asigna el signo de la diferencia di a cada uno de los rangos que se separa los
rangos positivos de los negativos.
- Cuando se presenta d i = 0 , se excluye este par del anlisis.
- Se suman todos los rangos positivos T+ y rangos negativos T-
T + = Suma de los rangos de las diferencias positivas "+".
T = Suma de los rangos de las diferencias negativas "".
De lo anterior, la suma de todo los rangos es N ( N + 1 ) 2 , T = N ( N + 1 ) 2 T + .,
luego se asigna a T+, la suma ms pequea de rango (T+ = suma pequea de
rangos).
- Se determina N como el total de las diferencias con signo.

EMPATES:
S X i Yi = d i = 0 , entonces queda excludo del anlisis y el tamao de N se
reduce, respectivamente.

MUESTRAS PEQUEAS:
Si N 15, se trabaja con la prueba de Wilcoxon que nos proporciona la proba-
bilidad asociada a los valores de T+. Si la probabilidad es menor o igual que en
nivel de significacin seleccionado, rechace la Ho:
MUESTRAS GRANDES:
Si N > 15, entonces se aproxima a la distribucin normal, T+: la suma de los
rangos, se distribuye aproximadamente en forma normal.
FG N ( N + 1)IJ
Z=
T+
H 4 K
N ( N + 1 )( 2 N + 1 )
24
Estadstica Aplicada a la Educacin - 389 -
RANGOS EMPATADOS Y MUESTRAS GRANDES:
- Si existieran rangos con empates, es necesario ajustar la prueba estadstica
para considerar el decremento en la variabilidad de T. La correccin requiere
contar los empates y reducir la varianza, respectivamente. En caso de existir
rangos empatados, entonces:

=2N( N + 1)( 2 N + 1) 1 g
T+
24
t j t j 1 t j + 1
2 j =1
d id i
Donde: g = Nmero de agrupamiento de diferentes rangos empatados.
tj = Nmero de rangos empatados agrupados en j.
- Se puede plantear la hiptesis, realizando de la siguiente forma:
Ho: Mediana(X) - Mediana(Y) = C versus Ha: Mediana(X) - Mediana(Y)<C

DECISIN:
- Si T+ > Ttabla, entonces aceptar la Ho:
- T+ Ttabla, entonces rechazar la Ho:
- En trminos de probabilidad p , entonces rechace la Ho:

EJEMPLO:
A un grupo de 10 estudiantes del curso de Lenguaje ensean dos profesores uno
despus de otro, durante un semestre, en este caso asumimos que el segundo
profesor tena mejor mtodo de enseanza y por consiguiente los estudiantes han
mejorado en el rendimiento. Las calificaciones de los estudiantes con los dos
profesores fueron los siguientes:

Nota-1 Nota-2
Estudiante Prof. 1 (Xi) Prof. 2 (Yi) di = Xi - Yi Rango Rango (+) Rango (-)
1 15 14 1 3 2
2 11 17 -6 9 -9.5
3 8 13 -5 8 -8
4 9 10 -1 1 -2
5 17 13 4 7 6.5
6 11 13 -2 4 -4
7 11 17 -6 10 -9.5
8 18 19 -1 2 -2
9 14 18 -4 6 -6.5
10 12 9 3 5 5
+ -
TOTAL T =13.5 T =41.5
- 390 - V. Ibaez Q.
SOLUCIN:
1. Hiptesis Estadstica:
Ho: La mediana de las calificaciones de los estudiantes obtenidas por el primer
profesor es igual a la mediana de calificaciones obtenidos por el segundo
profesor.
Ha: La mediana de las calificaciones de los estudiantes obtenidas por el primer
profesor es menor a la mediana de calificaciones obtenidas por el segundo
profesor.
2. Prueba Estadstica: Se seleccion la prueba de Wilcoxon puesto que los datos
representan diferencias entre las puntuaciones de dos muestras relacionadas.
3. Nivel de Significacin: = 0.01 y N = 10
4. Distribucin muestral: Cuando Ho: es verdadera, los valores calculados de
Wilcoxon, se encuentran en el Anexo.
5. Clculo de la prueba estadstica:
Encontrando los rangos promedios:
1+ 2 + 3
- Rango de: -1, -1, +1, su rango promedio ser: Rango Promedio = =2
3
6+7
- Rango de: -4, 4, su rango promedio ser: Rango Promedio = = 6.5
2
9 +10
- Rango de: -6, +6, su rango promedio ser: Rango Promedio = = 9.5
2

- La suma de los valores positivos es:"+"= 3


- La suma de los valores negativos es: "-" =7
- El nmero total de datos es: N = 10, T+ = 13.5

6. Regin de Rechazo:
La tabla de Wilcoxon proporciona el valor tabular de T10, 0.01 = 5.1 con N = 10
y = 0.01, entonces podemos comparar que 13.5 >5.1, aceptar la hiptesis
Ho: , o tambin p = 0.01

7. Decisin: Los rendimientos de los estudiantes con dos profesores en la ense-


anza del curso de fisiologa es la misma o es indiferente, es decir que no se
puede evaluar estas calificaciones, esto posiblemente se debe al azar.
Estadstica Aplicada a la Educacin - 391 -

14.5. EL CASO DE K-MUESTRAS RELACIONADAS

A. ANOVA BIFACTORIAL POR RANGOS DE FRIEDMAN

Cuando los datos estn en k muestras igualadas y al menos estn en escala


ordinal, se puede utilizar el Anlisis de Friedman para evaluar la hiptesis nula
de que las k muestras fueron extradas de la misma poblacin.
Debido a que k muestras son igualadas, el nmero de casos N es el mismo en
cada una de las muestras. La igualacin se logra estudiando el mismo grupo de
sujetos en cada una de las k condiciones.
El investigador puede obtener N conjuntos, cada uno de k sujetos igualados, y
asignar al azar a un sujeto de cada conjunto a la primera condicin, segunda
condicin, etc.
El anlisis de varianza bifactorial de Friedman evala la hiptesis nula de que
los k grupos igualados o medidas repetidas provienen de la misma poblacin o
de poblaciones con la misma mediana.
Para la prueba de Friedman, los datos deben presentarse en una tabla de doble
entrada conteniendo N renglones (sujetos o conjuntos de sujetos igualados) y k
columnas (las distintas condiciones). Los datos que emplea esta prueba son ran-
gos, las puntuaciones en cada rengln se ordenan por rangos separadamente,
estudiando k condiciones, los rangos de cualquier rengln varan de 1 a k.
La prueba de Friedman determina la probabilidad de que diferentes columnas de
rango (muestras) provengan de la misma poblacin, es decir, que las k varia-
bles tengan la misma mediana. La prueba de Friedman determina si los rangos
totales (R ) para cada condicin o variable, difieren significativamente de los
j
valores esperados por oportunidad, para realizar esta prueba, se calcula el valor
del estadstico denotado por Fr.

F 12 I
GH Nk ( k + 1) R JK 3N ( k + 1)
k
Fr = 2
j
j =1

Donde:
N = Nmero de renglones (sujetos)
k = Nmero de columnas (variables o condiciones)
(R ) = Suma de los rangos en la j-sima columna (suma de los rangos para varia-
j
ble j-sima)
k

= Sumatoria de los cuadrados de los rangos de todas las condiciones.


j =1
- 392 - V. Ibaez Q.
Cuando el nmero de renglones (N) y/o columnas k es grande, el estadstico de
Fr, se distribuye aproximadamente como la Ji-Cuadrada con gl. = k - 1, y mejor
se aproxima a la prueba de F que resulta al hacer el ANVA usual.

Procedimiento para realizar el Anlisis de FRIEDMAN:


1. Hiptesis: H0 : 1 = 2 =L= t
H a : j j' j j'
2. Nivel de significancia: = 005
. = 001.
3. Estadstica de prueba (Porque usar la prueba de Friedman)
4. Distribucin Muestral:
k
12
Fr =
Nk ( k + 1) j =1
R2j 3N ( k + 1) , con gl. = k - 1

2c = Fr > gl , , entonces se rechaza la Ho.


2
5. Regin de rechazo: Si

Si 2c = Fr gl , , entonces se acepta la Ho:


2

o
Fc > FglNumerador
error ,
, entonces se rechaza la Ho:

Fc FglNumerador
error ,
, entonces se acepta la Ho:

6. CONCLUSIN: Se puede concluir comparando ( 2c = Fr) con 2gl , (Ji-


cuadrado de la tabla).

EJEMPLO:
Tinker lleva a cabo un experimento para investigar la resistencia al parpadeo en
la lectura. Se registraron datos en 6 perodos sucesivos de lectura de 5 minutos cada
uno. Los datos se presentan a continuacin:
PERIODOS
Individuo 1 2 3 4 5 6
A 24 23 28 30 30 41
B 18 17 17 19 19 18
C 41 41 49 39 19 27
D 46 69 74 58 54 50
Estadstica Aplicada a la Educacin - 393 -
SOLUCIN:
1. Hiptesis:
Ho: El nmero de parpadeo en la lectura es el mismo en los diferentes perio-
dos.
Ha: En el perodo tres el nmero de parpadeo es mayor que los dems cuatro
inidividuos.
2. Nivel de significancia: = 0.05 = 0.01
3. Estadstica de prueba: Se elige el anlisis no paramtrico de la varianza de dos
clasificaciones en lugar del paramtrico.
4. Distribucin Muestral:
k
12
Fr = R2j 3N( k + 1) ,
Nk ( k + 1) j =1 con gl. = k - 1

5. Regin de rechazo: Si 2c = Fr > 52,0.05 = , entonces se rechaza la Ho.


Si 2c = Fr 5,0.05 = , entonces se acepta la Ho:
2

o
Fc > FglNumerador
error ,
, entonces se rechaza la Ho:

Fc FglNumerador
error ,
, entonces se acepta la Ho:
6. Clculo de la estadstica de prueba: Mediante el uso de datos de la tabla ante-
rior, se obtiene:

PERIODOS
Individuo 1 2 3 4 5 6
A 24 23 28 30 30 41
Rango 2 1 3 4 5 6
B 18 17 17 19 19 18
Rango 3 1 2 6 5 4
C 41 41 49 39 19 27
Rango 4 5 6 3 1 2
D 46 69 74 58 54 50
Rango 1 5 6 4 3 2
Rj R1 = 10 R2 = 12 R3 = 17 R4 = 17 R5 = 14 R6 = 14

Fr =
12 k=6 2
Nk( k +1) j=1
12
c h
Rj 3N(k +1) = 4x6(6+1) 102 +122 +172 +172 +142 +142 3x4(6+1) =2.71
- 394 - V. Ibaez Q.

7. DECISIN: Como 2c = Fr = 2.71 < 52,0.05 = 11.07, entonces se acepta la Ho:


y se rechaza la hipteis Ha.
8. CONCLUSIN: Se concluye que en cualquiera de los 6 parpadeos en la lectu-
ra es el mismo, es decir no existe diferencias significativos.

14.6. EL CASO DE K-MUESTRAS INDEPENDIENTES

A. PRUEBA JI-CUADRADA PARA K-MUESTRAS INDEPENDIENTES.

- Cuando los datos experimentales consisten en frecuencias en categoras discre-


tas (nominales o categricos y, en ocasiones, ordinales), se puede utilizar la
prueba Ji-cuadrada para evaluar la significacin de las diferencias entre k
grupos independientes.
- La prueba Ji-cuadrada para k muestras o grupos independientes es una exten-
sin de la prueba Ji-cuadrada para dos muestras independientes, presentada
anteriormente.
- La prueba Ji-cuadrada es similar tanto para dos como para k muestras o
grupos independientes.

MTODO:
- Para aplicar la prueba Ji-cuadrada, primero debemos presentar los datos (fre-
cuencias) en una tabla rxk, donde los datos en cada columna corresponden a las
frecuencias en cada una de las r categoras de respuesta para cada uno de los
k grupos o muestras diferentes.
- Determine la frecuencia esperada segn Ho: para cada celdilla encontrando el
producto de los totales marginales comunes a la celdilla y dividiendo este pro-
ducto entre N. Es decir, encuentre las frecuencias esperadas eij = i j N (N es
la sumatoria de cada uno de los totales marginales y representa el nmero total
de observaciones independientes. Cuando se inflan los valores de N debido a
mltiples observaciones de cada sujeto, esto invalida la prueba). Si las frecuen-
cias esperadas son pequeas, combine categoras.
- Calcule 2c , utilizando las siguientes ecuaciones.

r
2c =
k
d
ij eij i
2

~ (2r1)( k 1) , eij =
i j
i =1 j =1 eij N
Estadstica Aplicada a la Educacin - 395 -

r k ij2
=
2
c N ~ (2r 1 )( k 1 )
i =1 j =1 eij
Donde:
i. =Es el total observado por la i-sima fila.

.j = Es el total observado por la j-sima columna.

.. = Es el total general (tamao de muestra).


r = nmero de filas.
k = nmero de columnas.
- Determine los grados de libertad gl = (r - 1)(k - 1)
- Determine la significacin de la 2c observada recurriendo a la tabla de valores
crticos de la prueba Ji-cuadrada (Anexo). Si la probabilidad para el valor ob-
servado de 2c con un valor particular de grados de libertad (el que correspon-
da) es menor o igual que , rechace la hiptesis nula en favor de Ha:

Cundo utilizar la prueba Ji-cuadrada


- La Ji-cuadrada requiere que las frecuencias esperadas eij en cada celdilla no
sean demasiado pequeas.
- Cuando se viola este requisito, los resultados de la prueba no pueden ser inter-
pretados porque la distribucin 2c no est bien aproximada a la distribucin
de la Ji-cuadrada de la Tabla de valores crticos de Ji-cuadrada (Anexo).
- Cochran (1954) recomienda que en pruebas de Ji-cuadrada donde los grados de
libertad son mayores que uno (gl>1) (esto es, que r k sean mayores que dos), el
nmero de celdillas que presenten frecuencias esperadas menores que cinco (eij
<5), no debe ser mayor del 20% y ninguna celdilla debe presentar frecuencias
esperadas menores que uno (eij <1).
- Si los requisitos no son cubiertos por los datos de acuerdo con la forma en que se
recolectaron y no fue posible contar con una muestra grande, el investigador
debe combinar categoras para incrementar las eij en varias celdillas.
- Despus de combinar las categoras y despus de que menos del 20% de las
celdillas tengan frecuencias esperadas menores que cinco, y ninguna celdilla
tenga una frecuencia esperada menor que uno, el investigador puede interpretar
tilmente los resultados de la prueba Ji-cuadrada.
- 396 - V. Ibaez Q.
- La combinacin de las categoras debe realizarse juiciosamente, esto es, los
resultados de la prueba estadstica pueden no ser interpretados si las categoras
han sido combinadas caprichosamente.
- Las categoras que son combinadas deben tener alguna propiedad en comn o
identificacin mutua, por si la interpretacin del resultado de la prueba, despupes
de haber combinado los renglones o columnas, tiene cierta utilidad.
- El investigador debe ser precavido contra la necesidad de combinar categoras
si se utiliza una muestra suficientemente grande.
- La prueba Ji-cuadrada es insensible a los efectos de orden, as, cuando se orde-
nan las categoras de respuesta o los grupos (o ambos), la prueba Ji-cuadrada
puede no ser la mejor.
- Cochran (1954) ha presentado mtodos que fortalecen la prueba Ji-cuadrada
comn cuando Ho: es verdadera contra alternativas especficas.
- Finalmente, debe notarse que la prueba Ji-cuadrada es aplicada a frecuencias.
- No es correcto emplear porcentajes o cualquier otra transformacin de los datos
al aplicar la prueba de Ji-cuadrada.

EJEMPLO:
Un grupo de investigadores, al estudiar la relacin entre el tipo sanguneo y la
severidad de una afeccin en la poblacin, reuni los datos de 1500 personas, los
cuales se presentan en la tabla de contingencia. Los investigadores desean saber
si estos datos son compatibles con la hiptesis de que el grado de la afeccin y el
tipo sanguneo son independientes. La informacin se presenta a continuacin:
1500 individuos clasificados segn la severidad de su condicin y tipo de sangre
Severidad TIPO DE SANGRE
de la condicin A B AB O TOTAL
AUSENTE 543 211 90 476 1320
MODERADA 44 22 8 31 105
SEVERA 28 9 7 31 75
TOTAL 615 242 105 538 1500

SOLUCIN:
1. Hiptesis Esadstica (Planteamiento de la hiptesis).
Ho: El tipo sanguneo y la severidad de la afeccin son independientes.
Ha: Las dos variables no son independientes.
2. Nivel de significacin = 0.05.
3. Prueba Estadstica: Se elige la prueba estadstica de Ji-cuadrada de r filas por
k categoras, adems los datos estn expresados al menos en una escala ordinal,
por consiguiente se aplicar la Ji-cuadrada.
4. Distribucin muestral: Se utiliz la siguiente ecuacin:
Estadstica Aplicada a la Educacin - 397 -

2c
r
=
d k
ij eij i 2

~ (2r 1 )( k 1 )
i =1 j =1 eij
5. Clculo de la prueba estadstica:
(543- 541.2) 2 (211- 212.96) 2 (31- 26.90) 2
2c = + + L+
5412. 212.96 26.90
= 0.005987+0.018039+ .........+0.624907
= 5.12
6. Regin de rechazo y aceptacin:
Si 2c = 5.12 26 ,0 ,05 = 12.592 , se acepta la Hiptesis Nula (Ho).

Si 2c = 5.12 > 26 ,0 ,05 = 12.592 , se rechaza la Ho: y se acepta la Ha.

7. Decision: Como 2c = 5.12 26 ,0 ,05 = 12.592 , entonces se concluye que es


cierto la hiptesis Ho:, es decir los datos son compatibles con la hiptesis de
que el grado de la afeccin y el tipo sanguneo son independientes. al menos
estos datos, debido a la ntima concordancia entre las frecuencias observadas y
esperadas, no proporcionan evidencia suficiente que indique una falta de inde-
pendencia entre los criterios de clasificacin, debido a que 5.12 < 10.645, p >
0.10

B. ANLISIS DE VARIANZA UNIFACTORIAL POR RANGOS DE KRUSKAL-


WALLIS (KW)

El Kruskal-Wallis, es una prueba extremadamente til para decidir si k mues-


tras independientes provienen de diferentes poblaciones. La tcnica de Kruskal-Wallis
prueba la hiptesis nula de que las k muestras provienen de la misma poblacin o
de poblaciones idnticas con la misma mediana.

El anlisis de varianza por rangos de Kruskal-Wallis, requiere que las medicio-


nes de la variable se encuentre, al menos en escala ordinal. Los datos se presentan en
una tabla de doble entrada, donde cada columna representa cada grupo o muestra
sucesiva.

En la mayora de las situaciones prcticas la estadstica KW, se aproxima sufi-


cientemente por una estadstica F, transformando las observaciones a rangos y
haciendo el ANVA usual sobre rangos.
- 398 - V. Ibaez Q.

G RUP O
1 2 3 .... k
Y 11 Y 12 Y 13 .... Y 1K
Y 21 Y 22 Y 23 .... Y 2K
Y 31 Y 32 Y 33 .... Y 3K
.... .... .... .... ....
.... .... .... .... ....
.... .... .... .... ....
Y n1 Y n2 Y n3 .... Y nk

Donde Y : Es el dato para la i-sima observacin en el j-sima grupo, y


ij
n : Es el nmero de observaciones en el j-simo grupo.
ij

En el clculo de la prueba de Kruskal-Wallis, cada una de las N observaciones


reemplaza por unrango (el que le corresponda). Esto es, todas las puntuaciones de
todas las k muestras, se combinan en una sola serie y se ordenan por rangos. La
puntuacin ms pequea se reemplaza por el rango uno, el que sigue en tamao
(ascendente), se reemplaza por el rango dos, y la puntuacin mayor se reemplaza por
el rango N, donde N es el nmero total de observaciones independientes de las k
muestras. Luego realizar la suma de rangos en cada muestra (columna).
La prueba de Kruskal-Wallis, evala la diferencia entre los rangos promedios
para determinar si son lo suficientemente dispares, de tal forma que no hayan sido
extrados de la misma poblacin. Existen dos formas para calcular la prueba de
Kruskal-Wallis (KW).
12 k

n j Rj R d i2 LM
12 k OP
KW = = nj Rj2 3( N +1)
N Q
KW
N( N + 1) j =1 o
N( N +1) j=1

Donde:
k = Nmero de muetras o grupos.
n = Nmero de casos en la j-sima muestra
j
N = Nmero de casos en la muestra combinada (suma de n)
R = Sumatoria de los rangos en la j-sima muestra o grupo.
j

R j = Promedio de los rangos en la j-sima muestra o grupo.


Estadstica Aplicada a la Educacin - 399 -

R = ( N +1) 2 = Promedio de los rangos en la muestra combinada (la gran media)


Cuando k>3 grupos el nmero de observaciones en cada grupo es mayor que 5
(n >5), la distribucin muestral de KW est bien aproximada a la distribucin de la
j
Ji-Cuadrada con g.l. = k - 1.

Procedimiento para realizar el Anlisis de Kruskal-Wallis (KW).


1. Hiptesis: H0 : 1 = 2 =L = g
Ha : g g' g g'
2. Nivel de significancia: = 005
. = 001 .
3. Estadstica de prueba (Porque usar la prueba de Kruskal-Wallis)
4. Distribucin Muestral:

L 12 n R OP 3( N + 1) R = n R
KW = M
k k 2 k

,
N N ( N + 1) Q
2 j 2
j j j j
j =1 n j =1 j j =1

5. Regin de rechazo: Si KW > 2gl , , entonces se rechaza la Ho.

gl , , entonces se acepta la Ho:


2
Si KW
o
Fc > FglNumerador
error ,
, entonces se rechaza la Ho:

Fc FglNumerador
error ,
, entonces se acepta la Ho:

6. CONCLUSIN: Se puede concluir comparando KW con 2gl , (Ji-cuadrado


de la tabla).

EJEMPLO:
Se estudi el efecto de dos medicamentos en el tiempo de reaccin ante cierto
estmulo de 3 grupos de animales experimentales. El grupo III sirvi de control,
mientras que a los animales del grupo I se les aplic el medicamente A y a los del
grupo II el medicamento B antes de la aplicacin del estmulo. La informacin que
se presenta a continuacin muestra el tiempo de reaccin, en segundos de los 13
animales.
- 400 - V. Ibaez Q.

GRUPO GRUPO(Rangos)
I II III I II III
17 8 2 9 6.5 1
20 7 5 10 5 4
40 9 4 13 8 3
31 8 3 11 6.5 2
35 12
nj 5 4 4 Rj R1 =55 R2 =26 R3 = 10
nj 5 4 4 N= 13

SOLUCIN:
1: Hiptesis: Ho: Las distribuciones de las poblaciones son idnticas.
Ha: Al menos una de las poblaciones tiende a mostrar valores ma-
yores que, cuando menos, una de las otras poblaciones.
2. Nivel de significancia: = 0.05
3. Estadstica de prueba (La escala de medicin a utilizarse es, al menos ordinal).
Las muestras son aleatorias e independientes, y fueron extradas de sus res-
pectivas poblaciones.
4. Distribucin Muestral:
LM 12 n R OP 3( N +1) = 12 L55 + 26 + 10 O 3(14 )
13(14 ) MN 5 4 PQ
k 2 2 2

N N ( N + 1) Q
KW = j
2
j ,
j =1 4
= 10.68131868
5. Regin de rechazo: Si KW = 10.68 > 22 ,0.05 = 7.7604 , entonces rechazamos
la hiptesis nula y se acepta la Ha:.
6. CONCLUSIN: Como KW = 10.68 > 22 ,0.05 = 7.7604 , entonces al menos
una de las poblaciones tiende a mostrar valores mayores que, cuando menos,
una de las otras poblaciones.

CORRECCIN PARA LOS EMPATES


Para realizar la correccin de los empates, debemos determinar cuntos grupos
de empate hay y cuntas puntuaciones se encuentran empatadas en cada grupo. Se
usar la siguiente frmula:
g

(t i
3
ti )
1 i =1
N3 N
Estadstica Aplicada a la Educacin - 401 -
En nuestro ejemplo, se tiene un grupo (Grupo II) y existen dos puntuaciones con
6.5 y 6.5, entonces g = 1.
23 2 6
1 = 1 = 0.9972527
13 13
3
2184
KW 10.68
KWcorr . = = = 10.709 ~ 10.71
6 0.9972527
1
2184
es significativo al nivel de 0.01. Como es significativo al nivel dado, entonces no
es necesario ajustarla.

MUESTRAS GRANDES: Cuando existen ms de 3 grupos y, al menos, una de


las nj (tamao de muestra) es mayor que 5, la distribucin muestral de KW, se aproxima
a la distribucin de Ji-Cuadrada con gl. = k - 1.

k 2
12 Rj
= KW =
2
c 3( N + 1)
N ( N + 1 ) j =1 n j
123
k
nj Rj
2
j =1

Otra forma de realizar la prueba de Kruskal-Wallis, es la aproximacin a la prue-


ba estadstica de F, es decir, se realiza como un diseo completamente al azar.

EJERCICIO:

1. Un grupo de investigadores desea comparar cuatro programas de aptitud fsica


diseados para directivos. A cada miembro de un conjunto de treinta directos se
le asign aleatoriamente uno de los cuatro programas. La siguiente tabla muestra
la diferencia entre las puntuaciones de la condicin fsica obtenidas por cada uno
de los directivos, antes y despus de participar en el programa.
- 402 - V. Ibaez Q.

P R O GR A M A S
A B C D
13 11 12 22
24 13 19 26
19 20 9 22
18 14 14 22
9 11 21 26
21 21 7 19
17 14 6
22 8
24

Es posible concluir que los cuatro programas difieren en cuanto a efectividad?.


Sea = 0.05. Aplicar la prueba de Kruskal-Wallis.

14.8. MEDIDAS DE ASOCIACIN Y SUS PRUEBAS DE SIGNIFICACIN

A. EL COEFICIENTE DE C DE Cramr

FUNCIN:
- El coeficiente C de Cramr es una medida del grado de asociacin o relacin
entre dos series de atributos o variables.
- Se usa nicamente cuando tenemos slo informacin categrica (escala nomi-
nal) acerca de uno o de ambos conjuntos de atributos o variables.
- Se emplea cuando la informacin acerca de los atributos consiste en una serie
no ordenada de categoras.
- Para el uso del coeficiente de Cramr, no es necesario suponer continuidad
subyacente para las diferentes categoras usadas al medir uno o ambos conjun-
tos de atributos.
- No se necesita siquiera ser capaces de ordenar las categoras en alguna forma
particular.
- El coeficiente de Cramr, al ser calculado de una tabla de contingencia, propor-
ciona los mismos valores sin considerar cmo fueron ordenadas las categoras
en las filas y columnas.

MTODO:
- Arregle las frecuencias observadas en una tabla de contingencia de rxh, donde
r es el nmero de categoras en las cuales se clasifica una variable y k es el
nmero de categoras en las cuales se clasifica la otra variable.
- Determine la frecuencia esperada segn Ho: para cada celda, al multiplicar los
Estadstica Aplicada a la Educacin - 403 -
datos totales marginales comunes a esa celda y dividiendo despus este produc-
to por el nmero total de casos N. Es decir, para cada celda en la tabla de
contingencia calcule: eij = i j N . Si ms de cerca del 20% de las celdas
tienen frecuencias esperadas menores que cinco o si cualquiera de las celdas
tiene una frecuencia esperada menor que uno combine las categoras (ya sea
filas o columnas) para incrementar las frecuencias esperadas que sean deficien-
tes.
- Mediante la siguiente ecuacin, calcule el valor de 2c para los datos.

2c =
d
r k
ij eij i 2


i =1 j =1 eij

r k ij2
=
2
c N ~ (2r 1 )( k 1 ) - Use este valor de 2c para calcu-
i =1 j =1 eij
lar el valor de C mediante la siguiente ecuacin:

2c
C=
N (L - 1)
Donde: L : Es el mnimo del nmero de filas o columnas en la tabla de contin-
gencia.
El grado de asociacin entre dos conjuntos de atributos al medirse por medio
del coeficiente de Cramr, aunque sean o no ordenables e independientemen-
te de la naturaleza de la variable (puede ser continua o discreta) y de la distri-
bucin subyacente del atributo (la distribucin poblacional pueder ser normal
o de cualquier forma), puede encontrarse en una tabla de contingencia de
observaciones.
Debe notarse que, como la correlacin producto-momento de Pearson, el co-
eficiente de Cramr tiene un valor mximo de uno y C ser igual a cero cuan-
do las variables o los atributos sean independientes. A diferencia de la corre-
lacin producto-momento de Pearson, el coeficiente de Cramr no puede ser
negativo. Esto es de esperar, ya que el estadstico mide la relacin entre varia-
bles categricas que no poseen ningn orden inherente.
- Para probar si el valor observado de C indica que existe una asociacin signifi-
cativa entre las dos variables en la poblacin muestreada, determine la probabi-
- 404 - V. Ibaez Q.

lidad asociada segn Ho: de un valor tan grande como el observado 2c con gl
= (r - 1)(k - 1), consultando la tabla de valores crticos de la Ji-cuadrada (Anexo).
Si esa probabilidad es igual o menor que (p ), la hiptesis nula (Ho.) es
rechazada en ese nivel de significacin, aceptndose la Ha:

Ejemplo:
Un grupo de investigadores, al estudiar la relacin entre el tipo sanguneo y la
severidad de una afeccin en la poblacin, reuni los datos de 1500 personas, los
cuales se presentan en la tabla de contingencia. Los investigadores desean saber
si estos datos son compatibles con la hiptesis de que el grado de la afeccin y el
tipo sanguneo son independientes. La informacin se presenta a continuacin:
1500 individuos clasificados segn la severidad de su condicin y tipo de sangre
Severidad TIPO DE SANGRE
de la condicin A B AB O TOTAL
AUSENTE 543 211 90 476 1320
MODERADA 44 22 8 31 105
SEVERA 28 9 7 31 75
TOTAL 615 242 105 538 1500

SOLUCIN:
1. Hiptesis Esadstica:
Ho: El tipo sanguneo y la severidad de la afeccin son independientes.
Ha: El tipo sanguneo y la severidad no son independientes.
2. Nivel de significacin = 0.05.
3. Prueba Estadstica: Se elige el coeficiente de Cramr (C), con r filas por k
categoras, adems los datos estn expresados al menos en una escala ordinal,
por consiguiente se aplicar C.
4. Distribucin muestral: Se utiliz el coeficiente de Cramr:

2c
C=
N (L - 1)
5. Clculo de la prueba estadstica: Primeramente se debe calcular 2c , de la
siguiente manera:
(543- 541.2) 2 (211- 212.96) 2 (31- 26.90) 2
2c = + + L+ = 5.12
5412
. 212.96 26.90

Reemplazando al coeficiente de Cramr (C), se tiene:


Estadstica Aplicada a la Educacin - 405 -

2c .
512
C= = = 0.041
N (L - 1) 1500( 3 1 )
6. Regin de rechazo y aceptacin:
Si 2c = 5.12 26 ,0 ,05 = 12.592 , se acepta la Hiptesis Nula (Ho).

Si 2c = 5.12 > 26 ,0 ,05 = 12.592 , se rechaza la Ho: y se acepta la Ha.

7. Decision: Como 2c = 5.12 26 ,0 ,05 = 12.592 , entonces se concluye que es


cierto la hiptesis Ho:, es decir los datos son compatibles con la hiptesis de
que el grado de la afeccin y el tipo sanguneo son independientes. La probabi-
lidad conforme ocurre la Ho: es de 0.5 (C = 0.041). Por lo tanto podemos
aceptar la Ho: es decir existe evidencia suficiente para indicar que hay la inde-
pendencia entre los criterios de clasificacin.

B. COEFICIENTE DE CORRELACIN rs de Spearman de Rangos Ordenados

FUNCIN:
- Es una medida de asociacin entre dos variables que requiere que ambas estn
medidas en al menos en una escala ordinal, de manera tal que los objetos o
individuos en estudio puedan ser colocados en rangos en dos series ordenadas.
- Al calcular un coeficiente de correlacin podra haber problemas o inconvenientes
para usar directamente las d i. Una dificultad es que las di negativas podran cancelar
a las positivas cuando tratamos de determinar la magnitud total de la discrepancia
entre los rangos, aun pensando que es la magnitud, ms que el signo de la
discrepancia, la que representa un ndice de la disparidad de los rangos. Sin
embargo si se emplea d i2 en lugar de d i esta dificultad se elimina. Queda claro
que mientras ms grandes sean las diferencias d i , ms grande ser el valor de

d i
2
, que es la suma del cuadrado de las diferencias para N pares de datos.
- La derivacin de la frmula calculada para rs es bastante sencilla. Se hace
simplificando la frmula del coeficiente de correlacin producto-momento r de
Pearson cuando los datos estn compuestos por rangos. Proporcionaremos dos
expresiones alternativas para rs . Una de estas formas alternativas es til en el
clculo del coeficiente y la otra se usar posteriormente cuando encontremos
necesario corregir el coeficiente, cuando se presenten puntuaciones empatadas en
los datos. Si x = X X , donde X es la media de las puntuaciones en la variable
- 406 - V. Ibaez Q.

X, y si y = Y Y , donde Y es la media de las puntuaciones en la variable Y,


entonces una expresin general para el coeficiente de correlacin producto-
momento de Pearson es:
xy
r =
x2 y2
en el cual las sumas estn sobre los valores de N en la muestra. Ahora cuando las
X y las Y son rangos, r = r. Conociendo que los datos que estn en rangos,
podemos simplificar la ecuacin anterior para obtener la expresin siguiente para
el coeficiente de correlacin de Spearman de rangos ordenados:
x 2 + y 2 di2
rs = , y
2 x2 y2
n
6 d i2
rs = 1 i =1
N3 N
Recurdese que di = Xi Yi , la diferencia en rangos en las dos variables. la

x 2 + y 2 di2
simplificacin de la ecuacin rs = a la forma proporcionada
2 x2 y2
n
6 d i2
en la ecuacin rs = 1
i =1
es posible notando que cuando los datos estn en
N3 N
rangos y no existen empates en los datos, x2 = y2 = (N3 - N) 12 . Debe notarse
que si existen empates, el uso de las ecuaciones anteriores proporcionar el valor
correcto de rs; mas tarde se proporcionar una correccin para los empates para la
ecuacin rs. Este coeficiente se usa para medir el grado de relacin entre dos
variables medidas a nivel ordinal preferentemente (ordenar) y en algunos casos
para datos medidos a nivel de intervalo o de razn.

EJEMPLO:
Suponga que un dictaminador ha clasificado a ocho maestros de ciencias
elementales segn su habilidad docente y que todos presentaron un examen
Estadstica Aplicada a la Educacin - 407 -
nacional para maestros. Los datos se dan en la tabla siguiente. Sugieren los
datos si existe una correlacin entre rangos y calificaciones?

Rango del C a lif ic a c i n


M a e s t ro d ic t a m in a d o r d e l e xa m e n
1 7 44
2 4 72
3 2 69
4 6 70
5 1 93
6 3 82
7 8 67
8 5 80

SOLUCIN:
1. Hiptesis estadstica:
Ho: No existe asociacin entre el docente dictaminador con la calificacin del
examen.
Ha: Existe asociacin entre el docente dictaminador con la calificacin del
examen.
2. Nivel de significacin: = 0.05
3. Prueba Estadstica: Se elige el coeficiente de correlacin de Spearman de
rangos ordenados, ya que la escala de medicin a utilizarse es, al menos ordinal.
4. Distribucin Muestral: Se calcular con la siguiente ecuacin:
n
6 d i2
rs = 1 i =1
N3 N
5. Clculo de la prueba estadstica:

Rango del Calificacin Rango del


Maestro dictamin. (Xi) del examen Examen di = Xi - Yi di2
1 7 44 1 6 36
2 4 72 5 -1 1
3 2 69 3 -1 1
4 6 70 4 2 4
5 1 93 8 -7 49
6 3 82 7 -4 16
7 8 67 2 6 36
8 5 80 6 -1 1
d=
8 2
TOTAL i=1 i
144
- 408 - V. Ibaez Q.
Al sustituir a la frmula r , obtenemos:
s
n =8
6 di2
6x144
rs = 1 i =1
= 1 = 0.714
N N
3
83 8
6. Regin de rechazo y aceptacin:
Prueba de hiptesis nula (Ho:) de una cola: P(rs r0 ) =
Para realizar una prueba de dos colas rechazamos la hiptesis nula si:
rs r0 o rs r0 . El valor de para la prueba es el doble del valor que
aparece en la parte superior de la tabla.
6. Decisin: Como P( rs 0.643 ) = 0.05 , es decir es superior al valor crtico
de la tabla de r , entonces se rechaza la Ho:, por consiguiente existe suficiente
s
evidencia para afirmar que el dictaminador y el examen de calificacin estn
asociados en forma negativa con r = -0.714.
s
Estadstica Aplicada a la Educacin - 409 -

BIBLIOGRAFA CONSULTADA

AVILA, A.R.B. (2000). "Estadstica Elemental". Edicin 2000. Estudios y Ediciones


RA. Universidad Nacional Mayor de San Marcos. Lima - Per.
BALLUERKA, N. y Vergara, A. (2002). Diseos de Investigacin Experimental en
Psicologa. 1ra. Edicin. Edit. Prentice-Hall. Madrid Espaa,
FERNANDEZ, C.J. y FERNANDEZ, C.J. (1993). "Estadstica Aplicada: Tcnicas
para la investigacin". Parte I. Segunda Edicin. Editorial San Marcos.
Lima - Per.
DOTTONE, R.H. (1971). "Estadstica Elemental". 12a. y 13a edicin. Cooperativa
de Cultura y Publicaciones, Ltda. Universidad de Chiel. Santiago de Chile.
IBAEZ, V. (1998). Modelos Lineales. Edicin Primera. Editorial Aquarium
Impresiones & Editores. FINESI - UNA-Puno.
IBAEZ, V. (2000). "Aplicaciones Estadsticas en Ganadera". Primera Edicin.
Editorial Universitaria. Facultad de Ingeniera Estadstica e Informtica. UNA
- Puno. Puno -Per.
IBAEZ, V. (2001). Estadstica bsica aplicada a la ganadera. Edicin Primera.
FMVZ - UNA-Puno.
IBAEZ, V. (2003). Diseos Estadsticos con SAS. Edicin Primera. Maestra en
Ganadera Andina. UNA-Puno.
IBAEZ, V. (2005). Bioestadstica. Edicin Primera. FINESI-UNA-Puno.
IBAEZ, V. (2006). Estadstica Inferencial Aplicada a la Salud. Edicin Primera.
FINESI - UNA-Puno.
IBAEZ, V. Y ZEA, W. (2006). Aplicaciones con el sistema de anlisis estadstico
SAS. Universidad Nacional Micaela Bastidas de Apurimac- Abancay - Per.
IBAEZ, V. (2006). Mtodos Estadsticos para la Investigacin. Edicin Primera.
Fac. de Enfermera - UNA-Puno.
IBAEZ, V. (2007). Estadstica no paramtrica aplicada a la Ganadera. Primera
Edicin. Editorial Universitaria (En prensa).
MITACC, M.M.(1990). Tpicos de Inferencia Estadstica. Primera Edicin.
Editorial San Marcos. Lima - Per.
MOYA, C.R. (1991). "Estadstica Descriptiva: Conceptos y Aplicaciones".
Universidad Nacional del Callao. Facultad de Ciencias Econmicas. Primera
Edicin. Editorial San Marcos. Lima - Per.
- 410 - V. Ibaez Q.
MUCHAYPIA, R.J. (2000). "Estadstica y Probabilidades". Primera Edicin. Editora
Kano LAFONTE. Lima - Per.
POZO, M. y ORIHUELA, P. (1992). Estadstica Aplicada a la Educacin. Primera
Edicin. Editorial. Talleres Grficos P.L. Villanueva S.A. Lima - Per.
Ruiz-Maya, L. (2000). Mtodos Estadsticos de Investigacin en las Ciencias Sociales:
Tcnicas no paramtricas. 1ra. Edic. Edit. AC. Madrid Espaa.
SIEGEL, S. (1986). Estadstica no paramtrica aplicada a las ciencias de la conducta.
Primera Edicin. Edit. Trillas S.A. de C.V. Mxico.
SIEGEL, S. y CASTELLAN, N.J. (1995). Estadstica No Paramtrica aplicada a las
ciencias de la conducta. 2da. Edic. Edit. Trillas, Mxico.
VILLALTA, P. e IBAEZ, V. (1998). "Estadstica Pecuaria". Primera Edicin.
Editorial Universitaria. Fac. Medicina Veterinaria y Zootecnia. UNA - Puno. .
(En prensa). Puno - Per.
ZEA, F.W. e IBAEZ, Q.V. (1996). "I Curso de Sistema de Anlisis Estadstico SAS
para la Investigacin Experimental". Universidad Nacional Jorge Basadre
Grohomann Tacna. Facultad de Ciencias Agrcolas.
ZEA, F.W. (1999). Diseos Estadsticos aplicados a la Educacin. Primera Edic.
Editorial Titikaka. Fac. Cs. de la Educain.
ZEA, F.W. e IBAEZ, Q.V. (2003). "Tablas Estadsticas". Segunda Edicin. Edit.
Universitaria. Fac. Cs. Agrarias - FINESI. UNA - Puno.

You might also like