You are on page 1of 64

Estadstica General Mg.

Mara Vallejos Atalaya



















Estadstica General

Mg. Mara Vallejos Atalaya



























Estadstica General Mg. Mara Vallejos Atalaya






PRESENTACIN


El mdulo de Estadstica General tiene la naturaleza terico- prctica, pertenece al rea de
Formacin Bsica, en el I ciclo, con un total de 4 horas y 3 crditos. Asimismo, responde a las
exigencias curriculares de los programas acadmicos y de los diseos curriculares de la Facultad de
Ciencias Empresariales y sus respectivas carreras acadmicas profesionales, en el contexto de los
perfiles, las visiones y las misiones institucionales educativas y profesionales.

Tiene el propsito de proporcionar al futuro profesional los conocimientos necesarios de la estadstica,
que le permitir investigar y resolver problemas con el quehacer de su carrera profesional. El mundo
actual que vivimos, ha provocado incertidumbre en las personas que tienen que tomar decisiones en
las diferentes funciones que les toca desempear, ya sea en las instituciones gubernamentales,
comerciales, de negocios pblicos y privados. La estadstica es una herramienta intelectual que ayuda
a tomar decisiones racionales, porque sabemos que El pasado puede evaluarse, el presente puede
ser descrito y el futuro puede ser previsto.

El sistema modular no es sino un encuentro de los alumnos y profesores en espacios diseados y
establecidos previamente, con mucha inteligencia, seleccin adecuada y pertinente de los contenidos,
instrumentos y metodologa, cuyos alcances de autoaprendizajes sern coronados en la grandeza de
los alumnos participantes, especialmente de quienes quedan inmersos en los programas acadmicos a
distancia, cuya dinmica acadmica se ha estandarizado y responde al uso de las tecnologas
modernas. En este sentido, el mdulo ha sido diseado para desarrollarlo en dos fases: una a distancia
y la otra presencial (tutorial) que comprende 10 tutoras presenciales.

Este mdulo contiene la sumilla, las competencias, los contenidos agrupados en 5 unidades. Unidad 1:
Conceptos fundamentales y la organizacin de la informacin, Unidad 2: Medidas de resumen: anlisis
e interpretacin de los resultados, Unidad 3: Nociones de probabilidad: propiedades, anlisis
combinatorio, Unidad 4: Distribuciones de probabilidad y Unidad 5: Distribuciones muestrales. Adems,
en el mismo mdulo se encuentra la metodologa, la evaluacin y la bibliografa. Por ejemplo, se
trabajar la metodologa activa, adems, se ejercer la evaluacin de acuerdo con los indicadores,
criterios y condiciones registrados en el desarrollo de cada unidad. Este mdulo comprende una
bibliografa bsica y especializada.

















Estadstica General Mg. Mara Vallejos Atalaya


NDICE



UNIDAD I: TEORA ESTADSTICA

Sesin N1
CONCEPTOS FUNDAMENTALES Y ORGANIZACIN DE LA INFORMACIN
1.1 Generalidades
1.1.1 Definicin de estadstica
1.1.2. Ramas de la estadstica
1.1.3. Poblacin
1.1.4. Muestra
1.1.5. Unidad estadstica
1.1.6. Dato estadstico
1.1.7. Parmetro
1.1.8. Estadstico o estadgrafo
1.1.9. Variable estadstica

Sesin N 2
ETAPAS DEL MTODO ESTADSTICO
2.1. Etapas del mtodo estadstico
2.1.1. Planificacin del estudio
2.1.2. Recoleccin de la informacin
2.1.2.1. Mtodo de recoleccin de la observacin
2.1.2.2. Muestreo
2.1.2.3. Determinacin del tamao de muestra
2.1.3. Presentacin u organizacin de la informacin
2.1.3.1. Revisin y correccin de la informacin recogida
2.1.3.2. Presentacin de la informacin mediante cuadros
2.1.3.3. Presentacin de la informacin mediante grficos
2.1.4. Anlisis e interpretacin de los resultados
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

Sesin N 3
ORGANIZACIN DE LA INFORMACIN: TABLAS Y GRFICOS ESTADSTICOS
3.1. Tablas de frecuencias o distribucin de frecuencias
3.1.1. Distribucin de frecuencias de una variable discreta
2.1.2. Distribucin de frecuencias para datos agrupados

Sesin N 4
REPRESENTACIN DE LA INFORMACIN
4.1. Presentacin de la informacin mediante grficos
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN


UNIDAD II: MEDIDAS ESTADSTICAS
Estadstica General Mg. Mara Vallejos Atalaya


Sesin N5
MEDIDAS DE RESUMEN
5.1. Anlisis e interpretacin de los resultados
5.2. Medidas de tendencia central
5.2.1. La media o promedio aritmtico ( x )
5.2.1. Mediana (Me)
5.1.3. La moda (Mo)

Sesin N 6
MEDIDAS DE POSICIN
6.1. Medidas de posicin
6.1.1. Cuartiles (Q
i
)
6.1.2. Deciles (D
i
)
6.1.3. Percentiles (Pi )
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

Sesin N 7
MEDIDAS DE DISPERSIN
7.1. Medidas de dispersin
7.1.1. Varianza (s
2
)
7.1.2. Desviacin estndar (s )
7.1.3. Coeficiente de variacin (c.v. % )

Sesin N 8
MEDIDAS DE FORMA
8.1. Medidas de forma.
8.1.1. Asimetra (As)
8.1.2. Coeficiente de Kurtosis o apuntamiento (K)
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

UNIDAD III: PROBABILIDAD

Sesin N9
PROBABILIDAD
9.1. Introduccin
9.2. Anlisis combinatorio
9.2.1. Factorial de un nmero (!)
9.2.2. Permutaciones
9.2.3 variaciones
9.2.4. Combinaciones
9.2.5. Propiedad

Sesin N 10
ALGUNOS CONCEPTOS BSICOS DE PROBABILIDAD
10.1. Algunos conceptos bsicos de probabilidad
10.1.1. Experimento
10.1.2. Espacio muestral
Estadstica General Mg. Mara Vallejos Atalaya


10.1.3. Suceso o evento
10.1.4. Operaciones con eventos
10.1.5. Eventos mutuamente excluyentes
10.2. Probabilidad de un evento
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

Sesin N 11
PROBABILIDAD CONDICIONAL
11.1. Probabilidad condicional
11.2. Regla de la multiplicacin de eventos
11.4. Teorema de bayes
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

UNIDAD IV: PROBABILIDAD Y DISTRIBUCIN

Sesin N12
PROBABILIDAD BSICA
12.1. Las distribuciones de probabilidades bsicas
12.2. Las variables aleatorias
12.3. Las distribuciones de probabilidad
12.3.1. La distribucin binomial
12.3.1.1.1. Propiedades de una distribucin binomial
12.3.1.1.2. Uso de tablas de la distribucin binomial
12.3.1.1.3. Media y desviacin estndar de una distribucin binomial
12.3.2. La distribucin de poisson
12.3.2.1. La frmula de poisson
12.3.2.2. Uso de tablas de la distribucin acumulada de poisson
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

Sesin N 13
DISTRIBUCIN NORMAL
13.1. Distribucin normal
13.1.1. Uso de tablas de distribucin acumulada normal estndar
EJERCICIOS PROPUESTOS
EVALUACIN
AUTOEVALUACIN

UNIDAD V: DISTRIBUCIONES DE MUESTREO

Sesin N14
DISTRIBUCIONES MUESTRALES
14.1. Distribuciones muestrales
14.2. Muestreo
14.3. Etapas del muestreo
14.4. Las distribuciones muestrales de probabilidad
Estadstica General Mg. Mara Vallejos Atalaya

14.5. Distribuciones de muestreo de estadsticas
14.6. Distribucin muestral de la media

Sesin N 15
DISTRIBUCIN MUESTRAL DE UNA PROPORCIN
15.1. Distribucin muestral de una proporcin
15.2. Distribucin muestral de la diferencia de dos medias

EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN
REFERENCIAS BIBLIOGRFICAS
APNDICES
Apndice N 1 Nmeros aleatorios
Apndice N 2 Tabla de la distribucin acumulada binomial
Apndice N 3 Distribucin de poisson - trminos acumulativos
Apndice N 4 Distribucin acumulativa normal

Mg. Mara Vallejos Atalaya


15

















SUMILLA


La asignatura de Estadstica General tiene la naturaleza terico- prctico, pertenece al rea de
Formacin Bsica, con cuatro horas, tres crditos, corresponde al I ciclo de las Carreras Acadmico
Profesional de Administracin y Contabilidad. Pretende proporcionar los conocimientos necesarios de
la estadstica, que le permitir investigar, analizar y resolver problemas con el quehacer de su carrera
profesional, cuyo contenido son: conceptos fundamentales y la organizacin de la informacin, medidas
de resumen: anlisis e interpretacin de los resultados, nociones de probabilidad, distribuciones de
probabilidad y distribuciones muestrales.





























Mg. Mara Vallejos Atalaya


16














UNIDAD I:
TEORA ESTADSTICA

Sesin N1:
Conceptos fundamentales y organizacin de la informacin
Sesin N2:
Etapas del Mtodo Estadstico
Sesin N3:
Organizacin de la informacin: tablas y grficos estadsticos
Sesin N4:
Representacin de la Organizacin






















Mg. Mara Vallejos Atalaya


17




















CONCEPTUAL PROCEDIMENTAL ACTITUDINAL

Reconoce los diferentes
conceptos
fundamentales y
construye tablas y
grficos de informacin
estadstica.


Reconocen y delimitan
la poblacin, muestra y
variables en estudio, y
adems utilizan tablas y
grficos adecuados.


Analizan e interpretan los
resultados obtenidos en
las tablas y grficos
estadsticos.




















COMPETENCIAS
Mg. Mara Vallejos Atalaya


16


Sesin N 1


CONCEPTOS FUNDAMENTALES Y
ORGANIZACIN DE LA INFORMACIN


1.1 GENERALIDADES

1.1.1 Definicin de estadstica

La estadstica es una ciencia que nos proporciona un conjunto de mtodos y tcnicas para la
recoleccin, clasificacin, presentacin, anlisis e interpretacin de los datos, con la finalidad de
realizar una toma de decisin ms efectiva.

1.1.2. Ramas de la estadstica

Estadstica descriptiva
Consiste en recolectar, clasificar, presentar y describir los datos vlidos nicamente para la poblacin
objeto de estudio, utilizando tablas, grficos y algunas medidas de resumen. No se efectan inferencias
para un grupo mayor.

Estadstica inferencial
Se emplea para generalizar conclusiones vlidas para una poblacin a partir de datos obtenidos de
una muestra extrada de dicha poblacin.

1.1.3. Poblacin

Es el conjunto de todos los individuos, objetos u observaciones que poseen al menos una caracterstica
comn, que son objetos de estudio. Se representa con la letra N.

La poblacin se define de acuerdo a la caracterstica, unidad estadstica y extensin del problema
objeto de estudio.

Ejemplo:
1. Las edades de los estudiantes de la UPeU.
2. Los errores que presentan las facturas del supermercado La Unin.

Respecto a la caracterstica objeto de estudio se puede distinguir:

a) Poblacin objeto. Considerada como el conjunto de elementos que son objeto de estudio.
Ejemplo.
1. Conjunto de los alumnos de la UPeU.
2. Conjunto de facturas del supermercado La Unin.

b) Poblacin objetivo. Considerada como el conjunto de observaciones, medidas de la
caracterstica que es de inters para el estudio de la poblacin objeto.
Ejemplo.
1. Conjunto de edades.
2. Conjunto de errores.

La poblacin de acuerdo al nmero de elementos que la forman puede ser finita o infinita.
Poblacin finita: Es aquella que tiene un nmero limitado de elementos.

Ejemplo:
Mg. Mara Vallejos Atalaya


17
1. Ventas efectuadas durante un ao en una tienda determinada.

2. Edades de los alumnos de la UPeU.

Poblacin infinita: Es aquella que tiene un nmero indeterminado de elementos. No se refiere a que
no se puede contar, sino que es imposible ubicar a todos los elementos de la poblacin.

Ejemplo:

1. Los sntomas de los enfermos tuberculosos de Lima.

2. Evasin de impuestos de las empresas adscritas al RUC.

1.1.4. Muestra

Es un subconjunto o parte de la poblacin. Se examina una muestra cuando no es posible examinar
una poblacin, ya sea por factores econmicos, disponibilidad de personal o tiempo.
La muestra debe cumplir dos requisitos bsicos: Debe ser representativa y adecuada.

Es representativa cuando contiene todos los sectores o aspectos de la poblacin en la misma
proporcin en que se hallan en la totalidad del universo. La representatividad asegura la calidad de la
muestra.

Es adecuada cuando el tamao de la muestra tiene una magnitud suficiente que permita confiar en la
estabilidad de las caractersticas presentes en la muestra. La adecuacin asegura la confiabilidad de la
muestra.

1.1.5. Unidad estadstica

Es el elemento que pertenece a la poblacin objeto de estudio. Dicho elemento contiene las
caractersticas, atributos que el individuo o fenmeno puede poseer.

Ejemplo:

1. Para un ingeniero que verifica la calidad de productos elaborados por una empresa, la unidad
estadstica son los productos terminados.

2. Para un auditor que verifica los estados financieros de una empresa en el balance general, cuentas
clientes, la unidad estadstica son las facturas por cobrar.

1.1.6. Dato estadstico

Son nmeros o medidas que han sido recopilados como resultado de observaciones que pueden ser
comparados, analizados e interpretados.



Ejemplo:

1. Si la caracterstica de estudio es la variable X: edad de un grupo de 5 estudiantes. El conjunto de
datos estadsticos seran los siguientes:
x
1
= 17, x
2
= 18, x
3
= 21, x
4
= 22, x
5
= 19

2. Si la caracterstica de estudio es la variable X: n de errores ubicados en 5 facturas. El conjunto de
datos estadsticos seran los siguientes:
x
1
= 2, x
2
= 5 , x
3
= 0, x
4
= 4, x
5
= 2

1.1.7. Parmetro

Es una medida de resumen que describe alguna caracterstica de toda la poblacin objeto de estudio.

Para determinar el valor del parmetro se requiere informacin de toda la poblacin.
Mg. Mara Vallejos Atalaya


18

Las ms usadas son:

i) Media poblacional ()
ii) Varianza poblacional (o
2
)
iii) Desviacin estndar poblacional (o)
iv) Proporcin poblacional (P)

1.1.8. Estadstico o estadgrafo

Es una medida de resumen que describe alguna caracterstica de la muestra.

Las ms usadas son:
i) Media Muestral (
x
)
ii) Varianza muestral (s
2
)
iii) Desviacin estndar muestral (s)
iv) Proporcin muestral (p)

1.1.9. Variable estadstica

Es una caracterstica de la poblacin que interesa al investigador y que toma diferentes valores.
Se denota con las letras: X, Y, Z, etc.

Ejemplo:

1. Edad 2. Profesin
3. Ingreso familiar 4. Estado Civil
5. Estatura 6. Nivel socioeconmico

Las variables se pueden clasificar de la siguiente manera:

a. Variables cualitativas

Son aquellas caractersticas que no se expresan cuantitativamente, constituidas por atributos.

Ejemplo:
- Lugar de procedencia (norte, centro sur, oriente)
- Estado civil (soltero, casado, viudo, divorciado, conviviente).
Estas variables a su vez pueden clasificarse segn la escala de medicin en:

i) Variable cualitativa nominal

Es aquella que no lleva ninguna ordenacin en sus posibles modalidades (datos estadsticos).

Ejemplo:
- Estado civil: soltero, casado, viudo divorciado, conviviente (en estas clasificaciones no hay
ordenacin jerrquica, si quisiramos forzar la ordenacin y pondramos al soltero en primer lugar,
quin ira segundo, el casado o el conviviente y luego el viudo o el divorciado).
- Filiacin religiosa: catlico, adventista, mormn,

ii) Variable cualitativa ordinal

Es aquella que busca ordenar sus casos en trminos del grado que posee una determinada
caracterstica.

Ejemplo:
- Nivel socio-econmico: alto, medio, bajo
- Rendimiento: excelente, bueno regular malo, psimo.

b. Variables cuantitativas

Mg. Mara Vallejos Atalaya


19
Es aquella cuyos datos estadsticos son numricos y se obtiene como resultado de mediciones o
conteos.
Ejemplo:
- Sueldos: 800, 1500, 935, 450,
- Notas: 12, 19, 16, 08, 10,

Las variables cuantitativas segn la escala de medicin pueden ser:

i) Variable cuantitativa de intervalo

Es aquella que se presenta en intervalos y no necesariamente empieza del cero racional.

Ejemplo:
- Temperatura corporal: 36, 37, 38 (una persona no puede tener 0 de temperatura, porque estara
muerta).
- Peso: 20kg, 35kg, 58kg.

Todos los signos vitales son variables cuantitativas de intervalo.

ii) Variable cuantitativa de razn

Es aquella que necesariamente empieza del cero racional.

Ejemplo:
- Notas: 0, 1, 2, 3, , 20 (empieza desde cero)
- Edad: 0, 1, 2,

Las variables cuantitativas segn su naturaleza pueden ser:


i) Variable discreta

Son aquellas que toman valores numricos aislados y no pueden tomar ningn valor entre dos
nmeros consecutivos fijados (slo asume nmeros enteros).

Ejemplo:
- N de hijos: 0, 1, 2, 3, (no puede existir 2.5 porque sera ilgico pensar en 2 hijos y medio)
- N de facturas que presentan errores: 0, 1, 2, 3,

ii) Variable continua

Son aquellas que pueden tomar infinitos valores entre dos nmeros, por muy prximos que los fijemos,
es decir, se presentan valores enteros as como decimales.

Ejemplo:
- Peso: 62.55 kg, 72.40 kg, 56.35 kg,...
- Talla: 1.50 mt, 1.65 mt, 1.85 mt,















Mg. Mara Vallejos Atalaya


20




Sesin N 2



ETAPAS DEL MTODO ESTADSTICO


2.1. ETAPAS DEL MTODO ESTADSTICO

De acuerdo con el orden de aplicaciones de la estadstica a un problema determinado, los mtodos
estadsticos se dividen en cuatro etapas:

1. Planificacin del estudio.
2. Recoleccin de la informacin.
3. Presentacin u organizacin de la informacin.
4. Anlisis e interpretacin de los resultados.

2.1.1. Planificacin del estudio

Estudia los detalles concernientes a la recoleccin, clasificacin y anlisis de la informacin. En base a
lo cual se definirn caractersticas de la poblacin o se negarn o confirmarn una hiptesis de trabajo.

En esta etapa se pueden considerar los siguientes aspectos:

- Planteamiento del problema.
- Bsqueda y evaluacin de la informacin existente.
- Formulacin de hiptesis.
- Verificacin de la hiptesis.
- Anlisis y presentacin de los resultados.

2.1.2. Recoleccin de la informacin

Los principales puntos que deben considerarse al recoger la informacin son:

- Los errores que puedan cometerse en la recoleccin de los datos y la manera de controlarlos.
- Las ventajas y limitaciones de los diversos mtodos empleados en la recoleccin de la informacin.
- Las condiciones que deben reunir los individuos que se estudian y los procedimientos ms
convenientes para su eleccin.
- El diseo de los formularios que servirn para registrar la informacin que se recoja.

2.1.2.1. Mtodo de recoleccin de la observacin

a. Directa.- Cuando los datos son recolectados directamente de la fuente de origen. sta puede ser
mediante la observacin o el interrogatorio.

b. Indirecta.- Cuando los datos provienen de datos recogidos por otros individuos en este caso se
habla de fuentes secundarias.

En cuanto al tiempo, la recoleccin de datos puede clasificarse en:

Continuas: Cuando son registradas a medida que ocurren.

Ejemplo:
Mg. Mara Vallejos Atalaya


21
Registro civil de hechos vitales (nacimientos, defunciones y casamientos).

Peridicas: Cuando est hecho en determinados intervalos de tiempo (forma cclica).

Ejemplo:
Censos hechos en el Per cada 10 aos.

Ocasionales: Cuando se efecta en cualquier poca.

Ejemplo:
Estudios de investigacin realizados por algn investigador.

2.1.2.2. Muestreo
Es la tcnica mediante la cual se obtiene la muestra representativa y adecuada.

VENTAJAS Y LIMITACIONES DEL MUESTREO

a. Permite conocer con relativa aproximacin determinada caracterstica de una poblacin de gran
tamao, dentro de un costo razonable y en menor tiempo.
b. Permite mayor exactitud de los resultados, puesto que los factores artificiales de variacin pueden
controlarse.
c. Cuando la poblacin es infinita o muy grande, entonces, el estudio slo podr realizarse a travs de
una muestra.
d. Cuando se trata de ensayos destructivos o no recuperables, necesariamente se tendr que utilizar
una muestra.
e. Una limitacin de la muestra, es que, por buena que pueda ser la muestra y los cuidados puestos
en ella, siempre existe el sesgo debido a factores aleatorios. Dicho riesgo debe ser establecido a
priori por el investigador de modo que se tenga suficiente garanta de la muestra seleccionada.

2.1.2.3. Determinacin del tamao de muestra

Se determina el tamao de muestra utilizando la frmula siguiente, para una muestra sacada de una
poblacin finita cuya fuente es Arkin y Colton.

( )
2
1 1
N
n
N k
=
+

NOTAS

Donde:

n = tamao de la muestra (nmero de elementos de la muestra)
N = tamao de la poblacin (nmero de elementos de la poblacin)
k = error de muestreo.

Ejemplo:

Seleccionar el tamao de la muestra para la poblacin que est constituida por 1500 estudiantes de la
UPeU, utilizando un error de muestreo del 25% y 5%.

Solucin:

si: k = 25%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =
25/100 = 0.25



( )( )
2
1500
15.84 16
1500 1 0.25 1
n alumnos = = =
+

Mg. Mara Vallejos Atalaya


22


si: k = 5%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =
5/100 = 0.05.


( )( )
2
1500
315.96 316
1500 1 0.05 1
n alumnos = = =
+



2.1.3. Presentacin u organizacin de la informacin

Se consideran los tres pasos siguientes:

1. Revisin y correccin de la informacin recogida.
2. Presentacin de la informacin mediante cuadros.
3. Presentacin de la informacin mediante grficos.

2.1.3.1. Revisin y correccin de la informacin recogida

Se debe revisar y corregir:

a) La escritura.
b) Las respuestas inconsistentes.
c) Las respuestas incompletas.
d) Las unidades en las cifras son diferentes.

2.1.3.2. Presentacin de la informacin mediante cuadros

Despus de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a
algn sistema de ordenacin, a fin de describirlos y analizarlos.

2.1.3.3. Presentacin de la informacin mediante grficos

Los grficos ms usados son:

a. Histograma de frecuencias
b. Polgono de frecuencias
c. Polgono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo

2.1.4. Anlisis e interpretacin de los resultados

Para el anlisis e interpretacin de los resultados nos basamos en los cuadros y grficos, y en las
medidas de resumen de la serie de datos.



EJERCICIOS PROPUESTOS


1. Indique cules de los trminos u operaciones siguientes se relacionan con una muestra o con una
poblacin:

a) grupo de medidas llamados parmetros
b) uso de inferencia estadstica
c) hacer un censo
d) juzgar la calidad de un embarque de fruta inspeccionando varios de los bultos incluidos en el
Mg. Mara Vallejos Atalaya


23
embarque.

2. En los siguientes enunciados, indicar si se trata de una Muestra (M) o una Poblacin (P):

a) Nmero de estudiantes egresados del Instituto YI en el ao 2004
b) Estudio de personas con proceso judicial por trfico de drogas en el ao 2000
c) Nmeros de nios nacidos vivos en el hospital X
d) Estudio del 25% de pacientes con tuberculosis del distrito DF


3. Elabore una lista de 10 variables. Luego:

a. Identifique la poblacin objeto.
b. Identifique la poblacin objetivo.
c. Determine la unidad estadstica.
d. Mencione algunos datos estadsticos.


4. Clasificar las siguientes variables en cualitativas (nominal y ordinal) y cuantitativas (discreta y
continua).

a. rendimiento acadmico
b. velocidad de lectura
c. peso contenido en un paquete de cereales
d. categora de docente
e. nmero de artculos defectuosos producidos
f. nmero de unidades de un artculo en existencia
g. grado de desnutricin
h. asistencia a los cultos devocionales
i. patrn conductual
j. cultura organizacional
k. tipo de alimentacin
l. nmero de hermanos
m. grado de instruccin
n. estado civil.

5. Clasifique las variables e indique el tipo de escala en que estn medidas las siguientes
caractersticas:

a) Profesin
b) Ao de nacimiento
c) Nacionalidad
d) Grado de instruccin
e) ingreso mensual familiar promedio
f) Nmero de telfono
g) Grado de instruccin
h) Nmero de hijos

6. Utilizando la frmula determine el tamao de la muestra, considerando los datos que se mencionan
a continuacin.

a). N = 1 500 k = 3%
b) N = 2 000 k = 10%
c) N = 5 000 k = 2%
d) N = 500 k = 10%
e) N = 1 000 k = 5%

7. En el siguiente enunciado identifique: poblacin, muestra, unidad estadstica, parmetro,
estadstico, variable(s), tipo de variable(s) y d 2 ejemplos de dato estadstico.

Con la finalidad de mejorar el servicio de la Biblioteca de la UPeU" se decidi realizar un estudio
de investigacin, para lo cual se seleccion aleatoriamente a 45 estudiantes usuarios de la
biblioteca obtenindose los siguientes resultados:

- En promedio un alumno dedica 1 hora a la lectura en sala.
Mg. Mara Vallejos Atalaya


24
- El 80% afirma que la atencin es buena.
- El 10% de los usuarios son recin ingresantes a la UPeU.
- En promedio un alumno se lleva 1.5 libros a su casa.

8. Identifique en cada caso: unidad elemental, variable, tipo de variable

a) consumo mensual de electricidad
b) opinin acerca de la gestin de un ministro
c) peso de nios de 5 aos
d) estado civil
e) nmero de artculos defectuosos producidos por las mquinas de una fbrica
f) nacionalidad de personas que asisten a un congreso.






Mg. Mara Vallejos Atalaya


28

Autoevaluacin


CONCEPTUAL

1. Seale con una V si es verdadero o F si es falso en los siguientes enunciados:

a) ( ) Una muestra es representativa si sta contiene todas las
caractersticas de la muestra.
b) ( ) La variable es una caracterstica que asume diferentes valores.
c) ( ) Para que una poblacin est bien definida, debe contener la
caracterstica, unidad estadstica y extensin.
d) ( ) Las ramas de la estadstica son: estadstica descriptiva e inferencial.
e) ( ) Las variables cualitativas son aquellas que son numricas y se
obtiene como resultado del conteo

PROCEDIMENTAL

2. Los mtodos de recoleccin de la informacin son: directa e indirecta. Cul
es la diferencia entre ambas?

3. Dadas las siguientes variables, colocar en la tabla en el lugar donde le
corresponde de acuerdo a su naturaleza y escala de medicin.

a. Estudios diarios e. Grado de instruccin
b. Lugar de procedencia f. Sueldos
c. Velocidad de lectura g. Gastos
d. Idiomas h. Rendimiento
i. Estado civil j. Edad
k. Estatura l. Categora de docente

Variable cualitativa Variable cuantitativa
Nominal Ordinal Discreta Continua




4. Utilizando la frmula determine el tamao de la muestra, considerando los
datos que se mencionan a continuacin.

a) N = 500 k = 10% b) N = 1 000 k = 5%
c) N = 1 500 k = 3% d) N = 2 000 k = 10%

ACTITUDINAL

5. Considerando los conocimientos adquiridos en esta tutora identificar las
clases de variables estadstica, su naturaleza, y de esta manera poder realizar
un estudio estadstico.

Mg. Mara Vallejos Atalaya


29


Sesin N 3



ORGANIZACIN DE LA INFORMACIN:
TABLAS Y GRFICOS ESTADSTICOS



3.1. TABLAS DE FRECUENCIAS O DISTRIBUCIN DE FRECUENCIAS

Una distribucin de frecuencias (o tabla de distribucin de frecuencias) es una representacin de una
serie de datos. En ella se muestra cmo se distribuyen los valores de la variable estadstica junto a sus
frecuencias correspondientes a cada uno de ellos.

En estas tablas de distribucin de frecuencias, como producto de la operacin de tabulacin (conteo),
se observa cuantos elementos (frecuencia o repeticin) hay en cada categora, valor o intervalo de la
variable.

Luego de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a
algn sistema de ordenacin, a fin de describirlos y analizarlos. A continuacin se presenta algunos
conceptos y procedimientos comunes para la presentacin de cuadros o tablas.

Frecuencia absoluta simple (
i
f ): Se llama al nmero de veces que aparece repetido dicho valor, en
un conjunto de valores realizadas. La suma de todas las frecuencias es igual al total n de datos
observados.

Se denota mediante:
i
f
Propiedad: n f f f f
m
i
i m
= = + + +

=1
2 1
...

Frecuencia absoluta acumulada (F
i
): Es igual a la suma de las frecuencias absolutas simples
inferiores o iguales a las frecuencias acumuladas que se desea encontrar.

Se denota mediante:
i
F

Propiedad:

q
f F =
1


2 1 2
f f F + =
.
.
.

m m
f f f F + + + = ...
2 1


Frecuencia relativa simple (
i
h ): Es el cociente entre la frecuencia absoluta simple de su fila y el
nmero total de observaciones realizadas (n). La suma de todas las frecuencias relativas es igual a 1.
Su frmula es:
n
f
h
i
i
=

Se denota mediante:
i
h
Mg. Mara Vallejos Atalaya


30
Propiedad: 1 ...
1
2 1
= = + + +

=
m
i
i m
h h h h

Frecuencia relativa acumulada (
i
H ): Se llama al cociente entre la frecuencia absoluta acumulada de
su fila y el nmero de observaciones realizadas (n).
Su frmula es:
n
F
H
i
i
=
Se denota mediante:
i
H

Propiedad:

q
h H =
1


2 1 2
h h H + =
.
.
.

m m
h h f H + + + = ...
2 1


Para presentacin de la informacin mediante cuadros o tablas, es necesario construir la tabla de
distribucin de frecuencias. La cual puede ser:

3.1.1. Distribucin de frecuencias de una variable discreta

Una distribucin de frecuencias es un arreglo de los valores observados x
1
,...x
m
de una variable X con
sus respectivas frecuencias, en una tabla de la forma:

Valores
de X
f
i
F
i
h
i
H
i

x
1
x
2
.
.
.
x
k

f
1
f
2
.
.
.
F
m

F
1
F
2
.
.
.
F
m
= n
h
1
h
2
.
.
.
H
m

H
1
H
2
.
.
.
H
m
= 1
Total Ef
i
=n Eh
i
=1


Ejemplo:

Dadas las edades de 12 estudiantes de la UPeU, construir la tabla de distribucin de frecuencias.

EDAD (X): 19, 20, 23, 20, 18, 20, 25, 18, 18, 20, 25, 23.

Solucin

EDAD f
i
F
i
h
i
H
i

18
19
20
23
25
3
1
4
2
2
3
4
8
10
12
0.25
0.08
0.33
0.17
0.17
0.25
0.33
0.66
0.83
1.00
Total 12 1.00

La suma de las frecuencias relativas simples (h
i
) siempre debe ser igual a uno, en caso de error de
redondeo no diera 1, hay que ajustar, es decir, hay que sumar o restar 1 dgito a cualquier nmero para
conseguir la suma de 1.

f
3
: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 4.
Mg. Mara Vallejos Atalaya


31

F
4
: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 10.

h
3
: Indica la fecuencia relativa absoluta simple de la tercera fila y corresponde al nmero 0.33. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza
multiplicando el nmero por 100, as 0.33x100 = 33%.

H
4
: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.83. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando el nmero por 100, as 0.83x100 = 83%

Interpretacin:

f
3
: Existen 4 alumnos que tienen 20 aos de edad.

F
4
: Existen 10 alumnos cuyas edades varan de 18 a 23 aos.

h
3
: El 33% de los alumnos que tienen 20 aos de edad.

H
4
: El 83% de los alumnos tienen edades que varan de 18 a 23 aos.

Las frecuencias absolutas interpretan la variable en su fila, en cambio las frecuencias acumuladas
interpretan desde el principio hasta su fila.

Observacin:

Cuando se realiza una observacin en una muestra o en una poblacin, se puede presentar los
siguientes casos:

- Que se hayan hecho pocas observaciones y por lo tanto, la variable estadstica tome pocos
valores.
- Que se hayan hecho muchas observaciones y sin embargo, la variable estadstica toma muy pocos
valores diferentes.
- Que se hayan hecho muchas observaciones y la variable toma muchos valores distintos.

(*) Los dos primeros casos caern dentro del estudio de variable discreta.
(*) El tercer caso se agrupar los valores de la variable en intervalos adecuadamente para no perder
mucha informacin.

2.1.2. Distribucin de frecuencias para datos agrupados

Es una tabla en donde los datos originales se clasifican en intervalos de clase.

Para la elaboracin de esta tabla se debe tener en cuenta las definiciones siguientes:
- Intervalos o lmites de clase: se identifica por tener su lmite superior y su lmite inferior. Los
extremos de los intervalos no se repiten.

Ejemplo:
15-19 LCI=15 y LCS=19
20-24
25-29

- Amplitud intervlica (c): Llamado tambin ancha de clase, es la cantidad de datos que estn
comprendidos en un intervalo de clase.


- Marca de clase (X
i
): Es el punto medio del intervalo de clase:

2
i
LCI LCS
X
+
=

Mg. Mara Vallejos Atalaya


32
Ejemplo:
La marca de clase para el primer intervalo ser:

( ) 15 19
17
2
i
X
+
= =

REGLA GENERAL PARA LA CONSTRUCCIN DE UNA DISTRIBUCIN DE FRECUENCIAS DE
UNA VARIABLE CONTINUA AGRUPADA EN INTERVALOS

Dado n valores de una variable cuantitativa X continua, o discreta con ms de 20 valores
distintos, uno de los mtodos para construir la distribucin de frecuencias es:

1) Determinar el Rango:
R


El rango de variacin de los datos se define por:
mn mx
X X R =


2) Determinar el Nmero de intervalos: k

Utilizando la regla de Sturges:
1 3.322log( ) k n = +

n: Nmero total de datos.

Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor.

Ejemplo:
Si 6.32 k = entonces, 7 k = (Nmero de intervalos igual a 7).
Si 6.84 k = entonces, 7 k = (Nmero de intervalos igual a 7).

3) Determinar la Amplitud del intervalo: c

La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.
R
c
k
=

4) Determinar los extremos de los intervalos

Ejemplo:
Los siguientes datos son puntajes del cociente de inteligencia (CI) de 50 alumnos de la UPeU. Con
base en estos puntajes, preparar la tabla de distribucin de frecuencias.

PUNTAJES DEL COCIENTE DE INTELIGENCIA (CI)
DE 50 ESTUDIANTES DE LA UPeU

91 104 113 125 101
114 105 101 89 126
118 100 111 125 109
119 95 106 120 129
89 113 118 127 129
128 107 89 122 89
114 106 105 115 98
112 103 92 125 107
97 104 105 95 91
106 93 89 100 115

Mg. Mara Vallejos Atalaya


33
1) Determinar el Rango:
R


El rango de variacin de los datos se define por:
mn mx
X X R =


2) Determinar el Nmero de intervalos: k

Utilizando la regla de Sturges:

1 3.322log( ) k n = +

n: Nmero total de datos.

Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor.

Ejemplo:
Si 6.32 k = entonces, 7 k = (Nmero de intervalos igual a 7).
Si 6.84 k = entonces, 7 k = (Nmero de intervalos igual a 7).

3) Determinar la Amplitud del intervalo: c

La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.
R
c
k
=

4) Determinar los extremos de los intervalos


Tabla N 1

DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU

Lmite de
clase
Yi f
i
F
i
h
i
H
i

88 94
94 100
100 106
106 112
112 118
118 124
124 130
91
97
103
109
115
121
127
9
6
11
5
8
3
8
9
15
26
31
39
42
50
0.18
0.12
0.22
0.1
0.16
0.06
0.16
0.18
0.3
0.52
0.62
0.78
0.84
1.00
50 1.00

f
3
: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 11.

F
4
: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 31.

h
3
: Indica la relativa absoluta simple de la tercera fila y corresponde al nmero 0.22. Para interpretar se
debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando
al nmero por 100, as 0.22x100 = 22% .

H
4
: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.62. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando al nmero por 100, as 0.62x100 = 62%

Interpretacin:

f
3
: Existen 11 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que
vara de 100 a 106 puntos.

Mg. Mara Vallejos Atalaya


34
F
4
: Existen 31 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que
vara de 106 a 112 puntos

h
3
: El 20% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de
100 a 106 puntos

H
4
: El 62% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de
106 a 112 puntos

Las frecuencias relativas interpretan la variable en su fila, en cambio, las frecuencias acumuladas
interpretan la variable desde el principio hasta su fila.

CUIDADOS EN LA PRESENTACIN DE CUADROS ESTADSTICOS

A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin
de informacin estadstica mediante cuadros.

1. N de cuadro
2. Ttulo: Debe responder las siguientes preguntas:
a. Qu informacin contiene el cuerpo del cuadro?

Ej. Cociente de inteligencia de 50 alumnos

b. Dnde fue tomada la informacin?
Ej. ...en la UPeU Lima

c. Cundo fue tomada la informacin?
Ej. ...Enero, 1995

3. Los encabezados: Corresponde a la identificacin de la variable y las frecuencias.

4. Columna matriz: corresponde a las categoras de clasificacin de la variable.

5. Cuerpo del cuadro: Corresponde a la informacin numrica, generalmente frecuencias absolutas y
relativas.

6. Fuente: Sealar el medio de informacin que condujo al conjunto de datos.
Ej. Test aplicado por los investigadores

7. Notas: son colocadas para esclarecimiento.

8. Comentarios: sirve para aclarar minucias en relacin a cada celda.

Para nuestro ejemplo visto anteriormente el cuadro ser:


CUADRO N 1

COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA, 2004

COCIENTE DE
INTELIGENCIA
N DE
ALUMNOS
%
88 94
94 100
100 106
106 112
112 118
118 124
124 130
9
6
11
5
8
3
8
18
12
22
10
16
6
16
TOTAL 50 100
Fuente: Test aplicado por los investigadores.
Mg. Mara Vallejos Atalaya


35
Sesin N 4



REPRESENTACIN DE LA INFORMACIN

4.1. PRESENTACIN DE LA INFORMACIN MEDIANTE GRFICOS

Los grficos ms usados son:

a. Histograma de frecuencias
b. Polgono de frecuencias
c. Polgono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo


a. Histograma de frecuencias

Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos de clase,
mediante una serie de intervalos continuos.

Se usa:

Cuando se tiene una variable cuantitativa continua

Se construye:

1. Se coloca los intervalo de clase en el eje horizontal (eje de las abscisas o eje x).

2. Se levanta cada intervalo a la altura de la frecuencia absoluta simple o relativa simple.

Ejemplo:
Considere el ejemplo de tabla de distribucin de frecuencia para datos agrupados del Puntajes del
Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.





















Mg. Mara Vallejos Atalaya


36
b. Polgono de frecuencias

Se usa:

Cuando se tiene una variable cuantitativa continua y econmica.

Se construye:

1. Se ubica en el eje x la marca de clase y se considera el punto medio,

2. Se levanta el punto de la marca de clase a la altura de la frecuencia absoluta simple o relativa
simple,

3. Luego de marcar los puntos, unirlos,

4. Finalmente, unir los extremos al eje de las abscisas.


Ejemplo:
Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual
estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
















c. Polgono de frecuencias acumuladas u ojivas

Se usa:

Cuando la frecuencia acumulada es de inters.

Se construye:

1. Se ubica en el eje x la marca de clase.

2. Se levanta el punto del extremo superior de cada lmite de intervalo de clase a la altura de la
frecuencia absoluta acumulada o relativa acumulada.

3. Luego de marcar los puntos, unirlos

4. Finalmente, unir los extremos al eje de las abscisas.


Ejemplo:
Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual
estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU

10
9
8
7
6
5
4
3
2
1

91 97 103 109 115 121 127

9
6
11
5
8
3
8
f
i

x
Mg. Mara Vallejos Atalaya


37
















d. Barras

Se representa mediante una serie de rectngulos separados

Se usa:
Para representar variables cualitativas.

Se construye:
1. Se ubica en el eje x las categoras de la variable, utilizando intervalos y separando
aproximadamente la mitad del intervalo entre una categora y otra.

2. Se levanta cada intervalo de la categora que corresponde a la variable, a la altura de la frecuencia
absoluta simple o relativa,

Ejemplo:

Facultad N de alumnos
1. Ciencias Contables y Administrativas
2. Teologa
3. Ciencias de la Salud
4. Educacin y Ciencias Humanas
5. Ingeniera
500
200
250
250
300
Total 1500













e. Bastones

Tiene la forma de alfileres.

Se usa:
50
45
40
35
30
25
20
15
10
5

88 94 100 106 112 118 124 130
9
15
26
31
39
42
50
f
i

x
50
0
45
0
40
0
35
0
30
0 25
0
20
0
15
0
10
0
50
1 2 3 4 5
50
0
20
0
25
0
30
0
f
i

x
25
0
Mg. Mara Vallejos Atalaya


38
Para representar una variable cuantitativa discreta.

Se construye:
1. Se ubica en el eje x los valores de la variable, separando equitativamente entre uno y otro valor,

2. Se levanta utilizando una lnea recta para cada valor de la variable, a la altura de la frecuencia
absoluta simple o relativa y se termina con un punto, en forma de alfiler.

Ejemplo:

No de Hijos (x
i
) 0 1 2 3 4 5
N de familias (f
i
) 3 7 12 20 15 5
NOTAS














f. Sectores

Se representa mediante un crculo particionado.

Se usa:
Para representar una variable cualitativa cuyo principal inters es conocer su frecuencia relativa.

Se construye:
1. Se particiona a una circunferencia equitativamente, considerando que sta constituye el 100%,

2. Se efecta la particin, segn la frecuencia relativa simple lo considere y se ubican las categoras
de la variable en cada particin.

Ejemplo:



















Rubro h
i
%
Diezmo
Vivienda
Alimentacin
Vestido
Educacin
Recreacin
Otros
10
20
30
10
20
5
5
Total 100
20
15
10
5
1 2 3 4 5
7
12
20
5
f
i

x
15
3
ALIMENTA
CIN
30%
EDUCACI
N
20%
RECREAC.
5%
DIEZMO
10%
VESTIDO
10%
OTROS
5%
VIVIENDA
20%
Mg. Mara Vallejos Atalaya


39

g. Series de tiempo

Son curvas idnticas al del polgono de frecuencias pero sus extremos no tocan el eje de las abscisas.

Se usa:
Cuando la variable de inters es el tiempo.

Ejemplo:

N DE ALUMNOS INGRESANTES A LA UPeU DE TRES
COLEGIOS DIFERENTES 1991-1995

AOS N DE ALUMNOS INGRESANTES
COLEGIO 1 COLEGIO 2 COLEGIO 3
1991
1992
1993
1994
1995
10
15
20
25
35
20
25
20
25
25
15
20
25
20
25

















CUIDADOS EN LA PRESENTACIN DE GRFICOS ESTADSTICOS

A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin
de informacin estadstica mediante grficos.

1. N de grfico
2. Ttulo: Debe responder las siguientes preguntas:

a. Qu informacin contiene el cuerpo del cuadro?
Ej. Cociente de inteligencia de 50 alumnos

b. Dnde fue tomada la informacin?
Ej. ...en la UPeU Lima

c. Cundo fue tomada la informacin?
Ej. ...Setiembre, 1994

3. Representacin grfica (sealar escalas).
4. Leyenda (si fuere necesario).
5. Fuente.
6. Nota (en caso de ser necesario).


0
5
10
15
20
25
30
35
40
1991 1992 1993 1994 1995
COLEGIO 1
COLEGIO 2
COLEGIO 3
X
AOS
f
i

Mg. Mara Vallejos Atalaya


40
Ejemplo:

La representacin grfica para el ejemplo de datos agrupados de los datos del Puntajes del Cociente
de Inteligencia (CI) de 50 Estudiantes de la UPeU.

GRFICO N 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA,
2001














Fuente: Test aplicado por los investigadores.



EJERCICIOS PROPUESTOS

1. En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por sus
colores: Amarillo (A), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas:

B, R, R, B, R, A, A, B, B, A
B, A, A, R, B, A, B, R, B, A

a) Construir la distribucin de frecuencias
b) Graficar la distribucin

2. La tabla muestra la distribucin del ingreso familiar correspondiente a 80 familias:

Ingresos fi Fi hi
|160 170 )
|170 180 )
|180 190 )
|190 200 )
|200 210 )


48 60

0,125

0,075


a) Determinar el nmero de familias que ganan menos de 200 nuevos soles

3. Para cada uno de los siguientes ejercicios construir:

a) La tabla de distribucin de frecuencias
b) El grfico adecuado
c) Interpretacin

3.1. Los siguientes datos proporcionan las remuneraciones de 50 obreros.

730 470 672 820 670 610 800 670
600 700 650 700 570 850 590 700
Mg. Mara Vallejos Atalaya


41
570 730 770 580 609 700 574 578
730 663 569 720 860 766 456 258
378 930 848 860 748 777 640 560
730 640 708 461 685 630 720 840
650 740

3.2. Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en
cm)

151 152 154 155 159 159 160 161
161 161 161 162 163 163 164 165
166 165 166 166 166 166 166 167
167 167 167 168 168 168 168 168
168 168 168 168 168 169 169 169
169 169 169 169 169 170 170 170
170 170 170 170 171 171 171 172
172 172 173 173 173 173 174 174
174 175 175 175 176 176 176 176
176 177 177 177 177 178 178 178
179 179 180 180 180 181 181 181
181 182 182 182 183 184 185 186
187 188 189 190


3.3 El gerente de una compaa registra el nmero de cierto trabajo, completados por los
empleados. Cincuenta empleados realizan el mismo trabajo, divididos en dos grupos de 25
y en salones diferentes.

En el saln A, el gerente registra el siguiente nmero de unidades completadas por da:
21 22 20 15 25 30 28
29 28 30 24 29 27 34
38 24 35 36 31 41 32
43 44 53 50

En el saln B los datos son los siguientes:
16 21 13 36 18 24 32
16 18 20 28 25 33 26
30 26 20 35 45 59 32
31 30 40 30

a) Combinar todos los puntajes y obtener la distribucin de frecuencias con tamao de clase
k=10.
b) Obtener la distribucin de frecuencias por cada saln y realice la grfica adecuada.

4. Se tiene la siguiente tabla de frecuencias relativas de 300 empleados segn su edad.
EDADES h
i

19-21
22-24
25-27
28-30
31-33
0.15
0.25
0.40
0.10
0.10

a) Cuntos empleados tienen edades entre 22 y 30 aos?
b) Qu porcentaje de empleados tienen 25 aos o ms?
c) Qu porcentaje de empleados tienen 24 aos o menos?
d) Una empresa que se dedica a preparar dietas, proyecta lanzar al mercado una dieta rigurosa.
Los empleados de una compaa se presentaron como voluntarios para dicha promocin. Se
realiz un muestreo con 80 empleados elegidos aleatoriamente. Los resultados del chequeo
de los pesos (en Kg), fueron los siguientes:

80.6 65.8 49.6 79.1 84.4 66.2 79.3 59.4 72.9 73.6
53.2 60.2 91.2 74.8 78.6 81.4 58.6 68.2 67.4 55.6
76.9 77.4 67.9 63.7 49.9 46.4 68.8 67.3 72.3 75.8
Mg. Mara Vallejos Atalaya


42
88.3 94.6 57.3 87.3 74.3 73.2 90.4 76.3 52.7 71.7
75.6 41.8 73.6 71.4 83.2 67.4 99.3 62.3 89.2 86.8
65.2 62.1 44.8 82.9 81.7 70.4 74.6 76.9 85.7 40.9
54.2 75.3 50.1 61.1 42.3 68.6 56.2 70.8 47.3 66.9
80.2 60.2 71.6 77.1 94.9 61.4 82.1 78.3 51.2 79.3

a) Elaborar la distribucin de frecuencias
b) Cuntos empleados tienen pesos entre 45 y 60 kg?
c) Qu porcentaje de empleados tienen pesos mayores que 75.5 Kg?
Mg. Mara Vallejos Atalaya


42

Autoevaluacin



CONCEPTUAL

1. Seale con una V si es verdadero o F si es falso en los siguientes enunciados:

a) ( ) Una tabla estadstica representa a la informacin en forma organizada.
b) ( ) La marca de clase es el punto medio de los intervalos de clases.
c) ( ) F
3
indica la frecuencia acumulada relativa simple de la tercera fila.
d) ( ) La suma de las frecuencias relativas simples debe ser igual a uno.
e) ( ) El histograma de frecuencia se utiliza para una distribucin de frecuencias
agrupadas en intervalos de clase.

PROCEDIMENTAL

2. A continuacin se presentan las notas de 50 alumnos:

60
65
71
47
80
53
41
39
94
94
85
74
35
54
61
77
55
60
98
88
33
57
81
68
41
45
78
76
66
89
52
50
91
48
66
65
35
55
69
73
77
64
73
85
42
84
74
59
67
65

Se pide:

a) Determinar el rango.
b) Nmero de clases o filas.
c) Amplitud de las clases o filas.
d) Frecuencias absolutas y relativas simples, absolutas y relativas acumuladas.
Interpretar por lo menos 2 de cada fila.

3. Al investigar el nivel socioeconmico en los valores: Bajo (B), medio (M), alto (A), 20
familias dieron las siguientes respuestas:

M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B

Construir la distribucin de frecuencia y trazar su grfica.

4. Dibujar un diagrama de sectores para mostrar los gastos de un hospital de una gran
ciudad, siendo stos los siguientes: 73% en sueldos, honorarios profesionales
mdicos y bonificaciones a los empleados; 13% en suministros, equipo mdico y
quirrgico; 8% en mantenimiento, alimentacin y energa; y 6% en costos
administrativos.

ACTITUDINAL

5. Considerando los conocimientos adquiridos en la primera unidad, qu aconsejaras
a un empresario que necesita tomar decisiones acertadas para el buen
funcionamiento de su negocio?

Mg. Mara Vallejos Atalaya


43











UNIDAD II:
MEDIDAS ESTADSTICAS

Sesin N5:
Medidas de resumen
Sesin N6:
Medidas de posicin
Sesin N7:
Medidas de dispersin
Sesin N8:
Medidas de forma

























Mg. Mara Vallejos Atalaya


44


















CONCEPTUAL PROCEDIMENTAL ACTITUDINAL

Reconoce los conceptos
de las medidas de
resumen, como las de
tendencia central, de
posicin, de dispersin y
de forma, de una serie
de datos.


Calcular las diversas
medidas de resumen
para una serie de datos.


Identifican y reconocen
qu medidas de resumen
son adecuadas para el
anlisis de una serie de
datos.









COMPETENCIAS
Mg. Mara Vallejos Atalaya


67

Sesin N 5



MEDIDAS DE RESUMEN



5.1. Anlisis e interpretacin de los resultados

Se estudi los cuadros y grficos estadsticos en la unidad anterior como formas para ordenar y
describir un conjunto de datos para tomar decisiones. Sin embargo, el anlisis resulta incompleto, para
esto se utiliza ciertos indicadores.

Estos indicadores llamados medidas de resumen o ESTADGRAFOS permiten hallar un solo valor
numrico, el mismo que representa a toda la poblacin o muestra en estudio.

Los estadgrafos o medidas de resumen ms importante son:

De tendencia central: media, mediana y la moda.
De posicin: cuartiles, deciles y percentiles.
De dispersin: varianza, desviacin estndar, y coeficiente de variacin.
De forma: asimetra y el coeficiente de kurtosis.


5.2. MEDIDAS DE TENDENCIA CENTRAL

Son estadsticos que permiten hallar el valor numrico que indica el "centro" de un conjunto de datos;
sealando la caracterstica que destaca en la informacin.

5.2.1. La media o promedio aritmtico ( x )

Es la ms estable y se obtiene de acuerdo a lo siguiente:

a) Media aritmtica para datos simples (en serie):

Proceso: Sumar todos los valores de la variable y dividir entre el nmero de datos que se han sumado.


_
x
n
x
=



b) Media aritmtica para datos agrupados (en tablas):

Proceso: Sumar todos los valores de la variable o marca de clase multiplicados por la frecuencia
absoluta simple y dividir entre el nmero de datos o la suma de las frecuencias absolutas simples.

x f
x
f
=



Ventajas de la media aritmtica:

- Es til cuando los datos estn distribuidos en forma normal o simtrica.
- Es de gran estabilidad porque toma en cuenta todos los datos.
- Nos permite probar parmetros en inferencia estadstica.

Desventajas de la media aritmtica:

Mg. Mara Vallejos Atalaya


68
- Puede ser afectado por valores extremos.
- Cuando los datos agrupados tienen clases abiertas en los extremos, no es recomendable calcular
el promedio.

5.2.2. Mediana (Me)

Es el estadstico que representa el punto medio de los datos en el cual cae el 50% de puntuaciones. Se
obtiene de acuerdo a lo siguiente:

a) Mediana para datos simples (en serie):

Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la serie
es par); del conjunto de datos previamente ordenados en forma creciente.

(*) La mediana se utiliza tambin en variables ordinales

Ej: Se tiene la siguiente informacin sobre el nmero de alumnos repitentes por aos de estudios de la
carrera de contabilidad en la UPeU.

AOS f
i

1
F
i

2

Primero
Segundo
Tercero
Cuarto
Quinto
25
14
6
9
2
25
39
45
54
56

Clase
mediana.
Total 56

Proceso:

1. Se calcula la suma de las frecuencias absolutas simples entre 2 as:

2
n
=
56
28
2 2
f
= =



2. El valor inmediatamente superior o igual a 28 se busca en la columna de la tabla que corresponde
a la frecuencia absoluta acumulada F
i
(en este ejemplo corresponde a 39, porque 25 es menor
que 28).

3. Luego se observa la primera columna donde se encuentra la variable, en la fila donde se observ el
nmero 39, el valor de la variable que se encuentra en esa fila corresponde a la mediana.
Me = Segundo.

Interpretacin: La mitad de los estudiantes repitentes lo hacen como mximo hasta segundo ao,
aproximadamente la otra mitad repiten categoras superiores al segundo ao.


b) Mediana para datos agrupados:

Cuando los datos se encuentran agrupados en una tabla de distribucin de frecuencias, la mediana se
encuentra utilizando la siguiente frmula:

1
inf
2
i
i
n
F
Me L c
f

| |

|
\ .
= +

Donde

1
f
i
: frecuencia absoluta simple
2
F
i
: frecuencia absoluta acumulada.
Mg. Mara Vallejos Atalaya


69
inf
L : Lmite inferior del intervalo que contiene a la mediana
c : Amplitud del intervalo
n : Nmero total de datos
1 i
F

: Frecuencia absoluta acumulada anterior a la clase mediana


i
f : Frecuencia (o frecuencia absoluta) de la clase mediana.
Lugar de la Mediana, Me :
2
n
.
Ventajas de la mediana:

- No est afectada por valores extremos, y por lo tanto es ms representativa que el promedio,
cuando las series son poco simtricas.
- Es til cuando los datos agrupados tienen clases abiertas en los extremos (es decir, no tiene lmite
inferior en la primera clase ni lmite superior en la ltima clase).
- Se aplica a variables que pertenecen a la escala ordinal.

5.2.3. La moda (Mo)
Nos indica el valor o cualidad que se repite con mayor frecuencia dentro de una informacin. Se
obtiene de acuerdo a lo siguiente:

a) Moda para datos simples (en serie):

Es el valor que ms se repite en una serie.

(*) Es til cuando la variable en estudio pertenece a la escala nominal.

Ejemplo:
Hallar la moda para la siguiente informacin que consiste en una muestra de 100 consumidores segn
preferencia por tipos de panes Unin.

TIPOS DE
PANES
CONSUMIDORES
(f
i
)
Integral
Americano
Fibra
Hamburguesa
25
20
40
15
Total 100

Clase modal,
por ser el valor ms frecuente (f =40)


Entonces, la moda ser el valor que corresponde a la categora de la variable, en la clase o fila modal.
Mo = Fibra

Interpretacin:
La mayora de los consumidores de Productos Unin prefiere pan fibra.

b) Moda para datos agrupados:

En este caso la moda se halla mediante la frmula:


|
|
.
|

\
|
A + A
A
+ =
2 1
1
inf
c L Mo
Donde
inf
L : Lmite inferior del intervalo que contiene a la moda
Mg. Mara Vallejos Atalaya


70
c : Amplitud del intervalo
con
1 1 i i
f f

A = ;
2 1 i i
f f
+
A =


Ventajas de la moda:

- No est afectada por valores extremos.
- Puede usarse cuando los datos agrupados tienen clases abiertas en los extremos.
- Se usa para variables que pertenecen a la escala nominal.

Desventajas de la moda:

- No es representativa a menos que la distribucin contenga un gran nmero de datos y exista
significativa repeticin de alguno de ellos.
- Muchas veces la serie no tiene moda porque ningn valor se repite, en ese caso se dice que la
informacin es unimodal.
- Cuando la serie tiene 2 modas, se dice que la informacin es bimodal, y si tiene ms de 2 modas,
la informacin es multimodal. En estos casos se hace difcil su interpretacin y comparacin, por lo
tanto, no se considera una medida representativa

Ejemplo:
Correspondiente a datos simple (informacin en serie):

Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:

Edad :
X
i
: 18, 20, 23, 17, 18, 19, 23, 18

Calcular la media, mediana y moda e interpretar sus resultados.


Solucin:

Media

18 20 23 17 18 19 23 18 156
19.5 20
8 8
x
x
n
+ + + + + + +
= = = = =



Interpretacin

La edad promedio de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
es de 20 aos.

Mediana

Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la
serie es par); del conjunto de datos previamente ordenados en forma creciente.

En este caso la serie es par, por lo tanto, se procede del siguiente modo:

1 Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23

2 Se particiona la serie por la mitad

17, 18, 18, 18, 19, 20, 23, 23


Mg. Mara Vallejos Atalaya


71
3 la mediana ser la semisuma de los dos valores centrales, por ser la serie par, es decir 8 datos.


18 19
18.5 19
2
Me
+
= = =

Interpretacin:

La mitad de los de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
tiene como mximo 19 aos, aproximadamente la otra mitad tienen ms de 19 aos.

Moda

Es el valor que ms se repite.

As, en nuestra base de datos.

1 Se ordena la serie
17, 18, 18, 18, 19, 20, 23, 23

2 Se toma el valor que ms se repite.

En nuestro ejemplo el 18 se repite 3 veces.

Mo = 18


Interpretacin:

La mayora de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas tiene de
20 aos de edad.

Ejemplo:

Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

Hallaremos la media, mediana y moda para datos agrupados.

Tabla N 1

DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmites de
clases
X
i
f
i
F
i
X
i
f
i
X
i

2
fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
Mo 11
5
8
3
8
9
15
Me 26
31
39
42
50
819
582
1133
545
920
363
1016
74529
56454
116699
59405
105800
43923
129032
Total 50 5378 585842

Solucin:

La columna de las marcas de clase denotada por Xi, se obtiene por la formula dada anteriormente en la
Unidad 1.


Mg. Mara Vallejos Atalaya


72



















La columna de X
i
f
i
: se obtiene multiplicando valor por valor la columna de las marcas de clase
denotada por Xi por las frecuencias absolutas simple denotada por f
i
:

As:
X
1
f
1 =
91 x 9 = 819
X
2
f
2 =
97 x 6 = 582
X
3
f
3 =
103 x 11 = 1133


X
7
f
7 =
127 x 8 = 1016

Observacin: Las sumas de cada columna se encuentran en la fila que corresponde al total (al final de
las columnas).

La clase mediana se ubica con las frecuencias absolutas acumuladas.

La clase modal se ubica con las frecuencias absolutas simples.

Media:
819 582 1133 545 920 363 1016
9 6 11 5 8 3 8
5378
107.56 107
50
i i
i
x f
x
f
+ + + + + +
= =
+ + + + + +
= = =



Interpretacin:

El cociente de inteligencia promedio de los alumnos de la Universidad Peruana Unin es de
aproximadamente 107 puntos.


Mediana:

Proceso:

1. Ubicamos la clase o fila mediana (intervalo que contenga la mediana):

Lugar de Me: n/2= 50/2= 25 (25 avo. lugar)
Analizando, la mediana se encuentra en la 4ta. Clase.

Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 25.
2
LCS LCI
Xi
+
=
127
2
130 124
.
.
103
2
106 100
97
2
100 94
91
2
94 88
7
3
2
1
=
+
=
=
+
=
=
+
=
=
+
=
X
X
X
X
Mg. Mara Vallejos Atalaya


73
En nuestro ejemplo corresponde a la cuarta fila, pues su frecuencia acumulada es F
4
= 31 y es el
inmediatamente superior a 25.

La cuarta fila es la clase mediana y de all se considera los datos que van a ser reemplazados en la
frmula.

2. Utilizando la frmula:
1
inf
2
i
i
n
F
Me L c
f

| |

|
\ .
= +

L
inf
: Lmite inferior del intervalo de la clase mediana = 100

n : Nmero total de datos = 50

F
i-1
: Frecuencia absoluta acumulada anterior a la clase mediana = 15

f
i
: Frecuencia absoluta simple de la clase mediana = 11

c : Amplitud intervlica: 6


La mediana ser:


50
15
2
100 6
11
Me
| |

|
\ .
= + = 105.45


Interpretacin:

La mitad de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 105 puntos, aproximadamente la otra mitad tienen ms de 105 puntos.

Moda

Proceso:
1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando en la columna de las
frecuencias absolutas simples (f
i
) el mayor valor.

En nuestro ejemplo el mayor valor de las frecuencias absolutas simples es f
3
= 11,

En nuestro ejemplo, la clase modal o fila donde se encuentra la moda es la tercera fila porque en
ella se encuentra el mayor valor de las frecuencias absolutas simples.

2. Utilizando la frmula:

|
|
.
|

\
|
A + A
A
+ =
2 1
1
inf
c L Mo

hallando:
1 1 i i
f f

A = = 11- 6= 5
2 1 i i
f f
+
A = = 11-5= 6

Mg. Mara Vallejos Atalaya


74
5
100 6
5 6
Mo
| |
= +
|
+
\ .
= 102.72

Interpretacin:

La mayora de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia de
103 puntos.





















































Mg. Mara Vallejos Atalaya


75

Sesin N 6




MEDIDAS DE POSICIN



6.1. MEDIDAS DE POSICIN

Son estadgrafos que dividen a una serie de datos en cuatro, diez o cien partes iguales.

Estas medidas son:

- Cuartiles
- Deciles
- Percentiles


6.1.1. Cuartiles (Q
i
)

Son estadgrafos que dividen a la informacin en cuatro partes iguales, donde cada uno de ellos es el
25% de la informacin.

Esquemticamente se tiene:

Q
1
25%
Q
2

25% Q
3


25%

25%

total 100%


Los cuartiles se calculan con la frmula siguiente:


1
inf
( )
4
i
j
i
j n
F
Q L c
f

(

(
= +
(
(



Donde:
j : 1,2 3
L
inf
: Lmite inferior del intervalo de la clase cuartlica.
n : Nmero total de datos.
F
i-1
: Frecuencia absoluta acumulada anterior a la clase cuartlica.
f
i
: Frecuencia absoluta simple de la clase cuartlica.
c : Amplitud intervlica.

6.1.2. Deciles (D
i
)

Son estadgrafos que dividen a la informacin en diez partes iguales, donde cada uno de ellos es el
10% de la informacin.
Mg. Mara Vallejos Atalaya


76

Esquemticamente se tiene:


D
1
10%

10% D
9

. . .
10%

10%

Total 100%

Los deciles se calculan con la frmula siguiente:


1
inf
( )
10
i
j
i
j n
F
D L c
f

(

(
= +
(
(




Donde:
j : 1,2, 3, 9
L
inf
: Lmite inferior del intervalo de la clase declica.
n : Nmero total de datos.
F
i-1
: Frecuencia absoluta acumulada anterior a la clase declica.
f
i
: Frecuencia absoluta simple de la clase declica.
c : Amplitud intervlica.



6.1.3. Percentiles (Pi )

Son estadgrafos que dividen a la informacin en cien partes iguales, donde cada uno de ellos es el 1%
de la informacin.

Esquemticamente se tiene:

P
1
1%

1%

P
99

. . .
1%

1%

total 100%


Los percentiles se calculan con la frmula siguiente:

1
inf
( )
100
i
j
i
j n
F
P L c
f

(

(
= +
(
(



Donde:

D
2

P
2

Mg. Mara Vallejos Atalaya


77
j : 1,2, 3, 99
L
inf
: Lmite inferior del intervalo de la clase percentlica.
n : Nmero total de datos.
F
i-1
: Frecuencia absoluta acumulada anterior a la clase Percentlica.
f
i
: Frecuencia absoluta simple de la clase percentlica.
c : Amplitud intervlica.

Observacin:

Generalmente se calculan las medidas de posicin para datos agrupados, pues se tiene una gran
cantidad de informacin.

Ejemplo:

Correspondiente a datos agrupados (informacin en tablas)
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

Hallaremos los cuartiles 1 y 3, los deciles 2 y 8 y los percentiles 10 y 90.


Tabla N 1

DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES
DEL CI DE 50 ESTUDIANTES DE LA UPeU

Intervalo de clase Xi fi Fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
11
5
8
3
8
9
15
26
31
39
42
50
P10
Q1,D2


Q3,D8
P90
Total 50

Solucin

Cuartil 1 (Q
1
)

Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el primer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.

(1)50
12.5
4 4
i f
= =



2. Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 12.5.

En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F
2
= 15 y es el
inmediatamente superior a 12.5.

3. La segunda fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en
la frmula.

1
inf
( )
4
i
j
i
j n
F
Q L c
f

(

(
= +
(
(


Mg. Mara Vallejos Atalaya


78

L
inf
: Lmite inferior del intervalo de la clase cuartlica = 94
n : nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase cuartlica = 9
i
f : Frecuencia absoluta simple de la clase cuartlica = 6
c : amplitud intervlica: = 6

Cuartil 1 ser:

1
(1)50
9
4
94 6 97.5
6
Q
(

(
= + =
(
(




Interpretacin:

El 25% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 98 puntos, aproximadamente el 75% restante tienen ms de 98 puntos.

Cuartil 3 (Q
3
)

Proceso

1. Se ubica la clase o fila cuartlica (donde se encuentra el tercer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.


( ) (3)50
37.5
4 4
j n
= =

2. Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 37.5.

En nuestro ejemplo corresponde a la quinta fila, pues su frecuencia acumulada es F
5
= 39 y es el
inmediatamente superior a 37.5.

3. La quinta fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en la
frmula.

L
inf
: Lmite inferior del intervalo de la clase cuartlica = 112
n : nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase cuartlica = 31
i
f : Frecuencia absoluta simple de la clase cuartlica = 8
c : Amplitud intervlica: = 6

El cuartil 3 ser:

(3)(50)
31
4
3 112 6 116.87
8
Q
(

(
= + =
(
(



Interpretacin:

El 75% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 117 puntos, aproximadamente el 25% restante tienen ms de 117 puntos.
Mg. Mara Vallejos Atalaya


79

Decil 2 (D
2
)

Proceso:
1. Se ubica la clase o fila declica (donde se encuentra el segundo decil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu decil se desea encontrar; ya sea el 1, 2, , 9.


( ) (2)50
10
10 10
j n
= =

2. Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 15.

En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F
2
= 15 y es el
inmediatamente superior a 10.

3. La segunda fila es la clase declica y de all se considera los datos que van a ser reemplazados en
la frmula.

L
i
: Lmite inferior del intervalo de la clase declica = 94
n : Nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase declica = 9
i
f : Frecuencia absoluta simple de la clase declica = 6
c : Amplitud intervlica: = 6

El decil 2 ser:

2
(2)(50)
9
10
94 6 95
6
D
(

(
= + =
(
(




Interpretacin:

El 20% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 95 puntos, aproximadamente el 80% restante tienen ms de 95 puntos.

Percentil 10 (P
10
)

Proceso

a. Se ubica la clase o fila percentlica (donde se encuentra el percentil 10), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2, ,
99.


( ) (10)50
5
100 100
j n
= =

b. Este valor se ubica en la columna de las frecuencias acumuladas (F
i
) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 5.

En nuestro ejemplo corresponde a la primera fila, pues su frecuencia acumulada es F
2
= 9 y es el
inmediatamente superior a 5.

c. La primera fila es la clase percentlica y de all se considera los datos que van a ser remplazados
Mg. Mara Vallejos Atalaya


80
en la frmula.


L
i
: Lmite inferior del intervalo de la clase percentlica = 88
n

: Nmero total de datos = 50
F
i-1
: Frecuencia absoluta acumulada anterior a la clase Percentlica = 0
i
f : Frecuencia absoluta simple de la clase percentlica = 9
c : Amplitud intervlica: = 6

El percentil 10 ser:

10
(10)(50)
0
100
88 6 91.3
9
P
(

(
= + =
(
(



Interpretacin:

El 10% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 91.3 puntos, aproximadamente el 90% restante tienen ms de 91.3 puntos.



EJERCICIOS PROPUESTOS


1) Los datos siguientes corresponden al peso en Kg. de 10 alumnos.
40.8 52.5 49.2 40.8 62.2
52.5 58.0 60.0 40.8 52.5

Calcular:
a) La media, la mediana y la moda.
b) Cul de los 3 indicadores (en (a)) miden con mayor precisin el centro de los datos?

2) El nmero de autos vendidos por cada uno de 10 vendedores de una distribuidora de
automviles en un mes particular, dispuestos en orden ascendente es: 2, 4, 7, 10, 10, 10,
12, 12, 14, 15.

Determine e interprete:

a) La media b) La mediana c) La moda

3) La media mnima para aprobar una asignatura es 11. Si un estudiante obtiene la notas 13.5, 14,
9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestin, el estudiante
fue aprobado?

4) A Continuacin se dan las notas de 50 alumnos.

60 85 33 52 65
77 84 65 74 57
71 35 81 50 35
64 74 47 54 68
80 61 41 91 55
73 59 53 77 45
41 55 78 48 69
85 67 39 60 76
94 98 66 66 73
42 65 94 88 89

Se pide:

Mg. Mara Vallejos Atalaya


81
a) Obtener la distribucin de frecuencias
b) Determinar: la media, mediana y moda
c) Determinar el 3er cuartil, 7mo decil y 55avo percentil.

5) A continuacin tenemos la distribucin del nmero de accidentes por da durante 43 das, en
cierta autopista.

N de accidentes 0 1 2 3 4
N de das 10 15 10 5 3

a) Determinar: la media, mediana y moda

b) Cul es el porcentaje de das en que se tuvo dos o ms accidentes por da?


6) Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en cm)
151 152 154 155 159 159 160 161 161 161 161 162
163 163 164 165 166 165 166 166 166 166 166 167
167 167 167 168 168 168 168 168 168 168 168 168
168 169 169 169 169 169 169 169 169 170 170 170
170 170 170 170 171 171 171 172 172 172 173 173
173 173 174 174 174 175 175 175 176 176 176 176
176 177 177 177 177 178 178 178 179 179 180 180
180 181 181 181 181 182 182 182 183 184 185 186
187 188 189 190

Calcular las medidas de tendencia central, posicin, dispersin y de forma. Interpretar los
resultados.

7) Obtenga la media y la mediana para cada uno de los siguientes conjuntos de nmeros:
1) 1, 5, 9, 13, 17 2) 1, 3, 9, 27, 81 3) 1, 4, 9, 16, 25

a) Para cul de estos conjuntos de datos son iguales la media y la mediana?
b) Cul medida es la misma para los 3 conjuntos?
c) Cul de estos conjuntos tiene una moda?

8) Los siguientes datos representan el nmero de obreros ausentes en cierta empresa
manufacturera, en 10 das consecutivos de trabajo:
5, 3, 0, 4, 3, 1, 4, 2, 20, 0

a) Encontrar la media, la mediana y la moda.
b) Interpretar sus resultados.

9) El siguiente cuadro muestra la distribucin de edades de casos de una cierta enfermedad
reportada durante un ao en una ciudad del estado.

EDAD Nmero de casos
5 - 14
15 - 24
25 - 34
35 - 44
45 - 54
55 - 64
5
10
20
22
13
5
Total 75

a) Determinar e interpretar las medidas de tendencia central: media, mediana, moda.
b) Determinar e interpretar las medidas de Posicin: Cuartiles (Q1 y Q3) Deciles (D3 y D4) y
Percentil (P14 y P94).


Mg. Mara Vallejos Atalaya


82




10) En la tabla siguiente se muestra los puntajes obtenidos por 36 alumnos en una prueba de
razonamiento matemtico:

Y
i-1

- Y
i

fi hi Fi Hi
Yi
42 - 51
51 - 60
60 - 69
69 - 78
78 87
87 - 96
11 0.35
10 0.28
2 0.055
5 0.14
3 0.08
5 0.14

a) Calcular la media aritmtica, mediana y moda e interprete los datos
b) Calcular Q
1
, P
90
, D
9
e interprete
c) Graficar el histograma y polgono de frecuencia












































Mg. Mara Vallejos Atalaya


83

Autoevaluacin



CONCEPTUAL

1. Seale con una V si es verdadero o F si es falso en los siguientes
enunciados:

a) ( ) La mediana es una medida de tendencia central.
b) ( ) La moda indica el valor que se repite con mayor frecuencia.
c) ( ) Los cuartiles dividen a la informacin en 10 partes iguales.
d) ( ) La media se calcula sumando todos los valores de la variable.
e) ( ) Los percentiles dividen la informacin en cien partes iguales.


PROCEDIMENTAL

2. Establezca las diferencias entre las medidas de tendencia central: media,
mediana y moda.

3. El nmero de autos vendidos por cada uno de 10 vendedores de una
distribuidora de automviles en un mes particular, dispuestos en orden
ascendente es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15.

Determine e interprete:

a) La media b) La mediana c) La moda

4. La siguiente tabla muestra la distribucin de edades de casos de una cierta
enfermedad informados durante un ao en una provincia.

Edad Nmero de casos
[5 - 15>
[15 - 25>
[25 - 35>
[35 - 45>
[45 - 55>
[55 - 65>
5
10
20
22
13
5
total 75

a) Calcular la media, la mediana, la moda. Interprete.
b) Calcular el Q
1
, Q
3
, D
2
, D
5
, P
8
, P
10



ACTITUDINAL

5. Para conocer la edad ms frecuente de tus compaeros de clase, qu
medida de tendencia central utilizaras?, qu procedimiento efectuaras
para su clculo? y cmo ensearas a tus subordinados para conocer la
edad ms frecuente de los que siempre llegan tarde?

Mg. Mara Vallejos Atalaya


84
Sesin N 7





MEDIDAS DE DISPERSIN


7.1. Medidas de dispersin

Son estadgrafos que cuantifican el grado de concentracin o de dispersin de los valores de la
variable en torno a un promedio o valor central de la distribucin. Las medidas de dispersin se
necesitan para dos propsitos bsicos:

a) Para verificar la confiabilidad de los promedios y
b) Para que sirva como base para el control de la variacin de la misma.

Las principales medidas de dispersin o variabilidad son:
- Varianza
- Desviacin estndar
- Coeficiente de variacin

7.1.1. Varianza (s
2
)
Es una medida que cuantifica el grado de dispersin o de variacin de los valores de una variable
cuantitativa con respecto a su media aritmtica.

Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a su media.

Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastantes
dispersos o alejados de la media aritmtica; si el resultado es bastante pequeo los datos estarn
bastante cercanos o concentrados alrededor de la media aritmtica.

Se obtiene de acuerdo a lo siguiente:

a) Varianza para datos simples (en serie):


2 2
2
( )
1
x n x
s
n



Donde:
=

2
x Cada valor de la muestra se eleva al cuadrado luego se suma todos los valores.
n = Tamao de la muestra. (nmero de datos).
x = Media para datos simples.

b) Varianza para datos agrupados:

2 2
2
( )
1
Y f n Y
s
n

=



Donde:

2
Y f

= Cada marca de clase elevado al cuadrado y multiplicado por su frecuencia absoluta simple,
luego se suman todos los valores.
n = Tamao de la muestra.
Mg. Mara Vallejos Atalaya


85
Y = Media para datos agrupados.
Observacin: La varianza es una medida terica; no tiene interpretacin prctica.

7.1.2. Desviacin estndar (s )

Es la raz cuadrada de la varianza. Esta medida tiene interpretacin prctica.

2
s s =

Es uno de los estadsticos de mayor uso en el cual las unidades de la variable ya no estn elevados al
cuadrado sino estn en unidades originales.

7.1.3. Coeficiente de variacin (c.v. % )

Es el cociente de la desviacin estndar y la media aritmtica, expresado en porcentaje. As:

100 . %
x
s
cv =

- El coeficiente de variacin se usa para saber si un conjunto de datos es homogneo o heterogneo
(concentrados o dispersos). Para esto se utiliza el siguiente criterio:

Si C.V. < 0.33 Datos HOMOGNEOS
Si C.V. 0.33 Datos HETEROGNEOS

- El coeficiente de variacin tambin se utiliza para comparar la variabilidad de 2 ms series de
datos que tengan unidades de medidas diferentes (por ejemplo, peso en kgs. y edad en aos).

Si C.V.A < C.V.B Los datos de la serie A presentan una menor variabilidad con respecto a los
datos de la serie B


Ejemplo:

Correspondiente a datos simples (informacin en serie):

Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:

Edad:

X
i
: 18, 20, 23, 17, 18, 19, 23, 18

Calcular la varianza, desviacin estndar y coeficiente de variacin e interpretar sus resultados.


Solucin:

La varianza (s
2
) :

Proceso:


18 20 23 17 18 19 23 18 156
19.5
8 8
x
x
n
+ + + + + + +
= = = =



2 2 2 2 2 2 2 2 2
18 20 23 17 18 19 23 18 3080 x = + + + + + + + =



n = 8, pues hay 8 datos.
Mg. Mara Vallejos Atalaya


86

Entonces, la varianza es:

2 2
2
2
( )
3080 8(19.5)
5.43
1 8 1
x n x
s
n


= = =



- No tiene interpretacin prctica, slo se calcula para poder determinar la desviacin estndar.

La desviacin estndar (s):

2 33 . 2 43 . 5
2
= = = = s s

Interpretacin:

Las edades de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas se
dispersan respecto al valor central en aproximadamente 2 aos.

El coeficiente de variacin (cv%):

2.33
% .100 .100 11.95% 12%
19.5
s
cv
x
= = = =

Interpretacin:

Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.

Ejemplo:

Correspondiente a datos agrupados (informacin en tablas):

Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

Hallaremos la varianza, desviacin estndar y coeficiente de variacin para datos agrupados.


Tabla N 1

DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU

Lmites de
clases
X
i
f
i
F
i
X
i
f
i
X
i

2
fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
11
5
8
3
8
9
15
26
31
39
42
50
819
582
1133
545
920
363
1016
74529
56454
116699
59405
105800
43923
129032
Total 50 5378 585842


Solucin:

La varianza (s
2
) :

Proceso:
Mg. Mara Vallejos Atalaya


87

Media
819 582 1133 545 920 363 1016
9 6 11 5 8 3 8
5378
107.56 107
50
i i
i
x f
x
f
+ + + + + +
= =
+ + + + + +
= = =




2 2 2 2 2 2
2 2
91 (9) 97 (6) 103 (11) 109 (5) 115 (8)
121 (3) 127 (8) 585842
x f = + + + +
+ + =



Entonces, la varianza es:

2 2
2
2
( )
585842-50(107.56)
150.70
1 50 1
x f n x
s
n

= = =




- No tiene interpretacin prctica, slo se calcula para poder determinar la desviacin estndar.


La desviacin estndar (s):

2
150.70 12.27 s s = = =


Interpretacin:

El cociente de inteligencia de los alumnos de la Universidad Peruana Unin se dispersa respecto al
valor central en aproximadamente 13 puntos.

El coeficiente de variacin (cv%):


12.27
% .100 .100 11.40% 12%
107.56
s
cv
x
= = = =


Interpretacin:

Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.














Mg. Mara Vallejos Atalaya


88
Sesin N 8




MEDIDAS DE FORMA



8.1. Medidas de forma

Son aquellos que permiten identificar la distribucin de la informacin.

8.1.1. Asimetra (As)

Permite identificar hacia dnde se acumula la informacin. Se obtiene mediante la siguiente frmula:


3 1 2
3 1
2
o
Q Q Q x Mo
As As
s Q Q
+
= =



S: As = 0 La distribucin es simtrica
As > 0 La distribucin es positiva
As < 0 La distribucin es negativa

8.1.2. Coeficiente de Kurtosis o apuntamiento (K)

Indica el grado de aplastamiento que tiene la distribucin. De acuerdo a ello se clasifican en:
distribuciones platicrticas (Fig.1), mesocrticas (Fig.2) y leptocrticas (Fig.3).























Para el grado de apuntamiento (deformacin vertical) utilizaremos el coeficiente denotado por:

3 1
90 10
2( )
Q Q
k
P P



Donde: P
90
= percentil 90; Q
1
= primer cuartil
PLATICRTICA
Fig.1
MESOCRTICA
Fig.2
LEPTOCRTICA
Fig.3
Mg. Mara Vallejos Atalaya


89
P
10
= percentil 10; Q
3
= tercer cuartil

Si k = 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es mesocrtica
(tiene igual apuntamiento que la normal o campana de Gauss).

si k < 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es platicrtica.

si k > 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es leptocrtica.

Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):

Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
cociente intelectual de 50 alumnos. [Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la
UPeU].

Hallaremos la asimetra y el coeficiente de Kurtosis para datos agrupados.

Tabla N 1

DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES
DEL CI DE 50 ESTUDIANTES DE LA UPeU

Intervalo de clase Xi fi Fi
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
91
97
103
109
115
121
127
9
6
11
5
8
3
8
9
15
26
31
39
42
50
P
10

Q
1
,D
2

Q
2


Q
3

D
8
P
90

Total 50

Solucin

La Asimetra (As):

Proceso:

Calcular los cuartiles 1, 2 y 3, como se hizo en el ejemplo de las medidas de posicin.



1
(1)50
9
4
94 6 97.5
6
Q
(

(
= + =
(
(



2
(2)(50)
15
4
100 6 105.45
11
Q
(

(
= + =
(
(



Mg. Mara Vallejos Atalaya


90
3
(3)(50)
31
4
112 6 116.87
8
Q
(

(
= + =
(
(



Reemplazar en la frmula de la asimetra, entonces, la Asimetra es:

3 1 2
3 1
2 116.87 97.5 2(105.45)
0.17
116.87 97.5
Q Q Q
As
Q Q
+ +
= = =



Interpretacin:

Como la asimetra tiende a cero, la informacin es simtrica.

El coeficiente de Kurtosis (k):

Proceso:

Calcular los cuartiles 1 y 3 y los percentiles 10 y 90, como se hizo en el ejemplo de las medidas de
posicin


1
(1)50
9
4
94 6 97.5
6
Q
(

(
= + =
(
(




3
(3)(50)
31
4
112 6 116.87
8
Q
(

(
= + =
(
(



10
(10)(50)
0
100
88 6 91.3
9
P
(

(
= + =
(
(



90
(90)(50)
42
100
124 6 126.25
8
P
(

(
= + =
(
(




Reemplazar en la frmula de la asimetra, entonces el coeficiente de Kurtosis es:

3 1
90 10
116.87 97.5
0.27
2( ) 2(126.25 91.3)
Q Q
k
P P

= = =



Interpretacin

Como k es igual 0.27 y este nmero es mayor que 0.263, entonces, la informacin es leptocrtica.



Mg. Mara Vallejos Atalaya


91
EJERCICIOS PROPUESTOS

1) Analizar comparativamente la distribucin de los sueldos de los 45 trabajadores de la empresa
metal mecnica.

s
x
C.V C.V%
Directivos 70 700 0,10 10%
Empleados 60 300 0,20 20%
Obreros 90 250 0,36 36%

2) En una empresa, el salario medio de los hombres es de S/. 4000 con una desviacin estndar de
s/. 1500 y el de las mujeres es un promedio de s/. 3000 con desviacin estndar de s/. 1200.
Hallar el Coeficiente de Variacin de los salarios de los hombres y mujeres. Interprete.

3) Determinar cul de las dos distribuciones A y B, tiene un mayor grado de dispersin

DISTRIBUCIN A

y
j-1
y
j
(0-2| (2-4| (4-6| (6-8|
nj 4 6 5 3

DISTRIBUCION B

y
j-1
y
j
(4-8| (8-12| (12-16| (16-20| (20-24|
nj 10 12 14 20 21

4) Una prueba de conocimiento, A, se calific sobre 20 puntos dando una media de 12 y una
desviacin estndar de 2 puntos. Mientras que una prueba de aptitud, B, se calific sobre 100
puntos, dando una media de 70 y una desviacin estndar de 5.

a) En cul de las dos pruebas los puntajes son ms homogneos?
b) Si Juan tiene 14 en A y Luis 73 en B, quin tiene mejor puntuacin estndar.

5) Multiplicando por 2 cada uno de los valores de la variable X: 3, 2, 0, 5, se obtiene la serie y: 6,
4, 0, 10. Comprobar que ambas series tienen el mismo coeficiente de variacin.

6) Se toman las medidas de 80 personas, las que tiene estatura media de 1,70mt. y desviacin
estndar de 3.4cm. Posteriormente se verific que la medida usada en la medicin tena 4 cm.
menos. Rectifique los estadgrafos mencionados.

7) Conteste lo siguiente:
a) Si la varianza de una distribucin de edades es 19.9809, entonces la desviacin estndar de
dicha distribucin es:
a1) 399.23636 a2) 9.99045
a3) 19.9809 a4) 4.47

b) Calcular el C.V. de: y=5x + 4 sabiendo
x
=240, V(x)=64
b1) 4.0% b2) 3.2% b3) 5.1% b4) 3.0%

8) Si la nota promedio en el curso de matemtica Bsica de la seccin A es 12 puntos y la
desviacin estndar es de 3 puntos y en la seccin B se tiene una nota promedio de 12 punto y
una desviacin estndar de 4 puntos podemos afirmar que:

a) La seccin B tiene mejor promedio
b) La seccin A tiene mejor promedio
c) Las notas de la seccin A son ms homogneas
d) Las notas de la seccin B son ms homogneas





Mg. Mara Vallejos Atalaya


92

Autoevaluacin


CONCEPTUAL

1. Seale con una V si es verdadero o F si es falso en los siguientes
enunciados:

a) ( ) La asimetra es una medida de forma.
b) ( ) El C.V. permite determinar si la informacin es homognea.
c) ( ) Kurtosis indica el grado de aplastamiento que tiene la
distribucin.
d) ( ) La varianza no tiene interpretacin prctica.

PROCEDIMENTAL

2. Un alumno obtuvo como promedio en estadstica 68.70 puntos con una
desviacin estndar de 15.40, y otro alumno obtuvo 50.90 puntos con
una desviacin estndar de 19.60. Diga Ud. cul de los dos alumnos
tiene un rendimiento homogneo.

3. En la siguiente tabla se presenta la distribucin de los salarios en
dlares. De 50 trabajadores de una empresa. La longitud de los
intervalos de clase es constante e igual a 20.

( y
j-1
- y
j
] y
j
n
j
N
j
y
j
n
j

300
400
23 350
17
( 100 - 120] 440
50

a) Completar la tabla de distribucin de frecuencia y los datos que faltan
b) Determine la varianza, la desviacin estndar, el coeficiente de variacin

4. Los siguientes datos muestran los calificativos de 20 personas
sometidos a una prueba de aptitud. Los 20 estudiantes fueron divididos
en dos grupos, al grupo 1 se calific de 0 a 100 y al grupo 2 se calific
de 0 a 20:

Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88
Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15

a) Calcule la media y la desviacin en cada grupo, cul de los grupos
es ms homogneo?

ACTITUDINAL

Mg. Mara Vallejos Atalaya


93
5. En una empresa deseas saber cmo estn dispersos los valores de las
edades, con respecto a la media aritmtica, de todos los trabajadores,
qu medida de resumen utilizaras y porqu?


Mg. Mara Vallejos Atalaya


94

You might also like