You are on page 1of 117

UNIVERSIDAD AMAZNICA DE PANDO

CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

67
PRESENTACION
El origen del presente texto gua obedece a una decisin del estamento docente y
las autoridades de la Universidad Amaznica de Pando, de aplicar reformas
profundas en el campo acadmico, determinacin que en la prctica se inicia el 8
de enero del ao 2001, inicialmente con una autocrtica y reflexin profundas que
concluyeron con la decisin de encaminar e introducir variantes en lo que hasta
entonces constitua la ctedra tradicional en nuestra superior casa de estudios.
Pretender alcanzar la excelencia acadmica no slo representaba en los hechos
encarar transformaciones en el terreno administrativo-organizativo, sino
fundamentalmente dar un giro substancial de 180 grados en la prctica docente,
vale decir la prctica en el aula. La Universidad no slo deba ser testigo de un
crecimiento cuantitativo en la ampliacin de su oferta curricular y la mejora
espectacular de la infraestructura y equipamiento, sino que la cualificacin de la
ctedra universitaria era una necesidad que en el corto plazo deba trasuntarse
en logros acadmicos concretos en favor del universitario pandino, que sumido en
su impotencia no atina an a dar crdito a lo que la nueva universidad pretende
para su propio beneficio.
El contenido de la presente gua constituye una recopilacin de textos
tradicionales y clsicos en la enseanza de la estadstica y las probabilidades,
asignatura no siempre asequible al estudiante novato por el contenido matemtico
que conlleva consigo.
La experiencia de muchos aos en la ctedra universitaria en la asignatura de
Estadstica y probabilidades ha constituido paralelamente un incentivo para
profundizar en los aspectos esenciales de la asignatura y ofertar al estudiante
universitario un apoyo didctico que espero vendr a contribuir a paliar la aguda
escasez de textos especializados y tcnicos en el medio.
Sin embargo, como todo texto en proceso de elaboracin, el mismo con seguridad
adolecer de muchas falencias que se irn corrigiendo y complementando
paulatinamente en la medida en que se vaya aplicando en este y posteriores
cursos regulares.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

En otro orden de cosas es digno ponderar la iniciativa de las autoridades


universitarias en implementar el proceso evaluativo y la titularizacin de
docentes, por cuanto ello permitir en el corto plazo mejorar la prctica docente
en el aula; en este sentido la UAP en sus cortos aos de vida viene encarando de
manera responsable el anhelo acadmico de toda casa superior de estudios: La
excelencia Acadmica, y de esta manera en muy poco tiempo ponerse a tono con
las transformaciones acadmicas y parangonarse con las grandes universidades,
para de esta manera insertarse en el fenmeno de la globalizacin.
Posteriormente, a partir de la gestin 2003, adelante, la UAP vive un intenso
proceso de modernizacin en la parte acadmica con la incorporacin en el mbito
acadmico del enfoque Basado en Competencias FBC, que en la prctica ha
trado muchos beneficios a la universidad. Hoy en da todos los hechos
acadmicos estn enmarcados dentro de este enfoque, incluso la readecuacin del
presente Texto-Gua cuya planificacin se trasunta en un proyecto formativo.
Como vern, queridos estudiantes, todos absolutamente todos, debemos
contribuir al proceso de excelencia acadmica para mejorar la educacin superior
en Pando, que no es obra de unos pocos sino es responsabilidad compartida de
todos: Docentes, estudiantes, autoridades y pueblo pandino en general.
Finalmente, quiero nuevamente expresar mi gratitud a los estudiantes de la
Universidad Amaznica de Pando, por brindarme esta oportunidad de contribuir al
progreso de un pueblo en franco proceso de desarrollo y crecimiento econmico.

Gracias: EL AUTOR

Cobija, Marzo del 2012

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

1. NOCIONES GENERALES DE LA ESTADISTICA


COMPETENCIA DE TEMA:
DESCRIBE LOS CONCEPTOS FUNDAMENTALES DE LA ESTADSTICA DESCRIPTIVA,
MEDIANTE UN PROCESO INTERACTIVO Y EL USO DE MEDIOS DE INFORMACIN, EN EL
AULA.

1.1. INTRODUCCION.No es posible precisar con exactitud el origen de la estadstica en el tiempo, su


gnesis se remonta hasta los albores mismos de la humanidad. Se cree que ste
surge como producto de la necesidad que sinti el hombre primitivo de registrar
en principio y luego controlar los resultados de la caza y la pesca, que son las
actividades primarias del ser humano. Sin embargo, estas actitudes del hombre
primitivo no fueron intencionadas sino intuitivas, que con el pasar de los aos y la
evolucin del ser humano se fue estructurando como tcnica y posteriormente
como ciencia hasta constituirse, hoy en da, en un instrumento muy valioso para el
desarrollo cientfico.
1.2. DESARROLLO HISTORICO DE LA ESTADSTICA.El desarrollo histrico de la estadstica presenta tres etapas en su desarrollo.
Estas etapas son:
a) ETAPA INICIAL
Este perodo se extiende desde la antigedad hasta mediados del Siglo
XVIII. Se caracteriza por que se asocia la estadstica a los censos
poblacionales y el registro de los bienes y servicios de un estado o pueblo , para
medir su podero como estado. El desarrollo de la estadstica, en este perodo,
se asocia con el mercantilismo como modelo de desarrollo econmico, donde la
riqueza de un pueblo o estado se pretenda medir en trminos de la cantidad de
metlico que este posea, para ello obviamente los estados deban implementar
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

un sistema confiable de registro de manera tal que estn permanentemente


informados de la situacin de un estado con respecto del otro.
Los pasajes histricos ms relevantes en esta etapa son:
La cultura Egipcia muestra en la composicin de su patrimonio cultural
interesante y abundante material sobre recopilaciones de datos estadsticos
en su administracin estatal, e incluso divinizaron a SAPHKIT como diosa de
los libros y de las cuentas.
Los romanos, otra importante cultura de la humanidad, llevaron registros
numricos con fines tributarios. El nacimiento de Cristo mismo, en esos
tiempos, est relacionado con un empadronamiento poblacional.
En la poca de los reyes catlicos de Espaa (SIGLO XV), se practicaron
censos bastante completos y sofisticados para su poca y durante la vigencia
del mercantilismo los estados desarrollaron tcnicas de registro para
cuantificar el volumen de metlico que reflejaba el podero y riqueza de un
estado.
Para no ir muy lejos, en el imperio incaico, en lo que hoy es Latinoamrica,
existen indicios de que se practicaron registros de cuentas y poblacin
mediante los quipus, en la cultura quechua.
a) ETAPA DE LA SISTEMATIZACIN
Esta etapa se caracteriza por la aparicin de escuelas estadsticas cuya
pretensin es la de sistematizar el estudio de esta ciencia, desde una
ptica cientfica. Se destacan en el tiempo tres escuelas:
La escuela Alemana.- Cre la primera ctedra de estadstica, considerando
esta disciplina como la descripcin de los fenmenos concernientes al estado y
la administracin estatal.
La Escuela Inglesa.- Cuantificaron las leyes que rigen los fenmenos sociales,
a travs de aritmetizacin de la estadstica. En esta etapa se disearon
modelos conductistas, vale decir modelos estadsticos no paramtricos.
La Escuela Francesa.- Introduce la teora de las probabilidades asocindola
con los juegos de azar. La Place, famoso estudioso de la estadstica, es el
representante ms destacado de la poca. En este perodo se desarrolla la
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

inferencia estadstica a partir del clculo de probabilidades, cuyo fundamento


es la matemtica.
c) ETAPA ACTUAL: Est comprendida entre principios del siglo XIX hasta
nuestros das. En esta etapa la matemtica se plasma en la columna vertebral de
la estadstica y se caracteriza por el gran desarrollo alcanzado como ciencia y
como una metodologa de la investigacin cientfica aplicada a todas las ramas del
saber humano: Ingeniera, Biologa, Economa, medicina, agronoma, etc.
Se destacan estudiosos como: Pearson, Student, Newman y Fisher.
1.3. DEFINICION DE LA ESTADISTICA
La palabra Estadstica parece derivar de la palabra latina Status, que en el latn
tena el sentido de estado poltico.
STATUS = ESTADO POLITICO
Luego, se us la estadstica en poltica econmica y significaba la exposicin
sistemtica y ordenada de las caractersticas ms notables de un estado,
consista en la recoleccin y el anlisis de los datos relativo a la poblacin y
riqueza para los fines de la guerra y de las finanzas. Se trataba de los famosos
censos para fines tributarios.
DEFINICIONES.estadstica:

continuacin

presentamos

algunas

definiciones

de

DICCIONARIO LAROUSSE: Es la ciencia cuyo objeto es reunir, clasificar y


contar todos los hechos en un mismo orden.
GUALBERTO AGUIRRE: Es una descripcin numrica sucinta de las
caractersticas de grandes conjuntos de observaciones, que en algunos
casos, se denomina reduccin de datos y condensa en algunos estadgrafos
toda la informacin obtenida.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

KENDALL Y STUART.-Es la rama del mtodo cientfico que trata de los datos
obtenidos al contar o medir las propiedades de las poblaciones de
fenmenos humanos.
H. CRAMER.- El objeto fundamental de la teora estadstica consiste en
investigar la posibilidad de extraer de los datos estadsticos inferencias
vlidas, elaborando los mtodos mediante los cuales pueden obtenerse
dichas inferencias
FILOMENO CARVAJAL.- Por estadstica entendemos a la ciencia o conjunto de
conocimientos que se ocupan de la recoleccin, tabulacin, anlisis e
interpretacin de datos numricos relativos a un conjunto de individuos y
observaciones que nos permiten extraer conclusiones vlidas y tomar
decisiones lgicas basadas en dicho anlisis.
HORACIO DOTTONE.- La estadstica comprende el conjunto de mtodos y
procedimientos para obtener, describir e interpretar conjuntos de datos y
para basar decisiones y predecir fenmenos que pueden expresarse en
forma cuantitativa.
MARIO MURILLO OPORTO.- El significado de la estadstica es mucho ms
amplio. Se refiere tambin a un cuerpo de tcnicas o metodologas para la
recopilacin, presentacin y anlisis de los datos cuantitativos y
cualitativos y al uso de tales datos para toma de decisiones.
Pero esto no es todo, ya que se refiere tambin a la prediccin frente a la
incertidumbre de los fenmenos de la naturaleza. En otras palabras, podemos
decir que la estadstica es un mtodo que sirve para tomar decisiones cuando hay
incertidumbre, sobre la base de datos numricos y calcular su riesgo.
CELESTINO GARCIA ORE.- Estadstica es una disciplina que nos proporciona
un conjunto de mtodos y procedimientos que permiten: recopilar ,
clasificar, presentar y describir datos en forma adecuada para tomar
decisiones frente a la incertidumbre o predecir o afirmar algo acerca de la
poblacin o sus parmetros a partir de los datos extrados de la misma.
1.4. DIVISION DE LA ESTADISTICA
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

En un proceso de investigacin, una vez definido el objetivo y delimitada


claramente la poblacin, en muchos casos, resulta imposible o es sumamente
difcil abarcar la totalidad de los elementos de la poblacin; esto debido a una
serie de factores como ser:
La distancia y dificultades de acceso a ciertos lugares.
Carencia de recursos econmicos
Carencia de recursos humanos
Otros factores limitantes
Para superar estas deficiencias, en vez de observar la totalidad de los elementos
de la poblacin es posible referirse a una proporcin adecuada de los elementos
de la misma, la cual recibe el nombre de MUESTRA.
ESQUEMA SIMPLIFICAD0O DEL CONTENIDO DE LA ESTADSTICA

MUNDO REAL
ESTADISTICA
DECRIPTIVA
ESTADISTICA
INFERENCIAL

MUESTREO

TABULACION

GRAFICOS

REGULARIDADES
CALCULO
PARAMETROS

ESTIMACION

AXIOMAS DE COMPORTAMIENTO
NUMEROS
INDICES

CONTRASTACION
HIPOTESIS

MODELOS TEORICOS

MUNDO
IDEAL

MODELO
MATEMATICO

PROBABILIDADES

DISTRIBUCIONES
ESPECIALES

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

POBLACION.- Es el conjunto mayor de objetos (UNIVERSO) que poseen al


menos una caracterstica comn, cuyo estudio nos interesa o acerca de los
cuales se desea informacin. Los elementos de este conjunto se denominan
unidades estadsticas.
MUESTRA: Es una parte representativa del universo y se recurre a ella cuando
es dificultoso utilizar todos los componentes de la poblacin.
A partir de ello, podemos establecer la siguiente divisin de la estadstica:
1. Estadstica Descriptiva
2. Estadstica Inferencial
1.4.1. ESTADISTICA DESCRIPTIVA: Es la parte de la estadstica que toma
en cuenta el total de los elementos de la poblacin en el proceso de anlisis de un
fenmeno en estudio. Se denomina Estadstica Descriptiva por que trata de la
recopilacin, clasificacin, presentacin y descripcin de los datos estadsticos
provenientes de una poblacin. Los datos o caractersticas que se obtienen de la
poblacin se llaman PARAMETROS.
1.4.2. ESTADISTICA INFERENCIAL: Nos proporciona la teora necesaria
para tomar decisiones frente a la incertidumbre o afirmar algo acerca de la
poblacin a partir de los datos bajo estudio. Los datos o caractersticas
obtenidas de esta manera se llaman ESTADIGRAFOS.
1.5. VARIABLE
Se denomina variable a una caracterstica o un aspecto determinado de las
unidades elementales de una poblacin, que cuantificados, toman diferentes
valores dentro de ciertos lmites, cuyos valores son nmeros.
* En este sentido, si la variable toma un solo valor se llama VARIABLE
CONSTANTE.
* Si la variable toma cualquier valor en un intervalo se llama VARIABLE
CONTINUA.
* Si la variable toma valores enteros se llama VARIABLE DISCRETA.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

En consecuencia, las variables discretas surgen del proceso de conteo, en cambio


las variables continuas surgen de la medicin.
Ejemplo de variable continua: Estatura de los estudiantes de la UAP.
Ejemplo de Variable Discreta: Nmero de hijos por familia: 0, 1, 2, 3,............ n
ATRIBUTOS: la variable atributo o cualitativa es la propiedad de los fenmenos
susceptibles de ser expresados cualitativamente, ejm:
Profesin
Color de la Piel
Sexo
Estado Civil
etc.
Las variables cualitativas pueden ser NOMINALES que no implican un orden y
ORDINALES donde existe algn orden o jerarqua entre atributos.
1.6. DATOS UNIVARIANTES Y MULTIVARIANTES.- En el estudio de un
fenmeno puede interesar el tratamiento de una sola variable o atributo o ms de
una variable o atributos.
De acuerdo a la forma como se encare el anlisis se puede hablar de diferentes
tipos de distribuciones:
a) UNIDIMENSIONAL.- hace referencia a una sola variable o atributo. Ejm.
Estatura de alumnos (Variable)
Sexo ( Atributo)
b) BIDIMENSIONAL.- Hace referencia a una variable o atributo al mismo
tiempo. Ejm. Clasificacin de los empleados por sueldos y por secciones.
c) MULTIDIMESIONAL.- Cuando al mismo tiempo se expresan ms de dos
atributos y/o variables. Ejm. Edad, sexo, peso y estado civil.
1.7. ESCALAS DE MEDICIN
La asignacin de valores a cada una de las unidades estadsticas mediante una
variable, se hace siguiendo determinadas escalas de medicin.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

10

1.7.1. DEFINICIN.- Se denomina escala de medicin a un instrumento de


medida, con el que se asigna valores (cualidades o nmeros) a las unidades
estadsticas para una variable definida. El conocimiento de las escalas de
medicin es muy importante, pues cada una de ellas contiene mtodos
estadsticos especficos. Las escalas de medicin son de los siguientes tipos:
Nominal, Ordinal, De intervalos, De razones
1.7.2. ESCALA NOMINAL.- Se tiene una escala NOMINAL si dos o ms
valores de una variable, slo permiten percibir las diferencias o semejanzas de
las unidades estadsticas que se midan. Tales valores son como etiquetas que
identifican a las unidades estadsticas y las hacen iguales o diferentes entre s.
Si se asignan nmeros a estos valores cualitativos (modalidades), con estos no se
pueden realizar operaciones aritmticas. Slo son vlidas las relaciones de
igualdad (=) y no igualdad ().
Por ejemplo, la variable sexo asigna a las personas dos valores: masculino y
femenino, que son de la escala nominal. Con los valores de esta variable las
personas estn en una misma modalidad o en modalidades diferentes. Si se asigna
un 0 al sexo masculino y un 1 al sexo femenino, con estos nmeros no se pueden
realizar operaciones aritmticas. Slo se puede decir que el smbolo 0 es distinto
al smbolo 1, pero no podemos decir que 1 es mayor que 0, o que 0 es menor que 1.
Las variables estadsticas: estado civil, ideas religiosas, entre otras, tienen
modalidades que son de escala nominal.
El mtodo estadstico con datos obtenidos en escala nominal consiste
bsicamente en obtener el nmero o porcentaje de casos en cada modalidad y
obtener la moda (valor de mayor frecuencia).
1.7.3. ESCALA ORDINAL.- Una escala ORDINAL es una escala nominal donde
los valores de la variable se pueden ordenar en forma ascendente o descendente.
En una escala ordinal los valores o modalidades reflejan el orden de las unidades
estadsticas. Si se asignan nmeros a tales modalidades, con estos, no se pueden
realizar operaciones aritmticas. Slo son vlidas las relaciones de igualdad (=),
de no igualdad () y de orden (=).

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

11

Por ejemplo, la variable estatus econmico con sus modalidades de: clase baja,
media y alta se mide en escala ordinal. La variable orden de mrito, cuyas
modalidades son: 1,2,3 etc, miden las calificaciones de las unidades
estadsticas en escala ordinal.
El mtodo estadstico con datos obtenidos en escala ordinal consiste bsicamente
en obtener el nmero o porcentaje de casos en cada modalidad y obtener la moda,
la mediana, los percentiles y el coeficiente de correlacin por rangos.
1.7.4. ESCALA DE INTERVALOS.- Una escala de INTERVALOS es una escala
ordinal con cuyos valores no slo se pueden verificar: igualdad, no igualdad y
orden, sino tambin, se puede elegir una unidad de escala y comprobar cuntas
veces la diferencia entre dos valores es igual a la diferencia entre otros dos
valores de la escala (es decir, podemos comparar intervalos).
Esto es, si X1, X2 y X3 son tres valores en la escala de intervalo, se verifica por
ejemplo, la relacin:
X3 X1 = c (X2 X1)

X3 X1 = c
X2 X1

Donde c es una constante.


Esta relacin se interpreta como que la escala de intervalos tiene un cero
relativo. Este cero no significa ausencia total de la propiedad que se
observa.
Se miden en escala de intervalos, por ejemplo: La temperatura (grados, Celsius o
Fahrenheit), el tiempo, que se registra en nuestros calendarios, las calificaciones
de una prueba de conocimientos o de aptitud. Estas mediciones tienen un cero
elegido arbitrariamente, por ejemplo, el agua se congela a 0oC ( = 32oF).
La calificacin cero de un alumno en un examen de matemtica bsica, no quiere
decir que no sabe nada de tal materia, pues con otra prueba ms fcil podra
tener otra calificacin.
Con los valores de esta escala son vlidas las relaciones de igualdad, de no
igualdad y de orden. Tambin, son vlidas las operaciones de adicin y
sustraccin entre los valores de la escala, y la multiplicacin y divisin entre las
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

12

diferencias de dos valores de la escala. Pero no es vlida la multiplicacin y


divisin entre los mismos valores de la escala.
Por ejemplo, si la variable X es el puntaje obtenido en un examen calificado de 2 a
20 donde la unidad de medida es un punto a partir de 2 (cero relativo), entonces,
se tiene una escala de intervalos.
En efecto, si tres alumnos A,B y C han obtenido los puntajes: 2, 4 y 16
respectivamente, no slo se verifican las relaciones: 2 4 16 y 2 < 4 < 16, sino
tambin: 16 2 = 7 ( 4 2); es decir la diferencia de los puntajes de C menos A es
igual a siete veces la diferencia de los puntajes de B menos A. No es vlida la
divisin 16/4, pero si lo es : (16-2)/(4-2).
1.7.5. ESCALA DE RAZON O PROPORCIN.- La escala de razn o
proporcin es una escala de intervalo con cuyos valores adems podemos
comprobar cuntas veces un valor de la escala es igual a otro valor de la
escala. Esto es, si X1 y X2 son dos valores, en la escala de razn se verifica la
relacin:
X2 = c X1

X2 = c
X1
Donde c es una constante, y X1 = 0.
La escala de razn tiene un cero absoluto (ausencia de la caracterstica que
se observa). Con los nmeros de esta escala son vlidas las relaciones de
igualdad, de no igualdad, de orden y todas las operaciones matemticas. Los
valores de esta escala se obtienen en general, por mediciones tipo conteo
(discretos) o por mediciones tales como de longitud, peso, volumen, vida til, etc.
(continuos).
Por ejemplo, si la variable X es la longitud (en metros) de un objeto, entonces, los
valores de esta variable son de escala de razn. En efecto, si tres objetos A, B y
C miden 2, 4, y 16 metros, se pueden establecer las relaciones:

2 4 16
2 < 4 < 16
16 2 = 7(4 2)

Adems: 4/2 = 2;

16/2 = 8;

16/4 = 4

Es decir, la longitud de B es el doble que la de A, el de C es 8 veces que la de A y


el de C es 4 veces que la de B.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

13

En la siguiente tabla resumimos las principales caractersticas de las diferentes


escalas existentes:

TEMA N 2
PROCESO ESTADSTICO RECOPLICACIN DE INFORMACIN

COMPETENCIA DE TEMA:
RECOPILA INFORMACIN DE PRIMERA FUENTE EN BASE A LA EJECUCIN
DEL PERFIL DE INVESTIGACIN SELECCIONADO, EN BASE A TECNICAS Y
PROCEDIMIENTOS DE LA ESTADSTICA DESCRIPTIVA, RESOLVIENDO
EJERCICIOS APLICATIVOS EN EL AULA Y SU APLICACIN DE EN LA
COMUNIDAD

La Estadstica Descriptiva, tal como se la defini en el captulo anterior,


bsicamente comprende cuatro fases:
a) Recopilacin
b) Clasificacin
c) Presentacin
d) Descripcin

DE DATOS

2.1. RECOPILACION DE DATOS.Se denomina recopilacin de datos a la operacin que consiste en acopiar o
recolectar datos; dicha operacin se la puede realizar de dos maneras: Si se
toman en cuenta a todos los elementos de la poblacin y se registran sus
caractersticas comunes, que pueden ser variables o atributos, se denomina
CENSO y la informacin obtenida de esta manera se llama dato censal. En cambio,

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

14

si se seleccionan slo algunos elementos de la poblacin se llama muestra y la


informacin obtenida a partir de ella se llama datos obtenidos por muestreo.
2.2. TCNICAS DE MUESTREO
Una parte fundamental para realizar un estudio estadstico de cualquier tipo es
obtener resultados confiables y que puedan ser aplicables. Como ya se coment
anteriormente, resulta casi imposible o imprctico llevar a cabo algunos estudios
sobre toda una poblacin, por lo que la solucin es llevar a cabo el estudio
basndose en un subconjunto de sta denominada: muestra.
Sin embargo, para que los estudios tengan la validez y confiabilidad buscada, es
necesario que tal subconjunto de datos, o muestra, posea algunas caractersticas
especficas que permitan, al final, generalizar los resultados hacia la poblacin en
su conjunto. Esas caractersticas tienen que ver principalmente con el tamao de
la muestra y con la manera de obtenerla.
2.3. IMPORTANCIA DEL MUESTREO
Usualmente se hace referencia a dos tipos de razonamiento: el deductivo y el
inductivo.
El primero est relacionado directamente con la teora de
probabilidad, y que a partir de las caractersticas de la poblacin se obtienen las
posibles caractersticas de una muestra. El segundo tipo de razonamiento se
relaciona con la denominada inferencia estadstica: utilizar las caractersticas de
un subconjunto de la poblacin (la muestra) para hacer afirmaciones (inferir)
sobre la poblacin en general. ste ser el caso de nuestro inters.
El muestro, como ya se mencion, implica algo de incertidumbre que debe ser
aceptado para poder realizar el trabajo, pues aparte de estudiar una poblacin
resulta ser un trabajo en ocasiones demasiado grande, para Wonnacott y
Wonnacott las razones principales para utilizar muestras son:

Recursos limitados. Es decir, no existen los recursos humanos, materiales o


econmicos para realizar el estudio sobre el total de la poblacin. Es como
cuando se compra un aparato, un automvil usado (por ejemplo), que se
prueba unos minutos (el encendido, una carrerita, etc.) para ver si funciona
correctamente y luego se adquiere, pero no se espera a probarlo toda la
vida (encendindolo y apagndolo o, simplemente, dejndolo encendida)
antes de realizar la adquisicin.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

15

Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo,


para el estudio paleontolgico de los dinosaurios (el T. Rex por ejemplo)
sera muy bueno contar con, al menos, muchos restos fsiles y as realizar
tales investigaciones; sin embargo, se cuenta slo con una docena de
esqueletos fosilizados (casi todos incompletos) de esas criaturas en todo el
mundo.

Pruebas destructivas. Es el caso en el que realizar el estudio sobre toda la


poblacin llevara a la destruccin misma de la poblacin. Por ejemplo, si se
quisiese saber el conteo exacto de hemoglobina de una persona habra que
extraerle toda la sangre.

El muestreo puede ser ms exacto. Esto es en el caso en el que el estudio


sobre la poblacin total puede causar errores por su tamao o, en el caso
de los censos, que sea necesario utilizar personal no lo suficientemente
capacitado; mientras que, por otro lado, el estudio sobre una muestra
podra ser realizada con menos personal pero ms capacitado.

2.4. TIPOS DE MUESTREO.- Deben seguirse ciertos procedimientos de


seleccin para asegurar de que las muestras reflejen observaciones a la poblacin
de la que proceden, ya que solo se pueden hacer observaciones probabilsticas
sobre una poblacin cuando se usan muestras representativas de la misma. Los
tipos ms comunes de tcnicas de muestreo aleatorios son: el muestreo aleatorio
simple, el muestreo sistemtico, el muestreo estratificado y el muestreo por
conglomerados.
a) MUESTREO ALEATORIO SIMPLE
Es aquella en la que los elementos se escogen del total de la poblacin en forma
individual con una oportunidad igual e independiente para todas. Por lo general se
utiliza una tabla de nmeros aleatorios.
Si la poblacin es infinita el muestreo aleatorio ocurre cuando la extraccin de
los elementos de la muestra se hace con o sin reemplazo. Si la poblacin es finita
de tamao N, el muestreo aleatorio ocurre tambin si la extraccin es con o sin
reemplazo.
Con reemplazo, la probabilidad de cada elemento de ser elegido es 1/N. Si es sin
reemplazo, la probabilidad de cada elemento de ser elegido es 1/N en la primera
extraccin, es 1/(N-1) en la segunda extraccin, es 1/(N-2) en la tercera
extraccin y as sucesivamente.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

16

Si una muestra aleatoria se elige de tal forma que todos los elementos de la
poblacin tengan la misma probabilidad de ser seleccionado, se llama muestra
aleatoria simple.
Ejemplo:
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un
grupo de estadstica de 20 alumnos. 20C5 da el nmero total de formas de elegir
una muestra no ordenada y este resultado es 15,504 maneras diferentes de
tomar la muestra. Si listamos las 15,504 en trozos separados de papel, una tarea
tremenda, luego los colocamos en un recipiente y despus los revolvemos,
entonces podremos tener una muestra aleatoria de 5 si seleccionamos un trozo de
papel con cinco nombres. Un procedimiento ms simple para elegir una muestra
aleatoria sera escribir cada uno de los 20 nombres en pedazos separados de
papel, colocarlos en un recipiente, revolverlos y despus extraer cinco papeles al
mismo tiempo.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco
prctico, imposible o no deseado; aunque sera deseable usar muestras aleatorias
simples para las encuestas nacionales de opinin sobre productos o sobre
elecciones presidenciales, sera muy costoso o tardado.
b) MUESTREO SISTEMTICO
Una muestra aleatoria sistemtica es aquella en la que sus elementos se eligen de
la poblacin a intervalos uniformes a partir de un listado ordenado. El k-simo
elemento de la muestra es k=N/n, donde n es el tamao de la muestra y N el
tamao de la poblacin.
Por ejemplo: al elegir una muestra sistemtica de 100 alumnos de una unidad
educativa que tiene 3000 estudiantes. K = 3000/100 =30, entonces el primero se
elige en forma aleatoria de los 30 primeros de la lista y los dems
sistemticamente cada 30 alumnos de la lista.
c) MUESTREO ESTRATIFICADO.- Primero se clasifican a los elementos de la
poblacin en sub-grupos separados de acuerdo con una o ms caractersticas
importantes (estratos). Despus se obtiene por separado una muestra aleatoria
simple o sistemtica en cada estrato. El tamao de cada sub-muestra debe ser
proporcional al tamao del estrato para asegurar la representatividad.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

17

Por ejemplo: Para obtener una muestra aleatoria de 600 electores de una
poblacin de 600.000 electores de los cuales 300.000 son de clase baja, 200.000
de clase media y 100.000 de clase alta. Para ello, primeramente se obtiene el %
de participacin de cada estrato sobre el total: 300.000/600.000 = 0,5 x 600 =
300; 200.000/600.000 = 0,33 x 600 = 200; y finalmente 100.000/600.000 =
0,166x600 = 100. Al interior de cada estrato se eligen en forma aleatoria simple.
d) MUESTREO POR CONGLOMERADOS.- Los elementos de la poblacin se
dividen en forma natural en sub-grupos o por conglomerados. Luego se eligen al
azar los sub-grupos que forman la muestra. Ejemplo: Al estudiar las pensiones que
se pagan en los colegios particulares donde no es posible tener la lista de todas
las pensiones, pero puede obtenerse una lista de los colegios particulares
(grupos). Entonces, con esta lista puede obtener una muestra aleatoria de
colegios y as obtener las pensiones que se pagan en estos colegios.
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple
de unidades heterogneas entre s de la poblacin llamadas conglomerados. Cada
elemento de la poblacin pertenece exactamente a un conglomerado, y los
elementos dentro de cada conglomerado son usualmente heterogneos o dismiles.
En el muestreo por conglomerados, stos se forman para representar, tan
fielmente como sea posible, a toda la poblacin; entonces se usa una muestra
aleatoria simple de conglomerados para estudiarla. Los estudios de instituciones
sociales como iglesias, hospitales, escuelas y prisiones se realizan, generalmente,
con base en el muestreo por conglomerados.
En la leccin anterior analizamos las diferentes modalidades de muestreo y tipos
de muestreo: Muestra probabilstica, muestra no probabilstica, etc.
En este captulo profundizaremos algunas consideraciones relativas a las
distribuciones que se dan dentro del muestreo.
2.5. DETERMINACIN DEL TAMAO DE UNA MUESTRA.- Uno de los
aspectos que deben definirse en el proceso de muestreo, es el tamao de la
muestra. Para ello, deben tomarse en cuenta los siguientes aspectos:
a) Tamao del universo o poblacin = N
b) Grado de heterogeneidad de dicho universo, expresado por el valor de la
desviacin estndar de la variable aleatoria.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

18

c) Magnitud del error estadstico que estemos dispuesto a aceptar en los


resultados. Dicho error dar lugar a un intervalo de valores en torno al
valor medio que produzca la muestra. Llamamos I a la amplitud total del
intervalo, es decir, a la diferencia entre sus lmites superior e inferior.
d) Grado o nivel de confianza que quisiramos poder depositar en los
resultados. A dicho nivel corresponder el coeficiente z, dado que, segn la
ley de los grandes nmeros, la distribucin de la media de muestras, en la
que nos apoyamos conceptualmente para el clculo, es normal; a menos que
se trate de una muestra pequea (n<30), en cuyo caso la distribucin es de
Student, y es necesario usar t en lugar de z.
FORMULA PARA DETERMINAR EL TAMAO DE LA MUESTRA
La frmula para definir el tamao de la muestra n, es la siguiente:
2
n=
Z x p x qxN
2
2
Z xpxq+ NxE
Donde:
n= Tamao de la muestra
Z = Variable Z
p= probabilidad de xito
q= probabilidad de fracaso
N=Tamao de la poblacin
E= Error estadstico
Ejemplo: Sea la poblacin de la ciudad de Cobija de 42074 habitantes. Se desea
conocer el ingreso familiar mensual promedio con un error promedio no mayor de
0,05 con un nivel de confianza del 95 %. Cuntos miembros se deben muestrear,
sabiendo que se estima que la probabilidad de xito es del 80 % ?.
SOLUCIN
N = 42075
Z = 1,96

E = 0,05
p = 0,8

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

q= 0,2

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

19

2
n = (1,96) x 0,8 x 0,2 x 42074
2
2
1,96 x 0,8 x 0,2 + 42074 x 0,05
n = 245 miembros

TEMA No 3
PROCESO ESTADSTICO PRESENTACIN DE DATOS
COMPETENCIA DE TEMA:
ELABORA E INTERPRETA CUADROS Y GRFICOS DE DISTRIBUCIN DE
FRECUENCIAS PARA DATOS AGRUPADOS Y NO AGRUPADOS, MEDIANTE LA
RESOLUCIN DE EJERCICIOS DE APLICACIN EN EL AULA, EN BASE A LA
INFORMACIN OBTENIDA EN LA PRIMERA FASE

3.1. CLASIFICACIN DE DATOS.Esta fase es la continuidad de la primera; una vez recolectada la informacin en
base a la aplicacin del Perfil de Investigacin, el estudiante de Estadstica
elabora e interpreta cuadros estadsticos y grficos. Para tener una aproximacin
a la tarea en cuestin, tomemos el siguiente ejemplo:
Ejemplo: Tenemos las calificaciones de 25 estudiantes, en la escala del 1 al 7, con
datos redondeados al entero para facilitar la comprensin y asimilacin del
ejercicio; estos datos los hemos obtenido de la revisin de la nmina de
calificaciones del profesor X, los resultados estn reflejados en la presente
tabla:
6
5
6
6
5
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

6
5
5
7

7
4
7
4

20

6
6
4
3

5
6
5
7

5
6
7
7

Los datos presentados de esta manera, prcticamente no dicen mucho y no tienen


mucha utilidad para su aplicacin. Por ello, la estadstica descriptiva nos
proporciona la segunda etapa que est constituida por la clasificacin de datos.
3.2. CUANDO LA VARIABLE ES DISCRETA Y EL NMERO DE DATOS NO
ES MUY GRANDE
La clasificacin de datos tambin recibe el nombre de tabulacin. Cuando la
variable es DISCRETA y el nmero de observaciones no es grande, esta
operacin se la puede efectuar de la siguiente manera:
a) Se ordenan los datos obtenidos en la fase de recopilacin, ya sea en forma
ascendente o descendente:
3
5
7

4
6
7

4
6
7

4
6
7

5
6
7

5
6

5
6

5
6

5
6

5
7

b) Luego se determina el nmero de veces que se repite la variable. La


caracterstica que queremos estudiar en el presente ejemplo son las
calificaciones de 25 estudiantes, caracterstica que es cuantificable y segn el
supuesto asumido toma nicamente valores enteros en la escala del 1 al 7. En
consecuencia, los valores que toma la variable son:
Xi = 3,4,5,6,7

3.2. CUANDO LA VARIABLE ES CONTINUA O PARA UN NMERO


GRANDE DE OBSERVACIONES DISCRETAS
Cuando la variable es continua o el nmero de datos es grande, el procedimiento
de la clasificacin o tabulacin de datos se lo realiza mediante Intervalos de
clase que se ver ms adelante.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

21

3.3. PRESENTACION DE DATOS: La presentacin de datos se lo efecta a


travs de cuadros denominados DISTRIBUCIONES O TABLA DE
FRECUENCIAS, que a su vez comprende las siguientes etapas en su elaboracin:
PASO 1: Una vez establecido los valores que toma la variable, en la primera
columna del cuadro anotamos dichos valores de la siguiente manera:
CALIFICACIONES: Xi
3
4
5
6
7

PASO N 2: Una vez que se defina los valores que toma la variable, se debe
establecer el nmero de repeticiones para cada valor en particular, a estos
valores se lo conoce como FRECUENCIA ABSOLUTA o nmero de repeticiones.
Ejemplo: El nmero 3 solamente se repite una sola vez, el nmero 4 se repite 3
veces, el 5 se repite 7 veces y as sucesivamente. Seguidamente estas
repeticiones los anotamos en la segunda columna del cuadro.
CALIFICACIONES
Xi
3
4
5
6
7
TOTAL

FRECUENCIA ABSOLUTA
Ni
1
3
7
8
6
25

La suma de los valores de la Frecuencia Absoluta debe ser igual al nmero de


personas encuestadas.
PASO N 3: La tercera columna o casilla para la construccin de una
distribucin de frecuencias cuando la variable es discreta y el nmero de datos no
es grande, es el referido a la Frecuencia Absoluta Acumulada, que no es ms que
la sumatoria sucesiva y acumulada de las Frecuencia Absolutas (ni) y
simblicamente se representa por ( Ni ).
CALIFICACIONES

FRECUENCIA

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

FRECUENCIA ABSOLUTA

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

Xi

22

ABSOLUTA
Ni
1
3
7
8
6
25

3
4
5
6
7
TOTAL

ACUMULADA
Ni
1+0 = 1
1+3 =4
4+7 = 11
11+8 =19
19+6 =25
.-.

PASO N 4: Otro concepto de fundamental importancia para la tabulacin es la


FRECUENCIA RELATIVA (hi), que resulta del cociente entre cada una de las
frecuencias absolutas y el total de las observaciones de la poblacin o la muestra
estudiada (n).
hi = ni
n
que una vez cuantificados se lo inserta en cuadro siguiente de la Tabla de
frecuencias.
Xi

Ni

Ni

3
4
5
6
7
SUMA

1
3
7
8
6
25

1
4
11
19
25
-.-

FRECUENCIA
RELATIVA ( hi )
1/25 = 0,04
3/25 = 0,12
7/25 = 0,28
8/25 = 0,32
6/25 = 0,24
1,00

PASO N 5:
En la prxima columna se registran las FRECUENCIAS
RELATIVAS ACUMULADAS ( Hi ), que resulta de la suma acumulada de las
Frecuencias Relativas:
Hi = h1 + h2 + h3 + ................... + hm
Xi

Ni

Ni

hi

3
4
5
6
7
SUMA

1
3
7
8
6
25

1
4
11
19
25
-.-

0,04
0,12
0,28
0,32
0,24
1,00

En resumen tenemos como resultado la siguiente tabla:


ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

FRECUENCIA RELATIVA
ACUMULADA Hi
0,04 + 0 = 0,04
0,04 + 0,12 = 0,16
0,04+0,12+0,28 =0,44
0,76
1,00
-.-

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

Xi
3
4
5
6
7
SUMA

TABLA DE DISTRIBUCION DE FRECUENCIAS


Ni
Ni
hi
1
1
0,04
3
4
0,12
7
11
0,28
8
19
0,32
6
25
0,24
25
-.1,00

23

Hi
0,04
0,16
0,44
0,76
1,00
-.-

3.4. INTERPRETACIN DE LA TABLA:


a) En la primera casilla de la tabla estn los distintos valores que toma la
variable; en nuestro ejemplo la variable calificaciones de 25 alumnos toma los
siguientes valores:
Xi = 3,4,5,6,7
b) En el segundo se registran las Frecuencias Absolutas, sea las repeticiones que
se presentan para cada valor de la variable Xi; en el ejemplo: 1 alumno obtuvo la
calificacin de 3; 3 alumnos la calificacin de 4; 7 la calificacin de 5 y as
sucesivamente.
c) La casilla de frecuencias absolutas acumuladas nos indica que hasta la
calificacin de 3 se tiene un solo alumno; hasta la calificacin de 4 alumnos; hasta
la calificacin de 5 11 alumnos, etc.
d) Las Frecuencias Relativas estn expresadas en trminos de porcentaje. Ejm. el
4 % de los alumnos tienen la calificacin de 3; el 12 % la calificacin de 4; el 20 %
la calificacin de 5, etc.
e) Las Frecuencias Relativas Acumuladas, tambin expresadas en porcentajes,
nos indica que hasta la calificacin de 3 se tiene al 4 % de los alumnos; hasta la
calificacin de 4 el 16 %, etc.
3.5. PROPIEDADES Y RELACIONES DE LAS FRECUENCIAS: Las principales
propiedades y relaciones que suelen observarse en el anlisis del contenido de una
distribucin de frecuencias son las siguientes:
a) Las Frecuencias Absolutas ( ni ) y las Frecuencias Absolutas Acumuladas ( Ni )
son nmeros enteros y positivos o cero en algunos casos.
b) Las Frecuencias Relativas ( hi ) y las Frecuencias Relativas Acumuladas ( Hi ),
son nmeros fraccionarios positivos que fluctan entre 0 y 1.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

24

0 < hi < 1
c) La suma de todas las frecuencias absolutas es igual al nmero de elementos que
componen la poblacin o la muestra.
ni = n1 + n2 +n3 + .......... nm = n
n = nmero total de observaciones.
d) La suma de todas las frecuencias relativas debe ser igual a 1
hi = h1+h2+h3+.......+hm= n1+n2+n3+....nm
n
ni = n = 1
n
n
e) La ltima frecuencia absoluta acumulada es igual al tamao de la muestra, ya
que ella incluye a todos los elementos.
Nm=n
f) Por ltimo, la frecuencia relativa acumulada puede obtenerse dividiendo por n
la correspondiente frecuencia absoluta acumulada.
Hi = Ni
n

EJERCICIO EN CLASE: Los siguientes datos corresponden a la edad de 60


alumnos de un curso de una escuela:
6,7,7,8,9,10,6,7,8,9,7,7,7,6,6,7,7,7,6,7,7,6,6,8,8,8,8,7,6,7,7,7,8,8,8,8,8,8,8,8,8,
9,9,9,9,9,10,10,10,10,8,10,8,8,9,9,8,8,9,10
Se pide: Elaborar la Tabla o distribucin de frecuencias e interpretarla.
3.6. LA DISTRIBUCION DE FRECUENCIAS CUANDO LA VARIABLE ES
CONTINUA Y PARA UN NMERO GRANDE DE OBSERVACIONES
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

25

Cuando se trata de datos continuos o cuando el nmero de datos discretos es


grande y se dificulta el conteo para la tabulacin, no es posible asignar un solo
valor o clase nica a los valores distintos de la variable; por esta razn los datos
deben ser agrupados en un nmero razonable de clases o intervalos, que
generalmente varan entre 5 y 15.
Para ello se debe seguir el siguiente procedimiento:
PASO N 1: Primeramente se establecen los valores extremos, es decir el valor
mximo y el valor mnimo de los datos observados; luego se determina la
diferencia existente entre ambos. Ejemplo: Tenemos los datos siguientes:
2,0 3,2 3,5 3,6 4,1
4,3 4,6 4,6 4,7 4,8
4,8 4,9 5,0 5,2 5,3
5,6 5,8 5,9 5,9 6,0
6,1
6,2 6,5 6,8 7,0
Los valores extremos son:

Valor Mximo 7,0


Valor mnimo 2,0
DIFERENCIA 5,0

Ls
Li

Al intervalo 7 - 2 se conoce como clase o familia. La diferencia entre ambos


valores se denomina como ancho de clase o amplitud de clase, en el ejemplo el
ancho de clase es igual a 5. Por otro lado el promedio o punto medio entre los
valores extremos del intervalo se denomina Marca de clase o punto medio. En
nuestro ejemplo, la marca de clase es:
7,0 + 2,0 = 3,5
2
PASO N 2: La diferencia entre ambos extremos o ancho de clase se divide
entre un nmero que oscila entre 5 15, dependiendo mucho del valor de la
diferencia y el nmero de observaciones; en el ejemplo que nos ocupa, el nmero
indicado es el nmero 5, por cuanto la diferencia es exactamente de 5.
5 = 1 Entonces, 1 resulta ser el ancho de clase o amplitud de clase de
5
resulta ser el valor indicado.
PASO N 3: Seguidamente se organizan las familias o clases tomando en cuenta
como lmite inferior del primer intervalo o familia el valor mnimo que toma la
variable; en el ejemplo el nmero 2,0. Luego como lmite superior tambin del
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

26

primer intervalo o familia se tendr el lmite inferior ms el valor del ancho de


clase 1, el resultado final ser: 2+1 = 3.
El anterior procedimiento se repite hasta concluir con el ltimo intervalo o clase,
que tendr como lmite superior el valor mximo de la variable, adems los lmites
superiores de cada intervalo se toman como el lmite inferior de la familia o clase
siguiente. Con estos datos estamos en condiciones de estructurar la primera
columna o casilla de la distribucin o tabla de frecuencias. En nuestro ejemplo:
CALIFICACIONES
Xi
2 - 3
3 - 4
4 - 5
5 - 6
6 - 7

PASO N 4: Una vez confeccionado el conjunto de familias o intervalos, se


procede con la tabulacin de los datos, teniendo en cuenta que en cada intervalo
se incluyan los datos comprendidos dentro de cada intervalo, convencionalmente,
los datos que coinciden con el valor del lmite superior de una clase sern tomados
en cuenta en la clase inmediata superior, excepto en el ltimo intervalo. Ejemplo:
CALIFICACIONES
Xi - Xj
2 - 3
3 - 4
4 - 5
5 - 6
6 - 7
SUMA

FRECUENCIA
ABSOLUTA
Ni
/ = 1
/// = 3
//////// = 8
/////// = 7
////// = 6
25

El conteo podr efectuarse bajo cualquier procedimiento conocido o el que mejor


convenga al tabulador.
PASO N 5: Para completar con las casillas o columnas restantes se procede
exactamente igual que con el caso de las variables discretas o nmero pequeo de
observaciones. El resultado en el caso del ejemplo utilizado, nos permite
estructurar la siguiente tabla de frecuencias:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

Xi - Xj
2 - 3
3 - 4
4 - 5
5 - 6
6 - 7
SUMA

ni
1
3
8
7
6
25

27

Ni
1
4
12
19
25
-.-

hi
0,04
0,12
0,32
0,28
0,24
1,00

Hi
0,04
0,16
0,48
0,76
1,00
-.-

El procedimiento convencional que se asumi en los captulos anteriores, respecto


al nmero adecuado de familias o intervalos deba fluctuar entre 5 y 15, pero no
explicamos como establecer o determinar el nmero exacto para cada caso en
particular. A continuacin le presentamos un procedimiento que constituye una
buena aproximacin para nuestro cometido, el mismo se conoce con el nombre de
Regla de Sturges.
REGLA DE STURGES: para determinar el nmero aproximado de clases o
intervalos, se puede utilizar como gua o referencia la Regla de sturges que est
dada por la siguiente frmula:
K = 1 + 3,3 Log n

Donde:
K = Nmero aproximado de intervalos o clases
n = Nmero total de observaciones o muestra
Log = Logaritmo de base 10
Ejemplo: Se tienen las calificaciones de 50 alumnos en una prueba de evaluacin:
40
60
50
60
60

30
50
30
40
50

60
40
20
30
40

20
30
10
20
40

50
20
40
10
30

40
30
50
60
30

10
20
40
40
40

30
70
30
30
10

50
40
60
60
60

70
40
20
30
50

Utilizamos la Regla de Sturges para determinar el nmero K de intervalos o


familias:
K = 1 + 3,3 Log 50
K = 1 + 3,3 x 1,7
K = 1 + 5,61 = 6,61
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

28

El nmero as obtenido es una aproximacin del nmero de intervalos, en


consecuencia en nuestro ejemplo K podra ser o 6 o 7; la decisin final depender
tambin de como se van estructurando los lmites inferior y superior de los
intervalos. En el ejemplo optemos por 6.
Seguidamente definimos el ancho o amplitud de clase: c
c = Ls - Li = 70 - 10 = 10
K
6
Donde: Ls = Limite superior

y Li = Lmite Inferior

Luego se estructuran los lmites o intervalos de la siguiente manera:


Intervalo 1:

Li + c = Ls y as sucesivamente.

Finalmente tenemos:
10
20
30
40
50
60

+
+
+
+
+
+

10
10
10
10
10
10

=
=
=
=
=
=

20
30
40
50
60
60

10
20
30
40
50
60

20
30
40
50
60
70

MARCA DE CLASE O PUNTO MEDIO: Otro concepto importantsimo cuando


trabajamos con distribuciones de frecuencias es el llamado MARCA DE CLASE o
PUNTO MEDIO (xi), que resulta de sumar los extremos de cada intervalo y luego
dividirlos entre 2. En nuestro ejemplo: La Marca de clase del primer intervalo
ser:
10 + 20 = 15
2
Una vez obtenidos los intervalos y las marcas de clase, se procede de la misma
forma que en el ejercicio o ejercicios anteriores, sea:
Xi

Xj
10 - 20
20 - 30
30 - 40

Xi
15
25
35

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

Ni
4
6
11

Ni
4
10
21

hi
0,08
0,12
0,22

Hi
0,08
0,20
0,42

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

40 - 50
50 - 60
60 - 70
SUMA
3.7.

45
55
65
-.-

12
7
10
50

29

33
40
50
-.-

0,24
0,14
0,20
1,00

0,66
0,80
1,00
-.-

REPRESENTACIONES GRAFICAS:

Generalmente, la interpretacin de los datos de una tabla de frecuencias, as


como otros cuadros que contienen informacin en cifras numricas demanda, de
quien lo utilice, tener un conocimiento previo sobre estadstica; esta situacin
puede ser superada, haciendo que dichas informaciones sean representadas en
grficos.
Las representaciones grficas permiten visualizar de manera objetiva la forma en
que se distribuye un conjunto de observaciones; es decir, hace ms simple la
interpretacin.
Traduce hechos numricos a una forma ms concreta y
comprensible.
3.7.1. METODOLOGIA BSICA PARA LA ELABORACIN DE GRAFICOS:
La metodologa bsica para la elaboracin de grficos, contempla las siguientes
etapas:
a) En primer lugar se debe trazar el eje de coordenadas cartesianas y tomar de
ella slo el primer cuadrante, teniendo cuidado de que el eje de las ordenadas
represente las del eje de las abcisas:
y

0
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

30

b) Utilizar escalas adecuadas en base a los criterios siguientes:


- ESTETICA
- SIMETRIA
- PROPORCIONALIDAD ( y = x )
3.7.2. TIPOS DE GRAFICOS:
La elaboracin de grficos implica hacer la siguiente discriminacin: Cuando la
Variable es Discreta y el nmero de observaciones es pequea, tenemos los
siguientes grficos:
a) GRAFICO DE BARRAS:
Los pasos que se desarrollan para confeccionar los grficos son los siguientes:
Se divide el eje de las abcisas con relacin a los distintos valores que toma la
variable (xi).
Se divide el eje de las ordenadas tomando en cuenta el mayor valor que toman
las frecuencias absolutas y distribuirlos proporcionalmente.
Se levantan perpendiculares desde los diferentes puntos que representan los
distintos valores que toma la variable, hasta la altura que representan sus
respectivas frecuencias.
Ejemplo:
TABLA DE FRECUENCIAS DE CALIFICACIONES
DE 25 ALUMNOS
Xi
3
4
5
6
7
SUMA

Ni
1
3
7
8
6
25

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

Ni
1
4
11
19
25
-.-

hi
0,04
0,12
0,28
0,32
0,24
1,00

Hi
0,04
0,16
0,44
0,76
1,00
-.-

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

31

REPRESENTACION GRAFICA:
8
7
6
5
4
3
2
1
0

Colum nas 3D 1

b) GRAFICO DE LAS FRECUENCIAS ABSOLUTAS ACUMULADAS ( Ni ):


Los pasos a seguir para la elaboracin de un grfico son los siguientes:
Una vez trazado el plano y distribuidos las coordenadas, se marcan los puntos
en la interseccin entre los valores de la variable y sus frecuencias acumuladas.
Luego, se traza una lnea paralela al eje de las abcisas, a partir de cada punto
marcado anteriormente, hasta el siguiente punto y as sucesivamente.
Por esttica se deja abierto a los extremos, lo que no altera la informacin
original.
Ni
25
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

32

19
11
4
1
3

Xi

Cuando los datos estn distribuidos en clases o familias, podemos estructurar los
siguientes grficos:

a) HISTOGRAMA DE FRECUENCIAS:
Es una representacin grfica de uso muy frecuente y est formado por
rectngulos contiguos, que tienen como base una longitud igual a la amplitud de
clase o intervalo, con una altura igual al valor de su correspondiente frecuencia
absoluta.
Una vez dividido el cuadrante y los ejes en forma proporcional, se trazan los
rectngulos con una base igual a la longitud de la amplitud de la clase y con una
altura igual a sus frecuencias absolutas (ni ).
REPRESENTACION GRAFICA:
8
7
6
5
4
3
2
1
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

33

B) POLIGONO DE FRECUENCIAS:
Esotro tipo de representacin grfica que tiene una superficie igual al
histograma, pero representada de manera global; permite tener una visin
general del comportamiento de la variable que se analiza.
PASOS:
Se distribuyen proporcionalmente los ejes.
El polgono se obtiene uniendo los puntos medios de cada rectngulo del
histograma en su parte superior. En los extremos se agrega un medio intervalo
para cerrar el polgono.
REPRESENTACION GRAFICA:
8
7
6
5
4
3
2
2

3.7.3. CURVA DE FRECUENCIAS SUAVIZADAS O AJUSTADAS:


Este grfico permite determinar si una distribucin es SIMETRICA O
ASIMETRICA.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

34

Es SIMTRICA cuando el grfico tiene una forma regular, similar a una campana
y es ASIMTRICA cuando se encuentra sesgada a la derecha o a la izquierda.
Para ajustar una distribucin de frecuencias normalmente se siguen los pasos
siguientes:
a) En vez de frecuencias absolutas se toma en cuenta las frecuencias
SUAVIZADAS O AJUSTADAS, que se obtienen con la siguiente frmula.

Fs = Fa + F + Fp
3

Donde:
Fs = Frecuencia Suavizada
Fa = Frecuencia adyacente anterior
F = Frecuencia que se suaviza
Fp = Frecuencia adyacente posterior
EJEMPLO: Tenemos el siguiente cuadro de datos referidos a calificaciones:
CALIFICACIONES
Xi
Xj
2
3
4
5
6

ni
0
1
3
8
7
6
0
25

3
4
5
6
7

SUMA

Xi
1,5
2,5
3,5
4,5
5,5
6,5
7,5
-.-

FRECUENCIAS SUAVIZADAS
Fs
( 0 + 0 + 1) / 3
= 0,33
( 0 + 1 + 3) / 3
= 1,33
(1 + 3 + 8) / 3
= 4,00
( 3 + 8 + 7) / 3
= 6,00
( 8 +7 + 6) / 3
= 7,00
( 7 + 6 + 0) / 3
= 4,33
( 6 + 0 + 0) / 3
= 2,00
= 24,99

EJEMPLO: Para encontrar la Frecuencia Suavizada para el intervalo ( 3 - 4 ):


Fs = 1 + 3 + 8 = 4,00
3
REPRESENTACION GRAFICA:
8
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

35

7
6
5
4
3
2
2

3.8. DIAGRAMA CIRCULAR:


El diagrama circular, ms conocido como TORTA PASTEL, es muy utilizado
cuando la variable o atributo toma pocos valores o caractersticas.
La
informacin se expresa en trminos de porcentaje, que grficamente se
representa como un sector parte del crculo.
ETAPAS PARA LA GRAFICACIN:
a) Se traza una circunferencia de tamao proporcional al espacio destinado a la
graficacin.
b) Se distribuye la superficie entre el nmero de aspectos distintos valores que
toma la variable. Para determinar la superficie cada sector se define los
ngulos en grados, para lo cul se aplica la siguiente frmula:
= Q x 360
100

Donde:
= ngulo correspondiente a cada sector ( Grados)
Q = Porcentaje que representa la frecuencia de cada valor
particular de La variable con relacin a la poblacin total.
360 = Grados que corresponde a una circunferencia.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

36

Ejemplo:
Tenemos datos de alumnos inscritos en una escuelita de Villa Busch con tres
cursos.
CURSO
XI
PRIMERO
SEGUNDO
TERCERO
SUMA

NUMERO DE
ALUMNOS
Ni
20
30
60
110

PORCENTAJE
Q

Q1 = ni x 100 = 20 x 100 = 18,18 = 18,2


n
110
Determinamos ahora los grados:
1 = Q1 x 360 = 65,5
100
2 = Q2 x 360 = 98,3
100
3 = Q3 x 360 = 196,2
100
REPRESENTACION GRAFICA:

196,2

EJERCICIO EN CLASES:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

18,2
27,3
54,5
100,0

GRADOS
PARA CADA
CURSO
65,5
98,3
196,2

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

37

Una encuesta sobre preferencias en el consumo de detergentes de cinco marcas


arroja los siguientes resultados:
MARCAS
ARIEL
ACE
OMO
A PANCHA
TOPAZZ
TOTALES

AMAS DE CASA
30
50
45
25
28
178

Se pide: Graficar la torta.


TEMA N 4: DESCRIPCION DE DATOS
MEDIDAS DE TENDENCIA CENTRAL
COMPETENCIA DE TEMA:

CUANTIFICA E INTERPRETA LA CONCENTRACION DE LOS DATOS


AGRUPADOS Y NO AGRUPADOS, ORGANIZADOS EN UNA TABLA DE
DISTRIBUCION DE FRECUENCIAS, APLICANDO LAS DIFERENTES MEDIDAS
DE TENDENCIA CENTRAL, EN EL AULA

4.1. INTRODUCCION:
En el tema anterior nos planteamos como objetivo desarrollar habilidades para la
recoleccin, clasificacin y presentacin de datos estadsticos; con la resolucin
de muchos ejercicios prcticos y evaluatorios creo firmemente que el mismo ha
sido logrado en forma satisfactoria.
Viene ahora a correlacin una etapa posterior a la presentacin de datos, la
llamada Descripcin de datos, sea que a partir de los datos tabulados y
ordenados el estudiante debe describir los datos as obtenidos. Para ello,
debemos incorporar nuevos conceptos en nuestro instrumental estadstico,
conceptos que nos permitir obtener indicadores o parmetros cuantitativos
sobre una o varias caractersticas de la poblacin y/o muestra estudiada.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

38

En general, las medidas ms usuales en el anlisis estadstico son:


a) MEDIDAS DE POSICIN O LOCALIZACION: En este grupo tenemos:

* Medidas de Tendencia Central:

1) PROMEDIOS: Media Aritmtica, Media


geomtrica, Media Armmica y
Media Cuadrtica.
2) MEDIANA
* La Moda
* Cuantilas o Fractilas

b) MEDIDAS DE DISPERSION O VARIABLIDAD:


* Varianza, Desviacin Tpica, Desviacin Media, Coeficiente de Variacin y Rango.
c) MEDIDAS DE ASIMETRIA Y KURTOSIS
d) MOMENTOS
4.2. MEDIDAS DE TENDENCIA CENTRAL:
Llamadas tambin media o promedio, son medidas de tendencia central que
intentan localizar el centro fsico de la distribucin de los datos. Entre las
medidas de tendencia central ms utilizadas tenemos:
La
La
La
La

media Aritmtica
Media Geomtrica
Media Armnica
Media Cuadrtica

Adems estn:
La Mediana
La Moda
Las cuantilas o fractilas
4.3. LA MEDIA ARITMETICA:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

39

Es una de las medidas de tendencia central de mayor aplicacin en el campo de la


estadstica, y se define como:
LA SUMA DE TODOS LOS VALORES OBSERVADOS, DIVIDIDO ENTRE
EL NMERO DE OBSERVACIONES
Ejemplo: Si;

x1, x2, x3, x4, ........................., xn

son los valores observados

Entonces:
M(x) =

xi
n

Donde:
n es igual al total de las observaciones o tamao de la muestra.
Adems n = N, cuando se refiere a todos los valores de la poblacin.
4.4. LA MEDIA ARITMETICA PARA DATOS NO AGRUPADOS:
Sean:

x1, x2, x3, ..............,xn una muestra de tamao n


=

xi
n

Ejemplo: Se tienen las calificaciones de 10 alumnos: 3,4,5,4,6,5,4,,,6,7, y 3


Calcular la Media Aritmtica de x.
Para ello:

= 3+4+5+4+6+5+4+6+7+3 = 47 = 4,7
10
10

4.5. LA MEDIA ARITMETICA PARA DATOS AGRUPADOS:


En este acpite distinguimos dos situaciones:
a) CUANDO LA VARIABLE ES
OBSERVACIONES ES PEQUEA:

DISCRETA

EL

NUMERO

DE

Cuando la variable es discreta y los datos estn agrupados en una distribucin de


frecuencias o familias, se utiliza la siguiente frmula:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

M(x) =

40

Xi ni
n

Donde:
M(x) =
= Media Aritmtica muestral
ni
= Frecuencia Absoluta
n
= Tamao de la muestra

Ejemplo:
CALIFICACIONES
Xi
3
4
5
6
7
SUMA

FRECUENCIA ABSOLUTA
Ni
1
3
7
8
6
25

Xi ni
3
12
35
48
42
140

Aplicando la frmula tenemos:


M(x) =

= 140 = 5,6
25

b) CUANDO LA VARIABLE ES CONTINUA O CUANDO EL NMERO DE


OBSERVACIONES ES GRANDE:
En este caso los datos estn agrupados en familias o intervalos; entonces el
procedimiento es algo distinto. Ejemplo tenemos las calificaciones de 25 alumnos
que fue abordado en el anterior ejemplo, sin embargo en este caso las
calificaciones estn agrupadas en intervalos o clases.
Para calcular la
, cuando los datos son agrupados, previamente debe
determinarse o calcularse la Marca de Clase o Punto Medio.
CALIFICACIONES DE 25 ALUMNOS
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

Xi
2
3
4
5
6

MARCA DE CLASE
Xi
2,5
3,5
4,5
5,5
6,5
-.-

- Xj
- 3
- 4
- 5
- 6
- 7
SUMA

41

Ni
1
3
8
7
6
25

xi ni
2,5
10,5
36,0
38,5
39,0
126,5

= 126,5 = 5,06 = 5,1


25
Por otro lado, cuando se tienen frecuencias relativas, se utiliza la siguiente
frmula:
M(X) =
= xi hi

M(X) =

EJERCICIO: Calcular la media aritmtica para el ejercicio anterior a partir de la


frecuencia relativa.
4.6. PROPIEDADES DE LA MEDIA ARITMETICA:
PRIMERA: La suma algebraica de un conjunto de datos o nmeros, respecto de
su media aritmtica, es igual a cero .
Si: di = ( Xi di =

( Xi -

Para todo i = 1,2,3,.........,n


) =0

DEMOSTRACION:

( Xi -

) =
=

( Xi )
n
- n

= 0
n

SEGUNDA: la media aritmtica de una constante (K) es igual a la misma


constante.
M(K)= K
DEMOSTRACION:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

M(K) =

Ki

42

= nK = K
n

TERCERA: La media aritmtica de una constante multiplicada por una variable es


igual a la constante multiplicado por la media aritmtica de la variable.
M (KX) = K M (X)
M(KX) = M ( K Xi ) = K M( Xi ) = K M ( X )
n
n
CUARTA: La media aritmtica de dos variables Y e Y es igual a la suma de las
medias aritmticas individuales.
M(X+Y) = M(X) +M(Y)
M(X+Y) =

(Xi + Yi)

Xi
n

Yi
n

M(X+Y) = M(X) + M(Y)


4.7.
MEDIA ARITMETICA PONDERADA: En la vida real, a veces, las
variables estudiadas o analizadas no todos tienen el mismo peso especfico, sino
que tienen una ponderacin distinta, entonces el clculo de la media aritmtica se
obtiene a travs de la siguiente frmula:
M(X)=

M (X) =

= w1.x1 + w2.x2 + w3.x3 + ............... + wn xn


w1 + w2 + w3 + ....... + wn

wxi
wi

Donde: xi = los valores de la variable


wi = La ponderacin que tiene cada valor de la variable
EJEMPLO: Si el examen final de un curso vale ms que un parcial, digamos tres
veces ms, que un parcial y un estudiante tiene calificacin de 85 en el examen
final y 70 y 90 en los dos parciales. Calcular la calificacin media.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

M(X) =

43

wi.xi
wi

M(X) = (1x70) + (1x90) + (3x85) = 415


1 + 1+ 3
5

= 83

En cambio la media comn nos da:


M(X) = 85 + 70 +90 = 81,67
3
4.8. LA MEDIA GLOBAL: Una ventaja que ofrece la media aritmtica es que si
una muestra se particiona en K sub-muestras y se conocen las medias y los
tamaos de cada sub-muestra, se puede determinar la media de toda la muestra
sin necesidad de conocer los datos originales. Esta media as determinada se
llama Media Global o Promedio Global.
MUESTRA
SM1
n1
_
X1

SM2
n2
_
X2

.......

........

SMk
nk
_
Xk

Entonces, la media global estar dada por:


G

ni Xi
n

EJEMPLO: Determinar la media global, para una muestra de tamao 40 que se


particiona en tres sub-muestras de tamaos: 10, 16, 14 con medias: 15,14 y 12,
respectivamente.
n = 40
n1 = 10
n2 = 16
n3 = 14

MEDIAS
X1 = 15
X2 = 14
X3 = 12

= (15+10) + (16x14) + (12x14) = 13,55


40
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

44

EJERCICIOS EN CLASES:
1.- Tres profesores de Estadstica dieron notas medias en sus cursos, con 32, 25
y 17 estudiantes, de 79, 74 y 82 puntos, respectivamente. Hallar la puntuacin
media de los tres cursos.
2.-- El salario medio anual en una empresa es de Bs 15.000. Los de hombre y
mujeres fueron, respectivamente, de Bs 15.600 y 12.600 en media. Hallar el
porcentaje de mujeres empleadas en esa empresa.
4.9. LA MEDIA GEOMETRICA:
La media geomtrica se define como la raz ensima del producto de los n valores
observados:
n ____
G (X) = x1. x2. x3..........xn = v ?xi
a) LA MEDIA GEOMETRICA PARA DATOS NO AGRUPADOS:
Cuando los datos no estn agrupados y son menores que dos, se tiene:
EJEMPLO: Tenemos las calificaciones de 2 alumnos:
x1 = 4
x2 = 7
Hallar la media geomtrica:
G (x) =

vx1 . x2 = v4x7 = v28

G (X) = 5,29
En cambio, la media aritmtica es = M(X) = 4+7 = 5,5
2
En consecuencia: G(x) < M(x)
Ahora bien, cuando el nmero de observaciones
logaritmos para facilitar los clculos.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

es mayor que 2, se aplican

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

45

a) PARA DATOS NO AGRUPADOS: Cuando tenemos datos no agrupados, se


utiliza la siguiente frmula:
Log G(x) = 1
n

Log

Xi

b) PARA DATOS AGRUPADOS EN UNA DISTRIBUCION DE FRECUENCIAS:


Cuando se tienen datos agrupados en una tabla de distribucin de frecuencias, se
incorporan las frecuencias absolutas.
Log G(X) = 1 ni x Log Xi
n
EJEMPLO: Determinar la media geomtrica para la siguiente distribucin de
frecuencias:
Xi
3
4
5
6
7

Log G(X) =

Ni
2
3
2
2
1
10

Log xi
0,4712
0,60206
0,69897
0,77815
0,84510
-.-

ni x Log xi
0,95424
1,80618
1,39794
1,55630
0,84510
6,55976

1 ( 6,55976) = 0,655976
n

Para determinar G(X) necesitamos calcular el Antilogaritmo correspondiente, que


en este caso es igual a:
x
G(X) = 4,53
Antilog= 10
La conclusin importante a la que podemos arribar, es el siguiente:
Que: M(X) > G(X)
USOS DE LA MEDIA GEOMTRICA:

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

46

Se usa el promedio geomtrico cuando los datos observados presentan una


progresin geomtrica de donde deriva su nombre, cuando los datos presentan
razones de cambio o porcentajes.
EJEMPLO: Supngase que la poblacin de cierta ciudad tuvo un incremento de
100.000 a 120.000 habitantes, durante el perodo 1920-1950. Cul es la razn o
ndice promedio por dcada?
SOLUCION: Normalmente hacemos esta operacin: El valor posterior lo
decidimos entre el valor inicial. Esto dar:
120.000 = 20 % = 6,67 % por dcada.
100.000
3
Nos preguntamos ahora Es correcta esta operacin?
No, por que la poblacin
crece a razn compuesta. Entonces, para responder adecuadamente tendremos
que aplicar otra frmula: El razonamiento para la resolucin de este problema es
el siguiente:
SOLUCION: Denotemos el crecimiento medio de cada dcada por ( r ), luego
tendramos:
1
Al finalizar la primera dcada = 100.000 + 1000r = 1000 ( 1 + r )
2
Al finalizar la segunda dcada = 100.000 (1 + r) + 1000(1+r) r = 1000(1+r)
2
2
3
Al finalizar la 3ra dcada = 100.000(1+r) + 100.000(1+r) r = 100.000(1+r)
3
Esta ltima expresin debe dar 120.000. Por tanto, 100.000( 1 + r) =
EJERCICIO DE APLICACION EN CLASES:
1.- Los siguientes datos son las velocidades ( Km/hora) de 30 carros que pasaron
por un punto de control de velocidad:
60
30
38
60
45
10
45
60
49
49
15
82
72
65
Hallar la media geomtrica.

20
30

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

55
55

20
46

40
29

54
38

38
80

35
40

40
28

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

47

Xi - Xj
xi
Ni
Log xi
ni x Log xi
10 - 20
15
2
1,176091
2,352182
20 - 30
25
4
1,397940
5,59176
30 - 40
35
6
1,544068
9,264408
40 - 50
45
8
1,653212
13,225696
50 - 60
55
3
1,740363
5,221089
60 - 70
65
4
1,812913
7,251652
70 - 80
75
3
1,875061
5,251652
SUMA
-.30
-.48,53197
Aplicamos la frmula de la media geomtrica para datos agrupados:

ni x Log xi

G(X) = 1
n

Respuesta:

G(x) = 41,46

2.- Que capital final se tendr al cabo de 6 aos, si se invierten $u$ 1.000 al 8 %
de inters anual?
Calcule a partir de la aplicacin de la media geomtrica.
4.10.-- LA MEDIA ARMONICA: La media Armnica H(x), de una serie de
datos: x1, x2, x3,.........., xn, se define como LA INVERSA DE LA MEDIA
ARITMETICA DE LOS VALORES INVERTIDOS y que corresponden a los datos
observados.
H(X) =

1
1
x1

1
1
xi
n

+ 1 + 1+ .........+ 1
x2
x3
xn
n

1
xi

En general tenemos:
H(x) =

n
1
xi

EJEMPLO:

Si

x1 = 4
x2 = 7

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

n=2

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

H(x) =

2
1 + 1
4
7

. = .

G(X) = 5,29

sea:

2
7+4
28

48

. = 56 = 5,09
11

M(X) = 5,5

H(X) = 5,09

M(X) > G(X) > H(X)

b) LA MEDIA ARMNICA PARA DATOS AGRUPADOS: Cuando los datos


estn agrupados en una distribucin de frecuencias, la frmula para calcular la
media armnica es el siguiente:
H(X) = .

n
ni
xi

EJEMPLO: se tiene la siguiente distribucin de frecuencias:


Xi

Ni

3
4
5
6
7
?

2
3
2
2
1
10

ni
xi
0,67
0,75
0,40
0,33
0,14
2,29

xi ni

Log xi

ni Log xi

6
12
10
12
7
47

0,47712
0,60206
0,69897
0,77815
0,84510
-.-

0,95424
0,80618
1,39794
1,5563
0,8451
6,55976

H(X) = 4,37
M(X) = 4,7
G(X) = 4,53
Entonces corroboramos que:

M(X) > G(X) > H(X)

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

49

La relacin anterior se explica, por que la M(X) es la ms afectada por los valores
extremos o pronunciados, que la media geomtrica (G(X) y la Media Armnica
H(X). Si bien, estas ltimas G(X) y H(X) son tambin afectadas por los valores
extremos, el uso del producto y la raz en el caso de la G(X) y el inverso en el caso
de la H(X), amortiguan de algn modo la incidencia de los valores extremos.
APLICACIONES DE LA MEDIA ARMONICA: La Media Armnica H(X) es til
para promediar razones al igual que la media geomtrica G(X). En el caso en que
se trata de:
a) Promediar velocidades
b) Promediar rendimientos laborales
EJEMPLO: Una fbrica de muebles de madera ha asignado a cinco de sus
trabajadores para completar una orden de 200 sillas de un cierto tipo. Las
razones de productividad de los cinco trabajadores estn dadas por la siguiente
relacin.
TRABAJADOR
RENDIMIENTO/OBERO
A
5
HRS/SILLA
B
8

C
6

D
12

E
4

Hallar el rendimiento promedio de los trabajadores.


M(X) = 5 + 8 + 6+ 12 +4 =
5
G(X) = Log G(X) =

H(X) = .

35
5

= 7 sillas/hora

Log xi
n

5
1 + 1 + 1 + 1 + 1
5
8
6
12
4

. = .

5
. = 6,06
0,825

SUPUESTO: Todos los trabajadores ha laborado el mismo nmero de horas.


ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

50

4.11. LA MEDIA CUADRATICA.


DEFINICION: La Media Cuadrtica de n valores se define como la raz cuadrada
de la media aritmtica de los cuadrados de las observaciones.
a) PARA DATOS SIN AGRUPAR:
2
Mc (X) =

xi

n
b) PARA DATOS AGRUPADOS:

Mc (X) =

2
xi . ni
n

EJEMPLO: Se tiene los siguientes datos


5, 8, 6, 12, 4
Mc (X) =

5 + 8 + 6 + 12 + 4 =
285 = 7,54
5
5
La aplicacin de la Media Cuadrtica MC (X) se ver en los prximos captulos, en
el tratamiento de las medidas de dispersin.
EJERCICIO DE APLICACION EN CLASES DE LA MEDIA ARMONICA: Una
Cia. de compra-venta de terrenos ofrece en venta 400 metros cuadrados de
terreno desrtico a 0,5 dlares cada metro cuadrado, 1000 metros cuadrados de
terreno cultivable a 10 dlares cada metro cuadrado y 500 metros cuadrados de
terreno urbanizado a 400 dlares cada metro cuadrado. Se pide calcular el precio
promedio por metro cuadrado de los terrenos ofertados. Calcule la media
armnica y la media aritmtica y luego compare los resultados.
Como usted explica las diferencias entre ambos resultados? Cul es la medida o
promedio ms acertado? Explique por que.
4.12. LA MEDIANA:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

51

ALGUNAS CONSIDERACIONES PREVIAS: Se ha podido apreciar que las


medidas anteriores estn influenciadas, en mayor o menor grado, por los valores
extremos, entonces cuando esto acontece la media aritmtica y otras medidas
estudiadas no constituyen un indicador adecuado.
EJEMPLO: Si un obrero produce diariamente 4 sillas de lunes a jueves, pero el da
viernes por una dolencia apenas produce 1 silla, entonces su rendimiento promedio
desciende considerablemente. Una forma de evitar la influencia perniciosa de los
valores extremos, cundo se calcula un promedio, es utilizando la medida
alternativa, que viene a ser la MEDIANA.
LA MEDIANA- DEFINICIN
La mediana (Me) es un valor de las observaciones que divide en dos partes iguales
el nmero total de observaciones cuando stos estn ordenados de acuerdo a sus
valores.
a) LA MEDIANA PARA DATOS SIN AGRUPAR:
Para calcular la mediana cuando los datos no estn agrupados, se sigue el
procedimiento siguiente:
EJEMPLO 1: Tenemos los siguientes valores.
4, 5, 8, 2, 7, 2, 3
Que valor es la Mediana ?
1) Previamente se ordenan los datos en forma correlativa:
2, 2, 3, 4, 5, 7, 8
2) Se elige el valor que divide exactamente en dos partes iguales la informacin:
Entonces la Mediana = Me = 4
EJEMPLO 2: Tenemos las siguientes observaciones:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

52

3, 4, 6, 7, 7, 8
Cul es la Mediana ?
En este caso dos valores se ubican fsicamente en el medio 6 y7. Cuando ello
acontece, se toman ambos valores y se promedia entre dos para hallar la mediana:
Me = 6+7 = 6,5 llega a ser la mediana.
2
La caracterstica tpica de la Mediana es que divide al conjunto de las
observaciones exactamente en dos partes iguales.
50 %
50 %
______________________x__________________________
Que viene a ser el punto de equilibrio que balancea el nmero de observaciones de
la serie estadstica.
b)
LA MEDIANA PARA DATOS AGRUPADOS: Cuando la mediana est
representada en una distribucin de frecuencias, es posible distinguir dos
situaciones:
b.1. CUANDO LA CLASE ES UNICA Y DISCRETA: Cuando ello acontece, es
preciso seguir los siguientes pasos:
1 SE DEBE CALCULAR LA FRECUENCIA ABSOLUTA ACUMULADA Ni
2 SE CALCULA EL VALOR DE n/2
GRAFICAMENTE TENEMOS:
Ni

Nj

n/2
N j-1

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

X j-1

53

Xj

Xi

3 SE APLICAN LAS SIGUIENTES REGLAS:


a)

Si: n > N
2
j-1

Mediana = Me = X
j
X

b) Si: n = N
2
j-1

Mediana =

+ X
j-1
j
2

EJEMPLO:
Se tienen las calificaciones de 50 alumnos distribuidos de acuerdo a la siguiente
distribucin de frecuencias:
CALIFICAC
IONES
Xi

FRECUENCIA
ABSOLUTA
Ni

10
20
30
40
50
60
70
?

4
6
11
12
8
7
2
50

Calculamos n/2 = 50/2 = 25


Entonces:

Como n/2 > N


= Me = X
j-1
j

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

FREC.
ABSOLUTA
ACUMULADA
Ni
4
10
21
33
41
48
50
-.-

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

54

sea: Me = 40
b.2. CUANDO SE TIENEN INTERVALOS DE CLASE:
Cuando se tienen intervalos de clase, se aplican los siguientes pasos:
Paso N 1.Se calcula n/2
Paso N 2.Se ubica n/2 entre las frecuencias absolutas Acumuladas Ni
Paso N 3.Se identifica la CLASE MEDIANA
Si n/2 est o se ubica en un punto intermedio, la clase mediana ser la que
corresponde a la frecuencia Absoluta Acumulada Inmediata Superior.
En cambio, si n/2 coincide con un punto de las Frecuencias Absolutas acumuladas,
la Clase Mediana ser la que corresponde a este punto.
Paso N 4:

Luego se desarrolla una de las siguientes frmulas:


X

a) Si: n/2 > N

Me =

+
j-1

j-1

b) Si:

n/2

N
j-1

GRAFICAMENTE TENEMOS:
Ni

Nj

n/2
N j-1

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

Me = X
j-1

c
j

n/2 - N
j-1
N - N
j
j-1

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

55

c
X j-1

cj

Xj

Xi

EJERCICIO:
CALIFICACIONES
Xj-1 - Xj

Ni

Ni

2 - 3

3 - 4

4 - 5

12

5 - 6

14

6 - 7

25

SUMA

25

-.-

n/2 = 25/2 = 12,5


En este caso:
n/2 > N
j-1

Me = X
+ c
j-1

n/2 - N
j-1
N - N
j
j-1

Remplazando datos tenemos:

Me = 5 + 1

Entonces:

12,5
19

- 12 =
- 12

5 +

0,5
7

Me = 5,1

EJERCICIO PARA RESOLVER EN CLASES:


ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

= 5,07

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

56

Se tiene la siguiente distribucin de frecuencias correspondiente a los salarios


semanales de 100 obreros.

INGRESOS
Xj - 1 - Xj

N DE
OBREROS
ni
4
5
10
9
13
15
18
12
8
6
100

280 - 295
295 - 310
310 - 325
325 - 340
340 - 365
365 - 370
370 - 385
385 - 400
400 - 415
415 - 430
SUMA

Ni
4
9
19
28
41
56
74
86
94
100
-.-

Calcular la mediana:
n/2 = 100/2 = 50
Entonces:

Xj - 1 +

Me = 15 + 50 - 41
56 - 41

cj

n/2 - Nj - 1
Nj - Nj - 1

= 364

4.13. CUANTILAS O FRACTILAS


A.- INTRODUCCION: En forma similar a la definicin de Mediana, pueden
derivarse otros estadgrafos llamados genricamente: CUANTILAS O
FRACTILAS, que cumplen con la condicin de superar a no ms de un cierto
porcentaje de las observaciones y de ser superado simultneamente por no ms
del porcentaje complementario de las observaciones. Entre estos tenemos:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

57

Los cuartiles
Los deciles
Los percentiles

CUANTILAS O FRACTILAS

B.- CUARTILES:
Como su nombre lo indica, divide en cuatro partes iguales al conjunto de las
observaciones:
0
1Q
2Q
3Q
4Q

Por lo tanto, existen tres cuartiles que responden a las siguientes definiciones:
B.1. LOS CUARTILES PARA DATOS SIN AGRUPAR:
Los pasos para determinar los cuartiles
agrupar, constan de las siguientes etapas:

cuando los datos se presentan sin

1 Paso: Se ordenan los datos en forma correlativa y ascendente.


2 Paso: Se determina el cuartil j-simo, que viene a ser el valor del dato que
ocupa la posicin , para ello recurrimos a la siguiente relacin:
(j/4)(n+1)
EJEMPLO: Dado el siguiente conjunto de datos: 15, 13, 2, 4, 10
Calcular los tres cuartiles.
SOLUCION.Primero ordenamos los datos:
2

x1
PRIMER CUARTIL:

13

15

19

x2

x3

x4

x5

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

58

Para el primer cuartil tenemos los siguientes datos: j = 1

n=5

( 1 / 4 ) ( 5 + 1 ) = 1,5 valor que no es un entero, por lo tanto el primer


cuartil estar entre las observaciones x1 y x2. Para ello efectuamos la
siguiente operacin:
2
4
13
15
19

x1

Posicin:

x2

Q1

x3

Q2

x4

x5

Q3

posicin n+1

Me
Para calcular el 1er cuartil extrapolamos las proporciones:
Q1 - x1 = 0,5
x2 - x1
1
Remplazamos datos:

Q1 = x1 + (x2 + x1) (0,5)

= 2 + ( 4 - 2 ) ( 0,5 ) = 3

Entonces el primer cuartil es igual a 3


SEGUNDO CUARTIL:
El 2o cuartil es igual a la mediana, y se calcula de la siguiente manera:
j=2
n= 5
Q2 = Me =
Cuartel.

(2/4) + ( 5 + 1) = 2/4 . 6 = 3 , Osea x3 viene a ser el 2do

Entonces Q2 = x3 = 13
TERCER QUARTIL.- Para calcular el 3er cuartil tenemos:
j=3

n=5

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

( 3/4) (5+1) = 3/4.6= 4,5


est entre x4 y x5
Para ello extrapolamos:

Despejamos Q3:
Q3

59

Que no es un valor entero, entonces el 3er cuartil

Q3 - x4 = 0,5
x5 - x4
1

Q3 - x4 = (0,5) ( x5 - x4 )
Q3
Q3
Q3
Q3
Q3

=
=
=
=
=

x4 + 0,5 . x5 - 0,5 . x4
15 + (0,5) (19) - (0,5) ( 15)
15 + 0,5 ( 19 - 15)
15 + 2
17

B.2. LOS CUARTILES PARA DATOS AGRUPADOS: Cuando los datos estn
distribuidos en una tabla de distribucin de frecuencias, el procedimiento que se
sigue para determinar los cuartiles es similar al utilizado para calcular la mediana
para datos agrupados, sea:
1 .2 .3 .4 .5 .-

Se calculan las Frecuencias Absolutas Acumuladas


Se calcula n/4 ( Q1 = ; Q2 = 2/4 = = Me ; Q3 = )
Se ubica n/4 entre las frecuencias absolutas acumuladas Ni
Se determina la clase del cuartil
Se aplica la siguiente regla:

PRIMER CUARTIL:
Para el primer cuartil Q1 =

Q1/4 = Xj -1 + c

Osea; n/4 =
n/4 - Nj - 1
Nj - Nj - 1

EJEMPLO:
Se tienen los siguientes datos, organizados en una tabla de distribucin de
frecuencias:
Xj-1 - Xj
Ni
Ni
2 - 3
1
1
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

3 - 4
4 - 5
5 - 6
6 - 7
SUMA

60

2
8
7
6
25

4
12
19
25
-.-

n/4 = 6,25
Remplazamos Datos:
Q1/4 = 4 + 1

6,25 - 4
12 - 4

= 4 + 0,28

Q1/4 = 4,28
SEGUNDO CUARTIL:
El segundo cuartil o cuartil medio coincide exactamente con la Mediana, para lo
cual se utiliza el mismo procedimiento de la mediana.
Q2/4 = Q = Me
TERCER CUARTIL:
El Tercer Cuartil ( Q 3/4) o cuartil superior es un valor que supera a no ms del
75 % de las observaciones y es superado por no ms del 25 % de las mismas.
3n/4 = Q3
Q3/4 = Xj-1 + c

3n/4 - Nj-1
Nj - Nj-1

EJEMPLO: Calculamos el Q3 para el ejercicio anterior:


Xj-1
2
3
4

- Xj
- 3
- 4
- 5

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

Ni
1
3
8

Ni
1
4
12

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

61

5 - 6
6 - 7
SUMA

7
6
25

19
25
-.-

Q3/4 = 3n/4 = 3 x 25 = 18,75


4
Q3/4 = 5 +
18,75 - 12 = 5 + 0,96 = 5,96
19 - 12
Q3/4 = 5,96
4.14.
LOS DECILES: Los deciles dividen en 10 partes iguales al conjunto de
las observaciones. Por lo tanto, existen los siguientes deciles:
PRIMER DECIL :
SEGUNDO DECIL:
TERCER DECIL :
.
.
NOVENO DECIL: :

P 1/10
P 2/10
P 3/10

P 9/10

El 5to. decil coincide con la Me


El procedimiento tanto para datos sin agrupar y agrupados es axactamente el
mismo que se aplica a los cuartiles.
4.15.
LOS PERCENTILES: El uso de los percentiles o centiles solo es
justificable cuando existen tantos numerosos valores de la variable, como una
frecuencia total bastante alta. Los percentiles dividen en 100 partes iguales el
nmero de observaciones.
PRIMER CENTIL
SEGUNDO CENTIL
TERCER CENTIL
CUARTO CENTIL
.

:
:
:
:

P 1/100
P 2/100
P 3/100
P 4/100

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

62

.
.
NOVENTA Y NUEVE CENTIL : P 99/100
El procedimiento al igual, que en el caso anterior es el mismo.
EJERCICIOS EN CLASES:
Sea el siguiente conjunto de datos:
3, 10, 0, 9 8, 4, 4, 3, 10, 15, 20, 18
Calcular: Decil 2, Decil 9, Percentil 50, Percentil 80
SOLUCION:
Ordenamos los datos:
0

10

10

15

18

20

x1

x2

x3

x4

x5

x6

x7

x8

x9

x10

x11

x12

DECIL 2:
j=2

n = 12

D2 = (2/10)(12+1) = 2,6
D2 =

Entonces: D2 estar entre x2 y x3

D2 - x2 = 0,6
x3 - x2
1

D2 - x2 = 0,6 ( x3 - x2)
D2 = x2 + 0,6 (x3 - x2)
D2 = 3 + 0 = 3
DECIL 9:
J=9

n = 12

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

63

(9/10)(13) = 11,7 Entonces el decil 9 estar entre x11 y x12


D9 = x11 + (x12 - x11) 0,7
D9 = 19,4
PERCENTIL 50: j = 50

n = 13

(50/100)(13) = 6,5 Entonces P50 estar entre x6 y x7


P50 = x6 + ( x7 - x6 ) 0,5 = 8,5
PERCENTIL 80:
j =80

n = 13

P80 = (80/100) (13) = 10,4 Entonces P80 estar entre x10 y x11
P80 = x10 + ( x11 - x10 ) 0,4 = 16,2
4.16.

LA MODA

DEFINICION: La Moda llamada tambin: MODO, MODO PROMEDIO, VALOR


TIPICO o VALOR MODAL ( Mo), es una medida de tendencia central, que viene a
constituir el valor ms frecuente de una serie de datos; sea el que ms veces se
repite.
a) LA MODA PARA DATOS NO AGRUPADOS:
Para determinar la Moda de un conjunto de datos sin agrupar, previamente se
ordenan los mismos en forma ascendente o descendente, respetando la
correlatividad de los mismos.
EJEMPLO:
1)

2, 2, 5, 7, 9, 9, 9, 9, 11, 12 En este primer ejemplo el valor que ms


frecuentemente se repite es el 9, Entonces la Mo = 9

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

2)

3, 5, 8, 10, 12, 15, 16

64

En este ejemplo, podemos decir que no existe


MODA

3) 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9
En este tercer ejemplo, dos son los valores
que se repiten ms veces : 4 y 7, Entonces existen 2 modas.
Cuando un conjunto de datos presentan dos modas, se dice que es BIMODAL; si
son ms de dos modas se llama MULTIMODAL.
b) LA MODA PARA DATOS AGRUPADOS:
Cuando los datos estn expresados en una tabla de distribucin de frecuencias,
es posible diferenciar dos situaciones:
b.1. CUANDO LA CLASE ES UNICA:
Cuando la clase es nica y discreta, entonces la MODA es la frecuencia que ms
veces se repite.
EJEMPLO:
Xi
3
4
5
6
7
SUMA

ni
2
3
2
2
1
10

En el presente ejemplo, la frecuencia que ms veces se repite es el 4; sea este


valor se repite tres veces.

La moda = Mo = 4

b.2. LA MODA PARA INTERVALOS DE CLASE:


Cuando se tiene intervalos de clase, la MODA se determina por interpolacin;
sea:

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

Mo = X j-1 +

Donde: X j-1
d1
d2
c

65

. d1 .
d1 + d2

= Lmite inferior de la clase modal, sea el intervalo que tiene


Mayor frecuencia.
= Diferencia entre la frecuencia de la clase modal y la frecuencia
pre-modal.
=
Diferencia entre la frecuancia de la clase modal y la frecuencia
de la clase post-modal.
=
Tamao del intervalo de la clase modal.

GRAFICAMENTE TENEMOS:
Ni
Clase modal
d2
d1

X j-1

Xj

Xi

Me
PROCEDIMIENTO PARA DETERMINAR LA MODA PARA INTERVALOS DE
CLASE: Cuando los datos estn distribuidos en una tabla de frecuencias, para
calcular la Moda se procede de la siguiente manera:
PASO 1: Se identifica el mayor valor entre las frecuencias absolutas.
PASO 2: Se determina la clase modal, que ser aquel intervalo que tiene la mayor
frecuencia absoluta.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

66

PASO 3: Luego, se determinan los datos que sern utilizados para aplicar la
frmula:

EJEMPLO:
X j-1 - Xj
2 - 3
3 - 4
4 - 5
5 - 6
6 - 7
SUMA

Mo = X j-1 + c

Donde:
X j-1
c
d1
d2

ni
1
3
8
7
6
25

d1
.
d1 + d2

=
4
=
1
= 8-3=5
= 8-7=1

Mo = 4 + 5 = 4 + 0,83 = 4,83
6
Mo = 4,83
Mo = 4,8
ALGUNAS CARACTERISTICAS MS RELEVANTES DE LA MODA:
1. La Moda le sigue en importancia a la media y a la mediana, su uso se hace
imperativo cuando los datos son de tipo CUALITATIVO.
Su fcil
interpretacin y su clculo sencillo hacen de la moda una medida de tendencia
central ms usual y prctico. De esta manera, un fabricante de muebles puede
estar interesado en saber que tipo de muebles se venden ms; esta medida
estar representada por la Moda.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

67

2. No es una medida nica como la media y la mediana. Un conjunto de datos


puede tener ms de una moda.
3. El clculo de la Moda es independiente de la magnitud de las observaciones.
Como tal, puede permanecer igual variando los valores o incrementando el
4. nmero de ellas.
RELACIONES ENTRE LA MEDIA, MEDIANA Y LA MODA:
En una distribucin UNIMODAL, si la distribucin es simtrica, entonces la
Media, la mediana y la Moda son iguales. En cambio cuando la distribucin es casi
simtrica, la Mediana se localiza aproximadamente a un tercio de la distancia
entre la Media y la Moda. La frmula que describe esta relacin es la siguiente:
Moda = Media - 3 ( Media - Mediana)
EJERCICIO EN CLASES: Calcular la Moda para los salarios semanales de 100
obreros, que trabajan en distintas empresas constructoras de viviendas:
INGRESOS
280 - 295
295 - 310
310 - 325
325 - 340
340 - 355
355 - 370
370 - 385
385 - 400
400 - 415
415 - 430
SUMA

N DE OBREROS
4
5
10
9
13
15
18
12
8
6
100

Me = 364
Mo = 375
M(x) = 360,85
Mo ( aproximado) = 370,30
Asimismo, calcular la Moda utilizando la relacin Moda = Media - 3 ( Media Mediana )
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

68

TEMA N 5
MEDIDAS DE DISPERSION Y VARIABILIDAD
COMPETENCIA DE TEMA:

CUANTIFICA E INTERPRETA LOS INDICADORES DE DISPERSION DE


DATOS AGRUPADOS Y NO AGRUPADOS, ORGANIZADOS EN UNA TABLA
DE FRECUENCIAS, A PARTIR DE LAS DIFERENTES MEDIDAS DE
DISPERSION EXISTENTES, MEDIANTE LA RESOLUCION DE EJERCICIOS Y
TRABAJOS PRACTICOS Y LA EJECUCION DEL PROYECTOS DE CURSO, EN
EL AULA Y LA COMUNIDAD

5.1.
DEFINICIN.- Las medidas de dispersin o variabilidad, a las que
convencionalmente llamaremos indicadores estadsticos de dispersin, miden el
grado de dispersin o concentracin de los datos estadsticos en torno a un valor
de medida de tendencia central previamente seleccionado.
Esta medida es particularmente importante por que permite corroborar o
desestimar una medida de tendencia central como indicador adecuado de la
representatividad de un conjunto de datos, en consecuencia, cuando los
indicadores de dispersin reflejan una alta variabilidad o dispersin la media
aritmtica no suele ser una medida adecuada para medir el grado de
representatividad de los mismos, al contrario una baja dispersin hace que la
media aritmtica se constituya en una medida eficaz para medir el grado de
concentracin de los datos estadsticos.
EJEMPLO:
1. Una baja dispersin de los salarios mensuales de un grupo de trabajadores
indica que los salarios son aproximadamente iguales.
2. En cambio, una alta dispersin indica que los salarios son muy diferentes.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

69

Por otro lado, estas medidas de dispersin son utilizadas para complementar una
medida de tendencia central, como por ejemplo la Media, y tambin para
comparar una informacin con otra.
Como regla general, se puede sealar:
- CUANDO LA DISPERSIN ES BAJA,
ALTAMENTE SIGNIFICATIVO.

ENTONCES EL VALOR PROMEDIO ES

- CUANDO LA DISPERSIN ES ALTA, LA MEDIA ES POCO REPRESENTATIVA.

EJEMPLO: Se tienen las calificaciones del 1 al 10 en dos cursos diferentes:


4, 2, 9
3, 6, 6

=5

Hay mayor dispersin.

= 5

Son menos dispersos.

Que conclusiones importantes podemos extraer de esta informacin ?

a) Que en ambos cursos se tuvo igual aprovechamiento en promedio.


b) Que probablemente se utiliz igual metodologa.
c) Que los profesores tienen igual experiencia, sea las condiciones en ambos
cursos son las mismas.
Por eso es importante contar con otras medidas complementarias que nos
permitan salir de esta disyuntiva, en particular en situaciones como el presente
las medidas de dispersin suelen jugar un papel importantsimo para dirimir la
disyuntiva.
5.2.
CLASIFICACIN
VARIABILIDAD:

DE

LAS

Las medidas ms comnmente usadas son:


1.
2.
3.
4.
5.

El Recorrido = R
La desviacin Media = DM
La varianza = V(x)
La Desviacin Estndar o Tpica =
El Coeficiente de Variacin = CV

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

MEDIDAS

DE

DISPERSIN

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

70

5.2.1 EL RECORRIDO:
El Recorrido o rango es la medida ms simple de dispersin y est dada por la
diferencia entre el mayor y menor valor de las observaciones.
sea:
R = X mximo - X mnimo

Donde:

R = Recorrido
X max = Valor mximo observado
X min. = Valor mnimo observado

Ejemplo:
Si:

X mximo = 430
X mnimo = 280

Entonces el recorrido ser igual a: R = 430 - 280 = 150


Sin embargo, como esta medida no contempla todos los valores contemplados
entre el valor mximo y el mnimo, se dice que no es un indicador de dispersin
muy relevante.
EJEMPLO DE APLICACIN:
Se tienen los siguientes datos de salario medio en 2 fabricas:
FABRICA A

FABRICA B

a = 50
Ra = 20 - 65 = 45

b = 50
Rb = 35 - 65 = 30

Entonces, podemos sealar a partir del anlisis del recorrido que la media de B
es ms representativa que la media de A, sea hay mayor dispersin en la
fbrica A.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

71

5.2.2. LA DESVIACIN MEDIA


DEFINICION.- La Desviacin Media ( DM ) es la media aritmtica de los
desvos de los valores individuales observados, con respecto al promedio de los
mismos.

DM
Me

Sin embargo, los ms usual es con


respecto a la Media Aritmtica.

Pero se sabe, por la primera propiedad de la sumatoria de los desvos respecto a


la media aritmtica es igual a cero, por esta razn es que se utilizan los desvos
en su valor absoluto.
DM = M ( / d / ) = | Xi n

LA DESVIACIN MEDIA PARA DATOS SIN AGRUPAR:


La frmula para calcular la desviacin media para datos sin agrupar est dada
por:
DM = | Xi |
n
LA DESVIACIN MEDIA PARA DATOS AGRUPADOS:
DM = | Xi n

| ni

EJEMPLO DE APLICACIN:
a) Se tiene el conjunto de calificaciones de 10 alumnos en una prueba de
Estadstica:
3, 4, 5, 4, 6, 5, 4, 6, 7, 3
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

72

Calcular la desviacin Media para datos sin agrupar.


Xi

|Xi -

Xi - 1,7
- 0,7
0,3
- 0,7
1,3
0,3
- 0,7
1,3
2,3
- 1,7
0

3
4
5
4
6
5
4
6
7
3
SUMA

1,7
0,7
0,3
0,7
1,3
0,3
0,7
1,3
2,3
1,7
11

= 47 = 4,7
10
Entonces, La DM = 11 = 1,1
10
a) Sea la informacin expresada en la siguiente tabla de distribucin de
frecuencias:
Xi
3
4
5
6
7
SUMA

ni
2
3
2
2
1
10

Calcular la Desviacin Media DM:


SOLUCIN:
Utilizamos la frmula de la DM para datos agrupados y calculamos previamente |
Xi | y luego multiplicar la relacin por la frecuencia absoluta ni.

Xi

ni

Xi . ni

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

|Xi -

|Xi -

|. ni

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

3
4
5
6
7
SUMA

2
3
2
2
1
10

6
12
10
12
7
47

= 47 = 4,7
10

73

1,7
0,7
0,3
1,3
2,3
-.-

3,4
2,1
0,6
2,6
2,3
11

DM = 11 = 1,1
10

LIMITACIONES DE LA DESVIACION MEDIA:


Si bien la desviacin media como medida de dispersin toma en cuenta todos los
valores observados, la misma es poco frgil debido a que ignora el signo de los
desvos, lo que hace que se tenga que recurrir a otra medida alternativa.
EJERCICIO EN CLASES:
Hallar la desviacin media para la siguiente distribucin de frecuencias:
INGRESOS
280 - 295
295 - 310
310 - 325
325 - 340
340 - 355
355 - 370
370 - 385
385 - 400
400 - 415
415 - 430
SUMA

N DE OBREROS
4
5
10
9
13
15
18
12
8
6
100

5.2.3. LA VARIANZA Y LA DESVIACIN STANDAR

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

74

DEFINICIN.- La Varianza y la Desviacin Estndar son las medidas de


dispersin ms utilizadas en la estadstica y entre todas, se trata de medidas de
variabilidad cuyos valores indican si los datos estn bastante concentrados o
dispersos con respecto a su media. Los simbolizaremos por:
2
Varianza : V(x) =
Desviacin Standar : DS =
Se denomina Varianza a la media aritmtica de los cuadrados de las desviaciones
respecto a la Media Aritmtica de dichas distribuciones.
Se denomina Desviacin Standar Desviacin Tpica a la raz cuadrada de la
Varianza.
Cuanto mayor sea la magnitud de la varianza los datos estn ms dispersos o
diseminados con respecto de la media y cuanto menor sea la varianza los datos
estarn ms concentrados al rededor de la media.
a)
LA VARIANZA Y LA DESVIACIN STANDAR PARA DATOS SIN
AGRUPAR:
2

V(x) = S = = ( Xi n
_____
DS = S = = V(x)
b)
LA VARIANZA
AGRUPADOS:

LA

) = M ( Xi -

DESVIACION

STANDAR

PARA

DATOS

Las formulas que determinan la Varianza y la desviacin Standar para datos


agrupados son:
2

= V(x) = ( Xi n

_____
S = = V(x)
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

). ni

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

75

EJEMPLO: Del conjunto de calificaciones de 10 alumnos: 3,4,5,4,6,5,4,6,7,3.


Calcular la varianza para datos agrupados y para datos sin agrupar.
PARA DATOS SIN AGRUPAR:

Xi
3
4
5
4
6
5
4
6
7
3
SUMA

( Xi )
2,89
0,49
0,09
0,49
1,69
0,09
0,49
1,69
5,29
2,89
16,1

= 47 = 4,7
10
2
V(x) = ( Xi 10

) = 16,1 = 1,61
10

PARA DATOS AGRUPADOS:

Xi
3
4
5
6
7
SUMA

ni
2
3
2
2
1
10

Xi . ni
6
12
10
12
7
47

= Xi . ni = 47 = 4,7
n
10
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

( Xi 2,89
0,49
0,09
1,69
5,29
-.-

2
(Xi - ) ni
5,78
1,47
0,18
3,38
5,29
16,1

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

2
V(x) = S = ( Xi n
_____
DS = S = 1,61 =

76

2
).ni = 16,1 = 1,61
10

PROPIEDADES DE LA VARIANZA:
A continuacin se mencionan las propiedades ms importantes de la varianza que
obviamente implican las propiedades de la Desviacin Standar.

Propiedad N 1.- Para un conjunto de datos observados:


x1, x2, x3, ................, xn
V(x) > 0
DEMOSTRACIN:
2
Por definicin sabemos que la M (d) = 0, pero si elevamos al cuadrado M(d)
Entonces:
2
(Xi - ) > 0 Cualquiera sea el valor de di
2
M(d ) > 0
Propiedad N 2.-entonces:

Si todos los valores de Xi son iguales a una constante k,

V(k) = 0
DEMOSTRACION: Por definicin sabemos que:
2
V ( k ) = M k - M( k )
Pero como M ( k ) = k
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

77

Entonces: V (k ) = M ( k - k ) = M(0) = 0
PROPIEDAD N 3.- Si k es una constante cualquiera, entonces:
V ( X + k ) = V (x)
DEMOSTRACION:
2
V ( X+k) = M[ (x+k) - M ( x+k)
2
V(X+K) = M

(X+K) - M(X) - M(K)


2
X(X+K) = M ( X+K-M(X) - K )
2
V(X+K) = M ( X - M(X) = V(X)
PROPIEDAD N 4.- Sea K una constante cualquiera, entonces:
2
V(K.X) = K . V(X)
DEMOSTRACION:
2

V(X.K) = M [KX - M(KX)


= M[XK - KM(X)
2
Sacamos fsctor comun K
2
2
2
2
M [ K ( X - M(X) = M [ K ( X - M(X)
2
2
V(K.X) = K M [ X - M(X)
VK.X) = K V(X)
PROPIEDAD N 5.2
V(X) = M(X)

2
- [ M(X)

DEMOSTRACION: Por definicin tenemos:


2
2
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

78

V(X) = M( X ) - [ M(X)
DEMOSTRACIN: Por definicin de Varianza sabemos que:
2

V(x) = (Xi -

) = [Xi - 2Xi .
n
n

+ ( )

2
V(x) = Xi
n

2
- 2

. Xi +

2
2
V(x) = M( X ) - [ M(x)
Esta ltima propiedad es muy til para fines prcticos, la gran ventaja radica en
que no es necesario el clculo de los desvos. Entonces alternativamente se puede
usar las frmulas siguientes:
PARA DATOS SIN AGRUPAR:
2
2
V(x) = Xi - [Xi
n
n
PARA DATOS AGRUPADOS:
2
2
V(x) =
Xi . ni - [ Xi . ni
n
n
EJERCICIO: Calcular la Varianza utilizando el mtodo abreviado, para la
siguiente distribucin de frecuencias:
2

Xi

Ni

Xi . ni

Xi

3
4
5
6

2
3
2
2

6
12
10
12

9
16
25
36

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

2
Xi . ni
18
48
50
72

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

7
SUMA

1
10

7
47

79

49
135

49
237

= Xi . ni = 47 = 4,7
n
10
Xi . ni = 237 = 23,7
n
10
2
2
V(X) = M ( X ) - [ M(X)
2
V(X) = 23,7 - ( 4,7 ) = 23,7 - 22,09
V(X) = 1,61

5.3. EL COEFICIENTE DE VARIACION


Las medidas de variabilidad absolutas, llmese: RANGO, DESVIACIN MEDIA,
VARIANZA Y LA DESVIACION STANDAR, no siempre son posibles de utilizar
en todos los momentos y circunstancias, sobre todo si los fenmenos estudiados
tienen distintas unidades de medida, dicho de otro modo, los datos estn
expresados en unidades de medida diferentes y su comparacin se dificulta (Slo
es posible comparar dos fenmenos si existen caractersticas comunes entre
ambos).
Por ejemplo, como comparar nmeros de libros con horas de viaje, o como
comparar horas de estudio con nmero de automviles en una ciudad ? .
En consecuencia, si dos conjuntos de valores se comparan, los valores absolutos
son convenientes solamente cuando los indicadores de los dos conjuntos son
aproximadamente del mismo tamao y las unidades de medida son idnticas.
Debido a esta limitacin, es que se requiere de medidas de dispersin que se
expresen en trminos relativos para efectuar las comparaciones como en los
casos citados. Trabajar con medidas expresadas en unidades relativas y no
absolutas, permite efectuar comparaciones entre dos conjuntos de valores o
datos expresados en medidas distintas.
5.3.1. EL COEFICIENTE DE VARIACIN - DEFINICIN:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

80

El Coeficiente de Variacin (CV) es una medida de dispersin relativa y est dada


por la siguiente expresin:
CV = _s_ = %
Donde:
CV = Coeficiente de Variacin
s = Desviacin Standar
= Media Aritmtica
EJEMPLO DE APLICACIN:
El ingreso mensual de cierto grupo de trabajadores adultos es de M(X) = 1.875
Bs con una desviacin Standar de s=285 Bs. En tanto que el ingreso medio
mensual para un grupo del mismo tamao de voceadores es de M(X) = 315 y la
Desviacin Stndar es de s = 80 Bs.
ADULTOS
= 1.875.-S = 285

NIOS VOCEADORES
= 315.-S = 80

Podemos afirmar categricamente


dispersin? La respuesta es: ! no !

que el salario de los adultos tiene mayor

Por que estaramos comparando dos grupos heterogneos diferentes, sea


adultos y nios y las ocupaciones son distintos. En consecuencia, no sirven mucho
en estos casos las medidas de dispersin absolutas, como la Varianza, la
desviacin Standar o el Rango.
Para estos casos es que utilizamos el CV.
CVa =

285
1.875

= 15,2 %

CVb = 80 = 25,3 %
315

Entonces, podemos afirmar definitivamente que los salarios de los nios


presentan mayor variabilidad que los adultos.
EJERCICIOS PARA RESOLVER EN CLASES:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

81

1.- Hallar la Varianza mediante el mtodo abreviado para la siguiente distribucin


de frecuencias:

INGRESOS
280 - 295
295 - 310
310 - 325
325 - 340
340 - 355
355 -- 370
370 - 385
385 - 400
400 - 415
415 - 430
SUMA

N DE OBREROS
4
5
10
9
13
15
18
12
8
6
100

Interpretar el resultado obtenido.


2.- Una regin se divide en dos zonas: A y B. En la zona A existen diez
cooperativas con una produccin promedio de arroz de 100 TM y una desviacin
Standar de 10 TM. En la zona B existen 15 cooperativas con una produccin
promedio de 120 TM de arroz y una desviacin Standar o tpica de 9 TM.
Determinar el Coeficiente de Variacin de la regin.
Interprete el resultado obtenido.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

82

TEMA N 6
DISTRIBUCIONES BIDIMENSIONALES
COMPETENCIA DE TEMA:

CUANTIFICA (CALCULA) EL GRADO DE DEPENDENCIA DE VARIABLES A PARTIR


DE INDICADOES BIDIMENSIONALES, MEDIANTE LA RESOLUCIN DE EJERCICIOS
PRCTICOS DE APLICACIN, EN EL AULA .

6.1. INTRODUCCION.- Hasta ahora nos hemos limitado al estudio de datos


UNIDIMENSIONALES o UNIVARIANTES, dicho de otra manera, nos hemos
concretado a estudiar una sola caracterstica asociada a cada observacin, ya sea
variable o atributo, dependiendo de la unidad estadstica objeto de estudio.
Ejemplo:

LA ESTATURA DE LOS ESTUDIANTES DE UN CURSO

Sin embargo, en la vida real los fenmenos no suelen presentarse solos, a menudo
es preciso estudiar ms de una caracterstica u observacin ligada a un fenmeno.
Ejm. La estatura y el peso de los estudiantes de una unidad educativa. En este
caso, se trata de distribuciones bidimensionales o bivariadas.
En el caso que nos ocupa, una muestra de tamao n se representa como un
conjunto de pares ordenados de la siguiente forma:
(X1, Y1) (X2,Y2) (X3, Y3),.........................., (Xn,Yn)
El par ordenado ( Xi,Yi) representa la estatura y el peso de cada estudiante.
6.2. CARACTERISTICA DE LOS DATOS BIDIMENSIONALES.Dadas las observaciones bivariadas:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

83

(X1,Y1) (X2,Y2) (X3,Y3),........................, (Xn,Yn)


Considerando en forma separada cada una de las variables o atributos (X1 ,X2
,X3,.......Xn) o (Y1, Y2, Y3,..........Yn), como valores independientes de la variable
univariante X o Y, se pueden calcular todas las medidas descriptivas hasta ahora
estudiadas, como ser:
= Media Aritmtica
Me = Mediana
Mo = Moda

V(x) = Varianza de X
Gx = Desviacin Standar
CV = Coeficiente de variacin

En forma anloga puede suceder con la variable Y, donde tambin se pueden


calcular por separado los mismos estadsticos o indicadores.
Sin embargo, al analizar las observaciones bivariadas conjuntamente surgen otras
medidas que relacionan ambas variables. Estos son:
LA COVARIANZA O CORRELACION
LA REGRESION
La Covarianza y la correlacin miden el grado de asociacin entre las variables.
Ejemplo, los alumnos ms altos suelen ser los ms pesados y los ms bajos son
generalmente de menos peso.
Por otro lado, si nos interesa el grado y tipo de relacin funcional que se presenta
entre las dos variables estudiadas (X,Y), estamos frente a un problema de
REGRESION, es decir si la variacin conjunta la podemops establecer mediante
una relacin funcional y estimar el peso de un alumno sobre la base de su
estatura, entonces es un problema de REGRESION.
6.3. CORRELACION LINEAL - COVARIANZA:
Si representamos las observaciones bivariadas en el plano cartesiano se obtendr
un conjunto de puntos que se conoce como DIAGRAMA DE DISPERSION O
NUBE DE PUNTOS.
Este diagrama nos sugiere dos aspectos:
a) La tendencia que siguen la nube de puntos.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

84

b) El grado de asociacin o correlacin lineal entre las variables X e Y


Este segmento tambin se llama relacin cualitativa. En cambio la medida
cuantitativa del grado de correlacin lineal entre las variables es proporcionada
por el coeficiente de correlacin lineal de PEARSON, denotado por la siguiente
frmula:
COEFICIENTE DE CORRELACIN DE PEARSON:
r

=
xy

Xi Yi -

Xi . Yi

2
2
n [ Xi - ( Xi ) [ n Yi

2
- ( Yi )

Llamado tambin coeficiente de Pearson o Covarianza.


El Coeficiente r puede tomar diferentes valores:
r=1

Existe correlacin positiva perfecta

r=0

Correlacin Nula

r=1

Correlacin negativa perfecta

Normalmente r flucta entre 0 y 1


0<r>1
Entonces, cuando r = 1 o r = - 1, se dice que X e Y estn perfecta y linealmente
relacionadas o correlacionadas. En este caso, todos los puntos estn alineados o
contenidos en la misma recta.
Y

r=1
-1
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

r=

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

85

X
X

El primer grfico est referido a una CORRELACION LINEAL PERFECTA O


DIRECTA ( + ) y el segundo se refiere a una relacin PERFECTA NEGATIVA O
INVERSA ( - ). En cambio si r = 0 , entonces se dice que las dos variables no
estn correlacionas linealmente:
Y
+

+
+

r=0

+
+

+
+
X
NO EXISTE CORRELACION LINEAL

Los casos analizados anteriormente son casos extremos, lo normal es que r


flucte entre 0 y 1:

+
+

+
+
+
+
+ +
+
r = 0,95

CORRELACION LINEAL ALTA


POSITIVA

+
+
+ +
+
+ +
+ +
+

r = 0,95

CORRELACION LINEAL ALTA


NEGATIVA

NOTA.- El Coeficiente de Correlacin de PEARSON ( r ), refleja nicamente la


relacin lineal entre las dos variables ( X e Y ). Sin embargo, puede ser que las
dos variables estn relacionados en forma no lineal, por ejemplo: exponencial.
En este ltimo caso, la r de Pearson no ser una medida apropiada para
establecer el grado de correlacin entre las variables.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

86

EJEMPLO.- Tomando los siguientes datos sobre estaturas y pesos de 10


estudiantes seleccionados al azar, calcular el coeficiente de correlacin lineal de
Pearson.
( 1,54 - 60 ) ( 1,82 - 94 ) ( 1,57 - 65 ) ( 1,60 - 66 ) (1,75 - 85 )
( 1,65 - 72,50 ) ( 1,69 - 77 ) ( 1,62 - 70 ) ( 1,77 - 89,5 ) ( 1,70 - 80 )
SOLUCION:

PASO N 1.cartesianas:

Representamos los datos obtenidos en un eje de coordenadas

Y = Peso
100
+
+ +

90
+

NUBE DE PUNTOS

80
+

+
70

+
+

60

+
1,5

1,6

1,7

1,8

1,9

2,0

Estatura

CONCLUSIONES DE LA GRAFICA:
a) La tendencia que se observa en el diagrama de dispersin es de tipo lineal.
b) Entonces, lo que se desea saber es cul es el grado de correlacin existente
entre la estatura y los pesos de los estudiantes; sea, saber la relacin entre X
e Y. Para ello calculamos el Coeficiente de Correlacin de Pearson ( r ),
utilizando la frmula ya conocida.
r =

n Xi Yi

Xi Yi

2
2
2
[ n Xi - ( Xi) [ n Yi - (Yi)
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

.
2

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

87

PASO 2.- Determinamos el valor de r


Para ello debemos calcular previamente los valores que requiere la frmula de r,
dado en la expresin anterior:
ESTATURA
Xi
1,54
1,82
1,57
1,60
1,75
1,65
1,69
1,62
1,77
1,70
16,71

PESO
Yi
60
94
65
66
85
72,5
77
70
89,5
80
759,0

Xi Yi
92,40
171,08
102,05
105,60
148,75
119,62
130,13
113,40
158,41
136,0
1.277,45

2
Xi
2,3716
3,3124
2,4649
2,5600
3,0625
2,7225
2,8561
2,6294
3,1329
2,8900
27,9973

2
Yi
3.600
8.836
4.225
4.356
7.225
5.256,25
5.929
4.900
8.10,25
6.400
58.737,50

n = 10
r=
0,9959

10 ( 1.277,45) - (16,71)(759)

.=

91,61

91,978
2
2
[10 ( 27,9973) - (16,71) [10(58.737,50) - (759)

CONCLUSION: Existe alta correlacin lineal directa entre estatura y peso de


los alumnos estudiados.
EJERCICIO PARA RESOLVER EN CLASES: Una agencia de control de trfico
vehicular ha compilado la siguiente informacin estadstica:
AOS
1947
1948
1949
1950

VEHICULOS
MATRICULADOS
( EN MILLONES)
352
373
411
441

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

ACCIDENTES DE
CARRETERA
( EN MILES )
166
153
177
201

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

1951
1952
1953
1954
1955
1956
1957

88

462
490
529
577
641
692
743

216
208
227
238
268
268
274

Calcular r:
6.4. ANALISIS DE REGRESION.- El objeto del anlisis de regresin es
establecer una relacin funcional matemtica entre variables, de manera que
seamos capaces de predecir el valor de una variable en base al comportamiento
de otra u otras variables, es decir una relacin funcional del siguiente tipo:
Y = f(X)
Donde:
Y = Variable dependiente o ENDOGENA
X = Variable Independiente o EXOGENA
En el mundo real los fenmenos se presentan relacionados o interrelacionados de
diferentes maneras unos con otros, entonces es posible estructurar diferentes
tipos de relaciones entre variables; entre estos podemos identificar las
siguientes:
CLASES DE DEPENDENCIA.- Los tipos de dependencia entre variables se
clasifican de la siguiente manera:
SIMPLE :
X2, ......,Xn )
CLASIFICACION

Relacin de dependencia

Y = f (X)

MULTIPLE:

Y = f ( X1 ,

Lineal : LINEA RECTA


Tipo de relacin

No lineal : PARABOLA,

LOGARITMICA,

HIPERBOLICA.

GRAFICAMENTE TENEMOS:
Y
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

89

2
Y

bX

Y=a+b+cX

X
X

LINEA

RECTA

PARABOLA
Y

Y = .
1
a+bX

Y
Y = a + b Log X

X
X
HIPERBOLA
LOGARITMICA

6.5. REGRESION LINEAL SIMPLE O LINEA RECTA.La relacin de dependencia ms simple y la ms utilizada por el mtodo cientfico
es el modelo de regresin lineal simple o LINEA RECTA y est dada por la
siguiente expresin algebraica:
Y = a + bX
Donde:
Y = Variable dependiente (ENDOGENA)
a = Ordenada en el origen; sea el punto donde la lnea recta corta
al eje de la ordenada.
b = Pendiente o grado de inclinacin de la RECTA
X = Variable Independiente (EXGENA)
EJEMPLO: La relacin funcional entre el nivel del salario y la antigedad o aos
de servicio, esta dada por:
SALARIO

= f (AOS DE SERVICIO O ANTIGEDAD )

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

90

Y = f (X)
6.5.1. TIPOS DE RELACIONAMIENTO FUNCIONAL LINEAL.De acuerdo al grado de relacionamiento y/o asociacin de dos variables, es
posible identificar tres tipos de relacionamiento lineal:
Dependencia Total
Independencia total
Dependencia estadstica parcial
a) RELACION LINEAL DE DEPENDENCIA TOTAL.- Este tipo de relacin se
da cuando ambas variables estn representadas por una lnea recta, aquello se
da cuando los datos caen exactamente sobre una LINEA RECTA, de modo que
ambas variables estn relacionadas por una lnea Recta.
EJEMPLO: La relacin entre el nivel del salario y la antigedad o aos de
servicio, estn dados por la siguiente tabla:
SALARIO/HORA
12
16
18
22
28

ANTIGUEDAD
1
3
4
6
9

Ahora bien, para determinar como estn relacionadas ambas variables


primeramente se deben identificar la variable dependiente y la variable
independiente. En el caso que nos ocupa estos son:
Salario = Variable Dependiente = Y
Aos de servicio = Variable Independiente = X
Entonces los salarios dependen de los aos de servicio:

Y=f(X)

Cuando relacionamos ambas variables en forma directa, estamos asumiendo el


supuesto de que el nivel de salario o ingreso de un trabajador nicamente depende
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

91

de los aos de servicio, en la prctica no suele ser as. De hecho, si hacemos un


anlisis de Causa-efecto vamos a ver que el salario no slo depende de los aos de
servicio sino de muchas otras variables como ser: Formacin profesional, cargo,
Ocupacin, lugar donde trabaja, etc. Entonces la relacin entre ambas variables
no es tan simple, sino compleja:
Y = f (X1, X2, X3,.................,Xn)
Donde:
Y =
X1 =
X2 =
X3 =
X4 =
X5 =

Salario
Aos de servicio o antigedad
Profesin
Cargo
Ocupacin
Otros

Sin embargo, para no complicar el anlisis de la relacin lineal entre ambas


variables podemos asumir el supuesto de que los salarios nicamente dependen de
los aos de servicio, mientras las otras variables permanecen constantes; estamos
aplicando ac uno de los supuestos bsicos de economa cual es el concepto de
CEATERIS PARIBUS.
Una vez definidas ambas variables, el paso siguiente de la metodologa es graficar
la relacin funcional en un eje de coordenadas cartesianas para determinar la
forma y el tipo de relacin existente entre ambas:
SALARIO

30
+
25
+
20
+
15
+
10

= 8 = 2

4
5
1
ANTIGUEDAD
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

10

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

92

En el ejemplo que nos ocupa, podemos advertir que los puntos o pares ordenados
trazados en la grfica coinciden exactamente sobre una lnea RECTA, que cortan
al eje de las ordenadas en el punto 10 y la recta tiene una pendiente de 2; con
estos datos estamos en condiciones de establecer la relacin funcional del
siguiente tipo:
Y = 10 + 2 X
La ecuacin anterior corresponde a una lnea recta y se dice que entre ambas
variables existe DEPENDENCIA TOTAL.
b) RELACION DE INDEPENDENCIA TOTAL:
Supongamos ahora, que los datos del ejemplo anterior son los siguientes:
SALARIO/HORA
ANTIGEDAD
16
1
10
3
13
4
10
6
16
9
Para determinar el tipo de relacionamiento entre ambas variables trazamos los
puntos o pares ordenados en un eje de coordenadas cartesianas.
SALARIO

16

12

+
+

ANTIGUEDAD

10

En este segundo caso, tenemos el otro extremo del ejemplo donde ambas
variables no muestran ningn tipo de relacin funcional ni lineal ni no lineal entre
ambos, vale decir no hay lgica de los pares ordenados. Ejemplo, un obrero con 1
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

93

o 9 aos llega a ganar el mismo nivel de salario o uno con 4 aos de antigedad
gana ms que otro de tres aos. En consecuencia, cuando no existe una relacin de
dependencia entre ambos se dice que entre ambos existe INDEPENDENCIA
TOTAL de variables.
c) RELACION DE DEPENDENCIA ESTADISTICA PARCIAL:
Los dos casos anteriores son casos extremos, lo normal es que exista una relacin
ms o menos fuerte entre dos variables relacionadas. Esta relacin por tanto
hace que el coeficiente de correlacin r flucte entre 0 y 1.
EJEMPLO.- Utilizando el mismo ejemplo anterior, tenemos los siguientes datos:
SALARIO/HORA
10
18
16
20
30

ANTIGEDAD
1
3
4
6
9

Graficamos luego la nube de puntos:


SALARIO
30

25
20

+
+
+
15

10

+
5

1
ANTIGUEDAD

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

10

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

94

CONCLUSIONES: De la grfica anterior podemos establecer las siguientes


conclusiones:
a) Existe una tendencia creciente de los salarios al aumentar los aos de
antigedad.
b) Existen algunas pequeas salvedades como el obrero que teniendo 4 aos gane
menos que el de tres.
c) Pero en general existe una tendencia a crecer cuando se incrementa la
antigedad.
d) A diferencia del primer ejemplo, en este caso no se puede directamente
ajustar una recta en base a los datos cuantificados.
En consecuencia, cuando la relacin no es EXACTA, se elige aquella funcin que
mejor se ajuste al conjunto de datos sea: lineal, parablica, hiperblica, etc.
sea, aquella funcin que mejor represente al conjunto de datos.
6.5.2. METODOLOGIA DE LOS MINIMOS CUADRADOS PARA AJUSTAR
UNA FUNCION DE LA LINEA RECTA:
Existen dos mtodos para ajustar una ecuacin de la lnea recta para una nube de
puntos que muestren dicha tendencia, estos son:
1.-- Mtodo de estimacin grfica.
2.- Mtodo analtico
Debido a que el segundo mtodo es el ms utilizado, en este texto solamente
trataremos el mtodo analtico.
6.5.2.1. METODO ANALITICO DE LOS MINIMOS CUADRADOS:
En general, la esencia del Mtodo de Mnimos Cuadrados consiste en minimizar la
sumatoria de las diferencias entre los valores reales (+) y los valores tericos
expresados o representados por la lnea recta punteada. En trminos de anlisis
matemtico, el problema se plantea de la siguiente forma: Teniendo en cuenta que
la ecuacin de la recta est dada por:
Y = a+ bX
Si: Y es la Variable Dependiente y X la variable independiente, entonces para
construir una expresin del tipo Y = a + b X, debemos estimar los parmetros a y
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

95

b, es decir la ordenada en el origen (a) y la pendiente o grado de inclinacin de la


Recta que est dada por (b).
SALARIO

+
+
=
+

CO
CA

10

ANTIGUEDAD

Para estimar los parmetros a y b a travs del mtodo analtico de los mnimos
cuadrados, debemos partir de la siguiente expresin matemtica de la recta de
los valores tericos:
(i)

Y = a + bX

Ecuacin de valores tericos

Luego minimizamos la sumatoria de los desvos:


2
(ii)
Di = ( Yi - Yi )
Donde:
Di = Desvos
Yi = Los valores reales
Yi = Los valores tericos
Remplazando i en ii tenemos:
2
Di = ( Yi - a - b Xi )
Esta funcin luego debemos minimizarla; para ello hay que saber si cumple las
condiciones de un mnimo, que son las siguientes:
1RA. CONDICION: La primera derivada parcial de la funcin debe ser igual a
cero.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

2DA, CONDICION:
que cero

96

La segunda derivada parcial de la funcin debe ser mayor

Aplicamos entonces las derivadas parciales de D respecto de a y b.


2
Di = ( Yi - a - b Xi )
D = -2 ( Yi - a - b Xi)
a
D = -2 ( Yi - a - b Xi ) Xi
b

/ -2
/ -2

Al dividir ambas expresiones entre -2, e igualamos a cero para que cumpla la
primera condicin de un mnimo, tenemos:
( Yi - a - b Xi )
=0
( Yi - a - b Xi ) Xi = 0
Aplicando clculo de sumatorias en ambas expresiones tenemos:
Yi - na - b Xi = 0
2
Yi Xi - a xi - b Xi = 0
El sistema de ecuaciones ms llamada como ECUACIONES NORMALES de la
recta se escribe as:
Yi = na + b Xi
2
Yi Xi = a Xi + b Xi
Ahora veamos si se cumple la condicin segunda de un mnimo, sea:
D > 0
D > 0
a
b
Comprobamos a partir del resultado obtenido con la aplicacin de la primera
derivada:
D = -2 ( Yi - a - b Xi )
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

97

a
Previamente hacemos operaciones en la sumatoria y obtenemos la segunda
derivada parcial respecto de a:
D = - 2 Yi + 2 na + 2b Xi
a
Entonces: 2
D = 2n que es mayor a cero, por que siendo n el tamao de la muestra
a
en ningn caso puede ser menor que 1.
Veamos que sucede ahora con b:
D = -2 ( Yi - a - b Xi ) Xi
b
Haciendo operaciones tenemos:
2
D = -2 Yi + 2na + 2b Xi
b
2
2
D = 2 Xi
b

> 0

Es mayor que cero, por que tratndose Xi de una observacin o dato no puede ser
menor que cero, por cuanto si as fuera utilizando el cuadrado automticamente
se vuelve positivo.
RESOLUCION DEL SISTEMA DE LAS ECUACIONES NORMALES:
Yi = na + b Xi

/ Xi

2
Yi Xi = a Xi + b Xi

/ -n

Por el mtodo de igualacin tenemos:


2
Yi Xi = na Xi + b ( Xi )
2
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

98

- n Yi Xi

= - na Xi - nb Xi
2
2
Yi Xi - n Yi Xi = b ( Xi ) - nb Xi
2

Yi Xi - n Yi Xi = b (Xi ) - n Xi
Finalmente tenemos:
b = Yi Xi - n Yi Xi
2
2
( Xi ) - n Xi
El valor de (a) lo obtenemos remplazando el valor obtenido para (b) en cualquiera
de las ecuaciones normales, con ambos parmetros cuantificados estamos en
condiciones de construir la ecuacin de la recta ajustada o de los valores
tericos.
EJEMPLO: Tenemos los datos referidos al nivel de salarios y la antigedad o
aos de servicios, reflejados en el siguiente cuadro:
SALARIO
10
18
16
20
30

ANTIGEDAD
1
3
4
6
9

Se pide calcular los parmetros (a) y (b) y ajustar la funcin lineal.


SOLUCION:

Paso N 1: Primeramente representamos los datos en un eje de coordenadas


cartesianas:
SALARIOS

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

99

30
+
25
20

+
+

15

10

5
1

10

ANTIGUEDAD

Como podemos apreciar en la grfica anterior, la nube de puntos nos seala que
los puntos tienen una tendencia muy cercana a la lnea recta, por tanto es posible
ajustar una funcin de Lnea Recta del tipo: Y = a + b X

Paso N 2.- Determinamos los parmetros (a) y (b), a travs de la resolucin de


las ecuaciones normales:
El parmetro (b) se calcular a partir de la siguiente expresin matemtica:
b = Yi Xi - n Yi Xi
2

(Xi)

- n Xi

De acuerdo con los requerimientos de la frmula se debern calcular los datos


solicitados de la siguiente manera:
Yi
10
18
16
20
30
94

Xi
1
3
4
6
9
23

Yi . Xi
10
54
64
120
270
518

n=5
Remplazamos los datos en la frmula:
b = (94) (23) - 5 (518) = - 428
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

2
Xi
1
9
16
36
81
143

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

- 186

(23)

100

- 5 (143)

b = 2,30
Seguidamente el valor de: (b) remplazamos en cualquiera de las ecuaciones
normales:
Yi = na + b Xi
94 = 5 (a) + 2,30 (23)
94 - 52,9 = 5a
41,1 = 5a
a = 41,1
a = 8,22
5
Con los dos parmetros calculados podemos finalmente estructurar la ecuacin de
la Recta:
Yi = 8,22 + 2,30 Xi

A partir de la ecuacin anterior es posible estimar valores de Yi dando valores a


Xi. Esta operacin se conoce como PRONOSTICO ESTADISTICO.
EJERCICIO PARA RESOLVER EN CLASES: La siguiente tabla contiene las
estaturas y los pesos de una muestra de hombres adultos:
ESTATURA
Cms
155
152
152
155
157
152
157
165
162
178
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

PESO
Kgs
61,5
50,0
54,5
57,5
63,5
59,0
61,5
72,0
66,0
72,0

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

183
178

101

84,0
82,0

Se pide:
a) Graficar el diagrama de dispersin
b) Obtener la Recta de Regresin Estimada del tipo Y = a + b X
c) Predecir el peso de un individuo que tiene una estatura de 168 cms.
d) Calcular el coeficiente de correlacin r e interpretarla
e) Estimar la altura de un hombre cuyo peso registrado es de 77,5 Kgs.
SOLUCION

6.7. APLICACIN A SERIES DE TIEMPO


Cuando una de las variables es el tiempo (En das, meses o aos), la regresin se
denomina SERIE DE TIEMPO. Supongamos que la produccin (En millones) de un

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

102

determinado artculo fabricado por una compaa durante los aos 1980-1989 es
como sigue:
Aos
Produccin

1980
92,2

1981
92,3

1982
80,0

1983
89,1

1984
83,5

1985
68,9

1986
69,2

1987
67,1

1988
58,3

1989
61,2

Primeramente debemos trazar el diagrama de dispersin para determinar la


tendencia de los puntos y el grado de correlacin entre ambas variables.

Seguidamente hacemos los clculos para hallar los valores de b y a, utilizando


las frmulas del mtodo de mnimos cuadrados:
AOS
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
SUMA

No
X
1
2
3
4
5
6
7
8
9
10
55

PRODUCCIN
Y
92,2
92,3
80,0
89,1
83,5
68,9
69,2
67,1
58,3
61,2
761,8

XY
92,2
184,6
240,0
356,4
417,5
413,4
484,4
536,8
524,7
612,0
3.862,0

b= 10 (3.862) 55(761,8) = - 3,97


10(385) (55)

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

X
1,0
4,0
9,0
16,0
25,0
36,0
49,0
64,0
81,0
100,0
385,0

Y
8.500,8
8.519,3
6.400,0
7.938,8
6.972,3
4.747,2
4.788,6
4.502,4
3.398,9
3.745,4
59.513,8

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

103

Remplazamos el valor de b en la primera ecuacin normal:


Yi = na + b Xi
761,8 = 10 a + (- 3,97)(55)
a = 98
Entonces la Recta de Regresin estar dada por:
Y = 98 3,97 X
A partir de esta Recta de Regresin podemos hacer proyecciones estadsticas:
Ejemplo, para el ao 1990, X = 11, la produccin para este ao ser:
Y= 98 3,97(11) = 54,33
6.5.3. REGRESION Y CORRELACION LINEAL MULTIPLE
CONCEPTO.- Las consideraciones efectuadas hasta ahora en torno a la
Regresin Lineal Mltiple del tipo: Y = a + b X, donde estn involucradas
solamente dos variables: (Y) Variable Dependiente y (X) la Variable
independiente, tienen la limitacin de no reflejar la realidad con la debida
aproximacin posible.
Existe necesidad de incorporar en el anlisis ms de dos variables, con lo cul
ingresamos a la regresin lineal mltiple, donde participan ms de dos variables;
sea, una variable dependiente y ms de una variable independiente:
Y = f( X1, X2, X3., Xn)
EJEMPLO:
El peso (Y) depende de la estatura (X) y de la edad (Z).
El consumo de un determinado producto (Y), depende de su precio (X) y el
ingreso del consumidor (Z).
El salario (Y), depende de la antigedad (X) y el cargo (Z).
La produccin agrcola de un producto (Y), depende de la precipitacin pluvial
(X) y el uso de los fertilizantes (Z).
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

104

En todos los ejemplos sealados anteriormente tendremos una funcin lineal


mltiple del siguiente tipo:
Y = a + b X + cZ
Donde:
Y
= Variable Dependiente
a
= Es la interseccin entre el plano y el eje Y o la ordenada.
b y c = Son los coeficientes de regresin parcial que miden:
b=
Es el estimador que mide la cantidad por el cul un cambio
unitario en X, provoca un cambio en Y, cuando Z permanece
constante.
c = Mide la cantidad de cambio en Y provocado por un cambio unitario
en Z mientras permanece constante X.
Geomtricamente hablando se trata de un PLANO:
Y
x

x
x

Y=a

+ bX +c Z

En el caso de la ecuacin lineal mltiple Y = a + b X + c Z, debemos estimar los


parmetros (a), (b) y (c). En consecuencia, la funcin de nuestro inters ser:
Y =a+bX+cZ

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

105

La estimacin de los parmetros se lo hace mediante el mtodo ya conocido de los


mnimos cuadrados.
DERIVACIN DE LAS ECUACIONES NORMALES PARA LA REGRESIN
LINEAL MULTIPLE:
Para obtener las ecuaciones normales de regresin lineal mltiple recurrimos al
criterio de los mnimos cuadrados, sea minimizamos la siguiente funcin:
2
Di = ( Yi - Yi )
Remplazando trminos tenemos:
2
Di = ( Yi - a - b Xi - c Zi)
La primera condicin de un mnimo exige que las primeras derivadas parciales con
respecto a los parmetros: a, b, y c deben igualados a cero.
D = - 2 ( Yi - a - b Xi - c Zi)
a
D = - 2 ( Yi - a - b Xi - c Zi) Xi
b
D = - 2 ( Yi - a - b Xi - c Zi) Zi
c

/-2

Ahora bien igualamos las derivadas parciales a cero:


D = ( Yi - a - b Xi - c Zi) = 0
a
D = ( Yi - a - b Xi - c Zi) Xi = 0
b
D = ( Yi - a - b Xi - c Zi) Zi = 0
c
Haciendo operaciones de sumatoria tenemos:
Yi - na - b xi - c Zi = 0
2
Yi Xi - aXi - bXi - c Zi Xi = 0
2
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

/-2
/-2

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

106

Yi Zi - a Zi - b Xi Zi - c Zi = 0
Finalmente tenemos las ecuaciones normales:
Yi = na + b xi + c Zi
2
Yi Xi = a xi + b Xi + c Zi Xi

ECUACIONES NORMALES

2
Yi Zi = a Zi + b Xi Zi + c Zi
Las ecuaciones normales pueden ser resueltas mediante los mtodos de
Eliminacin y Cramer.
EJEMPLO: En base a la informacin proporcionada en el cuadro siguiente:

AOS
1967
1968
1969
1970
1971
1972
1973

CONSUMO DE
PRODUCCION
AGROPECUARIA
39
40
45
43
50
53
62

INGRESO
DISPONIBLE
48
54
55
58
62
64
69

IMPORTACIN DE
PRODUCTOS
AGROPECUARIOS
9
10
12
11
14
18
20

Se pide: a) Ajustar la funcin de la forma Y = a + bX + c Z, estimando los


parmetros a, b, y c para:
Y = Consumo de Productos agropecuarios
X = Ingreso Disponible
Z = Importacin de productos agrcolas
b) Estimar a cuanto ascender el consumo de productos agrcolas en 1975, si el
ingreso disponible sube a 75 y la importacin de productos agrcolas a 30
SOLUCION:
Y = na + b X + c Z
(I)
2
YX = a X + b X + c ZX
(II)
2
YZ = a Z + b XZ + c Z
(III)

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

107

Teniendo las ecuaciones normales anteriores calculamos las equivalencias de cada


componente:
AOS
1967
1968
1969
1970
1971
1972
1973
SUMA

Y
39
40
45
43
50
53
62
332

X
48
54
55
58
62
64
69
410

Z
9
10
12
11
14
18
20
94

YX
1872
2160
2475
2494
3100
3392
4278
19771

X2
2304
2916
3025
3364
3844
4096
4761
24310

ZX
432
540
660
638
868
1152
1380
5670

Z2
81
100
144
121
196
324
400
1361

YZ
351
400
540
473
700
954
1240
4658

Remplazamos los datos en las ecuaciones normales:


332 = 7a + 410 b + 94 c
19.771 = 410 a + 24.310 b + 5.670 c
4.658 = 94 a + 5.670 b + 1.366 c

(I)
(II)
(III)

Calculamos el valor de los parmetros a, b y c por eliminacin o el mtodo de


Cramer. Los resultados obtenidos por cualquiera de los mtodos arrojan los
siguientes resultados:
b = 0,25
a = 12,24
c = 1,53
Con los parmetros a, b y c estamos en condiciones de elaborar la ecuacin de
regresin mltiple del siguiente tipo:
a)
b)

Y = 12,24 + 0,25 X + 1,53 Z


Si X = 75
y
Z = 30

Remplazando estos datos en la Ecuacin de regresin mltiple tenemos:


Y (1975) = 12,24 + 0,25 (75) + 1,53 (30)
Y (1975) = 12,24 + 18,75 + 45,9
Finalmente:

Y (1975) = 76,89

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

108

6.5.4. COEFICIENTE DE CORRELACION MULTIPLE


El coeficiente de correlacin mltiple rxyz mide el grado o porcentaje en que
las variables independientes (X) y (Z) explican a la variable dependiente Y. Esta
dada por la siguiente expresin:

rxyz

2
( Yi - a - b Xi - c Zi )
=

n
__ 2
( Yi - Y)
n

Al igual que el concepto de coeficiente de correlacin lineal simple ( r ), mientras


ms prximo se halle a 1 se dice que las dos variables independientes explican de
manera casi total a la variable dependiente Y, sea existe plena dependencia
entre las tres variables. Cuando r est prximo a cero, existe escasa correlacin
entre las tres variables o si es cero la correlacin es NULA.
EJEMPLO; Calcular

AOS
1967
1968
1969
1970
1971
1972
1973
SUMA

Y
39
40
45
43
50
53
62
332

X
48
54
55
58
62
64
69
410

r xyz del ejercicio anterior:


Z
9
10
12
11
14
18
20
94

bX
cZ
12
13,77
13,5
15,3
13,75
18,36
14,5
16,83
15,5
21,42
16
27,54
17,25
30,6
102,5 143,82

2
(Yi-a-bc+cZ)
0,98
1,08
0,42
0,32
0,70
7,73
3,65
14,88

Donde:
a = 12,24
b = 0,25
c = 1,53

Y = 12,24 + 0,25 X + 1,53 Z


_
Y = 47,4

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

_2
(Y - Y)
70,56
54,76
5,76
19,36
6,76
31,36
213,16
401,72

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

109

Remplazamos en la frmula de r los datos anteriores:

r=

1 -

14,88
7 .
401,72
7

1 - 104,16
2.812,04

1 - 0,037 =

0,963

r = 0,98
EJERCICIO PARA RESOLVER EN CLASES: El gerente de una Compaia de
seguros desea estimar el monto total de prstamos que har durante el ao 1974,
sobre las plizas emitidas por su compaia; para esto, los consejeros de
inversiones de la Cia., decidieron efectuar un estudio al respecto en base a los
resultados obtenidos durante los primeros 10 aos de existencia de la compaia;
tomando en cuenta adems otras variables como ser: el ingreso y la poblacin
estimada. Las estadsticas recopiladas se detallan en el cuadro siguiente:
AOS

PRESTAMOS
INGRESO
( En miles de ( En miles de Bs)
Bs)
1964
3,6
5
1965
3,5
7
1966
3,4
6
1967
3,3
6
1968
3,3
7
1969
3,2
8
1970
3,0
10
1971
2,9
13
1972
2,6
16
1973
2,3
18
SUMA
31,1
96
En base a los datos anteriores, se pide:
a) Ajustar la recta de regresin lineal mltiple.
b) Calcular el coeficiente de correlacin mltiple.
NOCIONES DE REGRESION NO LINEAL:
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

POBLACION
ESTIMADA
( En miles)
127
128
129
130
131
133
134
136
138
140
1.326

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

110

En muchos casos cuando los valores en parejas de las variables X e Y, no se


ajustan a una lnea recta, se puede conseguir una relacin lineal mediante una
transformacin de estos valores.
A continuacin se dan algunas ecuaciones no lineales y su transformacin lineal.
Ejemplo:

ECUACION
x

Y = AB

Y = AX
Y=.

TRANSFORMACION LINEAL

(Exponencial)

Log Y = Log A + (Log B) X

(Potencial)

Log Y = Log A + B Log X

1
. (Hiperblica)
(A + BX)

Y = A + BX, Siendo Y= 1/Y

EJEMPLO: Ajustar por el mtodo de mnimos cuadrados una curva de la forma:


Y = AX

A los siguientes pares de datos:

X
Y

1,5
2,6

2,0
2,4

Grficamente tenemos:

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

3,0
1,2

3,5
1,8

4,0
1,6

5,0
1,4

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

111

SOLUCION: La transformacin de la regresin lineal es:


Y= Log Y

X= Log X

A= Log A

B= B

Seguidamente obtenemos los valores transformados en la siguiente tabla:


CALCULOS PARA LA REGRESION NO LINEAL
X
1,5
2,0
3,0
3,5
4,0
5,0

Y
2,6
2,4
1,2
1,8
1,6
1,4

X=LogX
0,1761
0,3010
0,4771
0,5440
0,6021
0,6990
2,7993

Y=Log Y
0,4150
0,3802
0,0792
0,2553
0,2041
0,1461
1,4799

X.Y
0,07131
0,1144
0,0378
0,1378
0,1229
0,1021
0,5891

X2
0,0310
0,0906
0,2276
0,2959
0,3625
0,4886
1,4962

Y2
0,0172
0,1446
0,0063
0,0652
0,0417
0,0213
0,4513

Entonces:
X= 2,7993

Y= 1,4799

X.Y= 0,5891 X2=1,4962

Y=0,4513

b = nXY- X Y = 6(0,5891) (2,7993)(1,4799) = - 0,532


2

nX - (X)
6(1,4962) (2,6993)
_ _
a = Y- X = 0,24665 (-0,532)(0,46665) = 0,4949
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

112

La ecuacin lineal de regresin es:


Y= 0,4949 0,532 X
La ecuacin NO LINEAL de regresin se obtiene utilizando antilogaritmos:
Y= antilog (y) = (3,125) = X
Donde:

-0,532

A = Antilog(a) = Antilog(0,4949) = 3,125

6.10. NUMEROS INDICES


Uno de los mtodos estadsticos que se utilizan con mayor frecuencia en
economa, administracin de empresas, demografa y otros campos de la
estadstica aplicada, son los nmeros ndices.
Bsicamente un NUMERO INDICE, es el cociente de cualquier medicin de una
variable (o ms variables) con respecto a una de sus mediciones que se toma como
base.
El objetivo de los nmeros ndices es cuantificar variaciones de las mediciones
de una variable a travs del tiempo. En este sentido, el nmero ndice es el
cociente de la medicin de la variable en un perodo determinado con respecto a
un perodo base. Los nmeros ndices se clasifican en ndices simples o
elementales e ndices compuestos y agregados.
El nmero ndice simple se calcula a partir de una sola variable, mientras que un
ndice compuesto se calcula a partir de dos o ms variables.
INDICES SIMPLES
Sea Xt la medicin de una variable cuantitativa X registrada en un perodo
determinado t (ao, mes , da) y Xo la medicin de una variable para el perodo
base to. Se denomina ndice Simple de X para el perodo t con respecto al
perodo base to, al nmero que denotaremos por:
It/to = Xt x 100 %
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

113

Xo
Si el porcentaje de variacin es positivo se dice que ha habido un incremento, si
es negativo se dice que ha habido una baja.
EJEMPLO: En el cuadro siguiente se muestran los promedios de los salarios, en
dlares, de los trabajadores de una empresa, de 1975 a 1983. Calcular los
correspondientes ndices para cada uno de los nueve aos utilizando como base:
a) 1975

AOS
1975
1976
1977
1978
1979
1980
1981
1982
1983

b) 1978

c) 1983

SALARIOS
310
330
370
380
430
450
480
540
570

1975 = 100
100,0
106,5
119,4
122,6
138,7
145,2
154,8
174,2
183,9

INDICES
1978 = 100
81,6
86,8
97,4
100,0
113,2
118,4
126,3
142,1
150,0

1983 = 100
54,4
59,7
64,9
66,7
75,4
78,9
84,2
94,7
100,0

Interpretacin de la tabla.- La primera columna del cuadro se obtuvo


dividiendo cada cifra anual entre 310, que corresponde al salario del ao base
1975 (1975=100), lo que es lo mismo que multiplicar cada cifra anual por su
recproco: 100/300=0,323
La interpretacin es como sigue: El ndice 183,9 por ejemplo, significa que en
1983 ha habido un aumento respecto a 1975 de 83,9 %. Por otra parte, si la cifra
resultante es negativa se dice que ha habido una baja.
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

114

INDICES COMPUESTOS:
La finalidad del ndice de precios consiste en combinar movimientos de muchos
precios a fin de estimar el movimiento promedio de algn grupo en particular de
precios.
El procedimiento para estimar variaciones de precios consiste en utilizar varias
medidas alternativas o ndices de dichos cambios.
Ejemplo, supongamos que nos interesa el comportamiento de los precios de los
productos cerealeros entre 1955 y 1963. Para ello elegimos el trigo, el maz, el
centeno y la cebada como cereales tpicos y recogemos los siguientes datos
referentes a los precios y las cantidades que se consumieron en los dos aos
seleccionados:

PRODUCTO

Trigo
Maz
Centeno
Cebada
TOTALES

1955

1963

Precio
(en dlares)

Cantidad
Consumida en Tn

Precio
(En dlares)

Cantidad
consumida en Tn

1,75
1,20
0,50
1,00
4,45

100
90
30
20
240

2,10
1,80
1,50
0,80
6,20

90
120
50
40
300

Ahora queremos calcular un nmero ndice del precio de los cereales para 1963
usando 1955 como perodo base. La forma ms sencilla de hacerlo sera calcular
una razn de precios para cada uno de los cuatro cereales y promediarlas en
forma conjunta. Las relaciones de precios son las que aparecen a continuacin:
PRODUCTO

TRIGO
MAZ
CEBADA
CENTENO
ESTADISTICA Y PROBABILIDADES I (Texto Gua)
COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

RAZON DE PRECIOS
Precio de 1963/precio
de 1955 x 100
2,10/1,75X100=120
150
300
80

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

TOTALES

115

650

Los precios relativos obtenidos son en realidad nmeros ndices para cada
mercanca en particular, y expresan tan solo el precio de ella en 1963 como un
porcentaje de su precio en 1955. El precio del trigo en 1963 era el 120 % de su
precio en 1955, etc. El nmero ndice global lo obtenemos con solo sumar las
cuatro relaciones de precios y dividiendo el resultado entre cuatro. De esta
manera, el nmero ndice es 162,5 (650/4=162,5).
Como el nmero ndice para el ao base (1955 en este caso) es siempre 100, el
clculo sugiere que el precio de los cereales era en 1963 un 62,5 % superior al de
1955.
El ndice as calculado, si bien es legtimo, tiene sus restricciones por cuanto no
refleja o no acompaa las cantidades de cada cereal en la construccin del ndice
de precios, por tanto introduciremos otro ndice compuesto ms realista
denominado INDICE AGREGATIVO PONDERADO. Para ello hacemos las
siguientes operaciones:

P1963 = 2,10 x 100 + 1,80 x 90 + 1,50 x 30 + 0,80 x 20 =


1,75 x 100 + 1,20 x 90 + 0,50 x 30 + 1,00 x 20

433 = 136,2
318

El nmero ndice 136,2 representa que el promedio de los precios de los cereales
ha aumentado cerca de un 36,2 % entre 1955 y 1963. Esta estimacin es muy
inferior a la anteriormente calculada, sobre todo por que atribuimos al centeno
una ponderacin menor con relacin a la importancia de su consumo en 1955. Este
ndice emplea las ponderaciones del ao base y tiene una significacin precisa, que
puede explicarse de la siguiente manera:
En 1963, la compra de la cantidad de cereales que en realidad se consumieron en
1955, hubiera costado a los consumidores un 36,2 % ms que en este ao.
Con los datos ya presentados, podemos calcular tambin un ndice agregativo
ponderado usando las cantidades de 1963 como ponderaciones. La estimacin de
dicho nmero ndice es el siguiente:

P1963 = 2,10 x 90 + 1,80 x 120 + 1,50 x 50 + 0,80 x 40 =


1,75 x 90 + 1,20 x 120 + 0,50 x 50 + 1,00 x 40

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

512 = 139,7
366,5

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

116

El significado de este resultado es La compra de cantidades realizada durante


1963 cuesta a los consumidores un 39,7 % ms de lo que les hubieran costado en
1955.
Los dos nmeros ndices agregativos o compuestos ocupan un lugar importante en
la teora de los nmeros ndices. El ndice con ponderacin del ao base se
determina por la siguiente frmula:

Pg = pg.qb

pb.qb

Donde:
g = Significa el ao dado sea el ao del cual se computa el nmero
ndice.
b = El ao base
p = Significa el precio
q = La cantidad
P = El nmero ndice
As pues, el numerador de la frmula nos dice que hay que multiplicar el precio en
determinado ao de cada mercanca por su cantidad en el ao base, y sumar luego
estos productos para todas las mercancas. El denominador, en cambio, indica
multiplicar el precio en el ao base de cada mercanca por su cantidad en el ao
base y sumar luego esos productos por todas las mercancas.
Por otro lado, la frmula para el ndice ponderado de determinado ao es la
siguiente:

Pg = pg.qg

pb.qg

Para los ejemplos anteriores, en consecuencia, las frmulas generales seran las
siguientes:
a)

P1963 = p1963.q1955

ndice ponderado por el ao base

p1955.q1955

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

UNIVERSIDAD AMAZNICA DE PANDO


CIENCIAS Y TECNOLOGA INGENIERA DE SISTEMAS

b)

P1963 = p1963.q1963

117

ndice ponderado por un ao determinado

p1955.q1963

INDICE DE PRECIOS AL CONSUMIDOR


El ndice de precios al consumidor (IPC) se construye para medir los cambios de
precios en los bienes y servicios que adquieren los asalariados urbanos y los
trabajadores. El IPC se calcula mensualmente empleando el ao base con
ponderaciones del ao seleccionado. As para marzo de 1969, el nmero ndice se
calcul a travs de la siguiente frmula:

Pmar1969 = pmar.1969.q1960
pbase1955.q1960

La muestra utilizada para preparar el ndice contiene ms de un centenar de


bienes y servicios (alimentacin, vivienda, vestimenta, transporte, salud y
recreacin).
TAREA PARA INVESTIGAR: Investigar como se calcula el IPC en nuestro pas
y explicar con ejemplos.

ESTADISTICA Y PROBABILIDADES I (Texto Gua)


COBIJA - PANDO
Preparado por el Lic. Ren Mamani Quisbert

You might also like