You are on page 1of 67

UNIDADES TECNOLGICAS DE SANTANDER

APUNTES DOCENTES

ASIGNATURA: ESTADSTICA

PROFESOR: GERMN ERNESTO RINCN REY

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 1

UNIDADES TECNOLGICAS DE SANTANDER


UNIDAD 1: ARREGLO Y PRESENTACIN DE DATOS
ASPECTOS GENERALES DE LA ESTADSTICA
LOS FENMENOS
Un fenmeno es cualquier manifestacin de las actividades humanas o de la naturaleza que puede ser
percibido por los sentidos o la razn. Algunos ejemplos de fenmenos son los siguientes:
El crecimiento de una planta
El comportamiento del clima
Las ventas por periodo de una empresa
Las personas, por da, que son afectadas por una enfermedad
Los accidentes de trnsito en diferentes lugares de una ciudad
La variacin mensual del costo de vida
Palabras sinnimas de fenmeno son: suceso, hecho o acontecimiento
LOS FENMENOS PRODUCEN INFORMACIN
Por muchos motivos los seres humanos desean poseer informacin sobre el comportamiento de diversos
fenmenos y para ello realizan registros sobre el estado de estos fenmenos en diferentes momentos o
espacios.
Estos registros o mediciones generan diversos volmenes de datos y para que estos datos se conviertan en
informacin se pueden procesar de diferentes maneras. Una de las formas como se pueden tratar los datos
para extraer la informacin que ellos contienen es utilizando las tcnicas estadsticas
DEFINICIN DE ESTADSTICA
Es una ciencia que estudia cmo debe emplearse informacin para facilitar la toma de decisiones en
situaciones prcticas que se manifiestan bajo incertidumbre
IMPORTANCIA DE LA ESTADSTICA
La actividad mas importantes para las personas que trabajan en las organizaciones empresariales es la
toma de decisiones. Dado el enorme aumento de la disponibilidad de datos (gracias a los sistemas de
informacin), y dada la complejidad creciente de las operaciones empresariales, los procesos de decisin se
ven sometidos a presiones extraordinarias.
Una de las tcnicas ms valiosa que ayudan en los procesos de toma de decisiones es la Estadstica. Por lo
que es indispensable que los hombres y mujeres que dirigen organizaciones o que de alguna manera
participan en la toma de decisiones estn familiarizados con las tcnicas estadsticas para poder determinar
cuando se puede examinar un problema existente mediante la aplicacin del anlisis estadstico.
DIVISIN DE LA ESTADSTICA
La Estadstica se divide en dos grandes ramas:
La Estadstica Descriptiva
La Inferencia Estadstica
ESTADSTICA DESCRIPTIVA
Son los conocimientos y mtodos que tratan de la recoleccin, organizacin y presentacin numrica y
grfica de los datos.
Los anlisis que se hacen con las herramientas de la estadstica descriptiva se limitan, nicamente, al
conjunto de datos que se recolectaron

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 2

UNIDADES TECNOLGICAS DE SANTANDER


INFERENCIA ESTADSTICA
Son los conocimientos y mtodos que permiten:

Sacar conclusiones sobre el comportamiento total de un fenmeno basndose nicamente en la


informacin recolectada sobre una parte de ese mismo fenmeno. Estas conclusiones se obtienen bajo
incertidumbre.

Estimar el comportamiento futuro de un fenmeno

FASES DE UNA INVESTIGACIN ESTADSTICA


1. Planeamiento
Fin de la investigacin
Definir la poblacin
Unidad de investigacin
Naturaleza o clase de los datos
Fuentes de la informacin
Procedimiento para recolectar los datos
Diseo de instrumentos
Presupuesto
2. Recoleccin de los datos
3. Crtica y codificacin
4. Tabulacin y grficas
5. Anlisis e interpretacin

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 3

UNIDADES TECNOLGICAS DE SANTANDER


CONCEPTOS BSICOS
DATO
En trminos generales un dato es un registro o anotacin que se hace del estado de un fenmeno en un
momento determinado
ELEMENTO
En general, un elemento es una parte indivisible de un todo o un componente indivisible o bsico de un
cuerpo.
En estadstica se llama elemento a las entidades que tienen una o varias caractersticas cuyo estado nos
interesa registrar. El registro del estado de estas caractersticas es lo que constituye los datos. Estos
elementos pueden ser personas, objetos o sucesos.
En una investigacin sobre los salarios de trabajadores los elementos son los trabajadores (personas), y la
caracterstica que se observa a cada elemento es el valor de su salario. En una investigacin sobre el valor
de las facturas que expide una comercializadora los elementos son las facturas (un objeto), y la
caracterstica observada es el valor de cada factura En una investigacin sobre los accidentes de trnsito los
elementos son los accidentes (un suceso), y la caracterstica observada podra ser el nmero de personas
lesionadas
POBLACIN
Todos los elementos que presentan una caracterstica comn
Es el conjunto de todos los elementos que hacen parte de una situacin que se est estudiando y sobre la
cual se intenta sacar conclusiones
Las poblaciones se deben definir con toda claridad de tal manera que no exista confusin sobre si un
determinado elemento pertenece o no a la poblacin

COMO SE DEFINE UNA POBLACIN


Las poblaciones se deben definir con toda claridad de tal manera que no exista confusin sobre si un
determinado elemento pertenece o no a la poblacin. Para facilitar esta definicin, en muchos casos, las
palabras que la componen se pueden ordenar de acuerdo a la siguiente sintaxis:
TODOS(AS) + DESCRIPCION DEL ELEMENTO + CONDICION RESTRICTIVA
Significa que una definicin de poblacin debe empezar por la palabra Todos o Todas seguida de una
descripcin del elemento que se est observando mas una restriccin al alcance de la palabra Todos(as)
Ejemplo: En un estudio del nivel salarial de los operarios del sector de confecciones de la ciudad, una
definicin de poblacin podra ser la siguiente:
Todos los operarios del sector de confecciones de la ciudad
TAMAO DE UNA POBLACIN
Es el nmero total de elementos que componen una poblacin. El tamao de una poblacin se suele
representar por la letra N
EJEMPLO:
Para indicar que una poblacin tiene 670 elementos se indica as: N = 670
CLASES DE POBLACIONES
Las poblaciones se dividen en dos clases:
Poblaciones finitas
Poblaciones infinitas

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 4

UNIDADES TECNOLGICAS DE SANTANDER


Poblaciones Finitas
Son las poblaciones a las cuales se les pueden determinar fcilmente el nmero de elementos que las
componen, es decir, su tamao
EJEMPLO:
Situacin o fenmeno: La edad de los estudiantes de las UTS
Poblacin: Todos los estudiantes de las UTS
Tipo de poblacin: Finita, porque fcilmente se pueden contabilizar sus elementos acudiendo a la oficina de
la institucin que registra estos datos
Poblaciones infinitas
Son las poblaciones que fsicamente es imposible numerarlas o determinar su tamao
Son las poblaciones que aunque se puede determinar su tamao, no es conveniente hacerlo por razones
econmicas o de tiempo
EJEMPLO:
Situacin: Accidentes por da en un cruce de calles de la ciudad
Poblacin: Todas los das mientras exista este cruce
Tipo de poblacin: Infinita. Es imposible determinar cuantos elementos tiene esta poblacin
EJEMPLO:
Situacin: Nmero promedio de hijos por pareja de un barrio de la ciudad
Poblacin: todas las parejas que habitan en el barrio
Tipo de poblacin: Infinita. Es muy costoso o demanda mucho tiempo determinar su tamao
CARACTERSTICAS OBSERVABLES EN UNA POBLACIN
A los elementos de una poblacin se les observan sus caractersticas o la intensidad con que se presenta
una magnitud.
De acuerdo con su comportamiento las caractersticas que se observan en los elementos de una poblacin
se pueden clasificar en constantes o variables
CARACTERSTICAS CONSTANTES
Una caracterstica es constante cuando el valor que presenta esta caracterstica no vara de un elemento a
otro o vara muy poco; por ejemplo, la estatura de una persona adulta observada en los ltimos 20 meses o
la profesin de un graduado universitario.
CARACTERSTICAS VARIABLES
Es una caracterstica que cambia frecuentemente de valor cuando se observa en algunos o en todos los
elementos de la poblacin.
Es un smbolo que puede tomar diversos valores dentro de un conjunto determinado de valores que
reciben el nombre de dominio de la variable.(Significado matemtico)
La estadstica solamente estudia las caractersticas variables Estas caractersticas variables, comnmente
denominadas variables, pueden ser de dos clases:
Variables cualitativas o categricas
Variables cuantitativas
Variables cualitativas o categricas: Son las que describen el estado de la caracterstica nicamente
mediante palabras. Se refieren a atributos, cualidades, actitudes o preferencias de los elementos que se
estn estudiando
EJEMPLOS:
Las profesiones u ocupaciones de un grupo de personas: Abogado, maestro, panadero, ingeniero, etc.
El estado civil de un grupo de personas: Soltero, casado, unin libre, etc.

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 5

UNIDADES TECNOLGICAS DE SANTANDER

El sabor de las naranjas de una cosecha: dulce, inspido, cido


El color favorito de un grupo de individuos: Blanco, rojo, verde, etc.
Pasatiempos de un grupo de estudiantes: Deportes, lectura, reuniones sociales, labores manuales, etc.
La calidad de un producto: Bueno, regular o defectuoso

Como se puede observar, en los ejemplos, cada una de estas variables se expresa a travs de dos o ms
modalidades o categoras: soltero, casado, unin libre; bueno, regular, defectuoso.
Los datos que se registran cuando las variables son cualitativas o categricas corresponden a la cantidad o
proporcin de elementos que caen dentro de cada categora que toma la variable, por ejemplo: el nmero de
abogados o de maestros, el nmero de individuos que prefieren el color blanco, la proporcin de productos
defectuosos.
Las variables categricas se pueden a su vez subdividir en variables nominales y variables ordinales.
Variables Nominales: son las que no tienen una forma particular de organizar sus categoras. Por ejemplo,
no existe una forma comn de ordenar los colores o el estado civil de las personas.
Variables ordinales: cuando existe una forma comn de organizar las categoras que toma la variable. Por
ejemplo: las modalidades como se puede expresar la calidad de un producto se pueden ordenar como
bueno, regular, defectuoso o al contrario, en defectuoso, regular, bueno. Las categoras con las que se
califica el servicio que presta una EPS se pueden ordenar como psimo, malo, regular, bueno o excelente.
Variables cuantitativas: Son las que se describen por medio de nmeros, por ejemplo, la edad de los
empleados de una empresa, las personas que visitan por da un museo, los saldos de las cuentas por
cobrar de una empresa, el peso de los paquetes que moviliza una empresa transportadora, el nmero de
vehculos que vende un concesionario, etc.
Las variables cuantitativas se pueden clasificar, tambin, en discretas o continuas:
Variables cuantitativas discretas son las que nicamente pueden tomar valores enteros tales como el
nmero de vehculos que vende un concesionario o el nmero de personas que asisten a una sala de cine
Variables cuantitativas continuas son las que se refieren a mediciones de magnitudes fsicas o a
caractersticas apreciables en unidades monetarias y admiten valores fraccionarios o decimales tales como
el peso de los paquetes que moviliza una transportadora, los saldos de las cuentas de ahorro de una entidad
financiera o el tiempo que dura el recorrido de un bus urbano.
Variables cuantitativas categricas: Cuando se quiere facilitar el manejo de los datos o aumentar la
comprensin de un fenmeno, las variable cuantitativas se pueden convertir en categricas, como cuando
las personas que miden menos de 1.50 metros se clasifican como de estatura pequea, las personas que
miden entre 1.50 metros y menos de 1.70 se clasifican como de estatura mediana y las personas que miden
1.70 metros o mas se clasifican como de estatura alta.
CENSO
Es cuando se observa y registra el estado de una caracterstica examinado a todos los elementos de una
poblacin
Los censos rara vez se realizan debido al tiempo que demandan y a la cantidad de recursos que necesitan
por lo que se recurre a tomar datos del estado de la variable en algunos de los elementos de la poblacin
MUESTRA
Es cuando se observa y registra el estado de una caracterstica variable examinado a una parte de los
elementos que pertenecen a una poblacin
Las muestras deben ser representativas y para esto se requiere que las caractersticas de la poblacin estn

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 6

UNIDADES TECNOLGICAS DE SANTANDER


representadas en la muestra, en la misma proporcin en que estn incluidas en la poblacin.
TAMAO DE LA MUESTRA
Es el nmero de elementos que componen la muestra. Se suele indicar con la letra n
EJEMPLO:
Para indicar que una muestra 350 elementos se indica as: n = 350
PARMETRO
Es el resultado de una medida o clculo que se hace utilizando los datos relacionados con el valor que toma
una caracterstica variable cuando se observan todos los elementos de una poblacin, es decir, cuando se
hace un censo. Por ejemplo, la edad promedio de los nios que cursan primer grado, este ao, en todas las
escuelas oficiales de la ciudad. El parmetro siempre es un valor constante.
ESTADSTICO
Es el resultado de una medida o clculo que se hace utilizando los datos relacionados con el valor que toma
una caracterstica variable cuando se observan algunos de los elementos de una poblacin, o sea, una
muestra. Por ejemplo, la edad promedio de los nios de primer grado de algunas escuelas oficiales de la
ciudad escogidas al azar. El estadstico es un valor que vara de muestra en muestra
TIPOS DE ESTUDIOS ESTADSTICOS
Los estudios estadsticos pueden ser experimentales y de observacin
En los estudios estadsticos experimentales el investigador controla o manipula una o varias variables con
el fin de determinar su comportamiento en determinadas condiciones
En los estudios estadsticos de observacin el investigador registra el estado de la caracterstica variable
que le interesa sin ejercer ninguna influencia sobre ella. El estudio estadstico de observacin mas comn es
la encuesta.
UNIDAD DE OBSERVACIN O DE INVESTIGACIN
Se llama Unidad de Observacin o de Investigacin a alguno de los siguientes conceptos:
Al nombre genrico, que se le da a los elementos cuya caracterstica se est registrando
A la entidad que se investiga o de la que se recolectan los datos
Al soporte de donde se extraen los datos
ESTADSTICAS
Es cualquier conjunto ordenado de datos como por ejemplo las estadsticas de un torneo de ftbol, las
estadsticas de ventas de una empresa o las estadsticas de accidentes

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 7

UNIDADES TECNOLGICAS DE SANTANDER


ARREGLO DE DATOS DE VARIABLE CONTINUA
INTRODUCCIN
Para visualizar las caractersticas de una situacin representada por un conjunto de datos o establecer el
patrn de comportamiento de esta situacin, los datos se deben organizar de alguna manera. La Estadstica
propone una metodologa que consiste en agrupar los datos recolectados en clases estadsticas
CONCEPTO DE CLASE
En general, una clase es un conjunto de elementos que tienen una o varias caractersticas en comn, por
ejemplo, las personas que compiten en algn deporte pertenecen a la clase de los deportistas, las personas
mayores de 60 aos pertenecen a la clase de la tercera edad
CLASE ESTADSTICA
En estadstica se llama clase, nicamente, a un conjunto de datos que estn dentro de un intervalo
determinado de valores. Por ejemplo, para datos correspondientes a ingresos de personas podemos crear
una clase de las personas que tienen ingresos entre $500.000 y $800.000. Toda clase estadstica tiene, por
lo tanto, un lmite inferior ( $500.000 ), y un lmite superior ( $800.000 )
AMPLITUD DE CLASE
Es la distancia o diferencia que hay entre los lmites de una clase. En el ejemplo anterior la amplitud de la
clase de ingresos es de $300.000. Es decir, que para calcular la amplitud de clase se resta del lmite
superior de la clase el lmite inferior.
Para expresar estas ideas en smbolos, llamamos A a la amplitud de la clase, LS al lmite superior de la clase
y LI al lmite inferior de la clase, expresando aritmticamente la amplitud de la clase as:
A = LS LI
Para el ejemplo: A = LS - LI = $800.000 - $500.000 = $300.000
Entonces, para visualizar las caractersticas de un conjunto de datos, la Estadstica propone que se agrupen
estos datos en intervalos de valores o clases
CARACTERSTICAS DE LAS CLASES ESTADSTICAS
Toda clase estadstica, para que pueda ser considerada como tal, debe cumplir con las siguientes tres
caractersticas:
Amplitud constante
Mutuamente excluyentes
Exhaustivas
Amplitud constante se refiere a que la amplitud de las clases en que se agrupa un determinado conjunto
de datos debe ser la misma para todo el conjunto de datos
Clases mutuamente excluyentes se refiere a que cualquier dato, de un conjunto de datos en estudio, debe
corresponder nicamente a una sola clase
Clases exhaustivas se refiere a que las clases que se establezcan para agrupar a un conjunto de datos
deben agrupar a todos los datos recolectados
NMERO DE CLASES
La primera inquietud que surge cuando se van a agrupar un conjunto de datos en clases estadsticas es en
cuantas clases es conveniente o adecuado agrupar estos datos. Hay varios criterios para resolver este
problema:
El nmero de clases es determinado por una circunstancia deseable u obligante
Determinar el nmero de clases de clases orientndose por una norma emprica de la estadstica
K
Determinar el nmero de clases utilizando la expresin emprica: No.C = 2

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 8

UNIDADES TECNOLGICAS DE SANTANDER

Determinar el nmero de clases utilizando la expresin emprica:


Otros criterios

No.C = 1 + 3,3 log( n )

El primer caso se presenta, por ejemplo, cuando el estudio actual se va a comparar con un estudio anterior o
un estudio realizado por otro investigador. Entonces, para facilitar las comparaciones entre los dos estudios,
es deseable que los datos del estudio actual se agrupen con el mismo nmero de clases del estudio anterior
La norma emprica de la estadstica indica que el nmero de clases en que se deben agrupar cualquier
conjunto de datos debe ser como mnimo 5 6 clases y como mximo alrededor de 20 clases
K

En la expresin No.C = 2 , No.C es abreviatura de nmero de clases y K indica las clases en que, segn
esta expresin, se deben agrupar los datos.
Para un estudio contiene 155 datos esta expresin funciona as:
6

S K = 6 clases, entonces, No.C = 2 = 64 como 64 < 155 el nmero de clases igual a 6 no es conveniente
7
S K = 7 clases, entonces, No.C = 2 = 128 como 128< 155 el nmero de clases igual a 7 no es conveniente
8
S K = 8 clases, entonces, No.C = 2 = 256 como 256> 155 el nmero de clases igual a 8, segn este
procedimiento, es al ms adecuado para agrupar los 155 datos del estudio.
En la expresin No.C = 1 + 3,3 log( n ), No,C es tambin, abreviatura de nmero de clases, log se refiere
a logaritmo con base 10 y n es la cantidad de datos que se desean agrupar
Para el estudio de 155 datos se tiene: No.C = 1 + 3,3 log(155) = 8,23, quiere decir que el nmero
conveniente de clases, para agrupar estos 155 datos est entre 8 y 9 clases
Otros criterios pueden ser, por ejemplo, nmeros de clases que hacen que los lmites de las clases sean
muy fciles de establecer o que las clases automticamente queden mutuamente excluyentes.
EJEMPLO PRCTICO
La siguiente tabla se refiere a los galones de gasolina corriente que tanquearon la semana pasada, en un
autoservicio, una muestra de vehculos escogidos al azar
3,8

1,7

2,8

2,0

2,5

1,8

2,9

3,6

2,2

3,0

2,8

4,7

3,3

6,9

5,0

2,6

4,0

2,7

4,1

3,4

4,8

5,3

4,9

3,0

3,9

2,0

5,6

2,3

4,5

2,9

6,1

3,0

1,9

6,4

2,6

2,0

2,0

2,6

3,1

PROCEDIMIENTO PARA PRINCIPIANTES


1. Establecer el nmero de clases de acuerdo al volumen de datos ( No.C )
2. Determinar los valores mximo y mnimo del conjunto de datos: Xmax y Xmin
3. Calcular el Rango, R = Xmax Xmin
4. Calcular la amplitud de las clases A = R/ No.C
5. Modificar la amplitud teniendo en cuenta los decimales de los datos ( Amod )
6. Ajustar el rango ( Rmod ), para que coincida con la nueva amplitud modificada
7. Ajustar Xmin o Xmax o ambos para que coincidan con el rango modificado
8. Construir los lmites de las clases
9. Verificar que las clases cumplan con las tres caractersticas de las clases estadsticas
10. Establecer el nmero de observaciones dentro de cada clase ( FA ) ( tabla de conteo )
11. Calcular la frecuencia relativa ( FR )
12. Ajustar la frecuencia relativa para que la suma de igual a 1
13. Calcular la frecuencia relativa acumulada ( FRA )

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 9

UNIDADES TECNOLGICAS DE SANTANDER


DESARROLLO DEL EJEMPLO
1. Determinar el nmero de clases
No existe ninguna circunstancia que haga conveniente o deseable un determinado nmero de clases
Se puede escoger cualquier nmero de clases entre 5 y 20 dependiendo del criterio o preferencia personal
del analista y se hacen varios tanteos hasta encontrar un nmero de clases satisfactorio
k

Aplicando la frmula No.C = 2


5
Para K = 5 entonces 2 = 32 < 39 quiere decir que 5 no es un nmero conveniente de clases
6
Para K = 6 entonces 2 = 64 > 39 quiere decir que 6 es el nmero conveniente de clases
Aplicando la frmula No.C = 1 + 3,3logn = 1 + 3,3log (39) = 6,25 quiere decir que el nmero de clases
conveniente est entre 6 y 7
En un primer ensayo se escogi, para este ejemplo, agrupar los datos en 6 clases
Los pasos 2 a 7 se presentan encuentran en la siguiente tabla
ARREGLO DE DATOS CONTINUOS EN 6 CLASES
Xmax
Xmin
R
No.C

= 6,9
= 1,7
= 5,2
=
6

A
=
Amod =
Rmod =
Rmod-R =

0,87
0,9
5,4
0,2

Xmin = 1,5

Xmin se refiere al lmite inferior de la primera clase


Los pasos restantes estn desarrollados en la siguiente tabla

No.
1
2
3
4
5
6

CLASES
1,5
2,4
2,4
3,3
3,3
4,2
4,2
5,1
5,1
6,0
6,0
6,9

FA
9
14
6
5
2
3
39

FAA
9
23
29
34
36
39

FR
0,23
0,36
0,15
0,13
0,05
0,08
1,00

FRA
0,23
0,59
0,74
0,87
0,92
1,00

Menor
Que
1,5
2,4
3,3
4,2
5,1
6,0
6,9

FRA
0
0,23
0,59
0,74
0,87
0,92
1,00

Esta tabla recibe el nombre de Distribucin de Frecuencias. Los detalles de su construccin sern
explicados por el docente en la exposicin que haga sobre este tema
LA DISTRIBUCIN DE FRECUENCIAS
Es la tabla compuesta por la columna CLASES y por una o varias de las siguientes columnas de
frecuencias:
Frecuencia Absoluta FA: Es la cantidad de datos de la muestra que corresponden a cada clase. Se
obtiene por conteo
Frecuencia Absoluta Acumulada FAA: Se obtiene, para cada clase, sumando la frecuencia absoluta
de la clase, FA, con la frecuencia absoluta de la clase anterior

Frecuencia Relativa FR: Se calcula, para cada clase, dividiendo la frecuencia absoluta de la clase, FA,
entre el total de datos de la muestra. Es prctico que los valores de la frecuencia relativa se tomen con
dos decimales y su suma se ajuste para que d exactamente uno

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 10

UNIDADES TECNOLGICAS DE SANTANDER

Frecuencia Relativa Acumulada FRA: Se calcula, para cualquier clase, sumando la frecuencia relativa
de la clase, FR, con la frecuencia relativa de la clase anterior

LECTURA DE LA DISTRIBUCIN DE FRECUENCIAS


Esta tabla permite describir la situacin histrica de la venta de gasolina en esta estacin de servicio, por
ejemplo, la mayora de los vehculos de la muestra, un 36%, tanquearon entre 2,4 y 3,3 galones de
gasolina, el 5% de los vehculos de la muestra tanquearon entre 5,1 y 6,0 galones de gasolina y fue la clase
con menor frecuencia de tanqueo. Solamente tres vehculos de la muestra tanquearon mas de 6,0 galones.
LA TABLA MENOR QUE
Es una tabla auxiliar que se construye a partir de las distribuciones de frecuencias acumuladas, FAA y FRA,
con el fin de facilitar la descripcin de la situacin utilizando estas frecuencias. Esta tabla se encuentra al
lado de la tabla de distribucin de frecuencias y se utiliz, en este caso, la columna de frecuencia relativa
acumulada.
Observando esta tabla se puede ver que el 59% de los vehculos de la muestra tanquearon menos de 3,3
galones de gasolina o que el 13% de los vehculos de la muestra tanquearon mas de 5,1 galones
REPRESENTACIN GRFICA DE LA SITUACIN EN ESTUDIO
La Estadstica Descriptiva utiliza tres tipos de grficos para representar cualquier situacin o fenmeno en
estudio:
El histograma
El polgono de frecuencias
La ojiva
Estos grficos permiten visualizar de manera fcil y rpida los resultados que se presentan en la distribucin
de frecuencias
EL HISTOGRAMA
Es un grfico de frecuencia absoluta, FA o la frecuencia relativa, FR, donde las clases se representan
mediante rectngulos. El siguiente histograma se refiere al ejemplo prctico y se utiliz la frecuencia relativa

HISTOGRAMA
0,40

0,36

FRECUENCIA RELATIVA

0,35
0,30
0,25

0,23

0,20

0,15

0,13

0,15

0,08

0,10

0,05

0,05
0,00

1.5

2.4

3.3

4.2

5.1

6.0

6.9

GALONES

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 11

UNIDADES TECNOLGICAS DE SANTANDER


EL POLGONO DE FRECUENCIAS
Se hace a partir del histograma uniendo las marcas de clase proyectadas sobre el lado superior de los
rectngulos y agregando, para cerrar la figura, dos clases adicionales, una, por encima del lmite superior de
la clase ms alta y la otra, por debajo del lmite inferior de la clase ms baja
Para construir el polgono de frecuencias necesitamos introducir el concepto de Marca de Clase
MARCA DE CLASE
Es el punto medio de una clase. Se calcula sumando los lmites de cada clase y dividiendo este total por 2.
El smbolo que usualmente se utiliza para representar la marca de clase es Xi
La expresin matemtica de la marca de clase es:

Xi =

:
2

Donde LS es el lmite superior de la clase y LI es el lmite inferior de la clase. Por ejemplo, para construir la
marca de clase de la primera clase se procede as:

Xi =

1,5 : 2,4
2

1,95

POLGONO DE FRECUENCIAS

0,40

0,36

FRECUENCIA RELATIVA

0,35
0,30
0,23

0,25
0,20

0,15

0,15

0,13
0,08

0,10
0,05

0,05
0,00

0,00

0,00
1,0

1,9

2,9

3,8

4,7

5,6

6,5

7,4

GALONES

Las marcas de clase se utilizan, tambin, cuando se requiere representar todos los valores de una clase por
un solo nmero. Por ejemplo, 1,95 galones representa todos los valores de la muestra que se encuentran
entre 1,5 galones y 2,4 galones
Tanto el histograma como el polgono de frecuencias permiten visualizar algunas de las caractersticas de la
situacin o fenmeno que se est estudiando, tales como:
El rango de los datos
Alrededor de qu valores tienden a agruparse los datos
Valores de la muestra que se presentan con ms o menos frecuencia
A qu lado de la grfica parecen agruparse ms los datos

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 12

UNIDADES TECNOLGICAS DE SANTANDER

Los dems detalles de la construccin del polgono de frecuencias sern explicados por el docente en la
exposicin que haga sobre este tema
COMO INTERPRETAR UN HISTOGRAMA O UN POLGONO DE FRECUENCIAS
Los histogramas y los polgonos de frecuencias facilitan a las personas que tienen que tomar decisiones
sobre una determinada situacin una visin rpida del comportamiento y caractersticas de la situacin que
se estudia. Algunas de las preguntas que se pueden responder observando estas grficas son:
Cul es el rango de los datos?
En qu clases se concentran el mayor nmero de datos?
Cul clase contiene menos datos?
Qu valores de la muestra se presentan con ms o menos frecuencia?
A qu lado de la grfica parecen concentrarse ms los datos?
Se presentan huecos o clases vacas?
Se presentan valores aislados de los dems?
La grfica presenta subidas o bajadas bruscas o suaves?
Cuntos picos tiene la grfica?
Es simtrica la grfica?

LA OJIVA
La ojiva es un grfico de frecuencias acumuladas que describe que cuantas unidades o qu porcentaje de
unidades se encuentran por encima o por debajo de un determinado valor de la variable.
Este grfico se construye a partir de la tabla MENOR QUE, utilizando la frecuencia absoluta acumulada, FAA
o la frecuencia relativa acumulada, FRA. En el grfico que se presenta a continuacin se utiliz la frecuencia
relativa acumulada.

OJIVA
1,2
1,00
FRECUENCIA RELATIVA

0,87

0,92

0,74

0,8
0,59
0,6
0,4
0,23
0,2
0
0
1,5

2,4

3,3

4,2

5,1

6,0

6,9

GALONES

Los detalles sobre la construccin de estos grficos sern explicados por el docente en la exposicin que
haga sobre este tema

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 13

UNIDADES TECNOLGICAS DE SANTANDER


LA INTERPOLACIN
En general, la interpolacin, es un mtodo de clculo para establecer el valor de la ordenada de un valor de
la variable que se encuentra dentro de otros valores ya calculados en una tabla. En el caso de la
Estadstica Descriptiva, se utiliza para calcular valores de la frecuencia absoluta acumulada, FAA o de la
frecuencia relativa acumulada, FRA, correspondientes a valores de la variable que no se encuentran en la
tabla MENOR QUE, pero que estn dentro de los valores mnimo y mximo recolectados en el estudio.
Por ejemplo, si se quiere saber qu porcentaje de los vehculos tanquearon mas de 4,8 galones de gasolina,
al buscar este valor en la tabla MENOR QUE se detecta que aunque no est tabulado, se encuentra entre
los valores de la variable 4,2 y 5,1 galones. Con esta informacin se pueden disponer los datos existentes y
los buscados de la siguiente manera:

X0 = 4,2
X1 = 4,8
X2 = 5,1

Y0
Y1
Y2

= 0,74
= ?
= 0,87

La expresin matemtica que permite realizar el clculo de interpolacin es la siguiente:

Y1 = Y0 +

(1 ;0 )
(2 ;0 )

(Y2 - Y0)

Reemplazando los smbolos por los valores se tiene:

Y1 = 0,74 +

( 4,8 ;4,2 )
( 5,1 ; 4,2 )

( 0,87 - 0,74 ) = 0,827 0,83

Esto quiere decir que el 83% de los vehculos de la muestra tanquearon menos de 4,8 galones, pero, como
se quiere saber es que porcentaje tanque mas de 4,8 galones, se debe restar el resultado anterior de 1
1 - 0,83 = 0,17 = 17% = porcentaje de vehculos de la muestra que tanquearon mas de 4,8 galones

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 14

UNIDADES TECNOLGICAS DE SANTANDER


ARREGLO DE DATOS DE VARIABLE DISCRETA
PROCEDIMIENTO PARA PRINCIPIANTES
1. Establecer el nmero de clases de acuerdo al volumen de datos ( No.C )
2. Determinar los valores mximo y mnimo del conjunto de datos: Xmax y Xmin
3. Calcular el Rango, R = Xmax Xmin
4. Calcular la amplitud de las clases A = R/ No.C
5. Cortar a enteros la amplitud (Amod)
6. Ajustar Amod a nmero par
7. Tomar Xmin como el lmite inferior de la primera clase
8. Construir los lmites de las clases con extremos cerrados
9. Construir las clases que se requieran para que quede incluido, en la ltima clase, el Xmax
Al construir las clases con este procedimiento automticamente quedan con las tres condiciones de las
clases estadsticas, es decir, de amplitudes constantes, mutuamente excluyentes y exhaustivas.
A continuacin se ejecutan, de manera idntica, los pasos 10 a 13 del procedimiento para variable continua
EJEMPLO PRCTICO
Una muestra de 41 das del nmero de transacciones que se realizan por da un cajero automtico se
presenta en la siguiente tabla:
73
83
87
47
80

68
56
91
81
84

76
79
78
54
36

71
62
49
90
67

60
64
91
77
51

41
87
72
63
45

91
66
63
52
61

67
74
68
75
57

85

DESARROLLO DEL EJEMPLO


1. Establecer el nmero de clases

Utilizando la expresin logartmica se tiene:


No.C = 1 + 3,3 log (41) = 6,3 que indica que un nmero conveniente de clases para esta
cantidad de datos es 6 7clases. Para este ejemplo se tomaron 6 clases
Pasos 2 a 6:
Xmax =
Xmin =
R
=
No.C =
A
=
Amod =

91
36
55
6
9,16667
9

En el clculo anterior se puede observar que para construir la amplitud modificada, se borra toda la parte
decimal de la amplitud, A, calculada

Cuando la amplitud modificada es un nmero impar, las marcas de clase, que se utilizan para representar a
las clases, son valores fraccionarios, como ocurre en este ejemplo; esta situacin es incmoda porque no
refleja la realidad en los casos de variable discreta, por lo que se prefiere agrupar los datos en clases que
sean de amplitud par, como se presenta a continuacin, para el mismo ejemplo, donde la amplitud se cambi

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 15

UNIDADES TECNOLGICAS DE SANTANDER


de 9 transacciones por da a 8 transacciones por da, esto hace que el nmero de clases pase de 6 a 7
Amod = 8
Pasos 7 a 9:

No.
1
2
3
4
5
6
7

CLASES
36
44
45
53
54
62
63
71
72
80
81
89
90
98

FA
2
5
6
9
9
6
4
41

FR
0,05
0,12
0,14
0,22
0,22
0,15
0,10
1,00

FRA
0,05
0,17
0,31
0,53
0,75
0,90
1,00

Menor
Que
36
45
54
63
72
81
90
99

FRA
0
0,05
0,17
0,31
0,53
0,75
0,90
1,00

Se observa, tambin, que el lmite inferior de cada clase es igual al lmite inferior de la clase anterior ms
uno. Tambin se puede ver que el lmite superior de la ltima clase, (98), no coincide con el Xmax, (91), de
los datos y el lmite inferior de la primera clase es el Xmin (36), de los datos.
Las clases construidas de esta manera se llaman CLASES CERRADAS, porque en cada clase se
contabilizan todos los datos incluidos entre los dos lmites de la clase. Sin embargo, estas clases, como se
puede observar, son de amplitudes constantes, mutuamente excluyentes y exhaustivas.
Tambin se observa que la tabla MENOR QUE, se construye de manera un poco distinta a como se hizo
para el caso de variable continua, ntese que el ltimo valor de la columna Menor Que, no es igual al lmite
superior de la ltima clase, sino a se valor ms uno.
.
REPRESENTACIN GRFICA
HISTOGRAMA
Para el caso de variable discreta el histograma, recibe tambin el nombre de DIAGRAMA DE FRECUENCIAS y
en l las clases se encuentran separadas, como se ve en el siguiente grfico:

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 16

UNIDADES TECNOLGICAS DE SANTANDER

DIAGRAMA DE FRECUENCIAS

Frecuencia Relativa

0,25

0,22

0,22

0,2
0,15

0,14

0,15

0,12
0,1

0,1
0,05
0,05
0
36 44

45 53

54 62

63 71

72 80

81 89

90 98

Nmero de transacciones

Con frecuencia, en lugar de identificar cada clase con sus lmites de clase, es ms prctico utilizar la marca de clase,
como se muestra en este grfico, a continuacin

Diagrama de Frecuencias

Frecuencia relativa

0,25

0,22

0,22

0,20
0,15

0,14

0,15

0,12
0,10

0,10
0,05
0,05
0,00

40

49

58

67

76

85

94

Nmero de transacciones

Ahora es mucho ms fcil leer el diagrama de frecuencias, por ejemplo, en el 14% de los das de la muestra
se realizaron 58 transacciones, el nmero de transacciones por da menos frecuente, en la muestra, fue de
40 transacciones por da
POLGONO DE FRECUENCIAS
Se construye de la misma manera, a partir del diagrama de frecuencias y las marcas de clase, como se hizo
en el caso de variable continua. Ntese que en esta grfica se presenta una distorsin debido a que las
clases no son adyacentes

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 17

UNIDADES TECNOLGICAS DE SANTANDER

Polgono de Frecuencias

Frecuencia Relativa

0,25

0,22

0,22

0,2
0,15

0,14

0,15

0,12
0,10

0,1

0,05
0,05
0

0,00

0
31

40

49

58

67

76

85

94

103

Nmero de Transacciones

OJIVA
Cuando la variable es discreta, como en este caso, la ojiva se construye de forma diferente, porque la
variable slo toma valores enteros, aunque, aqu tambin, este grfico se construye a partir de la tabla
MENOR QUE

Frecuencia Relativa Acumulada

OJIVA
1,2
1,00
1

0,9
0,75

0,8
0,53

0,6
0,4
0,2
0

0,31
0,17
0,05

36

45

54

63

72

81

90

99

Nmero de transacciones

Los detalles sobre la construccin de este grfico sern explicados por el docente en la exposicin que haga
sobre este tema

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 18

UNIDADES TECNOLGICAS DE SANTANDER

ARREGLO DE DATOS PARA VARIABLE DISCRETA EN CLASES DE AMPLITUD CERO


Cuando el intervalo de valores que toma la variable es reducido y la variable es discreta, es ms prctico
agrupar los datos en clases de amplitud cero, como se muestra en el siguiente caso. Aqu X simboliza los
valores que toma la variable que son al mismo tiempo las clases estadsticas. Estas clases cumplen con las
tres caractersticas de una clase estadstica: son de amplitud constante, son mutuamente excluyentes y son
exhaustivas
EJEMPLO
Se tom una muestra de 60 facturas registrando el nmero de errores por factura. Los resultados se
presentan en la siguiente tabla:
1
2
0
4
2
0

0
1
3
1
2
0

1
1
0
1
0
3

X
0
1
2
3
4

2
1
0
0
3
1

FA
25
19
10
4
2
60

FR
0,42
0,31
0,17
0,07
0,03
1,00

0
0
1
0
3
2

FAA
25
44
54
58
60

0
1
0
0
1
2

1
4
1
1
0
0

FRA
0,42
0,73
0,90
0,97
1,00

0
0
2
0
2
1

MENOR
QUE
0
1
2
3
4
5

0
0
2
0
2
1

1
0
0
1
0
1

FRA
0
0,42
0,73
0,90
0,97
1,00

Diagrama de Frecuencias
30
25
No. de facturas

25
19

20

15
10
10
4

0
0

No. de errores

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 19

UNIDADES TECNOLGICAS DE SANTANDER

ARREGLO DE DATOS CUALITATIVOS


Cuando la variable es cualitativa, el arreglo y presentacin de datos estadstico es limitado. Slo se pueden
construir distribuciones de frecuencias con las frecuencias absolutas y relativas y diagramas de frecuencias.
Adicionalmente, se utilizan en estos casos otros tipos de grficos como se presenta en el siguiente ejemplo:
EJEMPLO
Se interrog a una muestra de clientes de una cafetera sobre el tipo de bebida gaseosa que prefieren
obtenindose los siguientes resultados:
Cocacola

Quatro

Pepsicola

Cocacola

Postobn

Link

Postobn

Postobn

Pepsicola

Seven Up

Pepsicola

Cocacola

Cocacola

Quatro

Quatro

Link

Cocacola

Postobn

Pepsicola

Sprite

Pepsicola

Sprite

Cocacola

Postobn

Cocacola

Postobn

Cocacola

Postobn

Cocacola

Quatro

Pepsicola

Link

Cocacola

Postobn

Sprite

No.
1
2
3
4
5
6
7

CLASES
Cocacola
Link
Pepsicola
Postobn
Quatro
Seven Up
Sprite

FA
10
3
6
8
4
1
3
35

FR
0,29
0,09
0,17
0,23
0,11
0,03
0,08
1,00

Diagrama de Frecuencias
0,35
Frecuencia Relativa

0,3

0,29
0,23

0,25
0,2

0,17

0,15

0,11

0,09

0,1

0,08
0,03

0,05
0
Cocacola

Link

Pepsicola Postobn Quatro Seven Up

Sprite

Tipo de bebida

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 20

UNIDADES TECNOLGICAS DE SANTANDER

Diagrama Circular
Seven Up
3%
Sprite
8%
Quatro
11%

Cocacola
29%

Postobn
23%

Link
9%
Pepsicola
17%

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 21

UNIDADES TECNOLGICAS DE SANTANDER

UNIDAD 2: MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN


MEDIDAS DE TENDENCIA CENTRAL
1. FORMAS ESTADSTICAS DE DESCRIBIR UN FENMENO
Anteriormente se vio que los fenmenos o hechos se pueden describir con tablas y grficos pero, tambin se
pueden describir con nmeros
2. CONCEPTO DE MEDIDA EN ESTADSTICA
En estadstica se llama medida a un clculo u operacin que se realiza sobre un conjunto de datos para
extraer alguna informacin
EJEMPLOS
Calcular la estatura promedio de un grupo de personas
Hallar la diferencia entre el mayor y el menor valor de un conjunto de datos
Establecer el valor que ms se repite dentro de un conjunto de datos
3. PARMETROS Y ESTADSTICOS
En la unidad anterior se vio que los clculos o medidas que se realizan con los datos referidos a una
situacin pueden clasificarse de dos maneras:
Parmetros: Cuando el clculo se realiza con todos los datos de la poblacin. Los parmetros son valores
constantes
Estadsticos: Cuando el clculo se realiza con una parte de los datos de la poblacin, es decir, una
muestra. Los estadsticos son variables
4. CLASES DE MEDIDAS EN ESTADSTICA
En estadstica existen tres clases de medidas:
Las medidas de tendencia central
Las medidas de tendencia no central o de posicin
Las medidas de dispersin
5. LAS MEDIDAS DE TENDENCIA CENTRAL
Son tres valores, con cada uno de los cuales, se pretende describir, parcialmente, el comportamiento de una
muestra o de una poblacin.
Las medidas tendencia central, reciben este nombre porque al representar el resultado de un clculo en un
grfico de una distribucin de frecuencias (histograma o polgono de frecuencias), el valor calculado siempre
se sita hacia el centro de la grfica.
6. LAS MEDIDAS DE DISPERSIN
Las medidas de dispersin son clculos o valores que indican que tan concentrados estn los datos
alrededor de un valor especial que se toma como referencia
7. MEDIDAS PARA POBLACIONES Y MEDIDAS PARA MUESTRAS
Las medidas de tendencia central y de dispersin pueden clasificarse como Parmetros o Estadsticos,
segn sea que los datos utilizados correspondan a una poblacin o a una muestra.
Los clculos de las medidas de tendencia central y de dispersin para poblaciones, en algunos casos, son
diferentes de los clculos de las medidas de tendencia central y de dispersin para muestras, por lo que se
utilizan, en estos casos, smbolos diferentes para cada tipo de medida.

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 22

UNIDADES TECNOLGICAS DE SANTANDER

8. CLASES DE MEDIDAS DE TENDENCIA CENTRAL


Existen tres clases de medidas de tendencia central:
La media aritmtica o promedio
La mediana
La moda
9. LA MEDIA ARITMTICA
Existen dos tipos de media aritmtica: la Media Aritmtica Simple y la Media Aritmtica Ponderada. A la
media aritmtica simple se le llama usualmente La Media y la forma de calcularla depende de s los datos
estn o no agrupados en clases.
9.1 MEDIA ARITMTICA PARA DATOS NO AGRUPADOS
La media aritmtica, para datos no agrupados, se calcula sumando los valores registrados de la variable en
estudio y dividiendo entre el total de estos valores registrados. La expresin matemtica de este clculo
tiene dos presentaciones: una s los datos registrados corresponden a una poblacin y otra s los datos
corresponden a una muestra, tal como se indica a continuacin.

Xi
N

Para Poblaciones

Xi
n

Para Muestras

El significado de los smbolos es el siguiente:


Es la letra del alfabeto griego mu, simboliza la media aritmtica calculada para una poblacin
Se lee equis trazo o equis barra, simboliza la media aritmtica calculada para una muestra

N Es el nmero de valores que toma la variable, en estudio, en la poblacin


n Es el nmero de valores que toma la variable, en estudio, en la muestra
Es cada uno de los valores que toma la variable en la muestra o en la poblacin

EJEMPLO
Las comisiones que un vendedor ha recibido en los 6 primeros meses del ao se presentan en la siguiente
tabla:
La expresin para calcular la media aritmtica indica
que se deben sumar todos los valores que toma la
variable y dividir por el nmero de datos

Ingresos
MES

(Miles de $ )

Enero

800

Febrero

950

Marzo

920

Abril

1000

Mayo

830

Junio

900

Calcular la media aritmtica


interpretar el significado

DEPARTAMENTO DE CIENCIAS BSICAS

800:950:920:1000:830:900
6

= $900 miles
e

Como esta forma de clculos es poco prctica se


suman, mejor, los datos en columna como se muestra a
continuacin

VERSIN 5

FECHA: 2011

Pgina 23

UNIDADES TECNOLGICAS DE SANTANDER

SOLUCIN:
Ingresos
MES

(Miles de $ )

Enero

800

Febrero

950

Marzo

920

Abril

1000

Mayo

830

Junio

900

Suma

= 5400

5400
6

= $900 miles

Interpretacin: La media aritmtica es el mismo


promedio y es como s en cada uno de los 6 meses el
comisionista hubiera ganado $900.000

5400

9.2 MEDIA ARITMTICA PARA DATOS AGRUPADOS


La media aritmtica se calcula sumando los productos de las marcas de clase por sus respectivas
frecuencias absolutas y dividiendo esta suma por el nmero total de datos registrados

XiFAi

Para Poblaciones

XiFAi
n

Para Muestras

el significado de los smbolos es el siguiente:


Es la letra del alfabeto griego mu, simboliza la media aritmtica calculada para una poblacin
Se lee equis trazo o equis barra, simboliza la media aritmtica calculada para una muestra

N Es el tamao de la poblacin
n Es el tamao de la muestra
Es la marca de clase de cada una de las clases en que se han agrupado los datos
Es la frecuencia absoluta de cada una de las clases en que se han agrupado los datos
EJEMPLO
Una muestra del valor de las facturas, en miles de pesos, que se cancelan con tarjetas de crdito en una
cadena de almacenes de modas se presenta en la siguiente tabla:

Ventas

Como se debe calcular la marca de clase de cada clase y


multiplicar cada uno de esto valores por su respectiva
frecuencia absoluta, estas operaciones es ms prctico
realizarlas en forma tabular, como se muestra a
continuacin:

No. de

(Miles de $) Facturas
30

36

25

36

42

38

42

48

49

48

54

51

54

60

32

60

66

29

224
Calcular la media aritmtica
interpretar el significado

Ventas
No. de
(Miles de $) Facturas

XiFAi

30

36

25

33

825

36

42

38

39

1.482

42

48

49

45

2.205

48

54

51

51

2.601

54

60

32

57

1.824

60

66

29

63

1.827

224

DEPARTAMENTO DE CIENCIAS BSICAS

Xi

VERSIN 5

10.764

FECHA: 2011

Pgina 24

UNIDADES TECNOLGICAS DE SANTANDER

SOLUCIN:
El total de la cuarta columna es = 10.764 y el total de datos, n, es 224, por lo que la media aritmtica
buscada es:

10.764
224

= $48.054 miles

Interpretacin: El valor de promedio de cada factura pagada con tarjeta de crdito es de $48.054 miles, que
es como si cada factura fuera de este valor
9.3 SIGNIFICADO DE LA MEDIA ARITMTICA
La media aritmtica o promedio calculada para un conjunto de datos significa que al remplazar el valor
promedio por cada uno de los datos se obtiene el mismo resultado general
10. MEDIA ARITMTICA PONDERADA
Existen situaciones en las cuales los datos registrados sobre una situacin traen in formacin adicional que
indica que estos valores no tienen la misma importancia relativa, como se presenta en el siguiente caso:
EJEMPLO
Las notas obtenidas por un estudiante en 3 quices de un corte y las notas finales, del semestre, extradas del
polgrafo correspondiente, se presentan en la siguiente tabla:

PRUEBA
Quiz No.1
Quiz No.2
Quiz No.3
Promedio

NOTA
3.5
4.1
2.4
3.3

ASIGNATURA
A
B
C

NOTA
FINAL
4.9
3.1
3.0

CRDITOS
2
4
3

En el caso de los quices no existe ninguna informacin que permita pensar que estas tres notas tienen
diferente nivel de importancia, por lo que su promedio se puede calcular utilizando la frmula de la media
para datos no agrupados, lo que no ocurre para el caso del polgrafo donde, por ejemplo, la nota de la
asignatura B vale el doble que la nota de la asignatura A; en casos como este, para calcular el promedio, se
utiliza una variante de la media aritmtica que recibe el nombre de Media Aritmtica Ponderada o Promedio
Ponderado, cuya expresin matemtica es la siguiente:
Xi Wi
p =
Media aritmtica ponderada
Wi
p Es el smbolo de la media ponderada
xi Representa los valores que toma la variable. En el ejemplo, las notas (4.9, 3.1 y 3.0)
Representa el valor relativo de cada uno de los datos, llamados Factores de Ponderacin. En el
ejemplo, los crditos de cada una de las asignaturas (2, 4 y 3)

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 25

UNIDADES TECNOLGICAS DE SANTANDER


Aplicando la frmula al ejemplo se tiene:
NOTA
FINAL

CRDITOS

ASIGNATURA

Xi

Wi

XiW i

4,9

9,8

3,1

12,4

3.0

9.0

31,2

Suma

Xi Wi = 31.2
Wi = 9

= 3.47

S para este caso del polgrafo el promedio se calculara como media aritmtica simple, ignorando la
informacin de los crditos, este clculo dara 3.7 que es diferente del promedio ponderado que da un valor
de 3.47
11. PROPIEDADES DE LA MEDIA ARITMTICA
El clculo de la media aritmtica tiene en cuenta todos los valores de la variable en estudio registrados
A todas las variables cuantitativas se les puede calcular la media aritmtica
Un conjunto de datos slo tiene una media
La media permite hacer comparaciones entre poblaciones o muestras
La media se puede trabajar matemticamente
La media es afectada por los valores extremos
No se puede calcular la media en distribuciones de frecuencias que tienen clase de extremo abierto

12. LA MEDIA GEOMTRICA


En muchas situaciones los datos se presentan en valores relativos tales como porcentajes o proporciones.
En tales casos el procedimiento de clculo de la media, que se ha estado utilizando hasta ahora, puede
apartarse de los resultados reales s la variabilidad de los datos es alta.
12.1 CLCULO DE LA MEDIA GEOMTRICA
Existe, entonces, una expresin matemtica especial para calcular promedios en los casos en que los datos
provengan de tasas de inters, porcentajes o nmeros ndices, entre otros. A este expresin matemtica se
le llama la media geomtrica y se suele representar por la letra G
G =

n ( FC1)( FC 2)( FC 3)............( FCn)

G Es el smbolo de la media geomtrica


FC1, FC2..FCn se llaman Factores de Crecimiento
El ndice de la raz depende del nmero de factores de crecimiento. S los factores de crecimiento son 2, la
raz es cuadrada, s los factores de crecimiento son 6 la raz es sexta y as sucesivamente.
Los factores de crecimiento, FCi, se determinan con la siguiente expresin:
FC = 1 +


100

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 26

UNIDADES TECNOLGICAS DE SANTANDER


Como el valor en porcentaje se llama comnmente Tasa, la expresin, ms apropiada, para el Factor de
Crecimiento es:
FC = 1 +

100

EJEMPLO
La rentabilidad de un ttulo valor ha estado variando en las ltimas semanas como se presenta en la
siguiente tabla:

RentaSemana

bilidad

3%

1%

-2%

0,7%

1,5%

Para aplicar la frmula, las tasas de


rentabilidad se deben convertir a factores de
crecimiento
RentaSemana

bilidad

FC

3%

1,03

1%

1,01

6
1%
A qu tasa promedio semanal ha estado
variando la rentabilidad de este ttulo?

-2%

0,98

0,7%

1,007

1,5%

1,015

1%

1,01

Con los factores de crecimiento, de la tercera columna, se calcula G


G=

(1.03)(1.01)(0.98)(1.007)(1.015)(1.01)

G = 1.008557 (Factor de crecimiento promedio)


Como las unidades de este clculo son Factores de Crecimiento, para convertir este resultado en tasa, se
despeja sta de la ltima frmula
FC = 1 +

100

====> Tasa = ( FC 1 )x100

Por lo tanto:
Tasa promedio = (1.00856 1 ) x 100 = 0.856% 0.9%
Respuesta: El ttulo ha estado aumentado a una tasa promedio del 0.9% semanal
Cuando los datos se presentan en valores absolutos, pero, se debe calcular un porcentaje promedio, los
factores de crecimiento se determinan como se indica en el siguiente ejemplo:

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 27

UNIDADES TECNOLGICAS DE SANTANDER


EJEMPLO
Las ventas anuales de una empresa, en millones de pesos, se presentan en la tabla No.1. A qu tasa
promedio anual estn variando las ventas de esta empresa?
TABLA No.1

AO

Ventas
(Millone
s)

2001

68

2002

75

2003

32

2004

59

2005

73

2006

92

2007

108

TABLA No.2

Obsrvese que se pide la tasa promedio de


crecimiento, que es un valor relativo y no la
venta promedio anual, que es un valor
absoluto.
Para convertir las ventas, que son valores
absolutos, en factores de crecimiento, se
divide el valor de un periodo cualquiera entre
el valor del periodo inmediatamente anterior.
Por ejemplo, el factor de crecimiento del ao
2004 se consigue dividiendo 59 entre 32
Los dems clculos se muestran en la tabla
No.2

Obsrvese que no se puede calcular el factor de crecimiento


del ao 2001 porque no se conocen las ventas del ao 2000.

AO

Ventas
(Millone
s)

2001

68

2002

75

1,1029

2003

32

0,4267

2004

59

1,8438

2005

73

1,2373

2006

92

1,2603

2007

108

1,1739

FC

Con los datos de la tercera columna, FC, se calcula G


6

G = (1.1029)(0.4267)(1.8438)(1.2373)(1.2603)(1.1739)
G = 1.08017 (Factor de Crecimiento promedio)
Tasa Promedio = (1.08017 1) x 100 = 8.017%
Respuesta: Las ventas estn creciendo a una tasa promedio
del 8% anual

Tambin se puede calcular la media geomtrica para el caso de valores que varan en funcin del tiempo y
slo se conocen los valores inciales y finales del periodo, como se puede ver en el siguiente ejemplo:
EJEMPLO
Una persona invirti $25 millones a 3 aos, recibiendo al final de este periodo la suma de $33,306 millones
A qu tasa promedio mensual creci esta inversin?
La expresin de la media geomtrica para casos como este es la siguiente:
G=

valor final
valor inicial

Donde n es el nmero de periodos de tiempo durante el intervalo de la inversin


Para el caso del ejemplo la expresin se aplica as:

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 28

UNIDADES TECNOLGICAS DE SANTANDER


36

G=

33.306
25

= 1.00800 (Factor de Crecimiento promedio)

Como la tasa que se pide es mensual el nmero de periodos es 36, por lo tanto, el ndice de la raz es 36
Para calcular la tasa promedio se aplica la expresin:
Tasa = ( FC 1 )x100
Tasa promedio = (1.008 1) x 100
Tasa promedio = 0.8%
Es decir, la inversin est creciendo, en promedio al 0.8% mensual.
12.2 PROPIEDADES DE LA MEDIA GEOMTRICA
La media geomtrica siempre es menor o igual a la media aritmtica, es decir: G
12.3 USOS DE LA MEDIA GEOMTRICA
La media geomtrica se utiliza para calcular promedios de cantidades expresadas en porcentajes o en
proporciones

13. LA MEDIANA
La mediana es el valor que ocupa la posicin central de un conjunto de datos cuando estos estn ordenados
de menor a mayor.
Para aclarar este concepto veamos el siguiente ejemplo:
EJEMPLO
La siguiente tabla presenta las notas obtenidas por una muestra de estudiantes en un examen

ESTUDIANTE
R. Martnez
P. Ardila
M. Castellanos
A. Manjarrs
O. Len

NOTA
4.3
1.7
3.8
4.8
3.5

ESTUDIANTE
L. Rueda
J. Zrate
G. Torres
Z. Bentez

NOTA
2.9
4.0
1.2
4.7

Ordenando estos datos de menor a mayor donde el menor est en el extremo izquierdo y el mayor en el
extremo derecho de la fila se tiene:
1.2

1.7

2.9

3.5

3.8

4.0

4.3

4.7

4.8

El nmero que ocupa la posicin central es 3.8 porque por debajo de l hay 4 datos y por encima otros 4, por
lo tanto, 3.8 es el valor mediano
13.1 INTERPRETACIN DE LA MEDIANA
El docente que tom la muestra podra describir el comportamiento de los estudiantes en la prueba diciendo
que la mitad de las notas de la muestra se encuentran por debajo de 3.8 o por encima de 3.8
Alternativamente, el docente podra haber utilizado el promedio o media aritmtica para describir el
comportamiento de los estudiantes en la muestra, como se vio anteriormente, pero, la mediana, entonces, es
otra manera de describir una situacin que es diferente de la media aritmtica

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 29

UNIDADES TECNOLGICAS DE SANTANDER

13.2 SMBOLO DE LA MEDIANA


El smbolo utilizado, en estas notas, para representar la mediana es:
una equis con una onda en la parte superior que se lee equis mediana
El clculo de la mediana para el caso de las notas se expresa as:

= 3.8
13.3 CLCULO DE LA MEDIANA PARA DATOS NO AGRUPADOS
Nmero impar de datos
Cuando en nmero de datos que componen la muestra es impar, como en el ejemplo de las notas, la
mediana se puede calcular por simple inspeccin como se hizo anteriormente. Pero, para situaciones que
representen un mayor nmero de datos existe una expresin matemtica que es la siguiente.

= Xn+1
2

Esta expresin indica que el valor mediano ocupa la posicin (n + 1)/2 cuando los datos estn ordenados en
orden ascendente
Para aplicar esta expresin es preciso ordenar, entonces, los datos en orden ascendente e indicar la
posicin u orden de cada dato como se muestra a continuacin:

X1
1.2

X2
1.7

X3
2.9

X4
3.5

X5
3.8

X6
4.0

X7
4.3

X8
4.7

X9
4.8

Los Xi indican la posicin de cada dato, por ejemplo, X 7 indica que 4.3 ocupa la sptima posicin cuando
los datos estn ordenados de forma ascendente
Como el nmero de datos es 9, entonces (n+1)/2 es igual a 5, esto quiere decir que el valor mediano es el
valor que ocupa la quinta posicin cuando los datos estn ordenados de menor a mayor
= X5 = 3.8
tal como se haba establecido anteriormente por simple inspeccin
Nmero par de datos
Cuando el nmero de datos sin agrupar es par, la expresin para calcular la mediana es la siguiente.
=

X n / 2 X n / 21
2

Esto quiere decir que el valor mediano es el resultado de promediar los valores que ocupan las posiciones
X n / 2 y X n / 21
Para explicar esta expresin veamos el siguiente ejemplo:

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 30

UNIDADES TECNOLGICAS DE SANTANDER


EJEMPLO
Una muestra de las estaturas, en metros, de 10 estudiantes de una clase se presentan en la siguiente tabla:

ESTUDIANTE
ESTATURA
ESTUDIANTE
ESTATURA
M. Rodrguez
1.75
G. Lpez
1.69
L. Snchez
1.68
H. Nez
1.57
D. Rojas
1.81
T. Garca
1.77
J. Acevedo
1.65
R. Orduz
1.62
F. Daz
1.73
P. Pinzn
1.71
Al ordenar estos datos de forma ascendente e indicar la posicin de cada uno de ellos se llega a la siguiente
tabla:
X1
1.57

X2
1.62

X3
1.65

X4
1.68

X5
1.69

X6
1.71

X7
1.73

X8
1.75

X9
1.77

X10
1.81

Como se puede observar, en esta ocasin, no existe un valor nico que se localice en el centro del conjunto
de datos ordenado, los valores X5 y X6 ocupan el centro de este conjunto y la mediana se localiza en el
punto medio entre estos dos datos , por lo que para establecer su valor se promedian 1.69 y 1.71 as:
=

X5 X6
2

1.69 1.71
= 1.70
2

Este valor se interpreta como que la mitad de los estudiantes de esta muestra miden menos de 1.70 metros
se deja al lector de estas notas, que como ejercicio, verifique que la expresin de la mediana para nmero
par de datos produce el mismo resultado anterior
13.4 CLCULO MEDIANA PARA DATOS AGRUPADOS
Recordemos que cuando se habla de datos agrupados nos referimos a datos agrupados en clases
Se presentan dos casos para el clculo de la mediana
Primer Caso
La frecuencia absoluta acumulada, FAA, hasta alguna de las clases, de la distribucin de frecuencias,
coincide con la cantidad total de datos dividida entre 2, es decir, ( n / 2), como se puede ver en el siguiente
ejemplo:
EJEMPLO
Los ingresos en una semana, en millones de pesos, de una muestra de tabernas se presenta en la siguiente
tabla:
clase
No.
1
2
3
4
5
6
7

Ingresos
(Millones de $)
1,6
1,9
1,9
2,2
2,2
2,5
2,5
2,8
2,8
3,1
3,1
3,4
3,4
3,7
Suma

DEPARTAMENTO DE CIENCIAS BSICAS

No. De
tabernas
6
11
18
25
29
20
11
120

VERSIN 5

FAA
6
17
35
60
89
109
120

FECHA: 2011

Pgina 31

UNIDADES TECNOLGICAS DE SANTANDER


Como se puede observar el nmero de datos de la muestra n es 120, por lo tanto, n/2 es 60 y este valor
coincide con la frecuencia absoluta acumulada, FAA, hasta la cuarta clase. En este caso la mediana es igual
al lmite superior de la cuarta clase, es decir:
= Lmite superior de la clase = $2.8 millones
Este valor se puede interpretar diciendo que la venta mnima de la mitad de las tabernas de la muestra fue
de $2.8 millones
Segundo caso
El clculo del total de datos de la muestra dividido entre 2, n/2, no coincide con el valor de la frecuencia
absoluta acumulada, FAA, de ninguna de las clases
Para calcular la mediana en este caso se utiliza la siguiente frmula de interpolacin:

n / 2 FAAi 1

FAi

= + A

es el lmite inferior de la clase que contiene la mediana


A es la amplitud de las clases
es la cantidad total de datos de la muestra dividida entre 2
; es la frecuencia absoluta acumulada hasta la clase anterior a la clase que contiene la mediana
es la frecuencia absoluta de la clase que contiene la mediana
Para saber cul es la clase que contiene la mediana se compara n/2, el tamao de la muestra dividido entre
2, con las frecuencias absolutas acumuladas, FAA, de la distribucin de frecuencias. La mediana se
encuentra en la clase cuya frecuencia absoluta acumulada, FAA, sea inmediatamente superior a n/2. A esta
clase, en trminos de la expresin anterior, se le llama la clase i, y la clase anterior a esta se le llama la clase
i-1
Para aclarar estos conceptos revisemos el siguiente ejemplo:
EJEMPLO
Los saldos de los depsitos al finalizar un mes en las cuentas de ahorro de un nmero de cuentahabientes,
de los bancos locales, escogidos al azar, se presentan en la siguiente tabla:

Clase
No.
1
2
3
4
5
6
7
8
9

SALDO
MENSUAL
(Miles de $)
0
300
300
600
600
900
900
1.200
1.200 1.500
1.500 1.800
1.800 2.100
2.100 2.400
Mas de 2.400

No. De
depsitos
25
36
51
42
37
30
22
19
17

FAA
25
61
112
154
191
221
243
262
279

clase i - 1
clase i

El nmero total de datos de la muestra es 279 depsitos, por lo tanto, n/2 es $139.5 miles. El valor, de la
frecuencia absoluta acumulada, FAA; inmediatamente superior a ste es $154 miles, es decir, que la clase
en la que se encuentra la mediana es la cuarta clase que va de $900 a $1.200 miles. Esta es entonces la
clase i. La clase anterior a sta es la tercera clase y su frecuencia absoluta acumulada hasta aqu es $112
miles.

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 32

UNIDADES TECNOLGICAS DE SANTANDER

Reemplazando estos datos en la expresin de la mediana se obtiene lo siguiente:


= 900 + 300

139.5 112

= $1.096 miles
42

esto quiere decir que la mitad de los clientes de la muestra tenan un saldo, al final del mes observado,
inferior a $1.096.000
14. MEDIDAS DE TENDENCIA NO CENTRAL O DE POSICI{ON
14.1 LOS CUARTILES
Los cuartiles son tres valores que se determinan o calculan a partir de un conjunto de datos, con la
particularidad de que dividen el conjunto de datos en cuatro partes iguales cuando este conjunto est
ordenado en forma ascendente. Estos valores son:
Primer cuartil o Q1: Es el valor por debajo del cual se encuentran la cuarta parte de los datos o 25% de los
datos cuando estn ordenados de menor a mayor
Segundo cuartil o Q2: Es el valor por debajo del cual se encuentran la mitad de los datos o 50% de los
datos cuando estn ordenados de menor a mayor, es decir, es la misma mediana
Tercer cuartil o Q3: Es el valor por debajo del cual se encuentran las tres cuartas partes de los datos o 75%
de los datos cuando estn ordenados de menor a mayor
Precisemos estas ideas con el siguiente ejemplo:
EJEMPLO
El nmero de clientes que atendieron en un da once vendedores de un centro comercial escogidos al azar
se presenta en la siguiente tabla

15

20

Nmero de clientes atendidos por vendedor


10
23
8
3
13

18

28

32

Este conjunto de datos ordenando de menor a mayor se muestra en la siguiente tabla:

Nmero de clientes atendidos por vendedor


10
13
15
18
20

23

28

32

Q1
Q2
Q3
Como se puede observar los nmeros 8, 15 y 23 dividen el conjunto en cuatro partes iguales. Estos valores
reciben, respectivamente, los nombres de Primer Cuartil, Segundo Cuartil y Tercer Cuartil
14.1.1 CUARTILES PARA DATOS NO AGRUPADOS
Revise el material CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOS, de estos mismos
apuntes
14.1.2 CUARTILES PARA DATOS AGRUPADOS
Primer caso:
La frecuencia absoluta acumulada hasta alguna de las clases coincide con el valor de la operacin
Qi x n
100

Donde:

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 33

UNIDADES TECNOLGICAS DE SANTANDER

Qi es el valor del cuartil que se pretende calcular, es decir: 25, 50 o 75


n es el tamao de la muestra
En este caso el cuartil buscado es igual al lmite superior de la clase
EJEMPLO:
Las utilidades por accin del portafolio de inversiones de una empresa se presenta en la siguiente tabla:
UTILIDAD POR

No. DE

ACCIN

Clculo del primer cuartil:

ACCIONES

FAA

1300

1400

100

100

1400

1500

175

275

1500

1600

230

505

1600

1700

190

695

1700

1800

150

845

1800

1900

130

975

1900

2000

125

1100

1100


100

25 x 1100
100

= 275

Como 275 es la FAA hasta la segunda clase,


entonces, el primer cuartil es igual al lmite
superior de esa clase, es decir:
Q1 = 1.500
Una interpretacin: El 25% de las acciones, de
este portafolio, dan una utilidad inferior a
$1.500

Segundo caso:
La frecuencia absoluta acumulada, FAA, hasta cualquiera de las clases no coincide con el valor de la
operacin Qixn/100
En este caso, el clculo del cuartil se hace de manera parecida al segundo caso del clculo de la mediana.
La expresin que se utiliza es la siguiente:

Qxn / 100 FAAi 1

FAi

= + A

Es el cuartil que se quiere calcular.


Es el lmite inferior de la clase que contiene el cuartil
A es la amplitud de las clases
Es el producto del valor del cuartil que se quiere calcular por el tamao n de la muestra dividido
entre 100. Q toma el valor de 25, 50, 75, segn que el cuartil que se pretenda calcular sea Q1, Q2 o Q3,
respectivamente Esta operacin se utiliza para localizar la clase donde se encuentra el cuartil.
; Es la frecuencia absoluta acumulada hasta la clase anterior a la clase que contiene el cuartil
Es la frecuencia absoluta de la clase que contiene el cuartil

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 34

UNIDADES TECNOLGICAS DE SANTANDER


EJEMPLO
Utilizando el mismo ejemplo del primer caso
Clculo del tercer cuartil:

UTILIDAD POR

No. DE

ACCIN

ACCIONES

FAA

1300

1400

100

100

1400

1500

175

275

1500

1600

230

505

1600

1700

190

695

1700

1800

150

845

1800

1900

130

975

1900

2000

125

1100


100

75 1100
100

= 825

El tercer cuartil se encuentra en la clase cuya


FAA es inmediatamente superior a 825. A esta
Clase i-1 clase se le llama clase i. Reemplazando en la
frmula se tiene:
Clase i
Q3 = 1700 +100 [

1100

825 ; 695
150

Q3 = $1787
Interpretacin: El 75% de las acciones tienen una utilidad inferior a $1787
14.2 LOS PERCENTILES
Los percentiles son valores que dividen un conjunto de datos en 100 partes iguales, cuando este conjunto
est ordenado de menor a mayor
Un percentil, por lo tanto, es un valor por debajo del cual se encuentra un determinado porcentaje de los
datos. Por ejemplo:
P30 = 200 que se lee: Percentil 30 igual a 200, quiere decir que por debajo del valor 200, del conjunto
ordenado de datos, se encuentran el 30% de los datos.
14.2.1 PERCENTILES PARA DATOS NO AGRUPADOS
Revise el material CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOS, en estos mismos
apuntes
14.2.2 PERCENTILES PARA DATOS AGRUPADOS
Primer caso:
La frecuencia absoluta acumulada hasta alguna de las clases coincide con el valor de la operacin:
Donde:
P es el percentil que se quiere calcular
n es el tamao de la muestra.

Pxn
100

S el percentil que se quiere calcular es igual al lmite superior de la clase cuya frecuencia absoluta

acumulada, FAA, coincide con el valor de la operacin


, entonces, el valor del percentil buscado es
100
igual al lmite superior de la clase

EJEMPLO
La siguiente tabla se refiere a una muestra, al azar, del tiempo que duraron las llamadas telefnicas
realizadas por el personal de oficina de una empresa

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 35

UNIDADES TECNOLGICAS DE SANTANDER


Duracin llamadas

No. de

en minutos

Llamadas

Clculo el percentil 20: P20


FAA

0,0

2,0

46

46

2,0

4,0

67

113

4,0

6,0

44

157

6,0

8,0

31

188

8,0

10,0

25

213

Mas de

10,0

17
230

230

100

20 230
100

= 46

Como 46 es la FAA hasta la primera clase,


entonces, el percentil 20 es igual al lmite
superior de esa clase, es decir:
P20 = 2.0
Interpretacin: el 20% de las llamadas, de la
muestra, duraron menos de 2.0 minutos

Segundo caso:
La frecuencia absoluta acumulada, FAA, hasta cualquiera de las clases no coincide con el valor de la

operacin
100

En este caso, el clculo del percentil se hace de manera parecida al segundo caso del clculo de la
mediana. La expresin que se utiliza es la siguiente:

Pxn / 100 FAAi 1

FAi

Pi = + A

es el lmite inferior de la clase que contiene la mediana


A es la amplitud de las clases
es la operacin que se hace para saber en qu clase se encuentra el percentil
; es la frecuencia absoluta acumulada hasta la clase anterior a la clase que contiene el percentil
es la frecuencia absoluta de la clase que contiene el percentil
Para saber cul es la clase que contiene el percentil se compara la operacin 100 con las frecuencias
absolutas acumuladas, FAA, de la distribucin de frecuencias. El percentil se encuentra en la clase cuya
frecuencia absoluta acumulada, FAA, sea inmediatamente superior al valor de esta operacin. A esta clase,
en trminos de la expresin anterior, se le llama la clase i, y la clase anterior a esta se le llama la clase i-1
Para aclarar estos procedimientos utilizamos el ejemplo de las llamadas telefnicas
EJEMPLO
Duracin llamadas

No. de

en minutos

Llamadas

FAA

46

46

100

0,0

2,0

Clculo del Percentil 70, P70:

2,0

4,0

67

113

4,0

6,0

44

157

Clase i -

6,0

8,0

31

188

Clase i

8,0

10,0

25

213

Mas de

10,0

17

230

70 230
100

= 161

El percentil buscado se encuentra en la


clase cuya FAA es inmediatamente
superior a 161. A esta clase se le llama
clase i. Reemplazando en la frmula se
tiene:

230
Interpretacin: El 70% de las llamadas, de la
muestra, fue inferior a 6.26 minutos

DEPARTAMENTO DE CIENCIAS BSICAS

P70 = 6.0 +2.0 [

VERSIN 5

161 ; 157
31

FECHA: 2011

Pgina 36

UNIDADES TECNOLGICAS DE SANTANDER


P70 = 6.26 minutos
EJEMPLO
Para el mismo ejemplo de la duracin de las llamadas Cul fue la duracin mnima del 40% de las
llamadas?
El valor que se pide es menor que el 40% de las llamadas, por lo tanto, este valor es superior al 60% de las
llamadas de la muestra, lo que quiere decir que se requiere calcular el percentil 60
15. PROPIEDADES DE LA MEDIANA, CUARTILES Y PERCENTILES
A la mediana, cuartiles y percentiles no los afectan los valores extremos
La mediana, cuartiles y percentiles se pueden calcular en distribuciones de frecuencias que tengan
clases de extremo abierto
Los clculos de la mediana, cuartiles y percentiles son ms complejos que los de las dems medidas de
tendencia central
La mediana, cuartiles y percentiles no se pueden operar matemticamente
Para calcular la mediana, cuartiles y percentiles los datos deben estar ordenados
16. LA MODA
La moda, de un conjunto de datos, es el valor que ms se repite dentro de ese conjunto.
16.1 SMBOLO DE LA MODA
El smbolo que se va a utilizar, en esta notas, para representar la moda es:
que se lee equis moda

16.2 MODA PARA DATOS NO AGRUPADOS


Cuando los datos no estn agrupados la moda se establece a simple vista.
EJEMPLO
Una muestra de las edades de la ltima promocin de graduados se presenta en la siguiente tabla:
25

21

19

23

22

27

21

23

22

18

20

22

21

19

21

26

28

22

25

24

22

20

19

31

22

24

30

28

22

26

A simple vista, el valor que ms se repite es 22


aos por lo que ste es el valor modal, es
decir:
= 22 aos
Interpretacin: la edad ms comn en la
muestra de egresados es 22 aos
Observacin: En este caso hay un solo valor
modal

EJEMPLO
Los puntajes alcanzados, en una escala de 100 puntos, en las pruebas de ingreso, por los aspirantes a
trabajar en una empresa se presentan en la siguiente tabla:

71

68

70

55

57

36

51

57

68

40

57

85

50

49

68

68

39

45

57

25

DEPARTAMENTO DE CIENCIAS BSICAS

A simple vista se puede establecer que los


puntajes que ms se repiten son el 57 y el 68,
con una frecuencia de 4 puntajes, por lo que el
conjunto de datos tiene 2 modas, es decir:
1 = 57 puntos
2 = 68 puntos
Cuando un conjunto de datos tiene ms de
una moda, como en este caso, se llama
conjunto de dato Polimodal

VERSIN 5

FECHA: 2011

Pgina 37

UNIDADES TECNOLGICAS DE SANTANDER


Interpretacin: Cuando un conjunto de datos tiene ms de una moda, esta medida de tendencia central no
es til para describir el comportamiento de los datos
EJEMPLO
El tiempo, en horas, que gastan los buses de una empresa de transportes en realizar el viaje entre dos
ciudades determinadas, en una muestra de recorridos escogidos al azar, se presenta en la siguiente tabla:

6,8

5,5

6,1

6,4

6,2

5,7

6,3

5,6

5,1

6,9

7,0

7,4

6,6

6,0

5,4

6,5

6,7

5,8

5,9

7,5

A simple vista se puede establecer que


ninguno de los datos se repite por lo que este
conjunto de datos no tiene moda. Por lo tanto,
no se puede utilizar la moda para describir el
comportamiento de los datos de esta muestra

16.3 MODA PARA DATOS AGRUPADOS


Primer caso: Datos de variable discreta agrupados en clases de amplitud igual a cero
En este caso la moda corresponde al valor de la variable que tiene la frecuencia ms alta
EJEMPLO
Una muestra del nmero de motocicletas que vende por semana un distribuidor se presenta en la siguiente
tabla:
No. de

No. de

Motos

Semanas

La ms alta frecuencia corresponde a 19


semanas y el valor de la variable para esta
frecuencia es de 4 motos por semana, por lo
que la moda es 4, es decir:

= 4 motocicletas por semana

12

19

16

10

ms de 6

Interpretacin: El volumen de venta ms


frecuente es de 4 motos por semana

Segundo caso: Datos de variable cualitativa


Aqu, tambin, la moda corresponde al valor de la variable que tiene la ms alta frecuencia
EJEMPLO
Se pregunt a una muestra de profesionales, escogidos al azar, por la marca de celular que utilizan y el
resultado se presenta en la siguiente tabla:
Marca de

No. de

Celular

Profesionales

Sony

18

Motorola

32

L. G.

15

Nokia

47

Samsung

30

iPhone

10

Otras marcas

DEPARTAMENTO DE CIENCIAS BSICAS

La ms alta frecuencia corresponde a la marca


Nokia, por lo tanto, esta es la moda, es decir:

= Nokia
Interpretacin: La marca de celular que con
ms frecuencia utilizan los profesionales, de la
muestra, es Nokia
Como se puede observar se puede calcular la
moda para datos de variable cualitativa

VERSIN 5

FECHA: 2011

Pgina 38

UNIDADES TECNOLGICAS DE SANTANDER

Tercer caso: Datos de variable discreta o continua agrupados en clases de amplitud mayor que cero
Se aplica la frmula como se muestra en el siguiente ejemplo
EJEMPLO
Utilizando un radar de carretera los agentes de trnsito tomaron una muestra de la velocidad, en kilmetros
por hora, a la que se desplazan los vehculos al pasar por un puente. Los resultados estn en la siguiente
tabla:
Clase

Velocidad

No. de

No.

(Kmts / hora)

Vehculos

Hasta

40

40

50

36

50

60

44

60

70

61

70

80

55

80

90

19

90

14

Mas de

En este caso, la moda se encuentra en la


clase que tiene la ms alta frecuencia. Esta
clase es la No.4 que corresponde al intervalo
de 60 a 70 kilmetros por hora. Para saber en
qu punto de este clase se encuentra la moda
se aplica la siguiente expresin:
= LI + A

1
1 : 2

LI es el lmite inferior de la clase que contiene la moda


A es la amplitud de las clases
es la diferencia entre la frecuencia absoluta de la clase que contiene la moda y la frecuencia absoluta de
la clase anterior a la clase que contiene la moda
es la diferencia entre la frecuencia absoluta de la clase que contiene la moda y la frecuencia absoluta de
la clase posterior a la clase que contiene la moda
Aplicando la frmula al ejemplo se tiene:
1 = 61 44 = 17
2 = 61 55 = 6
Interpretacin: Lo ms comn es que los
vehculos de la muestra se desplacen por el
puente a 67.39 Kmts / hora

= 60 + 10

17

] = 67.39 Kmts / hora

17:6

16.4 PROPIEDADES DE LA MODA


La moda se puede calcular en situaciones de variables cualitativitas y cuantitativas
A la moda no la afectan los valores extremos
La moda se puede calcular en distribuciones de frecuencias que tengan clases de extremo abierto
Existen conjuntos de datos que no tienen moda o que tienen ms de una moda
La moda no se puede operar matemticamente

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 39

UNIDADES TECNOLGICAS DE SANTANDER


CASOS ESPECIALES DE LA MEDIANA
DISTRIBUCIONES DE FRECUENCIAS DE VARIABLE DISCRETA CON AMPLITUD IGUAL A CERO
Para calcular la mediana, cuando se tienen distribuciones de frecuencia con amplitud igual a cero y datos
correspondientes a variable discreta se tiene dos casos
PRIMER CASO
La frecuencia acumulada hasta cualquiera de las clases es diferente de n/2
Este caso se presenta cuando ninguno de los valores de la columna de frecuencias relativas acumuladas o
FAA coincide con el tamao de la muestra dividida entre 2, es decir, n/2
EJEMPLO
La siguiente tabla se refiere a una muestra del nmero de computadores que vendieron en un mes 112
tiendas de tecnologa del pas escogidos al azar
No. De unidades No. De
vendidas
tiendas
0
1
1
12
2
18
3
23
4
21
5
19
6
18
112
La distribucin de frecuencias acumuladas de este ejemplo se presenta en la siguiente tabla, donde se
encuentra que n/2 es igual a 112/2 = 56
No. De unidades No. De
vendidas
tiendas
FAA
0
1
1
1
12
13
2
18
31
3
23
54
4
21
75
5
19
94
6
18
112
112
Como se observa ningn valor de FAA coincide con n/2
en este caso la mediana se encuentra en la clase cuya FAA sea mas prxima por arriba a n/2. Este valor es
75, entonces, la mediana se encuentra en la clase 4 (LI=4 y LS=4),. Por lo tanto la mediana es 4, es decir:

= 4

SEGUNDO CASO
Algn valor de la frecuencia absoluta acumulada coincide con n/2
Este caso se da cuando en la distribucin de frecuencias de la frecuencia absoluta acumulada, FAA, algn
valor de esta columna, es igual al tamao de la muestra dividido por 2, es decir, n/2
EJEMPLO
Se tom una muestra del nmero de estufas elctricas que vendieron en el ao una muestra de
distribuidores escogidos al azar

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 40

UNIDADES TECNOLGICAS DE SANTANDER

No. De unidades No. De


vendidas
distribuid.
10
12
11
18
12
17
13
22
14
15
15
10
94
n/2 es igual a 94/2 = 47
No. De unidades No. De
vendidas
distrbiud.
FAA
10
12
12
11
18
30
12
17
47
13
22
69
14
15
84
15
10
94
94
Como se puede ver un valor de la columna FAA coincide con n/2. En este caso la mediana se encuentra
entre las clases 12 y 13 y para calcularla se promedian estos dos valores.
= (12 +13)/2 = 12.5
Este resultado se puede interpretar de dos maneras as:
La mitad de los distribuidores de la muestra vendieron 12 o menos unidades

La mitad de los distribuidores de la muestra vendieron 13 o ms unidades

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 41

UNIDADES TECNOLGICAS DE SANTANDER


CUARTILES Y PERCENTILES PARA DATOS NO AGRUPADOS
CUARTILES
Los cuartiles son tres valores que se calculan a partir de un conjunto de datos dividiendo este conjunto en 4
partes iguales cuando est ordenado de menor a mayor valor. Los cuartiles son:
Primer cuartil o Q1: Es el valor por debajo del cual se encuentran la cuarta parte de los datos o 25% de los
datos cuando estn ordenados de menor a mayor
Segundo cuartil o Q2: Es el valor por debajo del cual se encuentran la mitad de los datos o 50% de los
datos cuando estn ordenados de menor a mayor, es decir, es la misma mediana
Tercer cuartil o Q3: Es el valor por debajo del cual se encuentran las tres cuartas partes de los datos o 75%
de los datos cuando estn ordenados de menor a mayor
CUARTILES PARA DATOS NO AGRUPADOS
Cuando los datos no estn agrupados la posicin de cualquier cuartil, cuando los datos estn ordenados de
menor a mayor, se calcula con la siguiente expresin:

= X(n+1)Qi/100

es la posicin que ocupa el cuartil cuando los datos estn ordenados de menor a mayor
Qi corresponde a Q1, Q2, o Q3 y toman los valores 25, 50 y 75 respectivamente
EJEMPLO No. 1
El nmero de clientes que atendieron en un da once vendedores de un centro comercial escogidos al azar
se presenta en la siguiente tabla:

15

20

10

Nmero de clientes atendidos


23
8
3
13

18

28

32

la tabla de datos ordenados de menor a mayor se presenta en la siguiente tabla donde X1, X2, X3, etc,
representan la posicin que ocupan los datos:

X1
3

X2
5

X3
8

X4
10

Nmero de clientes atendidos


X5
X6
X7
X8
13
15
18
20

X9
23

Q2

Q3

Q1

X10
28

X11
32

Por simple inspeccin se puede establecer que los nmeros 8, 15 y 23 dividen el conjunto de datos en 4
partes iguales, donde:
El primer cuartil ocupa la tercera posicin, es decir, 1 = X3 = 8
El segundo cuartil ocupa la sexta posicin, es decir, 2 = X6 = 15
El tercer cuartil ocupa la novena posicin, es decir, 3 = X9 = 23
No siempre es fcil establecer los cuartiles por simple inspeccin por lo que se debe aplicar la frmula para
calcular cada uno de los cuartiles.
Clculo del primer cuartil
1 = X (11+1)25/100 = X(12)25/100 = X300/100 = X3 = 8
INTERPRETACIN:
La cuarta parte de los vendedores, de la muestra, atendieron menos de 8 clientes

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 42

UNIDADES TECNOLGICAS DE SANTANDER

La tres cuartas parte de los vendedores, de la muestra, atendieron mas de 8 clientes


El nmero mximo de clientes que atendi la cuarta parte de los vendedores fue de 8
El nmero mnimo de clientes que atendieron las tres cuartas partes de los vendedores, de la muestra,
fue de 8

Clculo del segundo cuartil


2 = X(11+1)50/100 = X(12)50/100 = X600/100 = X6 = 15
Clculo del tercer cuartil
3 = X(11+1)75/100 = X(12)75/100 = X900/100 = X9 = 23
EJEMPLO No. 2
Los ingresos en miles de pesos, en un da, de una muestra de taxis escogidos al azar se presentan en la
siguiente tabla:

13

16

INGRESOS POR TAXI EN UN DA


(miles de pesos)
18
20
9
30
11

28

23

25

X10
25

X11
28

X12
30

Al ordenar los datos de menor a mayor la tabla queda as:

X1
4

X2
6

X3
9

INGRESOS POR TAXI EN UN DA


(miles de pesos)
X4
X5
X6
X7
X8
X9
11
13
16
18
20
23

Q1
Q2
Q3
En este caso ningn cuartil coincide exactamente con alguno de los valores de la tabla de datos ordenada
Clculo del primer cuartil
1 = X(12+1)25/100 = X(13)25/100 = X325/100 = X3.25
X3.25 quiere decir que el primer cuartil se encuentra entre el tercero y cuarto valor en orden ascendente. Esto
quiere decir que es un valor superior a X3 pero inferior a X4. Para calcular el cuartil se interpola el excedente
de X3, es decir, 0.25 por la distancia que hay entre X3 y X4 as:
1 = X3.25 = X3 + 0.25( X4 X3 )
Por lo tanto: Q1 = 9+0.25(11 9 ) = 9+0.25( 2 ) = 9+0.5 = 9.5
Clculo del segundo cuartil
2 = X(12+1)50/100 = X(13)50/100 = X650/100 = X6.5
2 = X6.5 = X6 + 0.5( X7 X6 )
Por lo tanto Q2 = 16+ 0.5(18-16) = 16+0.5(2) = 16+1 = 17
Observe que el segundo cuartil es la misma mediana
Clculo del tercer cuartil
3 = X(12+1)75/100 = X(13)75/100 = X 975/100 = X9.75

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 43

UNIDADES TECNOLGICAS DE SANTANDER

3 = X9.75 = X9 + 0.75( X10 X9 )


Por lo tanto: Q3 = 23+0.75(25-23) = 23+075(2) = 23+1.5 = 24.5
PERCENTILES
Los percentiles son valores que dividen un conjunto de datos en 100 partes iguales, cuando este conjunto
est ordenado de menor a mayor
El percentil de un nmero, es un valor de un conjunto de datos por debajo del cual se encuentra la fraccin o
porcentaje de los datos correspondientes a se nmero. Por ejemplo:
P30 = 78.3 (se lee: percentil de 30 igual a 78.3). Indica que por debajo de 78.3 se encuentran el 30% de los
datos
Los cuartiles son casos especiales de los percentiles. Por ejemplo, el primer cuartil, Q1, equivale a P 25,
porque por debajo de Q1 se encuentran el 25% de los datos
PERCENTILES PARA DATOS NO AGRUPADOS
Para calcular los percentiles para datos no agrupados se utiliza la siguiente expresin:
XP = X(n+1)P/100
XP es la posicin que ocupa el percentil dentro del conjunto de datos ordenados de menor a mayor
n es el tamao de la muestra
P es el valor percentil
El clculo de los percentiles sigue la misma mecnica que el clculo de los cuartiles como se puede ver en
los siguientes ejemplos
EJEMPLO 3
Para el caso del ejemplo 1 calcule el percentil 35, es decir, P35 e interprete el resultado
XP35 = X (11+1)35/100 = X(12)35/100 = X420/100 = X4.2
X4.2 = X4 + 0.2( X5 X4 )
Por lo tanto: P35 = 10 + 0.2( 13 10 ) = 10 + 0.2(3) = 10.6

INTERPRETACIN:
El 35 % de los vendedores atendieron 10 o menos clientes
El 65% de los vendedores atendieron 11 o mas clientes
El mximo nmero de clientes atendidos por el 35% de los vendedores fue de 10
El mnimo nmero de cliente que atendieron el 65% de los vendedores fue de 11
EJEMPLO 4
Para el caso del ejemplo 2 calcule P78 e interprete el resultado
X P78 = X(12+1)78/100 = X(13)78/100 = X1014/100 = X10.14
X10.14 = X10 + 0.14( X11 X10 )
Por lo tanto: P78 = 25 + 0.14( 28 25 ) = 25 + 0.14(3) = 25.42

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 44

UNIDADES TECNOLGICAS DE SANTANDER

INTERPRETACIN
El 78% de los taxis de la muestra tuvieron ingresos por debajo de $25.42 miles
El 22% de los taxis de la muestra tuvieron ingresos superiores a $25.42 miles
El ingreso mximo del 78% de los taxis de la muestra fue de $25.42 miles
El ingreso mnimo del 22% de los taxis de la muestra fue de $25.42 miles

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 45

UNIDADES TECNOLGICAS DE SANTANDER


MEDIDAS DE DISPERSIN
Se haba dicho anteriormente que el objetivo de las medias de tendencia central es describir (parcialmente),
el comportamiento de un conjunto de datos que pertenezcan a una muestra o a una poblacin. Sin embargo,
esta capacidad descriptiva de las medidas de tendencia central es parcial porque es necesario
complementarla con otra caracterstica de las muestras y poblaciones que es la dispersin.
Para introducir el concepto de dispersin se presenta el siguiente caso:
EJEMPLO
Las ventas mensuales, en millones de pesos, de dos empresas se presentan en las siguientes tablas:
CREACIONES ARMANY
DISEOS GALAXIA
VENTAS

VENTAS
MENSUALES

No. De

(MILLONES)

MESES

10

14

11

14

18

32

18

22

19

22

26

12

26

30

30

34

5
86

MENSUALES

No. De

(MILLONES)

MESES

10

14

10

14

13

14

18

16

18

22

11

22

26

10

26

30

10

30

34

34

38

5
86

35

30
Meses

25
20

15

ARMANY

10

GALAXIA

Al calcular la venta promedio mensual


de estas dos muestras se encuentra que
es igual para ambas con un valor de
$19,395 millones, por lo que se podra
pensar que ambas empresas tienen un
comportamiento similar en cuanto a las
ventas. Sin embargo, si se comparan
sus polgonos de frecuencias como se
hace en el grfico de la izquierda, se
puede ver que sus ventas siguen
patrones de comportamiento muy
diferentes.

5
0
4

12 16 20 24 28 32 36 40
Millones de pesos

La diferencia se encuentra, entonces, en


que las dos muestras tienen diferente
dispersin de sus datos alrededor de
la media.
Los ventas de Diseos Galaxia son
menos dispersas que las ventas de
Creaciones Armany

CONCEPTO DE DISPERSIN
Se llama DISPERSIN al grado de variabilidad de un conjunto de datos alrededor de algn valor que se
toma como referencia. Usualmente se toma como referencia alguna de las medidas de tendencia central.

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 46

UNIDADES TECNOLGICAS DE SANTANDER


DISPERSIN Y VARIABILIDAD
La variabilidad hace referencia a qu tan diferentes son entre s los datos de una muestra o una poblacin.
La dispersin y la variabilidad son conceptos sinnimos como se puede ver en los siguientes ejemplos:

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES


2
3
4
5
6
7
8
9
3,8 3,8 3,8 3,8 3,8 3,8 3,8 3,8

1
3,8

10
3,8

En este caso todas las notas son iguales, por lo tanto, no hay ninguna variabilidad y ninguna dispersin

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES


2
3
4
5
6
7
8
9
3,8 3,8 3,8 3,8 3,8 4,7 3,8 3,8

1
3,8

10
3,8

Ahora hay una nota diferente a las dems, por lo tanto, existe una pequea variabilidad entre los datos y una
pequea dispersin con respecto a la primera muestra

1
3,0

2
3,5

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES


3
4
5
6
7
8
9
3,8
2,5
3,8
3,7
4,7
3,8
3,9

10
1,9

En esta ltima muestra, hay un aumento notorio en la variabilidad entre los datos y en la dispersin con
respecto a la muestra anterior
Es preciso resaltar, que la dispersin es un concepto relativo, siempre se evala comparando una muestra o
poblacin con algn valor de referencia o con otra muestra o poblacin
IMPORTANCIA DE LA DISPERSIN
Para que una medida de tendencia central sea representativa de los datos que la originaron se requiere que
su valor sea similar a los datos de esa muestra o poblacin que pretende describir, como se puede ver en el
siguiente ejemplo:
MUESTRA DE BAJA DISPERSIN

MUESTRA DE ALTA DISPERSIN

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

10

3,2

3,5

3,8

3,5

3,8

3,7

3,6

3,8

3,9

3,5

10

0,1 3,5 0,7 5,0 1,0 4,7 4,9 3,8 3,9 0,9

= 3,6

= 2,9

Como se puede observar, en la muestra de baja dispersin, el valor del promedio es similar o est cerca de
los valores de la muestra, en cambio, en la muestra de alta dispersin, ninguno de los valores de la muestra
es parecido al valor de la media. Por lo tanto, el promedio de la primera muestra es verdaderamente
representativo de los datos de esta muestra y el de la segunda muestra no.
El concepto de dispersin, entonces, es importante porque entre mayor sea la dispersin de un conjunto de
datos, menor es la fuerza representativa que tiene la medida de tendencia central calculada con esos datos
CLASES DE MEDIDAS DE DISPERSIN
Las medidas de dispersin que se van a estudiar en estos apuntes son las siguientes:
El Rango
El Rango Intercuartlico
La Desviacin Media

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 47

UNIDADES TECNOLGICAS DE SANTANDER

La Varianza
La desviacin Estndar

EL RANGO
Es la diferencia o distancia entre el mayor valor, de un conjunto de datos y el valor menor. Este concepto ya
se haba mencionado para agrupar los datos en clases estadsticas, por lo tanto se utilizar para enunciarlo
el mismo smbolo, es decir la letra R, es decir,

R = Xmax - Xmin
EJEMPLO
Calcular el rango de los siguientes conjuntos de datos
NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

NOTAS DE UNA MUESTRA DE 10 ESTUDIANTES

10

10

3,2

3,5

3,8

3,5

3,8

3,7

3,6

3,8

3,9

3,5

0,1

3,5

0,7

5,0

1,0

4,7

4,9

3,8

3,9

0,9

R = 3,9 - 3,2 = 0,7

R = 5,0 - 0,1 = 4,9

La dispersin de la muestra de la izquierda, medida por el rango, es menor que la dispersin de la muestra
de la derecha
El clculo anterior se realiz con muestras de datos que no estn agrupados. Cuando los datos ya estn
agrupados en clases el rango se establece restando del valor del lmite superior de la clase mas alta el valor
del lmite inferior de la clase mas baja. En smbolos:

R = LS clase ms alta - LI clase ms baja


EJEMPLO
Una muestra de las facturas que se cancelan con tarjetas de crdito en una cadena de almacenes de modas
se presenta en la siguiente tabla
Ventas

No. de

(Miles de $) Facturas
30

36

25

36

42

38

42

48

49

48

54

51

54

60

32

60

66

29

R = LS clase ms alta - LI clase ms baja


R = 66 - 30 = $36 miles
Como no se tiene el rango de otro conjunto de datos o un valor de
referencia, para comparar, entonces, no se puede decir s este
conjunto de datos es o no disperso

224
CARACTERSTICAS DEL RANGO
Es fcil de entender y de calcular
Da una idea rpida de la dispersin
En el clculo nicamente se tienen en cuenta los valores mximo y mnimo
Vara mucho de una muestra a otra
No se puede calcula con distribuciones de frecuencia que tienen clases de extremo abierto

EL RANGO INTERCUARTLICO

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 48

UNIDADES TECNOLGICAS DE SANTANDER


Una de las desventajas del rango es que solamente se tienen en cuenta, para su clculo, los valores
mximo y mnimo, por lo que no indica como estn distribuidos internamente los datos. Esta desventaja se
puede corregir con el rango intercuartlico
Para simbolizar el rango intercuartlico se utiliza, en estas notas, RQ y se calcula restando la diferencia entre
el primero y el tercer cuartil, es decir:

RQ = Q3 - Q1
Este rango muestra la dispersin de la porcin ms central de los datos que abarca el 50% del total
EJEMPLO
Las distancias en kilmetros, recorrida en un da por dos muestras de vehculos se presentan en la siguiente
tabla
MUESTRA B

MUESTRA A
Distancia

No. De

Distancia

No. De

(Kilmetros)

Vehculos

(Kilmetros)

Vehculos

25

35

35

45

45

55

12

55

65

15

65

75

10

75

85

25
35
45
55

35
45
55
65

3
7
11
19

65
75

75
85

7
6
53

53

R = Xmax - Xmin = 60 Kmts


Q1 = 47,7 Kmts

R = Xmax - Xmin = 60 Kmts

Q3 = 67,75 Kmts

Q1 = 48,0 Kmts

RQ = 20,05 Kmts

Q3 = 64,9 Kmts

RQ = 16,9 Kmts

Como se ve, aunque las dos muestras tienen el mismo rango, R, el rango intercuartlico es diferente, lo que
indica que la muestra B es menos dispersa que la muestra A
LA DESVIACIN MEDIA
Es la diferencia promedio, en valor absoluto, de los datos de la muestra o poblacin con respecto a su
propia media. La forma de la expresin de clculo vara dependiendo de que se trate de datos no agrupados
o datos agrupados
El smbolo que se utiliza en estos apuntes para la desviacin media son las iniciales DM
Desviacin media para datos no agrupados
Donde:
DM: Smbolo de la desviacin media
|
| ;
DM =
: Cada uno de los datos de la muestra

: La media aritmtica de la muestra


n : El nmero de datos
La razn por la cual se extrae el valor absoluto es porque los nmeros tienen una propiedad que consiste en
que la suma de las diferencias de un conjunto de nmeros con respecto a su media siempre da igual a cero

EJEMPLO

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 49

UNIDADES TECNOLGICAS DE SANTANDER


Una muestra, al azar, del tiempo, en minutos, que duran las llamandas que se hacen desde un telfono, se
presenta en la siguiente tabla
3

14

24

12

Hallar la desviacin media de esta muestra

3
14
24
9
7
12

= 11,5


-8,5
2,5
12,5
-2,5
-4,5
0,5

DM =

31

| |
8,5
2,5
12,5
2,5
4,5
0,5
31

= 5,2 minutos
6
Interpretacin: En promedio, la diferencia de cada llamada con respecto a la media es de 5,2 minutos
Desviacin media para datos agrupados
Donde:
DM : smbolo de la desviacin media

DM =

| ;|

: La marca de clase de la clase i


: La media aritmtica de la muestra

: La frecuencia absoluta de la clase i


n : El nmero de datos
EJEMPLO
La siguiente tabla es una muestra, en miles de pesos, del valor del arriendo mensual de vivienda del estrato
tres.
Datos
Tabla de Clculo
Valor arriendo

No. De

Valor arriendo

(miles de pesos)

viviendas

(miles de pesos)

210
230
250
270
290
310
330

200

220

12

200

220

12

220

240

15

220

240

15

240

260

23

240

260

23

260

280

22

260

280

22

280

300

20

280

300

20

300

320

18

300

320

18

320

340

15

320

340

15

125

= $271,92 miles

-61,920
-41,920
-21,920
-1,920
18,080
38,080
58,080

61,92
41,92
21,92
1,92
18,08
38,08
58,08

125

DM =

743,04
628,8
504,16
42,24
361,6
685,44
871,2
3836,48

3836,48

= $30,7 miles
125
En promedio, los arriendos de la muestra, se diferencian de la media en $30,7 miles
La desviacin media tiene en cuenta, para su clculo, todos los datos de la muestra y es fcil de interpretar.
Pero, la operacin del valor absoluto para soslayar la propiedad anteriormente mencionada de los de los
nmeros, da una descripcin incompleta de la situacin. Obsrvese que no se sabe s la diferencia de $30,7

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 50

UNIDADES TECNOLGICAS DE SANTANDER


miles, del ejemplo anterior, es por encima o por debajo de la media.
Parta evitar este inconveniente existe otra medida de dispersin que aprovecha otra propiedad de los
nmeros que consiste en que todo nmero elevado al cuadrado tiene signo positivo. Esta medida de
dispersin es la varianza.
LA VARIANZA
La Varianza, al igual que la desviacin media utiliza, para medir la dispersin, las desviaciones de los datos
con respecto a la media, pero, en este caso, estas desviaciones se elevan al cuadrado. Por lo tanto, se
puede decir que la varianza es el promedio de las desviaciones, de los datos, con respecto a la media
elevadas al cuadrado.
Para el clculo de la varianza, lo mismo que para las medidas de dispersin estudiadas anteriormente, se
debe tener en cuenta s los datos estn o no agrupados, pero, adicionalmente, el clculo de la varianza es
ligeramente diferente segn se trate con poblaciones o muestras, por lo que se utilizan smbolos diferentes
para indicar cada una de estas dos situaciones
VARIANZA POBLACIONAL
Es la varianza que se calcula utilizando todos los datos de una poblacin

Smbolo:

Varianza poblacional para datos no agrupados

( ; )2

Donde :

= Cada dato de la poblacin


= La media de la poblacin

N = El tamao de la poblacin
EJEMPLO
Los siguientes datos corresponden a los puntajes obtenidos por los aspirantes a un cargo en una empresa
Tabla de clculo
PUNTAJES
60

81

77

72

91

90

= 78,5 puntos

)2

60

-18,5

342,25

81

2,5

6,25

77

-1,5

2,25

72

-6,5

42,25

91

12,5

156,25

90

11,5

132,25

681,5
6

= 113,58 puntos al
cuadrado

681,5

Varianza poblacional para datos agrupados

( ; )2

= Es la marca de clase de c/u de las clases en que se agrupa la


poblacin

= La media de la poblacin
= Es la frecuencia absoluta de cada clase
N = El tamao de la poblacin

EJEMPLO
DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 51

UNIDADES TECNOLGICAS DE SANTANDER


En un programa sobre riesgo cardiovascular, se registr el peso en kilogramos de todos los empleados de
una empresa
Datos
Tabla de clculo
Peso en

No. de

Kilogramos Empleados
39

49

49

59

11

59

69

50

69

79

31

79

89

27

89

99

18

99

109

9
151

= 74,2 kilogramos

Peso en
Kilogramos

)2

)2

39

49

44

-30,2

912,04

4560,20

49

59

11

54

-20,2

408,04

4488,44

59

69

50

64

-10,2

104,04

5202,00

69

79

31

74

-0,2

0,04

1,24

79

89

27

84

9,8

96,04

2593,08

89

99

18

94

19,8

392,04

7056,72

99

109

104

29,8

888,04

7992,36

151

31894,04
151

31894,04

= 211,22 Kilogramos al cuadrado

Ntese que si la poblacin es infinita no se puede calcular la varianza poblacional porque el valor de N sera
infinito.
VARIANZA MUESTRAL
Es la varianza que se calcula sobre los datos de una muestra. El clculo con respecto a la varianza
poblacional difiere en que, el divisor de la expresin ya no es N, el tamao de la poblacin, ahora es (n 1),
que es el tamao de la muestra, n, menos una unidad.
Smbolo:

Varianza muestral para datos no agrupados


Donde:
2
( ; )
: Es cada uno de los datos de la muestra
2
=
; 1
: Es la media de la muestra
n : Es el tamao de la muestra

La razn por la cual se divide entre n - 1 es porque, de esta manera, s , es un estimador insesgado de la
varianza de la poblacin de la cual se extrajo la muestra. El concepto de estimador insesgado se estudia en
el curso de Estadstica Inferencial.

EJEMPLO

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 52

UNIDADES TECNOLGICAS DE SANTANDER


Los saldos de las cuentas de ahorro, de empleados, de una muestra de las cuentas de ahorro de una
cooperativa, escogidas al azar, se presentan en la siguiente tabla:
Tabla de clculo

)2

SALDOS DE LAS CUENTAS EN MILES DE


PESOS

157

157

-55,5

3080,25

62

-150,5

22650,25

234

21,5

462,25

532

319,5

102080,25

200

-12,5

156,25

90

-122,5

15006,25

62

234

532

200

90

= $212,5 miles

143.435,5
(6 ; 1)

= 28.687,10 miles de
pesos al cuadrado

143.435,50

Varianza muestral para datos agrupados


Donde:
2
)
(
;

: Es la marca de clase de c/u de las clases en que se agrupa la

2 =
muestra

( ; 1)

: Es la media aritmtica de la muestra


:Es la frecuencia absoluta de cada clase
n : Es el tamao de la muestra

EJEMPLO
Una muestra del tiempo, en horas, que demora el almacn de materiales de una fbrica en surtir los pedidos
que recibe:
Datos

Tabla de clculo

Tiempo

No. de

Tiempo

(Horas)

pedidos

(Horas)

)2

)2

10

10

-5,3

28,09

280,90

16

16

-3,3

10,89

174,24

33

33

-1,3

1,69

55,77

45

0,7

0,49

22,05

26

2,7

7,29

189,54

10

11

4,7

22,09

220,90

45

10

26

10

10

12

10

10

12

140

140

= 6,3 horas

2 =

943,40
(140 ; 1)

943,40

= 6,8 horas al cuadrado

Como se puede observar, en los ejemplos anteriores, todas las unidades de la desviacin estndar estn
elevadas al cuadrado por lo que es difcil interpretar el significado del valor de la varianza; esta en una de las
razones por las cuales, para medir la dispersin, se prefiere otra medida que es la Desviacin Estndar
LA DESVIACIN ESTNDAR
Conocida tambin como Desviacin Tpica, la desviacin estndar es la raz cuadrada de la varianza. Los
smbolos que se utilizan son , para clculo de la dispersin en poblaciones y s, para el clculo de la
dispersin en muestras

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 53

UNIDADES TECNOLGICAS DE SANTANDER

DESVIACIN ESTNDAR PARA POBLACIONES


Datos no agrupados

= 2 =

Datos agrupados

( ; )2

= 2

( ; )2

DESVIACIN ESTNDAR PARA MUESTRAS


Datos no agrupados

Datos agrupados

( ; )2
( ; 1)

( ; )2
( ; 1)

Las tablas de clculo para la desviacin estndar son idnticas a las que se utilizan para la varianza, con un
clculo adicional: extraer la raz cuadrada de la varianza
EJEMPLO
En un ejemplo anterior se vio que los puntajes de los aspirantes a un cargo, en una empresa fueron:
y se calcul que:
2 = 113,58 puntos al cuadrado
Por lo tanto,
= 2 = 113,58 = 10,7 puntos

PUNTAJES
60

81

77

72

91

90

EJEMPLO
En otro caso se estableci que el tiempo, en horas, que demora el almacn de materiales de una fbrica en
surtir los pedidos que recibe
Tiempo

No. de

(Horas)

pedidos

Y se calcul que:

= 6,8 horas al cuadrado

10

16

Por lo tanto:

33

45

s = 2 = 6,8 = 2,6 horas

10

26

10

12

10

140
Aunque es indispensable que se conozca, a ciencia cierta, como se obtienen la cifras de los clculos de la
media aritmtica y la desviacin estndar, en la prctica, la tecnologa disponible permite que estas
operaciones se hagan de forma ms rpida y segura utilizando las funciones estadsticas de las calculadoras
cientficas o de las hojas electrnicas de los programas de computador, por lo que se debe consultar, por lo
menos, en los manuales de las calculadoras, los detalles de la forma como se ejecutan estas funciones.

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 54

UNIDADES TECNOLGICAS DE SANTANDER

EL COEFICIENTE DE VARIACIN
Para introducir el concepto del coeficiente de variacin se analiza la siguiente situacin:
En la seccin de materiales livianos del almacn de materiales de una fbrica se tom una muestra del peso
de elementos de esa seccin escogidos al azar, lo mismo se hizo en la seccin de materiales pesados, de la
misma bodega y para ambas muestras se calcul su peso promedio y la desviacin estndar. Los resultados
son los que se presentan a continuacin:
SECCIN DE MATERIALES LIVIANOS

SECCIN DE MATERIALES PESADOS

= 4 Kilos

= 50 Kilos

S = 2 Kilos

S = 2 kilos

La primera impresin que se obtiene de una observacin desprevenida de estos resultados es que las dos
muestras tienen la misma dispersin porque sus desviaciones estndar son iguales. Sin embargo, si se
examina con ms atencin, se puede ver que en el caso de la seccin de materiales livianos, la desviacin
estndar equivale a la mitad del peso promedio de los materiales de la muestra. En cambio, en la seccin de
materiales pesados la desviacin estndar equivale nicamente a 1/25 del peso promedio de los paquetes.
Por lo que comparadas las dos desviaciones estndar con la magnitud de su respectivo promedio, es mucho
ms alta la dispersin de la seccin de materiales livianos.
De este anlisis se concluye que la desviacin estndar en casos como el del ejemplo, no permite comparar
la dispersin de dos muestras y se puede agregar que esta dificultad se presenta cuando las medias de las
muestras que se estn comparando son muy diferentes entre s.
Para resolver este inconveniente, la estadstica dispone de un indicador para medir la dispersin. Este
indicador es el Coeficiente de Variacin y se calcula con la siguiente expresin:
COEFICIENTE DE VARIACIN PARA POBLACIONES

COEFICIENTE DE VARIACIN DE MUESTRAS

SMBOLO : CV

SMBOLO : CV

CV =

CV =

El coeficiente de variacin es un nmero sin dimensiones por lo que se puede expresar en fracciones
decimales o en porcentaje
EJEMPLO
Se tomaron muestras de las ventas diarias, en miles de pesos, de dos vendedores de una empresa. Cul
de las dos muestras es mas dispersa?
VENTAS DEL VENDEDOR A
500

450

390

600

290

VENTAS DEL VENDEDOR B


400

440

80

25

= $438,6 miles

S = $96,5 miles

CV = 0,22

23

57

90

10

= $47,5 miles
=

$33,1 miles

CV = 0,70

Como se puede notar, la desviacin estndar del vendedor A es mayor que la desviacin estndar del

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 55

UNIDADES TECNOLGICAS DE SANTANDER


vendedor B; sin embargo, las ventas de la muestra del vendedor A son menos dispersas que las ventas de la
muestra del vendedor B, porque el coeficiente de variacin de las ventas del vendedor A es menor que el
coeficiente de variacin de las ventas del vendedor B
EJEMPLO
Una muestra de las ventas por da de un almacn de ropa de moda y un gran distribuidor textil se presentan
en la siguientes tablas. Cul de los dos promedios de ventas por da es ms confiable?
JEANS AND BREECHES

DISTRIMODA

VENTAS POR DA

VENTAS POR DA

(Millones de pesos)

(Millones de pesos)

Ventas

No. de

Ventas

No. de

por da

das

por da

das

0,9

1,1

9,2

10,3

12

1,1
1,3

1,3

10,3

11,4

16

1,5

16

11,4

12,5

25

1,5

1,7

23

12,5

13,6

19

1,7

1,9

29

13,6

14,7

10

1,9

2,1

20

14,7

15,8

2,1

2,3

11

9
91

111

Solamente se necesita establecer la marca de clase de ambas tablas y el resto de los clculos se realizan
directamente aplicando las funciones estadsticas de las calculadoras cientficas
JEANS AND BREECHES

DISTRIMODA

VENTAS POR DA

VENTAS POR DA

(Millones de pesos)

(Millones de pesos)

Ventas

No. de

por da

das

Xi

Ventas

No. de

por da

das

Xi

0,9

1,1

1,0

9,2

10,3

12

9,75

1,1

1,3

1,2

10,3

11,4

16

10,85

1,3

1,5

16

1,4

11,4

12,5

25

11,95

1,5

1,7

23

1,6

12,5

13,6

19

13,05

1,7

1,9

29

1,8

13,6

14,7

10

14,15

1,9

2,1

20

2,0

14,7

15,8

15,25

2,1

2,3

11

2,2

91

111

= 1,706306306

CV = 0,17868609

= 12,26428571
S

CV

= 0,13255294

= 1,62566714

S = 0,30489321
Respuesta: Es ms confiable el promedio diario de Distrimoda porque tiene el menor coeficiente de variacin

DESIGUALDAD DE CHEBYSHEV
DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 56

UNIDADES TECNOLGICAS DE SANTANDER


Es una regularidad que se presenta en todas las distribuciones de frecuencias y consiste en que, sin
importar la forma de la distribucin de frecuencias, la porcin mnima de datos que se encuentra en un
intervalo comprendido entre K desviaciones estndar por debajo y por encima de la media aritmtica es:

1 -

1
2

Donde K es cualquier nmero mayor que 1


Los lmites de este intervalo se encuentran, por lo tanto, por debajo y por encima de la media aritmtica. Al
lmite que est por debajo de la media se le llama lmite inferior o LI y al lmite que est por encima se le
llama lmite superior o LS. Las expresiones para estos lmites son:

LI = - Ks
LS = + Ks
Donde s es la desviacin estndar de la distribucin de frecuencias
EJEMPLO
Una muestra del tiempo que tienen que esperar los afiliados a una EPS para que los atiendan en el servicio
de urgencias de una clnica dio una media aritmtica de 32 minutos, con una desviacin estndar de 8,3
minutos. Entre qu intervalo de tiempo tuvieron que esperar como mnimo el 80% de los afiliados de la
muestra?
2

Esa porcin mnima es precisamente 1 1/K , por lo tanto:


0,80 =

1 -

1
2

Despejando K de la anterior ecuacin se encuentra que K = 2,24


Entonces, los lmites del intervalo que se pregunta son:

LI = - Ks = 32 - 2,24(8,3) = 13,4 minutos


LS = + Ks = 32 + 2,24(8,3) = 50,6 minutos
La respuesta es que, por lo menos, el 80% de los afiliados a la EPS, de la muestra, tuvieron que esperar
entre 13,4 minutos y 50,6 minutos para ser atendidos en el servicio de urgencias

UNIDAD 3:
DEPARTAMENTO DE CIENCIAS BSICAS

REGRESIN Y CORRELACIN
VERSIN 5

FECHA: 2011

Pgina 57

UNIDADES TECNOLGICAS DE SANTANDER

REGRESIN
1. INTRODUCCIN
En muchas situaciones de la actividad administrativa o cotidiana se presentan circunstancias en las que
parecen estar relacionadas dos o ms variables. Por ejemplo:
El nmero de vehculos que circulan por las vas de una ciudad y los ndices de contaminacin de la
misma
La tasa de desempleo y las ventas del comercio
Las ventas de licor y el nmero de accidentes de trnsito
Las horas de tutoras y el nmero de estudiantes que reprueban los parciales
El numero de apartamentos construidos en un determinado periodo y las ventas de muebles
El nmero de personas que se movilizan en bus y las ventas de motos y el estado del clima
Existe una tcnica para establecer matemticamente la relacin que puede existir entre variables como las
sealadas anteriormente. Esta tcnica es el anlisis de regresin
2. CONCEPTO DE REGRESIN
Es un mtodo de clculo para establecer una relacin matemtica entre dos o ms variables. Este mtodo
aplicado al anlisis estadstico permite predecir matemticamente el comportamiento de una variable a partir
del comportamiento conocido de otra u otras variables. Esta relacin entre las variables se establece a
travs de una ecuacin que se llama Ecuacin de Regresin
3. VARIABLES DEPENDIENTES E INDEPENDIENTES
Al establecer la relacin entre dos variables se encuentra que el comportamiento de una variable depende
del comportamiento de otra u otras variables o que la manifestacin de una variable ocurre primero que la
manifestacin de otra u otras variables. A la variable que ocurre primero o que determina el comportamiento
de otra se le llama Variable Independiente y se suele representar por la letra X y a la otra variable se le
llama Variable Dependiente y se suele representar por la letra Y
EJEMPLOS:
Tasa de desempleo y ventas del comercio: La variable independiente o variable x es la tasa de
desempleo y la variable dependiente o variable y es las ventas del comercio
Accidentes de trnsito y ventas de licor: La variable independiente es las ventas de licor y la variable
dependiente los accidentes de trnsito
El nmero de personas que se movilizan en bus puede depender de las ventas de motocicletas y del
estado del clima, por lo que el nmero de personas que utilizan el servicio de bus es la variable
dependiente y las otras dos son las variables independientes

4. GRFICO DE DISPERSIN
Es la representacin grfica, en el plano cartesiano, en forma simultnea, de los valores que toman la
variable independiente (x) y la variable dependiente (y)

EJEMPLO

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 58

UNIDADES TECNOLGICAS DE SANTANDER


Se tomaron datos sobre el kilometraje recorrido por un vehculo y el consumo de gasolina, en galones, como
se presenta en la siguiente tabla:

Kilmetros
X
30
50
10
40
60
20

Galones
Y
5,95
8,55
2,35
9,25
13,85
6,75

La representacin grfica de los valores de esta tabla en el plano cartesiano, recibe el nombre de Grfico de
Dispersin como se muestra a continuacin:

Grfico de dispersin
Galones consumidos

16
14
12

10
8
6
4
2
0
0

10

20

30

40

50

60

70

Kilmetros recorridos

5. TIPOS DE RELACIN ENTRE DOS O MS VARIABLES


La relacin entre dos o ms variables que como dijimos anteriormente matemticamente recibe el nombre
de regresin se puede clasificar de dos formas:

Atendiendo a la cantidad de variables que se relacionan se clasifica en Regresin Univariada o


Regresin Multivariada

Atendiendo a la representacin grfica de la ecuacin de regresin se clasifica en Regresin Lineal o


Regresin Curvilnea

Esta clasificacin se puede visualizar en la siguiente grfica:

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 59

UNIDADES TECNOLGICAS DE SANTANDER

TIPOS DE REGRESIN
5.1 Regresin Univariada
Se presenta cuando slo interviene una variable independiente
5.2 Regresin Multivariada
Se presenta cuando interviene ms de una variable independiente
5.3 Regresin lineal
Se presenta cuando la representacin grfica de la ecuacin de regresin es una lnea recta.
5.4 Regresin Curvilnea
Se presenta cuando la representacin grfica de la ecuacin de regresin es una curva
Tanto la regresin lineal como la curvilnea tienen dos formas de manifestarse: en forma directa o en forma
inversa
6. Regresin Lineal Directa
Ocurre cuando al aumentar el valor de la variable independiente aumenta, proporcionalmente, el valor de la
variable dependiente. Por lo tanto, una recta parece describir de manera apropiada la relacin entre estas
variables, como se puede ver en el siguiente grfico

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 60

UNIDADES TECNOLGICAS DE SANTANDER

10

Y
5
4
3
9
7
5

9
8
7

Variable Y

X
8
13
6
24
18
20

6
5
4
3
2
1
0
0

10

15

20

25

30

Variable X

10
9
8
variable Y

7
La curva de regresin
(una recta), que mejor
describe la relacin
entre estas dos
variables, se presenta
en la grfica de la
izquierda

6
5
4
3
2

1
0
0

10

15

20

25

30

Variable X

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 61

UNIDADES TECNOLGICAS DE SANTANDER


7. Regresin Lineal Inversa
Ocurre cuando al aumentar el valor de la variable independiente disminuye el valor de la variable
dependiente en una proporcin similar

Y
9
24
11
6
14

30
25

Variable Y

X
19
3
16
24
8

20
15
10
5
0
0

10

15

20

25

30

Variable X

La curva de regresin (una recta), que mejor describe la relacin entre estas dos variables, se presenta
en la siguiente grfica:
30
25

variable Y

20
15
10
5
0
0

10

15

20

25

30

Variable X

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 62

UNIDADES TECNOLGICAS DE SANTANDER

8. Regresin Curvilnea Directa


Ocurre cuando al aumentar de valor la variable independiente, la variable dependiente aumenta mas que
proporcionalmente
25

Y
12
21
6
7
17
8

20
15
Variable Y

X
16
18
8
12
17
10

10
5
0
0

10

15

20

Variable X

La curva de regresin, que mejor describe la relacin entre estas dos variables, se presenta en la siguiente
grfica

25

Variable y

20
15
10
5
0
0

10

15

20

Variable X

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 63

UNIDADES TECNOLGICAS DE SANTANDER


9. Regresin Curvilnea Inversa
Ocurre cuando al aumentar de valor la variable independiente, la variable dependiente disminuye de valor en
forma ms que proporcional

Y
2
9
7
18
2

Variable Y

X
14
5
10
2
20

20
18
16
14
12
10
8
6
4
2
0
0

10

15

20

25

Variable X

La curva de regresin, que mejor describe la relacin entre estas dos variables, se presenta en la siguiente
grfica:
20
18
16
Variable Y

14
12
10
8
6
4

2
0
0

10

15

20

25

Variable X

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 64

UNIDADES TECNOLGICAS DE SANTANDER


10. Ninguna relacin
Ocurre cuando la relacin entre la variable dependiente e independiente no se puede describir con ningn
tipo de curva
Y
8
5
4
3
10
7

12

10

Variable Y

X
13
2
15
5
4
7

0
0

10

12

14

16

Variable X

11. LA REGRESIN LINEAL


Cuando los puntos del grfico de dispersin se pueden relacionar con una recta que pase lo mas cerca
posible de todos ellos, a esta recta se le llama Recta de Mnimos Cuadrados, porque la suma de las
distancias al cuadrado, de los puntos del grfico a esta recta es mnima
Esta recta tiene por ecuacin Y = A + B X, donde A es el punto donde la recta corta al eje Y, y B es la
pendiente de la recta. El proceso para determinar el valor de los parmetros A y B es complejo, pero, el
estudiante interesado lo puede consultar en cualquier texto de estadstica. En el curso, se determinarn
utilizando las funciones de las calculadoras cientficas.

LA CORRELACIN
El inters del analista no est solamente en establecer la forma como se relacionan dos variables, sino,
tambin, en medir que tan fuerte es el grado de esta relacin.
La regresin univariada es un caso extrao, lo comn es que en comportamiento total de una variable
dependiente sea el resultado de la interaccin de varias variables dependientes, como se muestra en las
siguientes grficas:
VOLUMEN DE TRFICO

CLIMA
COSTO DE
REPARACIN
DE VAS

TOPOGRAFA DEL TERRENO

CALIDAD DE LOS MATERIALES USADOS

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 65

UNIDADES TECNOLGICAS DE SANTANDER


KILOMETRAJE RECORRIDO
MODELO
MARCA
CONSUMO DE
COMBUSTIBLE
DE UN
VEHCULO

ESTADO MECNICO
ESTILO DE CONDUCCIN
TOPOGRAFA DE LA VA
EDAD DEL VEHCULO

Como es lgico pensar, la influencia que tiene cada una de estas variables independientes en el
comportamiento total de la variable dependiente no es igual para todas las variables independientes. Habr
algunas variables independientes que determinan, en buena medida, el comportamiento de la variable
independiente y, tambin, habr algunas variables independientes cuya influencia en el costo de reparacin
de vas o en el consumo de combustible, para estos ejemplos, es muy reducida.
Para cualquier observador que analice estas situaciones, es de capital importancia determinar cules son las
variables que ejercen un efecto notable en el comportamiento de otra, es decir, establecer la fuerza o
intensidad con la que una variable independiente y otra dependiente estn relacionadas. A esta fuerza o
intensidad se le llama Correlacin
1. EL COEFICIENTE DE CORRELACIN
Es una medida del grado en que una variable independiente influye en una variable dependiente
Este grado de la relacin entre dos variables se mide con un indicador que recibe el nombre de coeficiente
de correlacin.
El coeficiente de correlacin es un nmero adimensional que se representa por la letra r y toma valores entre
-1 y +1. El significado de estos valores que toma r es el siguiente:

S r = -1 r = +1 la correlacin entre las variables es perfecta, es decir, la fuerza de la relacin entre la


variable independiente y la variable dependiente, es la mxima posible.
S r > 0, es decir, es positiva, la relacin entre las variables es directa
S r < 0, es decir, es negativa, la relacin entre las variables es inversa
S r 0,9 r -0,9 la correlacin entre las variables se considera ptima
S r = 0 no existe correlacin entre las variables

Como el coeficiente de correlacin es un nmero adimensional se puede expresar tambin en porcentaje. Se


suele preferir valores de coeficientes de correlacin superiores al 90%
2. Relacin entre el coeficiente de correlacin y la pendiente de la recta de regresin
S la relacin entre las variables dependiente e independiente es directa el coeficiente de correlacin r y
la pendiente de la recta de regresin son ambos de signo positivo
S la relacin entre las variables dependiente e independiente es inversa el coeficiente de correlacin r y
la pendiente de la recta de regresin son ambos de signo negativo
3. EL COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin es el cuadrado del coeficiente de correlacin y explica el porcentaje de
cambio de la variable dependiente que se puede explicar por el cambio de la variable independiente. Por
ejemplo, un coeficiente de determinacin de 64% entre los litros de licor vendidos los fines de semana y el
nmero de accidentes de trnsito, en esos das, significa que el 64% de los accidentes de trnsito de los
DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 66

UNIDADES TECNOLGICAS DE SANTANDER


fines de semana se pueden explicar por las ventas de licor
BIBLIOGRAFA
LEVIN y RUBIN Estadstica para Administradores. Sptima edicin. Editorial THOMSON
MARTNEZ B, Ciro. Estadstica y Muestreo. Dcimo segunda edicin. Editorial ECOE
LIND, MARCHAL Y OTRO. Estadstica Aplicada a los Negocios y la Economa Dcimo Tercera Edicin.
Editorial McGraw Hill
ANDERSON, SWEENEY Y OTRO. Estadstica para Administracin y Economa. Sptima edicin.
Editorial THOMSON

DEPARTAMENTO DE CIENCIAS BSICAS

VERSIN 5

FECHA: 2011

Pgina 67

You might also like