You are on page 1of 26

Para saber qu es la "ESTADISTICA" y de que forma puede ayudar en la solucin de algunos

problemas en la administracin, se examinarn algunas situaciones, posibles de resolver con la


aplicacin que esta ciencia ofrece.
Por ejemplo, el problema de efectuar un inventario en un hospital. En lugar de hacer un conteo y avalo
de los artculos farmacuticos, que seguramente son cuantiosos, se puede proceder, a travs de una
muestra de estos artculos. El conteo y avalo de los artculos farmacuticos de la muestra servirn
para estimar el valor de la totalidad de los artculos almacenados, evitando as una tarea lenta y costosa
En una tienda comercial en el que cada da se debe decidir la cantidad de unidades de determinado
artculo de venta perecedero que hay que ordenar a los proveedores. La decisin debe basarse en las
ventas observadas de este artculo en el pasado, as como los costos en que se incurre por quedar con
un remanente almacenado al final del da, o por no satisfacer completamente la demanda, por haberse
agotado el artculo en consideracin
Otro ejemplo, es el de los planes de inspeccin para los artculos comprados por una empresa
manufacturera. Sobre la base de una observacin, cada lote de artculos recibidos debe ser aceptado,
si se considera que satisface los requerimientos establecidos en el contrato, o rechazado y devuelto al
proveedor. El plan posiblemente consista en la inspeccin de solo diez artculos de cada lote,
observando cuantos de estos estn defectuosos por no satisfacer los requerimientos. Por lo tanto, la
decisin se basara en el nmero de artculos defectuosos de una muestra del lote.
En la produccin se puede observar que sta se ve afectada, tanto en el volumen como en la calidad,
por diversos factores a lo largo del proceso de manufactura. Si se tienen registros que muestren los
"valores" de estos factores en el pasado, as como los de la produccin, se puede intentar establecer
una ecuacin predictiva que relacione a la produccin con los factores histricos. La produccin futura
podra ser pronosticada dados los valores que los factores tendrn. Los mtodos para identificar los
factores ms relevantes para la produccin, al igual que para determinar la confiabilidad del pronstico,
son materias que un especialista puede reconocer de la poblacin en estudio.
Los problemas mencionados ilustran el hecho de que la "Estadstica" en la administracin requiere el
uso de la informacin muestral para estimar. Predecir en ltima instancia, para tomar decisiones
La "ESTADISTICA" moderna ofrece al administrador una gran variedad de herramientas analticas en la
toma de decisiones bajo incertidumbre, sea inherente a los problemas de la administracin
exclusivamente, o que la "ESTADISTICA" como ciencia de la matemtica aplicada, sirve de herramienta
en otras reas, como por ejemplo: La Psicologa, La Sociologa, La Educacin, La Ingeniera, Comercio
y Finanzas.
Los ejemplos anteriores utilizan las nociones de prediccin y toma de decisiones que involucran a la
muestra, y que adems, implican una serie de trminos que son necesarios para la aplicacin de los
mtodos estadsticos.

DEFINICIONES:
Estadstica Descriptiva: Se ocupa del desarrollo y utilizacin de tcnicas para la recopilacin,
presentacin y anlisis eficaz de informacin numrica, con objeto de poder describir y resumir el
conjunto de datos.
Estadstica Analtica o Inferencial: Se ocupa del desarrollo y utilizacin de tcnicas para analizar
correctamente informacin numrica.
Poblacin o Universo: es el conjunto que incluye a la totalidad de los elementos o individuos reales o
conceptuales sujetos a discusin, y acerca de los cuales se desea obtener informacin.
Muestra: Corresponde a un subconjunto de la poblacin seleccionada de acuerdo a un mtodo. Una
muestra se compone de los individuos, objetos, mediciones u observaciones seleccionadas desde la
poblacin.
Variable: Es la caracterstica de inters, observada en cada unidad de una poblacin o una muestra.
Experimento: Es la actividad realizada segn un plan definido, cuyos resultados producen un conjunto
de datos u observaciones.
Parmetro: Es una caracterstica constante que describe numricamente a una poblacin.
Estadgrafo: Es una caracterstica constante que describe numricamente a una muestra.
Ejemplo.
Una empresa importadora de computadoras desea tener una idea aproximada acerca del costo de las
computadoras que poseen los profesores en Via del Mar.
Para este caso, a continuacin se aplica cada uno de los seis trminos bsicos que se acaban de
definir.
1. La Poblacin es el conjunto de los costos de las computadoras de todos los profesores en Via del
Mar.
2. La Muestra es el conjunto de los costos de las computadoras cuyos dueos son los profesores de
Educacin superior en Via del Mar.
3. La Variable es el costo de la computadora que posee cada profesor de Via del Mar.
4. El Experimento es el mtodo que sirve para seleccionar la muestra, as como, el que sirve para
determinar el costo de las computadoras que posee cada profesor de Educacin Superior de Via del
Mar. Se llevar a cabo preguntando directamente a cada profesor de la Educacin Superior en Via del
Mar.
5. El Parmetro acerca del cual se busca informacin es el costo "promedio" de las computadoras en la
poblacin
6. El Estadgrafo que se encontrar es el costo promedio de las computadoras en la Muestra

Definiciones:

Variable Cuantitativa, en este tipo de variable las observaciones de inters estn representadas
por expresiones numricas, como es la edad, la altura, el precio venta de artculos, el nmero de
automviles

Variable Cuantitativa Discreta: sta se caracteriza porque los datos obtenidos provienen del
proceso de contar (contar es considerado slo los nmeros enteros, ej. UF no es eso)

Variable Cuantitativa Continua: sta se caracteriza porque los datos obtenidos provienen del
proceso de medir

Variables Cualitativas o Atributos: Es el resultado de un proceso que categoriza (clasifica) o


describe un elemento de una poblacin. Si existe una jerarquizacin se dice que es ordinal, en
caso contrario se dice que es nominal.

Presentacin de datos
Introduccin.
Una vez desarrollado el plan de muestreo es necesario recopilar, organizar y analizar la informacin,
con el propsito de describir y resumir la informacin.
Mtodo Tablas de frecuencias
El mtodo de presentar la informacin en una tabla de frecuencia es la forma ms prctica para resumir
la informacin, puesto que estas tablas presentan con mayor claridad y en forma ms breve la misma
informacin dada en un listado. Adems, permite destacar relaciones que no se advierten en la simple
lectura de los datos. En general, una tabla de frecuencias se compone de lneas y columnas, y sus
partes principales son:
Titulo: En una tabla estadstica se deben destacar el o los ttulos, los cuales proporcionan el objetivo de
la agrupacin, como tambin se deben contestar las siguientes preguntas: Qu se estudia?, Cmo
se estudia?, Dnde se efecto el estudio?, Cmo se efecto el estudio?
Cuerpo de la tabla: En este lugar se debe especificar: las clases o categoras de la tabla, las columnas
de frecuencias o conteos, y la efectiva agrupacin de la informacin.
Notas al pie de la tabla: Estas notas tienen por objeto aclarar ciertas operaciones o relaciones que se
usan en la tabla. Tambin es el lugar donde se indica la fuente de la informacin.
Tablas Estadsticas en variable cualitativas.
En el caso de tablas de frecuencias que agrupan informacin proveniente de una variable cualitativa o
no numrica, se deben construir clases mutuamente excluyente, es decir, las observaciones deben
pertenecer slo a una de las clases definidas. Su estructura est dada por:
Ejemplo: Tabla 1. Distribucin de Software en una Empresa.
Software

fi

%fi

Delphi

15.8

Autocard

10.5

Windows

31.6

Office

26.3

Acrobat

15.8

total

19

100%

Fuente: Inventario
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN

Estadstica sumaria.
Podemos usar una serie de nmeros conocidos como estadstica sumaria para describir las
caractersticas del conjunto de datos. Dos de estas caractersticas son de particular importancia para
los responsables de tomar decisiones las de: tendencia central y dispersin
Tendencia central: la tendencia central se refiere al punto medio de una distribucin. Las medidas de
tendencia central se conocen como medidas de posicin.
Dispersin: se refiere a la extensin de los datos en una distribucin, es decir, al grado en que las
observaciones se distribuyen.
La media aritmtica.

Cuando se refiere al "promedio", se esta hablando de la media aritmtica x . Para encontrar la media
aritmtica, se suman los valores observados y el resultado se divide entre el nmero de observaciones.
Smbolos convencionales.
Una muestra de una poblacin, consiste en n observaciones de ella. Las medidas que se calculan para
una muestra se conocen como estadstica.
La notacin es diferente cuando se calculan medidas para la poblacin entera, es decir, para el grupo
que contiene a todos los elementos que se estn describiendo. La media de una poblacin se
simboliza con . El nmero de elementos de una poblacin se denota con la letra N. Por lo general, en
estadstica se utilizan letras del alfabeto latino para simbolizar la informacin sobre las muestras y letras
del griego para referirse a la informacin sobre poblaciones.
Clculo de la media a partir de datos no agrupados.
Media de la poblacin:

i 1

Media de la muestra
n

x
i 1

Para calcular esta media, se suman todas las observaciones. Los estadsticos se refieren a este tipo de
datos como datos no agrupados.
Ejemplo
Calcular la media aritmtica de los siguientes datos:
451 462 451 230 661 233 448 442 666 660
558 569 667 459 662 440 550 551 235 239.
Solucin, lo primero que se debe hacer es ordenar la informacin, en este caso de menor a mayor:
233 235 239 440 442 448 451 451 459 462 550 551 558 569 660 661 662 666 667
_

230 233 235 ... 666 667 9634

481,7
20
20

Ventajas y desventajas de la media aritmtica.


La media aritmtica, en su carcter de un solo nmero que representa a un conjunto de datos completo,
tiene importantes ventajas:
1. Se trata de un concepto familiar para la mayora de las personas y es intuitivamente claro.
2. Cada conjunto de datos tiene una media, es una medida que puede calcularse y es nica, debido
a que cada conjunto de datos posee una y slo una media.
3. Es til para llevar a cabo procedimientos estadsticos, como la comparacin de medias de varios
conjuntos de datos.
Desventajas:
1. Puede verse afectada por valores extremos que no son representativos del resto de los datos.

2. Resulta tedioso calcular la media, debido a que se utiliza cada uno de los puntos de dato para su
clculo.
3. No se puede calcular la media para un conjunto de datos que tiene clases de extremo abierto,
ya sea en el inferior o en el superior de la escala.
SUGERENCIA:
La media aritmtica, a menudo, puede mal interpretarse si los datos no entran en un grupo
homogneo.

La mediana.(me)
La mediana es un solo valor calculado a partir del conjunto de datos que mide la observacin central de
stos. Esta sola observacin es la ms central o la que est ms en medio en el conjunto de nmeros.
La mitad de los elementos estn por encima de este punto y la otra mitad est por debajo.
Clculo de la mediana a partir de datos no agrupados:
Para hallar la mediana de un conjunto de datos, primero hay que organizarlos en orden descendente o
ascendente. Si el conjunto de datos contiene un nmero impar de elementos, el de en medio en el
arreglo es la mediana. Si hay un nmero par de observaciones, la mediana es el promedio de los dos
elementos de en medio.
x n1

me =

Ejemplo
Calcular la mediana de los siguientes datos:
451 462 451 230 661 233 448 442 666 660
558 569 667 459 662 440 550 551 235 239
Solucin, lo primero que debemos hacer es ordenar la informacin, en este caso de menor a mayor:
230 233 235 239 440 442 448 451 451 459 462 550 551 558 569 660 661 662 666 667.

x 201 x 21 x10,5
me =

x10 x11 459 462 921

460,5
2
2
2

Ventajas y desventajas de la mediana:


Los valores extremos no afectan a la mediana tan intensamente como a la media. La mediana es fcil
de entender.

Se puede encontrar la mediana incluso cuando los datos son descripciones cualitativas, en lugar de
nmeros.
Ciertos procedimientos estadsticos que utilizan la mediana son ms complejos que aquellos que
utilizan la media. Debido a que la mediana es una posicin promedio, se deben ordenar los datos antes
de llevar a cabo cualquier clculo. Esto implica consumo de tiempo para cualquier conjunto de datos
que contenga un gran nmero de elementos. Por consiguiente, si se desea utilizar una estadstica de
muestra para estimar un parmetro de poblacin, la media es ms fcil de usar que la mediana.
La moda.(mo)
La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la
mediana, pues en realidad no se calcula mediante algn proceso aritmtico ordinario. La moda es aquel
valor que ms se repite en el conjunto de datos.

En ocasiones, el azar hace que un solo elemento no representativo se repita lo suficiente para ser el
valor ms frecuente del conjunto de datos. Es por esta razn, que rara vez se utiliza la moda de un
conjunto de datos no agrupados como medida de tendencia central.
Ejemplo
Calcular la moda de los siguientes datos:
451 462 451 230 661 233 448 442 666 660
558 569 667 459 662 440 550 551 235 239
Solucin, lo primero que se debe hacer es ordenar la informacin, en este caso de menor a mayor:
230 233 235 239 440 442 448 451 451 459 462 550 551 558 569 660 661 662 666 667.
Y se observa que el valor 451 se repite dos veces y es el nico, por lo tanto la moda es 451. S hay
datos que se repiten ms que los otros y adems, ellos se repiten el mismo nmero de veces, significa
que hay tantas modas que corresponden a esos datos. S, todos los datos se repiten el mismo nmero
de veces significa que la informacin no tiene moda, es decir, es amodal.
Ventajas y desventajas de la moda:
La moda, al igual que la mediana, se puede utilizar como una posicin central para datos tanto
cualitativos como cuantitativos.
Tambin, al igual que la mediana, la moda no se ve mayormente afectada por los valores extremos.
Incluso si los valores extremos son muy altos o muy bajos, se escoge el valor ms frecuente del
conjunto de datos como el valor modal. Se Puede utilizar la moda sin importar qu tan grandes o qu
tan pequeos sean los valores del conjunto de datos, e independientemente de cul sea su dispersin.
Se puede utilizar aun cuando una o ms clases sean de extremo abierto.
Comparacin entre la media, la mediana y la moda.

Cuando se trabaja un problema de estadstica, se debe decidir si se va a utilizar la media, la mediana o


la moda como medidas de tendencia central. Las distribuciones simtricas que slo contienen una
moda, siempre tienen el mismo valor para la media, la mediana y la moda. En tales casos, no es
necesario escoger la medida de tendencia central, pues ya est hecha la seleccin.
CUARTILES(Qk)
Corresponden a los estadgrafos que dividen a la informacin ordenada en 25% - 75%; 50% - 50% (que
es la mediana) y 75% - 25% y se calculan por medio de la siguiente relacin:

Q k x k *n ( 4 k )
4

k = 1, 2 y 3

Ejemplo
Calcular los cuartiles de los siguientes datos:
451 462 451 230 661 233 448 442 666 660
558 569 667 459 662 440 550 551 235 239
Solucin, lo primero que debemos hacer es ordenar la informacin, en este caso de menor a mayor:
230 233 235 239 440 442 448 451 451 459 462 550 551 558 569 660 661 662 666 667.

Q1 x1*2041 x 23 x5,75
4

Q2 x 2*2042 x 42 x10,5
4

Q3 x3*2043 x61 x15,25


4

x5 x6 440 442

441
2
2
x10 x11 459 462

460,5
2
2
x15 x16 569 660

614,5
2
2

DECILES(Dk)
Corresponden a los estadgrafos que dividen a la informacin ordenada en 10% - 90%; 20% - 80%; ...
80% - 20% y 90% - 10%, se calculan por medio de la siguiente relacin:
Dk x k *n(10k )
10

k = 1, 2, 3, ... ,7, 8 y 9

Ejemplo
Calcular los deciles 2 y 7 de los siguientes datos:
451 462 451 230 661 233 448 442 666 660
558 569 667 459 662 440 550 551 235 239

Solucin, lo primero que debemos hacer es ordenar la informacin, en este caso de menor a mayor:
230 233 235 239 440 442 448 451 451 459 462 550 551 558 569 660 661 662 666 667.

D2 x 2*20102 x 48 x4,8
10

10

x4 x5 239 440

339,5
2
2

D7 x 7*20107 x143 x14,3


10

10

x14 x15 558 569

563,5
2
2

PERCENTILES(Pk)
Corresponden a los estadgrafos que dividen a la informacin ordenada en 1% - 99%; 2% - 98%; ...
98% - 2% y 99% - 1%, se calculan por medio de la siguiente relacin:
Pk x k *n(100k )

k = 1, 2, 3, ... ,97, 98 y 99

100

Ejemplo
Calcular los percentiles 22 y 78 de los siguientes datos:
451 462 451 230 661 233 448 442 666 660
558 569 667 459 662 440 550 551 235 239
Solucin, lo primero que debemos hacer es ordenar la informacin, en este caso de menor a mayor:
230 233 235 239 440 442 448 451 451 459 462 550 551 558 569 660 661 662 666 667.

P22 x 22*2010022 x 518 x5,18


100

100

x5 x6 440 442

441
2
2

P77 x 77*2010077 x1563 x15,63


100

100

x15 x16 569 660

614,5
2
2

Construccin de la tabla de seis columnas:


Una distribucin de frecuencias consta de datos agrupados en clases.
Se definen los siguientes elementos:

Clase: Corresponde a uno de los intervalos en que se ha dividido la informacin, generalmente la


informacin se subdivide en 3, 4 o 5 clases. Cada clase consta de un lmite inferior y uno superior.
Marca de Clase (yi ): Corresponde al valor promedio de los lmites de la clase i
Frecuencia Absoluta (fi ): Corresponde al nmero de observaciones de la clase i
Frecuencia Relativa (hi ): Corresponde al porcentaje de observaciones de la clase i
Frecuencia Absoluta Acumulada (Fi ): Corresponde al nmero de observaciones acumuladas a la clase i
Frecuencia Relativa Acumulada (Hi ): Corresponde al porcentaje de observaciones acumuladas a la
clase i
n = Nmero de observaciones de la muestra.
nc = Nmero de clases en que se subdividi la informacin.
a = Amplitud de la clase.
Al ordenar la informacin se encuentran dos valores, lmite superior (l sup) y lmite inferior (linf)
a

lsup linf decimal de Aprox


nc

N de Decimales de la Informacin

Decimal de Aproximacin

0,1

0,01

0,001

Y as sucesivamente.
En caso de no conocer el nmero de clases, se puede estimar
Utilizando la frmula de Sturges: nc= 1 + 3,3*log n, pero el nmero de clases debe ser entero.
Ejemplo
Construir una tabla de seis columnas con cuatro clases, para los siguientes datos:
451 462 451 230 661 233 448 442 666 660
558 569 667 459 662 440 550 551 235 239
Solucin, lo primero que debemos hacer es ordenar la informacin, en este caso de menor a mayor:

230 233 235 239 440 442 448 451 451 459 462 550 551 558 569 660 661 662 666 667.
Ahora se calcula la amplitud de la clase:
a

667 230 1 438

109,5
4
4

linfi-lsupi

yi

fi

hi

Fi

Hi

284,75

20

20

339,5 449

394,25

15

35

449

503,75

35

14

70

613,25

30

20

100

20

100

230

339,5

- 558,5

558,5 - 668

Clculo de la media de datos agrupados:


Cada valor de una observacin cae dentro de alguna de las clases. No se sabe el valor individual de
cada observacin. A partir de la informacin de la tabla, se puede calcular fcilmente una estimacin del
valor de la media de estos datos agrupados.
De haber usado los datos originales sin agrupar, se podra haber calculado el valor real de la media.
Para encontrar la media aritmtica de datos agrupados, se aplica la siguiente expresin:
nc

y * f
i 1

, en el ejemplo anterior se tiene:

y * f
i 1

20

284,75 * 4 394,25 * 3 503,75 * 7 613,25 * 6 9527,5

476,375
20
20
,

Clculo de la mediana a partir de datos agrupados:


Se ubica la clase donde se encuentra el 50 % de la informacin acumulada y se aplica la siguiente
relacin:

n
( Fi 1 )
2
*a
f
i
me = linf +
, en el ejemplo se tiene:
(10 7)
3 *109,5
*109,5 449
495,928
7
me = 449 + 7

Clculo de la moda a partir de datos agrupados:


Cuando los datos ya se encuentran agrupados en una distribucin de frecuencias, se puede suponer
que la moda est localizada en la clase que contiene el mayor nmero de elementos, es decir, en la
clase que tiene mayor frecuencia. Para determinar un solo valor para la moda a partir de esta clase
modal:
1
*a

1
2
mo = linf +

1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente


por debajo de ella.
2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente
por encima de ella.

En el ejemplo la moda es
4
* 109,5 536,6
mo = 449 + 4 1

Clculo de los cuartiles a partir de datos agrupados:


Se ubica la clase donde se encuentra el respectivo cuartil y se aplica la siguiente frmula:

Qk l inf

k *n
Fi 1
4
*a
fi
, k=1, 2 y 3 . En el ejemplo se tiene:

1 * 20
4
Q1 339,5 4
*109,5 376
3
2 * 20
7
Q2 449 4
*109,5 495,928 me
7

3 * 20
14
Q3 558,5 4
* 109,5 576,75
6
Clculo de los deciles a partir de datos agrupados:
Se ubica la clase donde se encuentra el respectivo decil y se aplica la siguiente frmula:

Dk l inf

k *n
Fi 1
10
*a
fi
, k=1, 2, ..., 9 . En el ejemplo se tiene:

4 * 20
7
D4 449 10
*109,5 464,642
7
Clculo de los percentiles a partir de datos agrupados:
Se ubica la clase donde se encuentra el respectivo percentil y se aplica la siguiente frmula:

Pk l inf

k *n
Fi 1
100
*a
fi
, k=1, 2, 3, ..., 98, 99 . En el ejemplo se tiene:

80 * 20
14
P80 558,5 100
*109,5 595
6
La dispersin.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo revelan una
parte de la informacin que se necesita acerca de las caractersticas de los datos. Para aumentar el
entendimiento del patrn de los datos, se debe medir tambin su dispersin, extensin o variabilidad.
La dispersin es importante porque:
1. Proporciona informacin adicional que permite juzgar la confiabilidad de la medida de tendencia
central. Si los datos se encuentran ampliamente dispersos, la posicin central es menos
representativa de los datos.
2. Ya que, existen problemas caractersticos para datos ampliamente dispersos, se debe ser capaz
de distinguir que representa esa dispersin, antes de abordar esos problemas.
3. Quizs se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una
amplia dispersin de valores con respecto al centro de distribucin o esto presenta riesgos
inaceptables, se necesita tener habilidad para reconocerlo y evitar escoger distribuciones que
tengan las dispersiones ms grandes.

Medidas de dispersin.
La dispersin puede medirse en trminos de la diferencia entre dos valores seleccionados del conjunto
de datos.
Recorrido o Alcance (R).
Es la diferencia entre el ms alto y el ms pequeo de los valores observados.
Recorrido = valor de la observacin ms alta valor de la observacin ms pequea
El recorrido es fcil de entender y de encontrar, pero su utilidad como medida de dispersin es limitada.
Slo toma en cuenta los valores ms alto y ms bajo de una distribucin y no considera ninguna otra
observacin del conjunto de datos. Ignora la naturaleza de la variacin entre todas las dems
observaciones, y se ve muy influido por los valores extremos.
Las distribuciones de extremo abierto no tienen recorrido, pues no existe un valor ms alto o ms bajo
en la clase de extremo abierto.
Medidas de desviacin promedio.
Las descripciones ms comprensivas de la dispersin son aquellas que tratan con la desviacin
promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son la varianza y la
desviacin estndar. Ambas medidas representan una distancia promedio de cualquier observacin del
conjunto de datos con respecto a la media de la distribucin.
Varianza de la poblacin.
2
Cada poblacin tiene una varianza, que se simboliza con (sigma cuadrada). Para calcular la
varianza de una poblacin, se divide la suma de las distancias al cuadrado entre la media y cada
elemento de la poblacin entre el nmero total de observaciones de dicha poblacin.

( xi ) 2
N
2 = i 1
N

2 = varianza de la poblacin.
Xi = elemento u observacin.

= media de la poblacin.
N = nmero total de elementos de la poblacin.
Para la varianza, las unidades son el cuadrado de las unidades de los datos. Estas unidades no son
intuitivamente claras o fciles de interpretar. Por esta razn, se tiene que hacer un cambio significativo
en la varianza para calcular una medida til de la desviacin, que sea menos confusa. Esta medida se
conoce como la desviacin estndar, y es la raz cuadrada de la varianza. La desviacin estndar,
entonces, est en las mismas unidades que los datos originales.

Desviacin estndar de la poblacin.


La desviacin estndar de la poblacin, , es simplemente la raz cuadrada de la varianza de la
poblacin. Como la varianza es el promedio de las distancias al cuadrado que van desde las
observaciones a la media, la desviacin estndar es la raz cuadrada del promedio de las distancias al
cuadrado que van desde las observaciones a la media. La desviacin estndar est en las mismas
unidades que las que se usaron para medir los datos.
La raz cuadrada de un nmero positivo puede ser tanto positiva como negativa. Cuando se considera
la raz cuadrada de la varianza para calcular la desviacin estndar, los estadsticos solamente
consideran la raz cuadrada positiva.
Para calcular la varianza o la desviacin estndar, se construye una tabla utilizando todos los elementos
de la poblacin.
Usos de la desviacin estndar.
La desviacin estndar permite determinar, con un buen grado de precisin, dnde estn localizados
los valores de una distribucin de frecuencias con relacin a la media. El teorema de Chebyshev dice
que no importa qu forma tenga la distribucin, al menos 75% de los valores caen dentro de + 2
desviaciones estndar a partir de la media de la distribucin, y al menos 89% de los valores caen dentro
de + 3 desviaciones estndar a partir de la media. Para esto aplica la siguiente frmula:
Sea
k: nmero de desviaciones estndar
Porcentaje de valores que caen dentro de k desviaciones estndar a partir de la media viene dado por:
100(1-

k2

Con ms precisin:

Aproximadamente 68% de los valores de la poblacin cae dentro de + 1 desviacin estndar a


partir de la media.

Aproximadamente 95% de los valores estar dentro de + 2 desviaciones estndar a partir de la


media.

Aproximadamente 99% de los valores estar en el intervalo que va desde tres desviaciones
estndar por debajo de la media hasta tres desviaciones estndar por arriba de la media.

Resultado estndar:
La desviacin estndar es tambin til para describir qu tan lejos las observaciones individuales de
una distribucin de frecuencias se apartan de la media de la distribucin. Una medida que se conoce

como resultado estndar da el nmero de desviaciones estndar que una observacin en particular
ocupa por debajo o por encima de la media:
Resultado estndar = (x - ) /
Clculo de la varianza y la desviacin estndar utilizando datos agrupados:

nc

i 1

2=

f i * ( yi ) 2
N

2 = varianza de la poblacin.
yi = marca de clase i.
= media de la poblacin.
N = nmero total de elementos de la poblacin.
fi = frecuencia de la clase i.
nc = nmero de clases
Varianza y desviacin estndar de una muestra:
Para calcular la varianza y la desviacin estndar de una muestra, utilizamos las mismas frmulas,
_

2
sustituyendo por s2, por x y N por n 1.

( xi x) 2

s2 = i1 n 1
n

Por qu se utiliza n 1 como denominador en lugar de N? Los especialistas en estadstica pueden


demostrar que si se considera un gran nmero de muestras de una poblacin dada, si se encuentra la
varianza de la muestra para cada una de ellas y se promedian los resultados, entonces este promedio
no tiende a tomar el valor de la varianza de la poblacin, a menos que se considere n 1 como
denominador de los clculos.
Del mismo modo se utiliza la desviacin estndar de la poblacin para derivar los resultados estndar
de la misma, se puede tambin usar la desviacin estndar de la muestra para calcular los resultados
estndar de la muestra. Estos resultados indican a cuntas desviaciones estndar se halla una
observacin en particular por arriba o por debajo de la media de la muestra.
_

Resultado estndar de la muestra = (x x ) / s

SUGERENCIAS
Las letras griegas siempre se refieren a parmetros de la poblacin y las letras latinas se refieren a
estadsticas de la muestra.
Recordar utilizar N como denominador cuando se calcula la desviacin estndar de la poblacin, pero
n 1 para calcular la desviacin estndar de la muestra.
Dispersin relativa: el coeficiente de variacin (cv).
La desviacin estndar es una medida absoluta de la dispersin que expresa la variacin en las
mismas unidades que los datos originales.
La desviacin estndar no puede ser la nica base para la comparacin de dos distribuciones. Si se
tiene una desviacin estndar de 10 y una media de 5, los valores varan en una cantidad que es el
doble de la media misma. Si, por otro lado, se tiene una desviacin estndar de 10 y una media de
5.000, la variacin con respecto a la media es insignificante. En consecuencia, no se puede conocer la
dispersin de un conjunto de datos hasta conocer su desviacin estndar, su media y cmo se
compara la desviacin estndar con respecto a la media.
Lo que se necesita es una medida relativa que proporcione una estimacin de la magnitud de la
desviacin con respecto a la magnitud de la media. El coeficiente de variacin es una de estas medidas
relativas de dispersin. Se relaciona la desviacin estndar y la media, expresando la desviacin
estndar como porcentaje de la media.
Coeficiente de variacin (cv) = ( / ) * 100
Organizacin de la informacin en grficos: Grficos para variables cualitativas
Grfico de barras Horizontales

Fuente: Archivos de la oficina


Las representaciones grficas en barras Horizontales, tambin pueden ser las barras trazadas de modo
vertical, pero ahora el eje X describe a las clases de la variable y el eje y sirve para ponderar las
longitudes de cada barra.

Grfico de barras segmentadas


En algunos casos sucede que el total de la informacin esta compuesta de varios estratos. Conviene
utilizar un grfico de barras segmentadas o componentes, como el del grfico 3 basado en los datos de
la tabla 2.

Tabla 2. Exportaciones de cobre en 1997


(en miles de toneladas mtricas)
Gran Minera, Mediana y Pequea Minera
Meses

Toneladas

Porcentaje

Toneladas

Porcentaje

Totales
(Ton.)

Agosto

42,5

81,7

9,5

18,3

52,0

Septiembre

47,9

82,1

10,4

17,9

58,3

Octubre

46,1

82,8

9,6

17,2

55,7

Noviembre

7,7

43,9

9,8

56,1

17,5

Diciembre

27,0

73,2

9,9

26,0

36,9

Totales

171,2

77,7

49,2

22,3

220,4

70
60
50
40
GRAN

30

PEQ.

20
10
0
AGO

AGO

SEP

OCT

NOV

DIC

Fuente: Corporacin del Cobre

Se obtiene as una idea de las exportaciones totales del cobre, a la vez que de cada uno de sus
estratos. Este grfico tambin es posible de preparar, a travs de las frecuencias porcentuales en el
cual todas las barras son de igual longitud y equivalen al 100%

En algunas oportunidades, en especial cuando se trata de atributos o propiedades componentes de un


total (tabla de frecuencia), conviene confeccionar un grfico de sectores.
Para la representacin es necesario establecer primero el porcentaje de cada elemento, respecto del
total. Los 360 se reparten proporcionalmente por la frmula:
grados 3,6 * a%

Ejemplo. Recurriendo a la tabla 1 tenemos

Este grfico se emplea para sealar desviaciones positivas o negativas, respecto de una base

Ejemplo.
Tabla 4
Aos

Exportaciones

Importaciones

Saldos

1992

544,3

353,4

190,9

1993

458,2

441,4

16,8

1994

388,5

414,5

-26,0

1995

496,7

412,6

84,1

1996

490,0

499,6

-9,6

1997

508,1

584,9

-76,8

1998

532,1

517,6

14,5

CONCEPTOS:

Recorrido o Alcance: distancia entre los valores ms bajo y ms alto de un conjunto de datos.

Alcance intercuartil: diferencia entre los valores del primer y tercer cuartiles; esta diferencia
representa el alcance de la mitad central del conjunto de datos.

Alcance interfractil: medida de la dispersin entre dos fractiles de una distribucin; es decir, la
diferencia entre los valores de dos fractiles.

Clase mediana: clase de una distribucin de frecuencias que contiene el valor mediano de un
conjunto de datos.

Codificacin: mtodo para calcular la media de datos agrupados mediante la recodificacin de


los valores de los puntos medios de las clases a valores ms sencillos.

Coeficiente de variacin: medida relativa de la dispersin, comparable por medio de


distribuciones diferentes, que expresa la desviacin estndar como porcentaje de la media.
Proporcin o porcentaje de la media que representa la desviacin estndar.

Cuartiles: fractiles que dividen los datos en cuatro partes iguales.

Curtosis: el grado de agudeza de una distribucin de puntos.

Deciles: fractiles que dividen los datos en diez partes iguales.

Desviacin estndar: raz cuadrada positiva de la varianza; medida de dispersin con las mismas
unidades que los datos originales.

Dispersin: la extensin o variabilidad de un conjunto de datos.

Distribucin bimodal: distribucin de puntos de datos en la que dos valores se presentan con
ms frecuencia que los dems elementos del conjunto de datos.

Estadstica (o estimador): medidas numricas que describen las caractersticas de una muestra,
representadas por caracteres latinos.

Estadstica sumaria: nmeros solos que describen ciertas caractersticas de un conjunto de


datos.

Fractil: en una distribucin de frecuencias, es la posicin de un valor en, o por encima de, una
fraccin dada de los datos.

Media: medida de tendencia central que representa el promedio aritmtico de un conjunto de


observaciones.

Mediana: punto situado a la mitad de conjunto de datos, medida de localizacin que divide al
conjunto de datos en dos partes iguales.

Medida de dispersin: medida que describe cmo se dispersan o distribuyen las observaciones
de un conjunto de datos. Cantidades que describen la variabilidad de los datos.

Medida de distancia: medida de dispersin en trminos de la diferencia entre dos valores del
conjunto de datos.

Medida de tendencia central (o de posicin): medida que indica el valor esperado de un punto de
datos tpico o situado en el medio. Cantidades numricas que dan una idea sobre la ubicacin de
la distribucin de frecuencias.

Moda: el valor que ms a menudo se repite en un conjunto de datos. Est representado por el
punto ms alto de la curva de distribucin de un conjunto de datos.

Parmetros: valores numricos que describen las caractersticas de una poblacin completa,
representados generalmente por letras griegas.

Percentiles: fractiles que dividen los datos en 100 partes iguales.

Resultado estndar: expresin de una observacin en trminos de unidades de desviacin


estndar por encima o por debajo de la media; es decir, la transformacin de una observacin al
restarle la media y dividirla entre la desviacin estndar.

Sesgo: grado en que una distribucin de puntos est concentrada en un extremo o en el otro;
falta de simetra. Asimetra en distribuciones de frecuencias no simtricas.

Simtrica: caracterstica de una distribucin en la que cada mitad es la imagen especular de la


otra.

Teorema de Chebyshev: no importa qu forma tenga la distribucin, al menos 75% de los valores
de la poblacin caern dentro de dos desviaciones estndar a partir de la media, y al menos 89%
caer dentro de tres desviaciones estndar.

Varianza: medida de la distancia cuadrada promedio entre la media y cada observacin de la


poblacin. Promedio de los desvos cuadrticos con respecto a la media.

RECOMENDACIONES PRCTICAS:

Revisar cuidadosamente los datos antes de usarlos; verificar que no contengan errores;
chequear en particular los valores extremos.

Elaborar histogramas o cualquier otro tipo de grficos que permita visualizar la forma y las
caractersticas principales de la distribucin de frecuencias.

Diferenciar con precisin cundo se hace referencia a un parmetro poblacional y cundo a un


estadstico muestral.

Usar en forma conjunta una media de posicin y una de dispersin (como mnimo) para analizar
el comportamiento de la variable.

Prestar atencin a las ventajas y desventajas de las distintas medidas de posicin y dispersin,
para decidir correctamente su eleccin.

Calcular la media aritmtica con los datos en bruto sin agrupar siempre que se requiera su
valor exacto.

Dar preferencia al clculo de la mediana como medida de posicin, cuando la serie tiene pocos
datos e incluye valores extremos.

No tiene sentido calcular la moda en series de datos sin agrupar.

Tanto la mediana como la moda son valores de la variable (no confundir con las frecuencias a las
que estn asociadas).

Comparar, siempre que se pueda, media, mediana y moda para determinar el sesgo de la
distribucin.

El rango o alcance es una medida de dispersin poco apropiada para describir series con
muchos datos.

La desviacin estndar es preferible a la varianza porque se expresa en las mismas unidades de


la variable.

BIBLIOGRAFA: RICHARD I. LEVIN - DAVID S. RUBIN, ESTADSTICA PARA ADMINISTRADORES,


ED. PRENTICE HALL, SEXTA ED., 1996

You might also like