You are on page 1of 38

.

.. _'. , .....

~......

:..

..~.

..

- " ., __.o.~ ......

0_-

o.J,:

_O

,o

>

.~

61.06.03
.-

'

Probabilidad y:; stad$tica


61 . 06 I

'. .
j~ .:"-.

....

o.-ooo-.o

- .....

'.

..

.'

.:

,
,
....

_ -t,'" "' ,__

'" _

ESTADISTICA
DESCRIPTIVA
TE'ORIA y EJEMPLOS
Ing. Civil Ricardo M. Bach

.~-

~----

..

"

,'.

.._

.~.:..:St.:,:.:~..
~."

--1--

ESTADISTICA DESCRI~TIVA

Introduccin
Un primer
es una investigacin

paso en cualquier

de los dates dis?oni~les

raleza y grado de incertidumbre


nmenos
diente

o procesos

dos mediante
mente

observaciones

idnticas

rrientenente

Tales

a otro

condiciones).

i
~
...x_s_en,

valores

~or
:-.

z ac n , presentacin

estn

pueden

ocurrir

de los. mtodos

t.odo

~S~~d~c
h.t.;! ....Li
..........

conocidos

ulterior

Lriqre
son

caracteriza

bajo

ap~

existe

co-

adem~s

cen-

~5 frecuentemen~ara
~....... _

y reduccin de datos ,~uefacili tan

fe

invariable-

observados;

ti

'.1::1

resultados

sean realizados

ta~~o
v~r'o, .. __
...... ~
~

_10

cin ':.'
eva l.uac n como as tambin
la aplicacin

En otras palabras,
medidos

muc~os

con t cnen

que difieren

(ani cuando

un rango de valores

que o t rc s .

En efecto

fen6menos

experimentales

tro de dicho rango algunos


te

de los mismos.

impredecibles.

la nat~

para indagar

es decir que los verdaderos

de un experimento

rentemente

de la ingeniera

de inters pura los. ingenieros

de aleatoriedad,

e::lalguna medida

campo

la OPca"~.... _
J~_
_

su nter?n::taque implique

estudio

como propios

de la Inferencia

E:stad:tstic:a.

Distribuciones de frecuencia
Los datos originales son los datos registrados que CCD~tituyen la i.'lfoImacifu
del atributo en estudio con respecto a los individuoso el~
!lEntosde un cierto
mente

ccnjunto,

y ~o dar~~ una idea clara

sor. sintetizados

una lista ordenada


anuaj_es

8:1

ponentes

una determinada

Qi

de datos,

\JI: e j ernpLo sera

del sexo masculino

puente,

el punto

la ll~~ada

de veh!culos

si no
el

con -

obtenidos

precipitaciones

C'.lenca,las horas

el n(~ero

determinado
:Desde

d!stico

de individuos

a l.f ab t.a
c araent e I las

electr6nicos,

por

de lo ~ue ellGs significa~

en for:oa sistemtica.

j~nto de las alt~ras

mente

los m.srrosno han sido an orga'iizadcs


nUrrerica-

de

de lluvia

de vida de ciertos
que circulan

8cm

diaria-

etc.

de vista matemtico
distribucin

del anlisis

de frecuencias

esta

es ~na de

las formas ms fec).lndasque puede adquirir una tabulaci6n.


El prii
rner paso para construir este tipo de tablas consiste en un o~dena-

...

i1ll!

miento numrico de. los datos originales en orden

deseen

dente de magnitud.

~l menor

La diferencia numrica entre

de los datos se denomina ranao, amnlitud o recor~ido


da una idea de la variabilidad

se~ie.y
,

de los dates.

Cuando se fi'sponede

unaicen t .dad

tos, es til distribuir

los mismos en clases o

nar el nmero de ellos

(datos) que pe.r t ene ce a

day q.eter:nf.
,n~:que

se

conoce como la frecuencia de la clase.


s~ongamos tener ~ observaciones Xl' ~2
Dividimos

un intervalo que contenga

valos de longitudes
signaremos

tl,

t2,

tI'
"

t2,

tK (donde

A tK cuyos punt

am?litudAtjl

inter-

medios de-

Kn).

El n~~ero de obse=vaciones
indica el nmero de observaciones

f~

j-sima

que pertenece al in

alo

de

expresado por

, 6.
t.

t.

+ .]2
L:::.. t.

.:::::x .

~ t.

1.

Una distribuci6n

(1) :

de frecuencias

denamiento

tabular de los datos por clases junto ccn la corres,


cuencia de la clase.

una

A modo de ejemplo supongamos haber


tabla de dl.strib~cin de frecuencias cor. los datos
asociados

a los tiem~os de vida e 87 componentes

1eccionados

al azar de una cierta produccin

asi presentados

(ver tabla I)
TABLA

-'-

ti.,J

f. (%)

O ---150

5,75

---300

18

20,70

300 ---450

29

33,33

450 ---600

26,44

600 ---750

23
10

750 ---900

2,29

Intervalo
t (horas)

.150

87

total

_ ...r:.........
~
..:.: .

'

ieos
!

LO:5

se los 11a1:\adates aqrupados

al entero ms cercano

i-, ,

elec

11,49

100

se
catos

(3)

La nocaci6n
ha 1 de la tabla
nmeros
perior

extremos,

numrica

anterior

que define

una clase tal com

se la denorrina un in~ervalo

por ejemplo,

en ~a colurn

de e pse.

300 y 450 son los lfmites i

er~Or y su

o, el

la clase y la diferencia entre ambos, valedecir

de

Los

. !

ancho

de la clase.
Por la desigualdad

(1) si algun dato

coincide

co

un limite

de clase no hay duda en cual de ellas se debe incluir ya q


10 e s cerrado

supe r .o
r y abierto

en su extremo

450 hs. pertenecer

pIo si un dato es

en el Ln.f e r:

sobre situacion

!ladas.

1o de c 1ase que, a~.~.menos


Un ~nterva
superior

valo de clase

abierto.

r.a razn por


tos es la de proteger
dsticamente,
sobre

se puede

utilizar

y/e enunciar

teor~c~~ente)

superior

incletermi-

ti~ne

.:
14

la que algunas veces se eligen inte

alOS abier-

en el anonimato

a cualquier

ello de la reserva

todo en clases extremas


la clase abierta

que

ente reg

'a veces s

f
!

qu~ere

n el. ej emplo

de baja f!ecuencia.

menor de 150 horas

traca esta

(la

rimera)

la ltima como ~ayor de 750 horas.

y se obtiene

hallando

el promedio

de los lmit

lintrValO

in'edor

de la clase.
En el ejemplo,

375.

o aila 450-600

es Un inter-

La seal o marca de la clase es el punto medio de


de la clase

;Por ejem-

o no tiene lmite de clase inferior

dependiendo

asegurar

r.

a la clase 300-450 y

No deja de_ser:una...;convenci6n para decidir

mite de clase

el :interva

Tambin

la seal

se conoce como el punto medio de la clase'.

Con prop6sit~s

de la clase de intervalo, pOO-450 es:

de un ulterior

anlisis

matemtico

~odas las ob
I

servaciones

~ertenecientes

den co~ la seal de la clase.


tervalo

de clase

Reglas generales

dado se aceptar ~ue qoir!ci-

a un intervalo

Por lo tanto

300-450 se considerarn
para formar

todas las rr:edi~s eri el in-

375.

distribuciones

de frecuencias
I

1.- Determinar
hallar

; !.

105

valores

el rango.

mximo

mnimo en los datos o 'gin4leS y

_ .. --""

2.- Dividir el rango en un nmero conveni:nt:ede intervalq

de clase
o

que tengan la misma medida.


tervalos de diferentes

Si ello no es factible, s

medidas o intervalos

de clase a -ertos.

El nmero de intervaloS. de clase se toma generlmente


dependiendo

el uso de la siguiente frmula.


n ~ nC de intervalos

re _iy 20

de los datos.

Sturges recomienda

donde N

usaZ!n in-

nOde individuos

~ l + 3,3

pg

En general, cuando N>100,

se r eccm.enda tomar un valo~ de n


i

mayor que el que resulta de la simple ap i cac tn de la


~ tambin depende del tipo de fen6meno en estudio
dades a Usar.
m61tiplo

rm~la.

V de ,las uni

Se trata en general que la amplitud del 'nt~.r,valosea

de dicha unidad de medida

Los intervalos de clase se eligen ~e modo tal que

os puntos

medios de las clases co .nc .dan- con las datos realmente

bbs ezvados ,

Esto tiende a disminuir el llaffiadoerror de agrupamien

p.

El nInero de intervalos
como para revelar demasiado
frecuentemente

en defi"nitiva

no

debe ser ~an Ejequeo

detalle que confunda al ob ~rvador

la objecin a la tabla original) ni tan

para hacer desaparece~

caractersticas

fundamentales

cir..

J.- Determinar el nmero de observaciones


valo de clase, es decir hallar
La serie o distribucin
lisis:o 1) caracterizar

que corresponde

las frecuencias

de frecuencias

su estructura

das para poder compararlos

ran~e como

la distribu
.
-

l~ad~ inter

de cla

conduce a

~ d~Jle an-

mediante nrr.~ros ~a.'-na~os


medi

con otras

tica (de ajuste) que la represente

(eso

2)

encontrar

'.lnap.lrvaanal

lo mejor posible, e

I dec:irun I

modelo matemtica
Distribuciones

probabilstico.

de ::recuencia

relativa.

lIistocrama

polql ~os de frecuen

Frecue:'lciarelativa de una clase es la frecuencia

~e l~ cla!?e ..
i

dividida por el total de la frecuencia


nente expresada como un porcentaje,
la columna

3 de la tabla

de todas las clases

cuyo clculo se puede

'f

r.

1;'
l

pserv,aroen

01,
.' ..
i .'~_
..

es !general-

-o

.. :'t. :-

-::>Por ejemplo
tabla

la frecuencia

relativa

de la clase

150 - 300 de la

I ser:

lB

20,70%

81

La suma de las frecuencias


.f
es 100%.
.,

relativas

.,

gicamente

Si en la tabla de frecuencias
por las correspondientes
frecuencia::relat\va,

frecuencias

de todas

las clases

son reemplazadas

l-

las frecuencias

se tiene una distribuci6n

relativas

de

o' tabTa: de ::recuencias relati

distribuci6n porcentual

vas.
~ara que sea vida
frecuencia

stas

deben

rerr.oscon la notaci6n

una comparaci6n

ser de frecuenci~
=

f.
)

La distribucin

entre dos distribuciones

relativaS

Esta ltima

de

la indica-

f~
In.
J
ser' r'ep re sen t ada graficamente

puede

en ccorde-

\._'

nadas c ar t.es Lan as como una funci6n

"escalera".

< x '"~t, J

h (x)

(2 )

'f

Es decir que como ordenada' 'n6'se'lleva: la''fr'ecuencia relativa


sino ella dividida
re?resentada

por la lcngitud

de la clase.

co~o ordenada

a los e!ectos

conOce corno histogramas


cias re1ativas
intervalos

estan

de clase

10 que se pretende

representadas

por reas.

nc son iguales

la funcin

es hacer

al elegir

resaltar

bucin y que ?asen desapercibidas

estar

J
usar directamente

A estos

diagramas

es la de que

?ropiedad

I A t. .)

se puede

de representaci6n.

ya se ha dicho,

COIT.O

los~t,

y su ?rincipal

f',J

(A t,.

por el rea de un r~ct&ngulo


En caso de ser iguales

Por lo tanto

Recordar

se los

c::uesi los

debe ser representada


.

los rasgos

segn

~a longitud~~"

intervalo

masiado

estas lti~as ~endrn pre90ndera~cia

caerar. s10 un n~~ero

grandes

En un histogra~a
servaciones

se distorsionan
una unidad

Si 10s,6t,

aleatorias.

.t':

son pequeos,

(2).

de la distri-

fundamentales

las variaciones

las frecuen

entonces

arbitrariamente

f.

pequeo
-";

en razn

de observaciones

las caractersticas

de su~erficie

representa

de que en dicho

v si los~t,
son de
J

de la distribuci6n.
el ~ismo

nmero

de ob

(Ver fig. 1).

.
... 't,)iH'~1"'~,,"I"''''''3'''''';-!ffCSli''''':J.?;Uiijjr~~~~''''~ifi~~A!

:an:.,~~.
.._----_.-

'J
,,

;!tW1:~.::;
..:
---

--- ------------

- --"-=---:-;C'''_-:;;:;:~;;;C'',

__ __,,

,__
,='

.......

,.".........,_~~

1-6~
I

Un polgono

mando como referencia

de frecuencia es un grfico lineal

los puntos medios del lado superior d

nstrbdo tolos ~ectngU

los del histograma.


s de] las cla

Es usual prolongar PQ y RS hasta los puntos med


ses inmediatamente

inferior y 5u~erior respectivamente,

,
I
~eneIl frecuen

que

cia nula.
en el

En dicho caso la suma de las reas de los rect

frecuen

histograma es igual al total del rea limitada por el pol!g


c a y el eje X.

Si se estudian

varios atributos

de un mismo

fen

eno se construi

r un histograma o poligono para cada uno de ellos.


Distribuciones de frecuencia
A la frecuencia

acumuladas
relativa total de todos los val l."esmenores o

iguales que uno dado, se la denomina la frecuencia acumulad


yendo dicho valor.

inclu

de obse ~aCi~nes orce

Sean x(l) , x(2)' ... x(n) un nmero n


nadas segn la magnitud.

I has ta e
I
j

La funcin H(x) de frecuencia ac

kada, de acuer

do a la definicin dada esta dada por


o

~ara x

i
n

para x

1 para

< xli)
(!.)~

x("xCi+l)

I
1, 2,

(3 )

"

. ; n-1

x.> x (n)
unoide a sal

Es esta una: funcin escalera que crece de cero


tos cuya altura es 1
n

una

Observar que x(il es el dato que ocupa el lugar


vez que han sido ordenados
tuviramos
y

105

los valores de merior a may or

87 datos del ejemplo orde!1ados, donde el

el ~enor 80 ~oras, se generarfa

ci6n que responde a la funcin

or f~era 900
a c4>ntinua-

una tabla como la

(3). (Ver tabla Ir)

I-

L_ ----.L----.-:J._'
.
':':."

'"

_"

_"~,o
/.

TABLA

H (x (i)

X(i}

II

1/87

para 80~ x

x(2)

100

2/87

para lOO~ x <.110

x (3) ==

110

3/37

para HO ~ x -: 120

x (4) = 120

4/87

?ara

5/87

para 135~x<x(6J

x(5)

ee

135

120~ x <..,135

-------~

--------------------

--------

x(85)

750

85/87

par a 7 SO"::; x <- 840

x(86~

840

86/87

para

x(87)

900

87;87

La r epr e sent.ac n grfica


escalera

cuyos saltos

tienen una magnitud

Trabajando

x ~ 9CJ

cornose ha dicho una f unc .n


de 1/87.
la frecuencia

con datos agrupados{

e incl~ye:::ldo
el intervalo de esa clase dada, ser
total ..de toos los valores

meneres que

5:1 el ejemplo anterior

yendo la

clase (300 - 450)es

la frecuencia

del

TABLA

tiem:co
(horas)

signifira2

a 450.

de f'::cecuencias acumuladas
de la distr::'bucin de frecuen

intervalo.

rr.r

f.

acuI!1ulada
H.
]

~ O

0%

~ 150

5,75%

~ 300

26,45%

~ 450

59,78%

~ 600

86,22%

~ 750

97,71.%

3CO

relativa

acumu Lada aas t a e inclu-

o iguales

para el e j ernpLo da do (tab2.a:ID:'.Es obtenida


de divisi6n

,:

la frecuencia

5,75% + 20,70% + 33,33% == 58,78%,

Se indica a con t .nuac.n la tabla

acumulada hasta

el lmite superior de la clase.

do que el 58,78% de las medidas son meneres

cias hasta cada R.J punto


.

840 ~ x <:. 300

para

ser

---

< 100

80

x(l)

:OC%

_ ...:.'

._- .. '.';~..... - .. ..:..

. ...._--_.:.._ ... .-..~._


.. _.

:.:"~

de datos agrupados

se ~a puede re

tambin por un polgono de frecuencias acumuladas

donqe las fron

Es decir que la distribuci6n

I
I

presentar

teras de clase t.
J

nadas.

+.1 t./2 son


)

como orde-

H.

ut lizados como abscisas y'lo

J
rfico es me-

Los puntos se unen por rectas, y el correspondiente

nos sensible a las variaciones de las longitudes

t. de las

laSS que en

el.caso deo:los histogramasi y !'lolgol'!os


de fre~uen:ca (Ver figufa 2) .
Para algunos propsitos, puede que se desee con ilderir una dis
tribuci6n

de frecuencias acumuladas de todos los valores ma ores o iguales


En este caso (refi~in

que el 11mi te inferior d:. cada intervalo de clase.

:donos al ejemplo) consideramos

valores de horas de cero o

SI

considerada
'nor que".

ms, etc. y

entr~s que la -:

se designa "distribuci6n acumulada mayor que".

sta

SO
!

acl$ulada me-

en el ejemplo anterior, se designa distri~uCi

Una es facilmente obtenida de la otra.

Curvas de frecuencia
Los datos ~eco~idos pueden en ger.e~al ser ccnsi
tenecientes a una m~estra extrada de una poblaci6n.
en una poblaci6n

Desd

grande, existe la posibi.lidad de realiz:ar

tambin es posible te6r~camer.te (?ara datos cor..tinuos)ele


de clase muy pequeos y an asi obtener

un nVroero de obse

s~ ~odr es~erar entonces que e

caiga dent~o de la clase.

frecuencia relativa oar a una qran poblacin est formado


mentos lineales que encierren c~rvas aproximadas

seg_

llamadas

fre

cuencia relativa.
)

Es razonable
aproximadas

suponer que. tales curvas terica

I puedan

ser

por ?ol.go:-1oS
de frecuencj.a (e de f:::-ecuenciq
a "mul~da) de la

muestra, aumentando

la aproxi~aci6n cuando la medida de la

uestra crece

Tipos de Curva de frec~encia


Las curvas de frecuencia que a?8reCen en la pr&c ~ca ~oman cier
tas formas caractersticas
rnatematico-probabilisticOs.

mas o menos distorsionadas

denow.inadas funciones de densid


Los histograrr.asson por

lo

(en razn del nmero de datos f

ble) del modelo que rige el fenmeno.

Los polgonos de fr

muladas son a su vez las representaciones


ciad~s a la funci6n de distribuci6n

empiiicas

terica.

La decisin sobre si un conjunto.de datos emp1ri

o modelos o ":mgenes"

ita !disponi
!

ueno a acu-

an corno aso

-9-

puede

ser aceptado. corno generado

de un determinado

ci6n) es materia de la estad1stica


~os para rechazar
jo de los datos

o aceptar

media~te

ros pases orientadores


buto'gue

es ebjete

hiptesis

en la bOsqueda

de modelos

ayudando

siones

a primera

de un modele

se la investigaci6n

El mane -

es uno de los prime-

para el fen6meno

tambin en su seleccin

o atri

la natura

en ebservacin.

parecera

respecto

(pobl~

diversos roto-

al respecto.

descriptiva

En el caso del ejemplo. desarrollado"


frecuencias

que aporta

planteadas

la estadstica

de estudio,

leza de la variable

inferencial

modelo terico

vista no.presentar

gaussiane

estadstica

el histograma

significantes

o normal ~udiendo

hacia el ~jaste

o polgono. de
distor-

entences

de dicho medelo

dirigi~

a los da-

tos empricos.
En la figura
,..__.

modelos,

~ereciendo

ferentes mecanismos

3 se ilustran

destacarse

algunas

que existen

dlstribucio:1es ms comune s o

muchos

otras que obedecen

de los datos y a ~a na~uraleza

de gene~aci6n

a di

i:1trin-

seca de la investigaci6n.
a) La ferma simtrica
observaciones
cia.

o de campana

se caracteriza

equidistar.tes del mximo

Un ejemplo

im?ortante

central

mximo

central.

Pueden

ser as .n t r cas hacia

Ejemplo:

la izquierda

la misma

frecuen

y moderadas,

el extremo

de la

ms que el del otro respecto del valer

curva de un lado s~~xtiecde

tricas hacia

tienen

es la curva normal

b) En las curvas de frecuer.cia asimtricas

por el hecho. de que las

la de rech a (asimetra pc s t ava l ' o asim-

(aSimetra

negativa).

la curva logartmica normal.

e) Otro tipo. es la curva J donde el mximo de la curva aparece en el ex


tremo.
~jemplo:

la curva

expcnenc .al neqa t .va,

d) La curva U tiene mximo


el La bi~~al
f) la multimodal

en ~,mos extremos.

tiene dos mx .mos ,


tiene ms de dos mximos.

:.,'
'.

;, \

'~

o".

, ..

.,,~,. .

,": ;'

Consideraciones

finales

En el caso de ser ms de uno los atributos

la distri

",..,

buci6n

se llama mul tidirnensi: al.


Si

n es bidimensional

cada en un diagrama,
de ooordenadas
dro

de la

cada obs.

ma forma que ubicamos


,.

ub L

'* sistema

un pun
~

ste cuadro de doble.entradru s

en el plano.

"eua

tabla de correlaci6n ".~

En algunos

tema de coordenadas

casol se realiza el histograma

sis

tridimenlfonal

el nllinerode'observaciones

rectangulares)y

U..'1

1 es-

de cada

t! representado

por el volumen de dichos prismas.


'-1
Cuando los atr1"\,utosson de caracter

cualitti

posible

construir cuadres
el histogr~~a

llamados

o polgono

de

contingencia

de frecuencia

, pero no es

respectivo.

En el caso de t::-abajarcon variables


la distribucin
proporcionales

de frecuenci~s

puede

graficarse

a las frecuen ias relativas

valor de la variable.
los de ancho unitario

A ve.
y

punt

:realiz<lr

cuantita
llevando

.discretas
;
lineales

ba

en correspondenc

se dibuja como

rect.tng'.l
-

medio de la base en corres?on

C01'_

el

valor de la variable.
Ejemplo

En estudios

los siguientes

de tormentas

datos en la red de estaciones

dichos datos se ha ccnstrudo


tabla nOrV)y

el histograma

qbservaron

de lluvia
de registro.

la distribuci6n

de fre

1 anlisis de
res~ectiva

(Ver figura N4).


Tabla IV
frecuencia

por estaci!"1
102

8,33~

144

0,00%

74

0,55%

28

7,78~

10

2,78~
,

.360

O/56~
100-'

(Ver

~ .:.:.

. :... .1.. :.

I'IGURA 1

polgono

de frecuencias

s
eco

100

JOO 400

500

600

FIGURA
Frecuenca
ac.umuiada

relat" a

700

BOa 900

HOR"'!>

-::

/1
I

~ORAS

150

300

900

Poli~ono d.e fl'ecuencia5 aClJT!1uJada5

-._-- -_._- .....

__

---._--------

--'-'--_

----_

FIGURA 3

n
\
a)

20

-_ .._

-.

"

_-

__

.....

......

.0

rr:'T~
1

FIGURA 4

l
1 I

h-

_.~. __

J . _..

~._._!

._.__~_

L.__

-..L...L.-

Observacin:

se debe interpretar que en 102 estaciones no ocurri6 ninguna

tormenta, en 144 una, en 74 dos, etc.


Parmetros de posicin o medidas de tendencia
Un promedio de un conjunto de datos homogneos
es un valor tpico o representativo
simple y concisa a la vez.

central, ya que tales valores

la raoda , la media ;eomtrica, y la media armnica.


dependiendo

la me-

Cada uno de ellos

su uso de las caractersticas

los datos y de los propsitos que se persiguen


promedio proporcione

ti

dentro de un conj unto de datos orde

Los m!s comunes son: la media aritmtica,

tiene ventajas y desventajas,

\,__,

en una forma

A los promed..o
s tambin se los conoce como :ne-

p:i:'cos
tienden a ubicarse centralmente

~,

e individuales,

de los mismos, expresado

didas de posicin o medidas de tendencia

nados segn su magnitud.

central

de

tratando de evitar que el -

una impresin e~gaosa y no representativa.

El smbolo xj ciesigna cualquiera


que puede asurnar una variable X (j

de Los n va Lore s xl' x2

1, 2

. n ) asociada

o estudio y en donde dicha n-upla de valores


u
~
mo"una muestra de camano
!!.
ex~erimento

xn

a un determ'::'nado

se le denomina co-

....

",Xn

est defiDida ~or la expresin:


x.,

~ xn

( '1 )

Es f.::-ecue~te
usar el trmino promedio como sin6ni~0

de-media

mtica, aunque hablando estricta.'1'lente,


existen otros ti[.>osde promedio
diana, moda. etc ...

Conviene aclarar que ~n promedio

ar~t
(H~

p~ede no perte-

necer al dominio de la variable en est~dio.


Las vent3.ias de la nedia aritmtica
10) Su clculo es fcil, de comprensi6n

resien en:

sencilla,

cada observacin

contribuye con igual peso, y. puade ser trate.da algebraicamente

o dato
sin di:1

cultad.
2) Es la mejor estimacin de la media aritntica,

de la poblacin

o.modelo

de la cual ha sido extrada la muestra aleatoriamente.

3) Las medias aritmticas de las muestras de medida uniforme extradas de


una poblacin tienden a distribuirse
de distribucin

normalmente

a que responde dicha poblaci6n.

presciendiendo

del tipo

Es qUizs la ms impoE_

:'ante :le :;,Jas las 9!:"or-iedades


ya crue eLla permite aootar en lenguaje de
probabilidad

el valor de la media de la po~:acin,

aun cuando ella no se

halle normalmente

distribuida.

Es de hacer notar que cuanto mayor sea el tamao de la


buc6n

de las

medias ser

rr.s prxima a la distribucin

E#ffiLcdiara.

Una desventaj a de la rr.ediaaritmtica es que la

due

ra,

no

~a distri-

al ~

i!

aujsm

6"'iI

~@

se ve justame!:!_

por los valores extremos, y, en general,! p

te influenciada

nes marcadamente
aconsejable
Si

asimtricas no es representativa,

en ~stos

los

a di~tribucio,

por

lp

e su, uso no es

casos, pese a su exactitud matemti~a.

valores numricos Xl' x2'

xk ocurren

l'

(es decir aparecen con frecuencia t.l

veces res~ectivamente
mtica sera:

~~ + .
",1

:::1 + "'2

Siendo n

f.

=L t'.J

+ . . . <='
~k

D=l
!

o nmero total de datos

arit

, x.
J

k
1

la frecuencia

m..edia

:L : ]

fk

la

iJ

!.
Fl' f2,

(5)

f.
J

Media aritmtica

ponderada

En ciertos casos a los valores Xl' x2'

sejas
,
Wk que dependen del si~nificado oim

buida a los datos numricos.

La media se calcula entonc~s

ian factores
rtancia atri

Fmo:

I
W,

2:.w

Por ejemplo, si un trabajador

metalrgico se halla!ex
,
!

jornada de trabajo a t.emcerat.uras que varan de acuerdo


que l mismo

realiza

sar la temperatura

pedra considerarse

promedio q~e afecta a dicho obrero a

cada operaci6n

S i llamamos
operaciones

y tl,

'

ioi

,
son ~os

a para expr:::_

rgo 'de la joE.


de du

para tres -

t3

los tiempos de d~raci6n de las

'p

1
I

ponderada estara expresada por:


T

su

operaciones

Tl' T2 I T3 a las ter:r?eraturasde expos jf'::'


t2,

(6 )

la media pon4er

nada de trabajo y donde los factores de ponderaci6n


racin de

I!-lestoen

s lanedia
i5

II

::;

I
./

' .

'lph

li1,

pr.opiedades de la media aritmtica


al La suma algebraica

de las desviaciones de

to de su media aritmtica es cero.

En efecto, sean las desviaciones

d
n

= _
~

ser! 'd.
~

x) =1 x J.

(x . J

--:l:.

- n 'X.
=

b) La suma de los cuadrados

L x~

a =

de Las desviaciones

:L (Xj

Se demuestra

F7

- a) 2

aplicando

mnimo si

de un conjunto de datos

es un mnimo ~)'i y solo si

Es decir

-:2.x~

num ri cos x , respecto de cualquier nme rp a

...x

conjunte de nmeros respe~

'Jn

la condici6n del m1~irnodel anlisis matemtico.

e) Si fl datos numricos tienen media xl' f2 datos tiener. media x2 y en


general f'k ates tienen media xk' entonces
rnricos es:
~
x

, -x2
,
f2

"1 xl + fZ

F'
~l

,-

'+
'. "f k

. .

~a media de todos los catos ~u

Xk,

=:

If~
'"
2.

fk

--t

es decir, eue es una media aritmtica ponderada

dl Propiedad

x"
(7)

f~

de todas las Ir:edias.

de la aditividad de la media

.~

-n

es Z ;:x ...y
En efecto:

z '"

L (x
n

-x +

+ y)

e) propiedad de la traslatividad

de la ~ed~a

Sea un conjunto de datos x . e i.ndiquemos por d. las desviaciones


J

respecto de un nmero A fijo (que puede ser uno de los x.) es decir
J

d.o::

x.-1\,

Por tanto:

x =
n

(8)

.r '
!

-;.,-:
.':.'
:::..:
,..
" :".,.,=_.~-----_.

Sin.tetizando:

A + d

Anlogamente,

si en el

veces, etc., se tendr


r

,,_f. ]

x ::

x,

d.

Por tanto

]
[:

ya que.:lEfJ.
J

Media aritmtica

calculada

de datos agrucados

Cuando los datos son presentados


todos los valores que pertenecen

e:1 una distribucli.6n e friec\J.encia,


;
i

pueden con .
a un intervalo de clas~ d ho,
l'
I
I

siderarse como coincidentes


tervalo.

Las f6rmulas

con la seal de la clase o gun ~ medio del in

(~l y

(9) son vlidas

para el caso

rada ':cs agr:-

a x. como la sealo punto medio de ~ clase, fi


J
i
as e c ua Lqu .e
frecuer.cia de clase, A'la sea"l de uJa

pados si se interpreta
su correspondiente

Ii

rs

ra y dj

xj

A las desviaciones

La realizaci6n

xj con respecto

A.

~q)

(~

de los clculos usando las f6rmulas

nocidos como el mtodo largo y corto respectivamente,

Actualmente,
'_1'

con el uso de las mqu~nas

sentido desarrollar
cuando el clculo

computadotas

en detalle el mtodo abreviado,


se realiza manualmente

1 c4lculo de

ptra

la media para datos aqrupados.

mt~do

o con nquinas

sen co

ro t~ene mayor

Ij us ~i f

cadc

de calcular elemen

tales.

!~

~..ediana

segfu1

Se denomina mediana de un conjunto de datos orden~do

su rnag_

nitudf al valor medio

(equidistante de les extremos) x(nTl

o la media aritmtica

de los dos 'Talares medios

n6mero par de datos(~n/2)

+7n2+11)

si n es impar
con tar con un

En otras palabrar

valores mayores que la mediana ocurren con la misma

freru

nores a ella, es decir que la mediana est determinada

ro

rfam~s que los


I

cia t;{uelos me
el nmero

el

.lo!que prese!!

::d::::::::::::~~:~::::::%~:::b:::::~:~~
::l:~::rn~::rcdiana
do por la siguiente

f6rmula;

Ilt\\1

Ii
j

est d~

donde:
Ll

limite

inferior

de la clase que contiene

fi

suma de las frecuencias

relativas

la mediana

de todas las clases

inferiores

a la clase de la nediana.

f~ : frecuencia
C : ~~plitud

de la figura NS. correspondiente

acumulada,

,",Xl

de la clase que contiene

-a :nediana.

de la clase de la mediana.

Dell grfico
cuencia

relativa

se observa

de fre-

a un polgono

que:

------,,--------_._-- ._

FIGURA 5

(suponiendo

5+_-

ya que x

ser x~

Ll +

,C

, I

y siendo

". 1

Ll

GA)

+ AD
B'b

AE

CE

: frecuencia

de la

clase mediana

'....

~ e

recta

1/2 -

.lf.J

y AE ""c
Reemplazando
Es evidente
ci6n

8:1

la expresin

anterior

que el valor de la. mediana

li~ea~.

En el polgono

sa de la mediana,

ha sido calculado

de frecuencias

le corresponde

Geomtricamente

se justifica

la mediana

relativas

la ordenada

la f6rmula

(lO)

por interpola-

ac~~uladas,

a la absci

0,5 o 50%

es el valor de x.

(abscisa)

que corres-

ponde a la vertical
rea, mientras

qt:e divi:::'e
el histcgrarna en des partes

~ue la media aritmtica

centro del rea delimitada


tie~e mayor

nes de frecuencia

propiedad

.E~~~

la ventaja

con clases

ocurre con la media

ser medidas

por el ~istcgra~a.

uso en el caso de distribucio~es

La mediar.a tiene

Adems

corresponde

de poder

abiertas

q-.:.e
tie::1enigual

a la abscisa

La mediana,
marcadamente

del bari

como promedio,
asimtricas.

ser ca.lculada para distribucio-

en uno y otro ext::::-err.o


r
cosa que no

aritmt::.ca.

es el prcmedio
cuantitativamente

indicado

cuando

pero pueden

las observaciones

ser ordenadas

no 9ueden

conforme

a alguna

Ii

Moda

valor

La moda o el modo de un conjunto de datos nurnrico~


que ocurre con mayor frecuenc~

A veces,

, es decir, el valor ms:

en las series empricas, no est nitidam~nte

el ntl

Piferenciadf'

mero de datos es pequeo o bien el valor'modal

no es ni~o

es unimo;

En general es ms usado en estadlstica

dal) .

econm.ca s :

,
,

nes discretas se la localiza rpidamente.


Por lo tanto en el caso de datos agrupados,

si se

hb

curva de frecuencia de acuerdo a los datos, la moda ser! e


(o valores de x.) correspondiente
)

al mximo de la curva,]

una valot ce x,

expresi6n de

la meda ser :
A

j
e

Moda =

(11)

I
"

donde:
Ll

D.x..:
A.

limite inferior de la clase modal,


I

exceso de la frecuencia modal sobre la frecuenbi

de l~ clase

inmediata inferior.

~A..

%1.'

exceso de la frecuencia modal sobre la frecuenJci

inmediata superior.
e

de la clase

medida del intervalo de la 'clas"emodal.

De un histograma,

puede ubicarse grficamente

la mqda

en la forma

q~e se incica en la figura


Figura N 6

La justificaci6n
QRP Y PST, mediante

.........
r:

se halla analizando
la proporci6n

la semejanza

siguiente

tr:ingulos

Lgica~ente

de la media, y mediana

los valores

Je acuerdo

se desiguales
(la variable
Cuartiles,

para distribuciones

la clase modal ser la de mayor

eon int~rvalos

frecuencia

de la mediana,

la idea o concepto

por unidad de x

segn su magnitud,

puede

el

dividirse

en cuatro partes

iguales

cc!!,.
que

con las letras qI' Q2' q3 y q4 respectivamente.

ql se denomina

q2 segundo

primer cuartil,

q~
... cuarto cuartil este ltimo,

valor numricc

cuartil

o mediana,

lgicamente,

qJ te~

es el mxi~o

de los datos en.estudio.

Otras medidas

de posicin

estn

dados por los deciIes

que co~siste en dividi~ el conjunto de datos en la

segundo

de cla-

y percent~les.

junto de datos ordenados

tivamente

unmodales,

considerada).

Extendiendo

cer cuartil
.

sintricas

coinciden con la noda.

a lo visto, para una distribucin

deciles

designaremos

perfectamente

iguales
:3.eci1,

o bien primer percentil,

etC'1

LoS dec .Les se usan preferentemente

~artes cuantita-

de ese modo se tendr1 el ?rimer decil,

respectivamente,

y 100

y percentiles,

segundo

en trabajos

percentil,

educacionales

etc.

y ps .coLq.>

coso
Es evidente
coincidir~n

que tanto el quinto

decil

como el cincuentavo

percentil

la mediana.

con

Otros oromedios
Existen
continuacin

que los ':la ir..dicadosanteriormente.

otro tipo de promedios

se indican algunos de ellos.

~edia qeomtrica
x la media geom~trica
n

Dado un conjur;to de dates x~ , x21

est

dada por:
x

m r co s
Si los datos m:...
f

f2,

fk

==

'\/

xn

xl' x2'

la media geomtrica
x

(12 )

Xl

x2

_,

lag

<;:" ~

-.;~ ::;-.7"-:.-.~

,
.. -

'.

" ~{_"_'l:.~_

:.

i
~--------=

=~~i

TI

\ ..9 ..1. :~~:"!'::-..~---=-=

cen frecuencias

f'

f
1

,4a: $"

apa~ecen

ser:

lag x

'q

TI

_".

~;

0_'

(l3)

fl.'

.-

-.
....<...;,;.'""'.,i..._,.-,4p.
...... _""',,4..__~~'"~,_,~........_:..:.:,\';
..1"

i
(18~

Se ver ~s adelante

que en distri9ucones

asimtricas

i se] adoE,
I

ta corno variable

&-,. t.L e$

.
simtrica y la media aritmj.ca
ser~ el lag xg
.
se compre~de-' la importanc

taja

Siguen una progresin

rieso, la imposibilidad
n~,ciada

a los valores

n~eri-

. I
TJ.enF la

ge. mtrica o una. ley exponencial.


se

pero a'

ocasionales,

~_~~t.4

e ser de utilidad cuando lo~

sobre la media aritmti.

grandes

~~~~e,'~'~~~~~~~s

de esta transformaci6n.

La media geomtrica pu
COS

el log x ""y en lugar de x la distribuci;n .iendb a ser

menos afectada

'le

la desventaja
~'~
..,.

de

os valores

por
"1

de un c~lc
!i

los valores nulos y una se

o m~s labo-

ibilidad

pr~

aprop ado

Este promedio reJul

peQue1Losde xj'

ve~

en el recuento, de bacterias~'

. que la poblacin

te saltar a un valor muy al - en una,muestra

uede 'facilme~

bacteriana

ocasional,

.1

1 p:tonedio

Es
I

entre dos variabl~s,

lgico ~uando los datos son relaciones

0:::- ejemplo:

x.
(porcentaj es)

es equivalente

El resultado

Yi

j,

ut.a l.Lz amos .

~'.
I

gl/r.

La mad a armnica

es el reciproco

de un c on j unt.o ie datos numricos Xl

de la media aritmtica.de

l.

los valores

los rec~rocos:de
!

dados, es decir.
I
!,

x.a
1

2:

(' 1}

x.

II

j=l
Su uso es excepcional

tasas y precios.

y se adapta en econona

En general

cuand?

t:::-abaja
con

se ado?ta para promediar reiac'ones

x/y,

donde mantenindose

fijo el numerador

varia el dencminadfr.

poriel conI

trario si es el numerador
minador,

se utiliza

Por ejemplo

el que varia manteni~ndose

la media aritmtica.

si 3 mquinas

tasa de produccin

con~t

por unidap

producen

48, 60, y 72

de tiempo fija ser.;

1/3 (48 u/h + 60 u/h + 72 u/h ) :::

180 u/h

.__
....
DAr~

la ~roducc!6n

(~.a. en 12~ un dade s ) y ~~<

mliauinas
'1.mo.

deno -

I
por hora la
I
!

60 u/hora

Si fi~amos
-'

el
I

:05 el

tiempo

v~J.ore'd. 150, 120, ~;-:. O mihutos.~

. '..~_._.-:-::._.:.._.

'.

_
......"'.....;".L ... ,o.

19

respectivamente.
de los 3 tiempos ser

La media

Si este fuera el tiempo medio


sa promedio

de producci6n

ser~

120 u

de producci6n

para

123,33 mino

120 unidades,

la ta

:
u

0,973

123,33 ra n

!!ln

P~ro sin errbargo la respuesta


Este error surge de haber
gura

.~ (150 + 120 + 100)

: t

es de 1 u/mino

correcta

considerado

de la magnitud

la media

que fi

en el denominador.
La soluci6n

correcta

es tomar

la media arm6nica, es decir,


3

xh

120 ~
l50

1
x,

120
120

120
100

'"

1 u/min

Er. geneya 1, las cond i.c..one


s ideales a cumplir por un prorr.edioson:
a) Zstar rigurosa~e~te

defin~do.

b) Ser fcilmente

calculado.

e) Interpretacin

simple.

de todos

d: Dependencia
el No estar

los valores

observados.

indebidarr,ente influenciado

f) Tener una fl~ctuaci6n


(del m.sraotamao

relativamente

por uno o dos valores extremos.


peque~a

ce una muestra a la otra

y de la rt.sraa poblacin)

g) Capaz ce ser tratado matemati9amente.'


Las dos ltimas

condicior-es que son las ms importantes

punto de viste ~ate~~icc estadstico,

sen satisfechas

desde el -

?O~ la media ari~

rntica.
La mediana

cumpLe con los requisitos

ms tpiCO que la media


te extremos.
intervalos

Ademas

pued~

manda"

ser calculada

la condicin

dada su ambigedad

sea grande.

cuando

ocurren

valores

an cuando

..
1:1 promed ,o

excepcio~alne~

la distribucin

sea de

abiertos.

La moda satisface
mediana

aritmtica

b) y c) y resulta

e) pero es menos im~ortante que la -

y tiene poco sentido al menos que la muestra

Se usa un "marke t .nq" para determinar

como as! tambin

el valor: de"nayor

de-

en estadi:sticas SOCiolgicas,

..,..,.,._-..,..,.,.

-- . ., _-.:..',:~.,'.~

"

"w"..~'.

.-

._. ~- - -

._.~-:- -.-.

."_

- I

20 :

I
,

i
En an~lisis

de tamao de partculas

lisis de tamices,
ti:nodales.

se halla

~ediante

frecuentemente

distribuciones

En casos de esta naturaleza,

presentada

una descripcin

gr~fica

representaci6n

de tendencia

clara

S~?ongamos

im dales o mul

un s610 nmero

no es en general

Dispersi6n
Las medidas

rio an

r~pr sent~do

el

de la part1cula

tamao promedio

el mlcrbsc

sUficien~e

de la distribuci6n.

no basta~

de los ~at(

o variabilidad

central

debtl ser -

para pro~or

ona~ una -

de un conjunto de datos o de su dis~ril lci6~.

tene~ 3 conjuntos

de datos como

los que ~ c( ltinuaci6n

se

indican:

(1)
x

x+x

x-x

-1

(2)
-)2
(x-x

(3)
,

- 2
(y-x)

y-x

y-x

t-x

z -cc

._

:6

36

1 -3

;3

O -4

:4

16

10

(z +x )

1
3

; 4

-4

I~

25

20

20

22
II

102

~edia

Rango

10

media

1,2

4 )4

Variancia

1,6

20 ~
14

Des v. ac

16

-1

20

r;

Desviacin

estandar

4;52
i
;

Obviamente la media ar~t~tica


= 4 no describe l~~ c?njuntos en
.a.. ~
A- ~
d...L Ltf.4... l..tY.> t.res ~aA'I.(!aJI.(1c.LD...
[D:n.t..l~""""a.A"'In'
\..J~~~~\C..
forma cabal."O Se necesita por consiguiente alguna med de d la ciispersi6n
,
de l~s datos.
,

t-

Se denomina
mismo

dispersi6n

o variaci6n

se aparta del promedio.

ida en que el

de un dato a lalme

Los par~.etros

m~s: utiliza-

de disper~ie

dos son el rango,


percentil

la desviaci6n

y la desviaci6n

media,

estandar

rango semi-interpuc

til,' rango

(este tltimo el m~s imE rtanite).

__o, _

__ ._--------

-....

...,~L
.:L

10-90

..

21

~:

Es la diferencia

Para datos

agrupados

es igual a la seal

al de la clase menor.
,
,

valos

de clase

diferencia
frontera
Aunque

Si existe

extremos,

entre

extrema

el rango nos proporciona

menos

apreciable

para hallar

superior

de la clase

de la clase mayor

nade datos

U~

corresponde

la :rontera

inferior

y 'el menor de los datos numricos.

entre el mayor

en los inter-

el rango,

de la clase

extrema

la se-

establecer

la

y la

superior

inferior.

alguna

informaci6n

acerca

de la dispersi6n

:I

de los ~atos
tremas,

respecto

lo que puede

del promedio,
ser puramente

de la distribuci6n

de los mismos

respecto

central.

del valor

Adems es muy sensible


muestras

de la misma

::'0 cua l, :0

rango)
control

accidental

unicamente

de los datos ex

y no nos dice nada acerca

entre esos extremos

o su concentraci6n

a las f Luot.uac.ones del muestreo

poblacin

pueden

hace de dificil

de calidad

l depende

tener grandes

diferencias

trata;niento matemtico.
y con muestras

por su sin91icidad

(diferentes
en su

Es usado

en general

en el

no mayo -

res de 5 unidades.
Desviacin

media

de Xl' x2,

D.M.

k
k.

ocurren

~l

D.M..

por:

(15)

j::l
Si Xl' x2' x3

se define

Ix]._ - xl

ea

datos num~ricos
n ,

fj

con frecuencias
_

xj

f~,
f2',
~

- )(

(16) ,

n
~

n =

E5ta ltima
sentan seales

2j:::l

fj

forma es usual para datos


f

de clase y las f.

agrupados

donde

las correspondientes

las x~ repre-

frecuencias

de clase.

Slo ocasionalmente
de las desviacicnes

la desviacin

absolutas

respecto

interesante

es que

media

est de f Ln da en trninos

de la mediana

u otros

?romedios

en

lugar de la media.

"h

Una propiedad

L.
j=l

na.

Su principal

aplicaci6n

estad!stica

\xJ'- A \ es mnim-i si A == media


:

resulta

cuando

apatecen

desvia-

ciones

grandes y errticas,

(que es la medida

ya que en este caso la desviaci6n

de disnersi~

ms usual)

las aumenta

an

e~andar

ms.
,

~"'I',:;r.;."';C'II!"""'_'."'~"$J...tE ------~-~-:-::'.-----..

...

'.

'M

_._--------.-._----_

,.,

'.

..

."

,.

_.

::.~'~~~~'~"

--~;

~,~."~,,".r"~~~',~"''''

. ._----

'""":i~L.-fl"-=-~--:
....
-, .,.~.~,::~~;
't.J
----, _ ..

..

-_ -

>

' .. _

.. ""....

j,;':~:~~

_--_: '--

~-----~-"-'-'--'-'-

Otros par~metros de desviacin,


go semi-intercuartil

expresado por

en general poco
Cl] - ql
q =
2

rango percentil 10-90 cuya ex!_)resines p

y el

P90 - flO
,

La Desviaci6n estandar
Xl' x2 ..

(as denominada

por Pearson) de un e njunto de datos


1
i

,xn est expresada por

j=l

2
( x. - -)
X
J
(17 ),
i

n
:,

por lo tanto s es la raz cuadr.tica media de las di svlaciorlles


resoecto de la media.
Para datos agrupados ser:
t
J

f.
s

_) 2

(x . - x
J

18 )

A veces, para los datos de una muest~a,

con (n - 1)

ser deftni

en lugar de n en el denominador,

una mejor e s t rr.acn de la desviacin

a causa de que el reSUltad

de 1a poblacin

reo:rl"esenta
-

de la que se ha to

mado la muest::ca.
Para valores grandes de n (n ~30)

no hay practicarnent 1 diferencia

tre las dos definiciones.

'.~

Cuando sea necesaria una mejor apreciaci6n


la multiplicando

e!!

se podrisi rpr.e:obteneE_

la ~ computada de acuerdo a la primera def hicin por el

factor

.,/_c__n
V

n - 1
;

Este aspecto se aclara al estudiar


esta raz6n muchos autores

la teora de la est tnaci6n.


I

Por

~. :, la(en-::re e2.105 Fisl.er) han p ropue.aco ~


re~~n~r
I

desviaci6n estandar con n-l en el denominador

aunc;:ueen re ~idad podra-

mas decir que no es la desviacin estnda'r de la muestra~ s


i

mejor estimaci6n de la desviacin estndar de la POblaci~n


finitiva lo que interesa conocer.

'
f

qie

es una

e~ en de-

Variancia
Est~ dada por s

(cuadrado de la desviacin

~ resulta en

estandar),

muchos aspectoa mas importante que s.


Cuando sea necesario distinguir

la desviaci6n

estandar

de una pobl~

ci6n de la de una muestra extrada de ella, se usar~ a menud~ ~ para la


muestra y
muestra,

cr para
?

yO--

la ?oblaci6n.

Por lo tanto ser s

la variancia

de la

la variancia de la nob Lac.n,

Las cantidades,

x)

(x.. J

son engaosas y si no se cons e.rvan con mu-

chas cifras puede introducirse

un error apreciable

en el resbltado.

esa raz6n existen mtodos abrlviados para el clculo de la d~sviaci6n

Por
es-

tandar con el objeto de salvar y si:nplificar las d .f cu Lt.ades que se pr~

sentan.
Las ecuaciones

(19)y (20)pueden escribirse:

y'ft
,n

x~

1).

2'

2-;",1

x.

.,.'-j

(t

x.

2..

._ 2

s.

(x~- x l

(x

~x~<-

xx-1 +n;t;-2

x;

s: x2
=
n

x.

:J

(201

x:x
el

se

tendr que

2,

X'j

..,

,2

(por definici6n)

f'

"--

( 19)

ix

Lx'
~
n

+1

-2
X

:=

!
2 -2
x + -2
x

LX2
=---

(i) 2

Po

Por lo tanto;
s ~x2

(xl2

t
----~_.-

,-,.

---

----

24
,..::

Propiedades

de la desviaci6n

estndar

Grfico A

1.- La desviaci6n

est~ndar

podra haber sido defi

1 (xj - a)

s:

n
donde a es un promedio

cualquiera.

De todas las

ticas la roinima es aquella para la cual a

la propie-

x en

dad ya demostrada.

(ver P'iqura

a~roxir;adamente no rrnaLe s , surje

2- Para distribuciones
7 ,

(a) 68% de las observac;'ones estn incluidas

s y

;><.

+ s.

(:o)

95% de las ob servacior.es estr:.includas

(e)

99,7%

I
-1

entre x -

es t n ir,clu.ic.as
entre x

de las observaciones

Para distribuciones ~oderadamente 3simtricas

s y

1
x +

2s

3s y x + 3s.
pue-

los p

den tomarse corno aproximadcs.


Para las muestras

superiores

a los 200 elementos


:(cor.oci-

rango o';" 6 S lo cual puede servir para es t .mar grose


do el rango de la muestra)
3.- Si se toman 2 cor.jur.tosde atas que cons+ an de nl
tivamente

(6 dos distribuciones

tengan va r anc .as dadas

por

512

cia cornb .anda de ambos conjuntes

ce

frecuencias
522

y
(J

totales

Y la rr.isma media

d..s t r ouc cnes

datos res?e~

n2''

aue
~

, la varianpo:- la ex

?resin.
(2l}

t_
( es en realidad una media aritmtica
4.- Si los dos conjuntos

ponderada

dados anteriormente

tienen me

+
000

dnnc'tpoox

$><:

lA m.,.diA

ti",,]

or1'ln-iunot-o

d~

de las
i

datosln

25

,-v ,

la variancia total puede ser descompuesta en 2 partes

s la media'

una

ponderada de las variancias de los subconjuntos y la otra es la variancia


~e sus medias.

Esta propiedad es de gran importancia en el

nlisis de

la variancia y es posible generalizarla a ms de 2 conjuntos.


Cor~ecci6n de Sheppard
Si bien en el c~lculo de la media para datos agrupados, el error de
agrupamiento no introduce un error apreciable, no sucede lo

ismo cuando

se trat'adel clculo de la desviaci6n es t.ndaz y ms se man iesta cuanto


ms'grosero es el agrupamiento efectuado.
Para visualizar este concepto, estudiemos el siguiente

jemp10 sen-

cilla:
(A) x

fIlO

3 ,4 5

20 30 30 20 10

Datos no ag:::-;:pados
(B) x

t 6Q

datos

agrupados

60

Se verifica =cilmente que

Z f' x

es'420 en ambos casos~

to el clculo de x no sufre ~odificacin.


~
12
Sin embargo, ~
fx crece de 1700 en el caso
(B), lo que hace que la variancia s
Para neutralar

fA)

a 174

en el caso

vare de 1,92 a 2,25.

este efecto se aplica la correccin d~ Shepparc

cuya expresin es la siguiente.

1
I

ve

(23)

por lo tan

donde:
variancia corregida.
variancia de los datos agrupados.
medida del intervalo de la clase.
La misma es utilizada para distribuciones de variables continuas
donde los extremos tienden gradualmente a cero en ambas dir cciones.
LOS

estadfsgrafcs discrepan acerca de cuando y si la c rrecci6n debe

efectuarse, argumentando algunos de e11,05el peligro de ree plazar los


errores existentes por otros nuevos que surjan de aplicar 1
Es evidente que en todos.los casos, antes de aplicarla hay
estudio de la distribucin.

""-"',~':":""---"""-:"--' -

_.~._.._-

---'

.._

-..._

~.-----~
...~ ...,.',..-

correccin.
ue hacer un

Para muestras pequeas, en gen ral el error

M .:-'_

~.

__

__

~,

.....

Dispersin

la

absoluta

magnitud

lo de la media

y relativa

de los datos

sino tambin

registrados

en el clculo

en el clcu

no slo

lo que

de las desvi~ci
i,

stos parecen

l~ descripto
luta.

depender

en alguna manera

de la desviacin

Es de hacer notar

sin embarso,

referida

!y el

es ex~resado

sea

la media

~l

Absoluta

Promedio
en porcentaje.

X,

I
sea la

absoluta

el coeficiente

de~.VtCin, es~ndar

anterior

denpmina!

y se exoresar. oar:

cceficie:1te de variacin

coefi-

dado Dor:

caso que la d .spez s In

promedio

que

em.

de 200

Dispersin

E::1el

e 10~cm respe~

se logra dar m~d'

=
y que CODunmente

abso-

que una dispersi~n

a un ~romedio

relativa

clcu

es una medida

Es por ello que esta apreciacin


ciente de dispersin

de

es diferente en su

de 1000 cm

to de un valor promedio
la misma desviacin

estndar

del valor

s
x

muy ti~

es un nmero

coeficiente

j)iC:lO

en la comparaci6n

y po

adimensional,

de distribuciones

donde

esta. raz6n es

las u, dades de me-

dida sean diferentes.


Momentos

_.__ .~-_._

-------

Como ya se ha expresado
rales de la estadstica
E:1 palabras

anteriormente

es sintetizar

de R. A. Fisne=

uno de los ,lcble~as

y caracterizar

"una cantidad

de datos

dat

que .po

gene-

mer a expr~

sin puede

ser Lncapaz

da por un conjunto

de ser retenida

en la mente,

debe ker :::-;eemplaza_

relativamente

pequer,o de nmeros que

~ de 'corrt.e ne r
!

tanto

como sea posi~le

vante contenida

(idealmente

la totalidad)

de la i

en los datos originales".

Entre estos

Como se ver luego,

dos principalmente
,la definici6n
tica que 9uede

de

los momentos

para caracterizar

figuran

cabe agregar

ser desc=ipta

enteramente

que la distribucin

de

ce mayor

poblaciones

poblacin,

ormac~on

rele

"nl1mercs representativos"

los -

dre
-,
I

momentos.

drd

so~ utilizaA

ms ~ue

la pOblaCi~nlpu
en forma matero

entje hipot

f6r,mufa matemtica.
Cuandp

se realiza

reemp[aza

un ajuste

la distribuci6n

terico

emp!rica

de un conjunto
a los efectos

de datos

e perimentales,

se

or discusin

de una ulter

por una distrib1..:ci6n


descripta matemticamente, que parece te.er 5imilares
Si el ajuste es satisfactorio (cosa que se

caractersticas.

uede juzgar m~

diante una prueba de significancia estadstica) ,entonces esta emos en condiciones de considerar la muest:::a
observada como proveniente de una poblaci6n
que tiene las caractersticas de :'adistribucinIf,atemtica.
Ir.
'.,.
En los m~todos mas comunes de curvas de ajuste, 1 s momentos ju~
gan un papel importante.
.x

datos numricos as~~idos, p r una variable

x , se denomina monento erresimo (con origen cero) a la expres 6n:


...,-

...
x-

''-'.

Xl

+ x2

;:

1, xr es la media aritmtica

Para r

El mo:nentode orden r con zespec t.o a la media

x,

T
1

-x er

importancia en la teora estadstica, y est definido por:

(25)

el de mayor

(26)
n
Si r

== 2

ml

m2

variancia.

Momentos para datos agrupados

...

Si Xl' x2'
t

f l' fZ"

cen con :
_recuenc~a5

quedar. expresados

por:

-xr

"f

=.c::.

xk (seales de las respectivas clases) apare-

.
;

. fk, los momentos dados por

x,
J

~as

f6rmulas

::

- r
x)

(28)

n
donde

.~H ,IIII' P"'..!!I!.X"',~I.

,'u"..,.,,, ~, ------,

,..~ -:

_. __ ._.

-,

- .. ~..:. .:_

;.-;- .... ~ .._._-:'._

_._._~~ '. r.._.,._.~-::.:--::-

1~n--"":

;:.J)j;; (

~K

:"_~<rIo.:I:..._. ,.~oiWo:

~.~,_:

......

__ -.;..
'

",.

._

---...."~-_.:.::.:.:.~__:_'.:.~.:_---_

--_ ..__ ..-

..

.-._._---_

_------

I . .

Sin embargo, si se quieren eS~irnar momentos

p4ra

medialnte los correspondientes

de una muestr, corresponde ca


I

ficados mediante la correspondiente

estimativa.

a pablaci6n
modi

1,
1

10S

Recordemos que una estadstica es un nmero


.;i
observaciones de una muestra y ~tilizado para estimar

ado :de las


!

de lapoblacin respectiva.
y son constantes

Es~as caractersticas

desconocidas

metr~

la distribuci6n,

distribucin

P1rmetros,

que aparecen en la ecuaci6ne

cuenqia que se presume represe~a


i

se

de fre

pero q~e

de una

Los momentos de una

del mismo tipo a otra.

que aparecen en las ecuaciones

son par,-

de varias curvas

ia cornun-

mente, usadas.
Los correspondientes

momentos ~ara las muestras

ciones de los momentos de la poblacin

'.._,

pero se

no son grandes, se obtienen mejores aproximaciones

estadsti-

ca que a continuacin se indica:


A

,A

cr2

n s2/n1

(n-2).
(n-2)

Ellos son

(Tl-3)

Se los
sin desvo, ya que si por ejem~lo

defirie como estimadores

ellos, dig~

.A

mos?:),

fue

ra calculado para

gran nmero de muestras

un

A.

momentos
~3'

conocidos, la media de todos los valores de~3

parmetro

es decir el parmetro momento de 3er orden para la


Para

haciendo

ti

suficiente~ente

tender n, aoO)

grande

frmulas

(como se

no tienen mayor incidencia

anterio:::

A las efectos de medir ciertas caracterstica~


ciones de frecuencias interesa expresar
mediante

los momentos en

a ==
r

adne ns ional,
i

la siguiente expresin.
m

las' d .s t r Lbu

r
::

(29)

~
i aZ = 1

Por ejemplo: al '"' O

(ya que ml
la ~ist=ibuci6n

O; m2

en estudio ?Or lo que dichos momentos

para Icarac~erizarlas.
/

) y esto sucede inde~en~~E!nt~ente de


utilidad

Lo s momen tos adirr.ensionales


de la variable

de cons .derar

surgen

estandarizada

z ",. x - x

, es decir

zr

L (x-x)r

,=

Asimetra
La magnitud

. l.

sional

ere;

3er

hacia

. (JO)

= 111ffi:l") 3

'r'2'

estimar e~3

de la poblaci6n.

Para distribuciones

perfectamente

simtricas,

nc rma.l, a3 es nulo.

_" tribucin

Si la asimetra es hacia la derecha,


menor que cero si la asimetra es hacia

CURTOSIS

a_ ser~ may
.5

(Palabra de origen griego que significa

-2~ 43,,:,;2.

"giba" o "j rcba").

la magnitud' cuso.de L de una distribuci6n

Analiza
mente, a la distribuci6n

normal.

que ceLo y

la izquierda.

Para la mayoria de las distribu.ciones

el

1
d~ frecuencias

de una distribuci6~

orden.
a3

que pretender~

asirr~tra

~ ;
la derecha o hacia la izquie~dat puede ser m~
,
formas, siendo una de ellas, precisamente ( ~l rome!1to adimen

(ya sea fsta asimAtrica


dida ~e v~ria5

de la

referida

Una ::'.,,,diaa de la misma se

btier.e

usual

med .ant;e

momento cu r t .co aclimensional.

=
que para la distribuci6n
de curtosis

se define

. (31)

normal es? 4 = 3.

Por dicha zaz n

1 coeficiente

a veces por:

(32~
Ejemnlc Nl
De la ~abla

I de distribuci6n

de frec~encias

Duece

calcclarse

las

siguientes estad1sticas ~ara dates agru~ados


a) media ari tmtica

(a~Hcando

- :' 5 x 75

la

f6rmula - (5) )

+ 18 X 225 + 29 x 375 + ..

4~1.
+ 2 S25 ~

horas

x = ----------~--~~~--~--~~~----~~~------~
27

"

~:t.
u.'!.

. __ ..

1
.................. _ ....--_._---

_---_

._

.._ ...... _._--_ .._- ..._~-..... '--_."

_--

,
I

b) !1.ediana (a:licando la f6rmula

300 +

I,

1/2 - 0,2645
0,3333

150

1~.

300 +

40~:
4.6() !llars

150

(11)

e) ~oda (aplicando la f6rmul"


x

(10)

e, 397 horas

11 + 6
i

(aplicando la f6rmula :(l8) )

d) DesV'!o standard

.s

l:4'i,Wl-:

---------------------------------------+--~------~

'.

el

(75

nt65
+ .. + ;2.(

+ 18 (22587

'

de' vari.aci6n (aplicando f rmu La (24)

Coeficiente

-1.:.I,b5

..lci +;::40
v
"
X

WA

'-Hf2

f) coeficiente

de asimetrfa
\fti,2.

5(7S-~)

(~plicando f6rmulas
~~~Il.3

+ lB

(225-~)

37

+ ..

(28) y (30)
'111,
+ 2. (825~

(l~:3

H'f"S
Esdecir, que la distribuci6n

hacia

~resente una moderada

la derecha.
;

g}

Coefi.cient.~de

cu r t.os s

411,2
5(7S-l:::I:l4
.__

(aplicando frmulas

87

Observar

nlJ65

,
aproxirnadanente nqrm

de as!metrfa y curtosis'va

adems gue la ~edia, la ~cda

h a l Lan r a La t .v araerrt e pr x raa s .

(minutos)

que ordenadas

~/~~u;::,
I mediana

bterrneo para
se ~ealizado

en 6rden ascendente res~lt ron er:


!

17; 18,5 . 19,8. 20; 21 25; 27

Cu~l ser~ la mediana?


Respuesta

x .. x ( n/2

+ 1)

20

se

Ejemplo 2: sear. los siguientes I los tiempos <:ue insume un


j
tr~sladarse entre dos terminales en las horas pico, hab~n
7 determinaciones

2 (825-

2,~
(174,4&)

puede considera~se

~sta Glti~a los coeficientes


pectivamente.

y (31)

,41/,
+ +

+ 13

'

na distribuci6n

(28)

mino

!;
!

Datos

observados

de a Dares
'

Si se dispone de muestras
a dos, variables

aleatorias

apareadas

X e Y se dis90ndr

en ~uchos

Interesa
nida, si

existe

:,

casos

de n pares de v lores de ter

Yl)'

emp1ricarnente, es dec'::'r
: (xl'

minados

en un ex~eriI1i.en
o-asociado

(x2', Y2)

investigar,

alguna correlacin

entre las

a travs

la correlacin

cartesiano

sobre

en ~s

a indag,r

n prlmera ins

En este easQ los pares ubie dos en sistema

lineal.

pueden orientar

obte

variables

La ms elemental y ms comn correla~i6n

tanciies

la bondad

de dicha

correl~ei
I

Este grfico

se lo suele

denominar

Una cuantifica~i6n
da por la cova=ianza
'~

de la muestra

s x,

numrica

definida

n
",0-/,. ~L-

diagrama

z's

i6n.

dencia

de

est da "

oor

(x .. -

(33)

x ) (y i - y)

:.i = 1
Es comn normalizar

la covarianza

Sx y sv'

viaciones

stndards

rrelacic

de la muestra

El resultado

rae . ante las des

de' la muestra
es denominado

eFe iciente de co-

y est dado por

rx,

Sx' '"

--"_.1

Puede de~ostrarse

{3 4)

~ue el rango de variacin

intervalo

puntos

en

el diag=&ma de disre=si6n

recta,

ste es, s610 si

de ~x'

est limi~ado

al

/1

-1;

1]

Y que los valores

extremos

son obtenidos.

5'

se ubican :perfectawente

y solo

si los

una linea

'~,

Yi

a ~ b Xi

El signo de rx,y denende slo del signo de b.


que los factores

estn

correlacionados

se dice

E~

L ne aLment.e y pe=fect

que las x y la y no estan cox,y = O, se dice


.'
;
(nc quiere decir sto que no se ha len ccrrelacio-

Por otro lado, si ~


rrelacionadas
nadas bajo

linealmente

otra ley r;atemtica)


En definitiva,

la bondad

tficada

conforme

al valor

se podr

decir que existe

asumido

de esta correlaci6n
Dar

"

rx,y

~~a correlacin

linea

Por otro ejempl


pobre positiva isi

i
indicar

la existencia

de Q~a buena

anlisis

de correlacin

y regresin

lo de' la estadstica,

correlaci6n

ser cuan

si ...

x,y

r.
, x,y, ,=

es Unim p~tante

a<,!usolamente

I el
I

~lClho
I
!

0,26

-0,92

lineal negat ~a,


etc.
;

entre variables

hab"'indose explicado

podr

se

El
capt~
de la

I!

----,-,,--

(5tl.:,.

\....J-- ..
medida de la correlacin

lineal, sin entrar a considerar

te6ripos que escapan al

objetivo de este captulo.

Ejemolo: Sup6ngase

se quiere cuantificar

la correlaci6n

unda4tentos

lire

exi~tente en-

tre dos Darrnetros (por ejemplo sulf~tos y elOrurps)

6x

acci6n de agua

e~t

dadas en mili

de la composici6n qumica del agua de un pozo de


subterrnea

ind~cadores

en cierta zona (las concentraciones


i
~

gramos por litro)


!
"

10

11

.!

Cl (:ng/l

71 68 66 67 70 73 72 65 66

71

70

C2 (mg/ll

69 64 65 63 65 64 66 59 62

62

65

Para el clculo cel coeficiente

de correlacin

I!

se dispone

i
I

\_, n = 11

xl~ 59

x2= 64

.. 3,545

S x,y

(aplicando frmula

2,593

(a~lica!1dc

Por lo tanto at:'llicando


la frmula
r =

s x,y

3,545

sx

(2,593)

S
y

de dispersi6n

7;;

(3~) se tiene qu~


0,558
(.2,449)

En la figura N8 al, b) f el, dl, el j


SaO de diagramas

J..orrr:u .....
a

;<17)
(a?licando f6:-mu::'a

'" 2,449

.f'~

r 33)

fl

I
!

se indica

con el correspondiente

I diferentes

ca

coefic rnte :de ccrrela

ci6n lineal.
E~ERCICOS PROPUESTOS

PROBLE.MA Nl
La resistividad del suelo es utilizada en estudios de corros ~n de: caT\eras
enterradas. Por ejemplo una resistividad de O
400 ohms/dm
fores;enta
con.'I
diciones de corrosin extremada:nente severas, de 400 a 900 ro
severas,_ de
900 a 1500 severas, de 1500 a 3000 moderadas; de 3000 a 8000 s uavea y de
8000 a 20000 levemente riesgosas. En vistas a una construcci , prQyectada

se ha hecho 32 mediciones

de acuerdo al siguiente detalle:

!
I
"
.._..

~ .--_ ..,.....
...........
,~."_

_. _ .. 1. .

..

......;.".l;:;i,.~k';';,

;i"

.~

FIGVRl\

:O~~...l....---._'...L.-_._

B.r

0.986

J
b)

al

X2

c.~ ""0.597

10

_----;

O I---

-__._.-.--___---

__

E.r

0.368

= -

10

t.

~}t1It~ .azl!ll!,
"."

-::.; ..::_.:...;.-..
,!J!Ij~:!!!I!~!!I'!".IJ."""""".J'!I""'_'''''--__''"'-~'''''';:

e)

Xl

d)

~Jj
.-

20

10

e)

X2

~x

I
I

:::.

"c

. ,. e

-~

-~

t;~~:
".':.:
i '. :ir]

~.._~~:'5j~~

,.

17

%0

,13

l610

'.) O

19

1,

lllO

h,~o

II :10

'1

1'):'!)

70

5W

') 1

':,
6

11'70

22.

5nO

23

hao

2300

2~

~550

1240

25

7500

10
,

810

26

:2300

,1

910

27

1240

12

840

28

~O60

13
14 '

1340

29

18BO

lHO

30

6550

15

1370

3i

i i ao

16

:!.260

3?.

1760

.L~

1))0

r;

1340

I
-

te.

Cons.truir

cin

:hi_~'tograma utilizando

las

..cons't.zu.r ' un 901ig'oilo-de .fr~cuen~ias

l~'

la media,

la mediana

c;las ific~-_ .

enu"_c.~ad~sl. como in tervalos.

Calcular

i _
! de

banda

I
:..

-.

."

acumu.La
f orrnu

y la 1:100a Il_led

pa.iil dz t.o s 3g1"'Upaaos.

.1

!,
j ..

'En.operaciones

de construccin ..pesada los

los

vehiculos

causan at~ascs

las

muestras,

las desviaciones

para

caca Una' de las

Cuales _etapas
~a~iaci6n
Existe

s .q u en t es etao2S

y los

del ciclo

,5'::1 ms v a r ab Les ?
indicador

que otras?

rnfis r~pidas
Compara~

stndards

total.

Hallai

coeficiente

COm!,)inacicnescon~uc
1
existe

si

.st~Card

cesviacin

oe

la

alguna correlac

su~a con

ldem para el coeficient~ ce variaci6n .

..

r-

- .'

I ce

de que algunas
(estudiar

~.

medias'

~.'"""":""""._

-.

.......

de

variaci6n

y pa.ra .el f.iem~o total..

ce" t.ransport e :r el tiempo ce retorno).


la

que curnoLen

Ct::ales con t r .buyen ms s ~iarnen't~

del tiemDo total?

algn

e~ tiempo

tiempos deLcicl

e~ el ~rocesc

~ la

.
r/v~hlculo

6n.l~neal

sean
entre

l~s

I
I

13S de

<:lf'

CIT.?onentes.

...

t!

.:

,-

Espera

,-

Carga

II

::1.etofno Total
6,67

0,46

2'F5

1,72

2,08
1,95

0,53

2/~5

6,65

0,00

2,52

2,18

O,~O

3,13

8,23

0,51

1,84

2,08

0,53,

2 , I53

7,49

1,02

1,47

2,15

'0,61

2,~4

8;,06

0,00

1,71

2,20

0,63

2 ,~2

7:,06

1,71

1,80

2,17

0,49

2,;51

8,68

2,35

1,67

2,25

0,64

2,146

9" 37

1,12

2,38

1,99

0,69

2'152

8;,70

0,50

2,06

2,07

0,41

7.,48

1,29

1,92

2,lB

0,54

2,\44
2,36

0,00

2,03

2,17

0,59

2,,69

7,48

.0,83

1,85

1,96

0,60

2,i52

7.,76

0,46

2,23

2,16

0,55

2,:47

7,87

1,05

1,94

1,9 9

0,57

2,A9

8,04

0,77

2,00

2,13

0,60

2~68

8,18

e,oo

1,88

2,03

0,80

2,35

7,06

1,32

1,93

1,99

0,50

2,36

8,10

0,00

1,58

0,00

!~

....,..

'.l.'ransporte Descarga

8,29

PROLE!-1A N 3
Los t.iempos

material

EaIlar

'o .'":~~_____"-'-_"-_"

del cicle

fueron 105 siguientes:

total de

.-------

30

la

17

24

20

20

16

24

25

19

24

28

23

23

17

la

23
11

y el coeficie::.:'e

-.--_ ... -

carr.Lone s de t.r ans oo te

de c e r t o

(en minutos)

la media de la mues t r a , su desve

asimetra

',* ..
~
.. .

observados

l8
s~:1da!:"d, el coe f i.c

:1::e o.e

d.3 cu rt os i.s .

' .

You might also like