You are on page 1of 37

El campo de la estadstica tiene que ver con la recopilacin, presentacin, anlisis y uso de

datos para tomar decisiones y resolver problemas.


La estadstica surge como herramienta en la ingeniera, la ciencia y la administracin,
porque en casi todos los procesos y sistemas de la vida real existe variabilidad; la
variabilidad es el resultado de cambios en las condiciones bajo las que se hacen las
observaciones.
El aspecto ms importante de la estadstica es la obtencin de conclusiones basadas en los
datos experimentales.

Para su estudio la estadstica se divide en dos grandes ramas:


a) Estadstica Descriptiva.
b) Estadstica Inferencial.
1.2.1 ESTADSTICA DESCRIPTIVA
Tiene como finalidad colocar en evidencia aspectos caractersticos de un proceso o
experimento para efectuar comparaciones sin pretender sacar conclusiones de tipo general.
Esta descripcin se realiza a travs de la recopilacin, ordenamiento, clasificacin,
elaboracin de cuadros, grficas, clculos de promedios, variabilidades, etc.

1.2.2 ESTADSTICA INFERENCIAL


Busca dar explicaciones al comportamiento de un conjunto de observaciones, probar la
significacin o validez de los resultados; intenta descubrir las causas que originan este
comportamiento.
La estadstica inferencial proporciona mtodos para estimar caractersticas de un grupo
total (poblacin o universo), basndose en datos de un conjunto pequeo (muestra) de
observaciones.

35

Entidad: Cada uno de los elementos de un grupo o conjunto que se va


someter a estudio
estadstico.
Muestra: Una parte de la poblacin.
Variable: Alguna caracterstica de la entidad que interesa al investigador.
Variable Aleatoria: Una variable es aleatoria cuando su valor no se puede
predecir con
anticipacin.
Las variables aleatorias pueden ser de tipo cuantitativo o de tipo cualitativo.
Variable Cuantitativa: Es aquella cuyo valor puede expresarse en forma
numrica.
Variable Cualitativa:
categora de la entidad.

Es aquella cuyo valor expresa una cualidad

La poblacin o universo es el conjunto de valores de alguna variable aleatoria


relacionada con un conjunto de entidades.

Por ejemplo, se puede hablar de una poblacin de pesos, una poblacin o universo de
densidades, entre otras cosas. Entonces, podemos definir poblacin como el conjunto ms
grande de valores (de una variable), por el cual existe algn inters.
Esta definicin indica que las poblaciones son definidas por el investigador y no estn
predeterminadas.
Las poblaciones o universos pueden ser finitos o infinitos. En el campo de la ingeniera
y ciencias generales las poblaciones son casi siempre infinitas.
En los estudios estadsticos el tamao completo de la poblacin aun siendo finita (N)
generalmente no se estudia o investiga en su totalidad. Puede ser conveniente o necesario
examinar solo una fraccin (muestra) de la poblacin.

35

Para la realizacin de un estudio estadstico se deben seguir ciertas etapas entre las cuales
las ms importantes son:
1)
2)
3)
4)
5)
6)
7)
8)

Planteamiento o formulacin del problema.


Formulacin de objetivos.
Definicin de la entidad a estudiar o investigar.
Formulacin de hiptesis.
Mtodo de investigacin (total o parcial).
Recoleccin de datos.
Generalizacin e inferencia final.
Presentacin del informe y publicacin.

Al definir la entidad en la etapa 3 se debe tener en cuenta:


a) Seleccionar las variables a medir (cualitativa o cuantitativa) y definirlas
correctamente.
b) Si la variable es cuantitativa continua, establecer el tipo de aproximacin
(redondeo).
c) En la etapa 5 si la investigacin es parcial establecer el tamao de la muestra.

Esquematicemos la etapa 3 con sus variables:

Variables:
X= peso es gramos.(variable cuantitativa)
Entidad: producto
terminado

Y = densidad (g/cm3 , variable cuantitativa)


Z= color. (variable cualitativa o categrica)

35

Las variables son el conjunto de las caractersticas de las entidades de inters en una
investigacin estadstica.

Los valores que puede tomar una variable en estadstica no se pueden predecir antes de
realizar el experimento estadstico, por lo tanto ese valor es aleatorio (al azar).
Las caractersticas que se pueden medir a una entidad son de dos tipos, cuantitativo o
cualitativo (categrico); cada caracterstica es una variable aleatoria, las cuales se
subdividen de la misma manera:

Variable
cuantitativa

Continua.

Discreta.

Variable Aleatoria

Variable cualitativa o categrica.

2.1 VARIABLE CUANTITATIVA


Se dice que una variable es cuantitativa siempre que los valores que puede asumir son el
resultado de medidas numricas.
Algunos ejemplos de variables cuantitativas son la densidad, el peso, la temperatura, la
viscosidad, entre otras.
2.1.1 VARIABLE CONTINUA
Una variable continua es aquella que tericamente puede tomar cualquier valor dentro
de un intervalo de valores, es decir, una variable continua se mide uniformemente. Por
ejemplo, si la variable peso en gramos la definimos como X, esta puede estar en el
intervalo 50g X 70g; es decir, puede tomar un continuo de valores entre 50 y 70
gramos.

35

2.1.2 VARIABLE DISCRETA


Cuando los valores numricos que puede tomar una variable son nmeros enteros, la
variable se denomina discreta. Por ejemplo, si la variable Y es la edad cumplida en
aos de una persona, esta solo puede tomar los valores 1, 2, 3,.,100.

2.2 VARIABLE CUALITATIVA O CATEGORICA


Hay muchos casos en el que no es posible hacer medidas numricas, por ejemplo, la
variable color puede recibir los valores cualitativos de rojo, verde, amarillo, etc. Una
variable cuyos valores consisten en categoras de clasificacin se denomina variable
cualitativa.

35

Redondear una medida numrica es aproximarla.


Un dato numrico es una secuencia de nmeros:
Siempre que se registren, en este texto, resultados finales o intermedios se tendrn las
siguientes reglas:
a) Establecer en nmero de dgitos que se van a retener :
..a b c d e f / g h..
b)
Si f es el ltimo digito a retener este puede ser par o impar y g el digito a la
derecha de este l puede ser mayor que 5, igual o menor que 5.
g

>5

=5

<5

f+1

f+1

f+1

Par
Impar

Esquematizando:

175,78
175,78

4
17 5,786 175,79

Una distribucin de frecuencia o tabla de frecuencia es una ordenacin y agrupacin de


una lista de datos dispuestos de tal forma que permita visualizar la informacin ms
reducida y clara.

35

Una distribucin de frecuencia o tabla de frecuencia es una disposicin tabular de datos; los
datos se distribuyen por clases o categoras con sus correspondientes frecuencias. Para
construir una distribucin de frecuencias, primero se divide el rango de los datos en clases;
si es posible, las clases deben tener el mismo ancho con la finalidad de mejorar la
informacin visual en la distribucin de frecuencias. Para la seleccin del nmero de clases
debe emplearse cierto criterio de modo que pueda desarrollarse un diagrama razonable. El
nmero de clases depende del nmero de observaciones y de la dispersin de los datos. En
general, una distribucin de frecuencias que emplea muy pocas o demasiadas clases no
contiene mucha informacin, por lo general el nmero de clases debe fluctuar entre 5 y 20
clases.
El nmero de clases se puede obtener mediante cualquiera de las dos frmulas siguientes:
M =1+3.322 log 10 n
M = n
n=Tama o de la muestra
M =N mero de clases

El smbolo que define una clase se llama intervalo de clase, los nmeros extremos de este
intervalo se llaman lmite inferior de clase y lmite superior de clase.
LICi = lmite inferior de la clase i
LICi

LSCi

LSCi = lmite superior de la clase i

El lmite inferior de la primera clase debe ser menor o igual que el dato menor
(LIC 1 X min ) y el lmite superior de la ltima debe cumplir la condicin LSC n X max .
El lmite superior de la primera clase se calcular con la siguiente frmula:
LSC 1=LIC 1 +(C Aprox)
LSC 1=L mite superior de la primera clase

35

LIC 1=L mite inferior de la primera clase


Aprox = Aproximaci n de los datos
Para calcular la marca de clase de cada intervalo de datos se implementa la siguiente
frmula:
LIC i + LSC i
Marca de clase=
2
La marca de clase es el punto medio de la clase, los datos que se encasillan en una clase
determinada, para efectos prcticos miden su marca de clase.

Los pasos para elaborar cuadros o tablas de frecuencia son:


1) Toma de datos
2) Encontrar el dato mayor y el menor con el fin de determinar el rango donde fluctan
los datos (cuando la variable es cuantitativa)
R= X max X min
X max =dato mayor
X min =dato menor
3) Establecer el nmero aproximado de categoras o clases (M) que tendr la
distribucin de frecuencias
R
C=
4) Encontrar el tamao de la clase.
M
5) Construir una tabla de conteo de forma siguiente:
LIC 1 X min
a) El lmite inferior de la primera clase ser
b) El lmite superior de la primera clase ser:

LSC 1=LIC 1 +(C Aprox)

6) Los limites inferiores y superiores de las clases subsiguientes se obtienen sumando


C al lmite inferior o superior de la clase anterior.
LIC 2=LIC 1+C , LIC 3=LIC 2 +C , , LIC n=LIC n1+ C
LSC 2=LSC 1+ C , LSC3=LSC 2 +C , , LSC n=LSC n1+ C

35

7) Debe cumplirse que

LSC n X max

, con el fin de que ningn dato se quede fuera de

tabulacin.
8) Encasillar los datos examinando cada uno de ellos con el fin de conocer en que
categora debe colocarse.
EJEMPLO
Desarrollar una tabla de conteo para el anlisis de la resistencia a la tensin, en
libras por pulgada cuadrada (psi), de una muestra de tamao 80 (n=80) de una
nueva aleacin de aluminio y litio, que est siendo evaluada como posible material
para la fabricacin de elementos estructurados de aeronaves.
Resistencia a la tensin (psi) de una aleacin aluminio-litio
105
97
245
163
207
134
218
199
160
196

221
154
228
131
180
178
157
151
175
201

183
153
174
154
190
76
101
142
149
200

186
174
199
115
193
167
171
163
87
176

121
120
181
160
194
184
165
145
160
150

181
168
158
208
133
135
172
171
137
170

180
167
176
158
156
229
158
148
150
118

143
141
110
133
123
146
169
158
135
149

Tabla 1.1

Siguiendo con las reglas para elaborar distribuciones de frecuencia:


1) Toma de datos
2) Encontrar el dato mayor y el dato menor con el fin de determinar el Rango; para
responder a esta regla buscamos el mayor y menor por fila de la tabla 1.2
Fila
1
2
3
4
5
6
7
8
9
10

Mayor
221
174
245
208
207
229
218
199
237
201

Menor
105
97
110
115
123
76
101
142
87
118

35

245

76

Tabla 1.2

Despus se busca el mayor dato de los mayores datos por fila y este ser el mayor
dato (245); igual se hace con el menor (76).
X max =245
X min =76
Posteriormente se determina el Rango
R= X max X min =24576=169
3) Establecer el nmero aproximado de categoras o clases
n=80 Tama o de la muestra
M =1+3.322 log 10 80=7.32

M =2 n

4) Encontrar el tamao de la clase


R 169
C= =
=23.09
M 7.32
5) Encontrar los lmites inferior y superior de la primera clase o categora.
LSC 1 X min =76
LIC 1=LIC1 + ( C Aprox )=76+ ( 231 )
LIC 1=98
LSC n X max
6) Construir los limites inferior y superior de las categoras o clases subsiguientes
LIC 2=76+C=76+23=99
LSC 2=98+C=98+23=121
Las dems clases se construyen siguiendo la frmula

LIC i=LIC i1 +C

LSC i=LSC i1+ C


7) La tabla de conteo quedara as:
Tabla 1.3
Clases

Conteo

Frecuenci
a absoluta

35

Tensin
(PSI)
76 98
99 121
122 144
145 167
168 190
191 213
214 236
237 - 259
TOTAL

Nmero de
76unidades
98
99(probetas)
121

3
122 144
7
145 167
10
168 190
191 25
213
20
214 236
9
237 259
4
TOTAL
2

///
//// //
//// //// /
//// //// //// //// ////
//// //// //// ////
//// ////
////
/
80

3
7
11
25
20
9
4
1
Tabla 1.3

80

Una distribucin o tabla de frecuencia absoluta es el resumen


que muestra las clases y frecuencias de la tabla de conteo

Tabla 1.4

HISTOGRAMA Y POLIGONO DE FRECUENCIA ABSOLUTA

40
30
20
10
0
1 2 3 4 5 6 7 8 910
Figura 1

A partir de la tabla de conteo 1.3 construimos la distribucin de frecuencia absoluta,


tomando de ella las clases y la columna de frecuencia absoluta. (vase en la tabla 1.4)
El histograma de frecuencia absoluta y el polgono de frecuencia son dos representaciones
grficas de la distribucin de frecuencia absoluta. Un histograma de frecuencias, consiste
en un conjunto de rectngulos con:

35

TENSIN
(PSI)

FRECUENCIA
RELATIVA
(%)
3.75
8.75
12.50
31.25
25.00
11.25
5.00
2.50
100.00

76-98
99-121
122-144
145-167
168-190
191-213
214-226
227-249
TOTAL

a) Sus bases en el eje X horizontal, con centro en las


marcas de clase y longitudes iguales a los tamaos de
clase
b) Alturas iguales a las frecuencias de clase.

Un polgono de frecuencia es una lnea quebrada, se obtiene


conectando los puntos medios de las partes superiores de los
rectngulos del histograma. Se acostumbra aadir las
longitudes AM y BN a las marcas de clase extremas asociadas a
una frecuencia cero. La suma de las reas de los rectngulos del histograma es igual al rea
total limitada por el polgono de frecuencias y el eje x.
Para construir el histograma y el polgono de frecuencia de la Tabla 1-4 se procede as:
a) Se encuentra la marca de clase 1
76 +98
m 1=
=87
2
b) Las marcas de clase siguientes se consiguen as:
mi=mi1+C
mi1=clase anterior
C=tama o de la clase

Tabla 1.5

(Para el ejemplo de
las 80 probetas
sometidas a tensin)

Tabla 1.6

HISTOGRAMA Y POLIGONO DE FRECUENCIA RELATIVA O PORCENTUAL

40
30
20
10
0
1 2 3 4 5 6 7 8 910

TENSI
N
(PSI)

98
121
144
167
190
213
236
259

NUMERO
DE
PROBETA
S
3
10
20
45
65
74
78
80

35

Si se sustituyen las frecuencias absolutas de la tabla 1.4


por sus correspondientes frecuencias relativas, la tabla
resultante se llama una distribucin relativa o distribucin
porcentual (vase en la tabla 1.5).

Figura 2

m2=m1+ C=87+23

La representacin de grafica de la tabla 1.5, es un


histograma y polgono de frecuencias relativas que se
muestra en la figura 2.

m2=110
Se construye una grfica
X Y ; colocando en
el eje X las marcas
clase y en el eje Y
frecuencias absolutas
cada clase; para
ejemplo de muestra
tamao 80 (n=80)
obtuvo la figura 1.

de
las
de
el
de
se

La frecuencia total de todos los valores menores o iguales


que el limite superior de una clase dada se llama
frecuencia acumulada; por ejemplo la frecuencia
acumulada hasta la clase (122 - 144) para la muestra de
tamao 80 (n = 80) de la alacion litio-aluminio, (de la
tabla 1.4) es 3+7+10 = 20, lo que significa que 20 probetas
resistieron 144 PSI de tension o menos.

La frecuencia relativa de
una
clase
es
su
frecuencia
absoluta
dividida por la frecuencia
total de todas las clases y
se expresa generalmente
como un porcentaje. La
suma de las frecuencias
relativas de todas las
clases da como resultado
1 100% cuando se
expresa en porcentaje.

35

Figura 3

100
80
60
40
20
0

Una tabla que presenta todas


las frecuancias acumuladas se llama distribucion de
frecuancias acumuladas o tabla de frecuancias acumuladas
(vase en la tabla 1.6).
El grafico que recoge las frecuencias acumuladas por
debajo de cualquiera de las fronteras de clase superiores
respecto a dicha frontera (limite superior de clase) se
llama un poligono de frecuencias acumuladas u ojiva;
se acostumbra a iniciar la grafica con el limite superior de
una clase que tiene frecuencia acumulada cero; si existiera
la clase (53 - 75); la frenuencia sera cero ya que no
existen probetas con resistencia menores o iguales a 75
psi.
TENSI
ON
(PSI)

75
98
121
144
167
190
213
236
259

PORCENTA
JE
ACUMULA
DO
%
0
3.75
12.20
25.00
56.25
81.25
92.50
97.50
100.00

120
100
80
60
40
20
0

Figura 4

Tabla 1.7

35

La frecuencia acumulada
relativa o frecuencia
acumulada
en
porcentajes,
es
la
frecuencia
acumulada
dividida por la frecuencia
total. As por ejemplo,
las
tensiones
(PSI)
menores o iguales a 167
PSI (para el ejemplo de
las probetas) representan

el [45/80 x 100 = 56.25%], si se usan las frecuencias


acumuladas absolutas de la tabla 1.6 , la distribucin se
llama distribucin de frecuencias acumuladas relativas y
su grafica polgono de frecuencias acumuladas relativas u
ojiva de porcentajes, respectivamente.
La tabla 1.7 y la figura 4 muestran la distribucin de
frecuencia acumulada relativa y el polgono de frecuencias
acumuladas relativas respectivamente, en el caso del
ejemplo tratado.

Las medidas de tendencia central o de posicin buscan reducir en un nmero una


caracterstica observada o investigada; son estimaciones o valores tpicos del conjunto de
datos.
La presentacin tabular de los datos y las grficas de estas tablas pueden mejorar la
presentacin de los datos, las descripciones numricas tienen gran valor en el anlisis de
datos estadsticos, en esta seccin se presentan varias medidas numricas importantes para
describir las caractersticas de los datos.
Se llaman medidas de localizacin o tendencia central porque son el centro de un
conjunto de datos.

La medida ms comn de localizacin o centro de un grupo de datos es el promedio


aritmtico o media. Ya que casi siempre se considera a los datos como una muestra, la
media aritmtica se conoce como media muestral .

35

Si las observaciones de una muestra de tamao n son: X 1, X2.X3,Xn, entonces la


media muestral es:
n

X + X + Xn
X = 1 2
= i=1
n
n

Xi

.
EJEMPLO
Encontrar la media muestral de la resistencia a la tensin en Kgf/cm 2 de 10
observaciones de una carga de cemento portland.
Observaciones: 16.5, 16.40, 17.21, 16.35, 16.52, 17.04, 16.96, 17.15, 16.59, 16.57
167.29
X =media=
=16.729 Kgf /cm
10

El valor de la media

, X , es ms exacta que la precisin asociada con cada observacin,

por esto se acostumbra calcular la media con un digito ms que los entregados en cada
medicin de la muestra.
Si ordenamos las medidas de menor a mayor magnitud, y las graficamos como puntos en un
eje horizontal X calibrado, en este mismo eje determinamos el valor de la media
X =16.729 Kgf /cm
La representacin grfica es un diagrama de puntos como sigue:

..
16.0
17.5
Figura 5

X =16.729

. ...

16.5
18.0

. ...
17.0

Datos ordenados:
16.35, 16.40, 16.50, 16.52, 16.57, 16.59, 16.96, 17.04, 17.15, 17.21

35

Ntese que en la figura 4 la media muestral

X =16.729 , puede considerarse como un

punto de equilibrio.
Esto significa, que si cada observacin individual representa, por ejemplo, una libra de
X
masa colocada en esos puntos del eje horizontal, un punto de apoyo localizado en
equilibrar todo el sistema de pesos.
De esta forma la media es una medida que representa al subconjunto o muestra observada.
Para los datos de resistencia de la aleacin litio-aluminio de la tabla (1-2), la media
12913
Lb
X =
=161.4
80
Pulg2

muestral es:

Si se examina el histograma de la figura 1, se observa que la media muestral 161.4 psi, es


un valor tpico de la resistencia a la tensin, ya que este se presenta en la parte media de
los datos, donde se concentran las observaciones. Una desventaja de la media como medida
de tendencia central es que puede ser influida muy negativamente por un solo valor
extremo y dar una idea distorsionada de los datos; para entender lo anterior supongamos
que las observaciones de muestra de tamao 7 (n=7) son las siguientes:
1, 3, 4, 2, 7, 2450, 8
Luego la media es:
1+3+ 4+2+7 +2450+8
X =
=353.57
7
En este caso, es evidente que la media muestral no dice mucho con respecto a la tendencia
central de la mayor parte de los datos (4,2) ; es decir 2450 es un dato atpico.

Cuando se agrupan los datos la media X

se calcula mediante la siguiente formula:

mi f i

X = i=1

mi=marca de clase

35

f i =frecuencia de clase de laclase i

Tambin es posible pensar en el clculo de la media para todas las observaciones de una
poblacin, este promedio se conoce como media poblacional y se simboliza con la letra
griega .
Cuando existe un nmero finito (N) de observaciones la media es:
N

Xi

= i=1
N

En aplicaciones prcticas de la estadstica a problemas de ingeniera, no se conoce la media


y es imposible (o poco prctico) examinar a todos los miembros de una poblacin
(N); en los captulos sobre inferencia estadstica se presentan mtodos para hacer

inferencias sobre la media poblacional, con base a la media muestral X


, en ellos se
emplea la media muestral como punto de partida para estimar .

La segunda medida de tendencia central es la mediana, la mediana es aquel valor que se


encuentra en la mitad de una muestra o poblacin cuyos valores estn ordenados en orden
de magnitud; es decir arreglados los valores del ms pequeo al ms grande o viceversa.
Sean X1, X2.X3,Xn, los valores de una muestra acomodada en orden creciente de
magnitud; esto es X1 es la observacin ms pequea, X2 es la segunda observacin, Xn la
~
observacin mas grande, entonces, la mediana X se define como el elemento que se
encuentra en la posicin

n+1
2

ubicadas en las posiciones

n
2 y

si n es impar o el promedio entre las observaciones


n
+1
si es par. En trminos matemticos seria:
2

35


X n +1
; para nimpar
2
Xn
2

+ X n +1
2

; para n par
~
X=

Una ventaja de la mediana es que los valores extremos no tienen mucha influencia sobre
ella.
EJEMPLO
Supongamos que las observaciones de una muestra son:
1, 3, 4, 2, 7, 6, 8
La media muestral es:
1+3+ 4+2+7 +6+8
X =
=4.43
7

n= 7 (impar)

La mediana ser:
X 7+1 X 8
= =X 4
2
2

1 2 3 4 6 7 8

~
X= X 4 =4.0

X1 X2 X3 X4 X5 X6 X7

La media muestral es 4.43, mientras que la mediana muestral es 4.0; ambas cantidades
proporcionan una medida razonable de la tendencia central de datos.
Ahora supngase que en los datos asignados se cambia el 6 por 245, al ordenarlos quedara
la muestra as:
1 2 3 4 7 8 2450
X1 X2 X3 X4 X5 X6 X7
La mediana sigue igual

~
X=4.0 , para estos datos la media es:

1+3+ 4+2+7 +6+2450


X =
=353.57
7

35

La media muestral

X =353.57

no dice mucho con respecto a la tendencia central de los


~
datos, la mediana sigue siendo X=4.0 , y esta es una medida de tendencia ms
significativa para la mayor parte de las observaciones.

EJEMPLO
Supongamos que las calificaciones de 10 alumnos son:
0 91 92 93 94 95 95 96 97 98
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
X 10 = X 5=94
2

n=10 (par)

X 10 +1=X 6=95
2

La mediana es:
X + X 6 94+95
~
X= 5
=
=94.5
2
2
La media es:
0+ 91+92+93+ 94+95+ 95+96+ 97+98
X =
=85.1
10
Si usted fuera profesor de esta clase Que medida de tendencia central preferira
informar como el comportamiento general de la clase: la medida de 94.5 o la de
85.1?

La moda es la observacin que se presenta con mayor frecuencia en la muestra; un grupo de


datos puede no tener ninguna moda o tener ms de una.
Esto no ocurre con la media y con la mediana, medidas que, para un conjunto de datos,
siempre existen y son numricas. La moda no es una medida muy utilizada.
EJEMPLO

35

Encontrar la moda para cada una de las siguientes muestras:


Muestra (1) 3 6 9 3 5 8 3 10 4 6 3 1
Muestra (2) 2 6 9 3 5 8 3 10 4 6 3 1 6 2 5 6
Solucin:
Si ordenamos la muestra (1) en orden de magnitud
1 3 3 3 3 4 5 6 6 8 9 10
El dato que ms se repite es 3, ocurre cuatro veces
^
Luego la moda es X =3
Si ordenamos la muestra (2) en orden de magnitud
1 2 3 3 3 3 4 5 5 6 6 6 6 8 9 10
Para la segunda muestra las modas son 3 y 6, ya que ambos valores se presentan el
mismo nmero de veces es decir tienen la misma frecuencia cuatro y ningn otro lo
hace con mayor frecuencia. En este caso se dice que los datos son bimodales.

Tanto la mediana como la moda se pueden calcular para datos agrupados, las formulas
son las siguientes:
n
f i
2
^
X =mediana=LIR mediana+
C
f mediana

LIR mediana

: Lmite inferior real de la clase mediana

n : Tamao de muestra
f

mediana: frecuencia de la clase mediana

fi

: Frecuencia acumulada de las clases inferiores a la clase mediana

C : Ancho de la clase de la mediana

35

^
X =moda=LIR modal+

LIR modal
1

1
C
1 + 2

: limite inferior de la clase modal

: Exceso de la frecuencia modal sobre la clase inferior inmediata

2 : Exceso de la frecuencia modal sobre la clase superior inmediata

EJEMPLO
Partiendo de los datos agrupados de la muestra de tamao 80 (n=80), de la aleacin
aluminio-litio de la tabla 1.4
Encontrar:
a) La media para datos agrupados.
b) La mediana para datos agrupados.
c) La moda para datos agrupados.
Solucin:
Tensin
(Psi)
76 98
99 121
122 144
145 167
168 190
191 213
214 236
237 259
Total

Nmero de
unidades
(probetas)
3
7
11
25
20
9
4
1

Frecuencia
acumulada
(fa)
3
10
21
46
66
75
79
80
80

Marca de clase
(mi)
87
110
133
156
179
202
225
248

35

a) Media=

b)

n
2 =

mi f
i=1

80
2 = 40

12940
80

= 161.75 psi

c = 23

( 4021 )
~
X=144.5+
23=161,98 psi (Mediana)
25

c^
X

14
( 15+5
)23=160.60

144.5+

psi (Moda)

35

4.4.1 PERCENTILES Y CUARTILES


La mediana (ya sea de una poblacin o de una muestra) divide los datos en dos partes
iguales. Tambin es posible dividir los datos en ms de dos partes. Cuando se divide un
conjunto ordenado de datos en cuatro partes iguales, los puntos de divisin se conocen
como cuartiles. El primer cuartil, o cuartil inferior, q 1, es un valor que tiene
aproximadamente la cuarta parte (25%) de las observaciones por debajo de l, y el 75%
restante, por encima de l. El segundo cuartil, q2, tiene aproximadamente la mitad (50%) de
las observaciones por debajo de l. El segundo cuartil es exactamente igual a la mediana.
El tercer cuartil o cuartil superior, q3, tiene aproximadamente las tres cuartas partes (75%)
de las observaciones por debajo de l.
EJEMPLO
Partiendo de los datos agrupados de la muestra de tamao 80 (n=80), de la aleacin
aluminio-litio de la tabla 1.4, encontrar los cuartiles q1, q3 y los percentiles P50 y P80.
Encontrar:
a) El cuartil q1
b) El cuartil q3
El percentil P50
c)
El percentil P80
d)
Tensin
(Psi)
76 98
99 121
122 144
145 167
168 190
191 213
214 236
237 259
Total

Nmero de
unidades (probetas)
3
7
11
25
20
9
4
1
80

Solucin:

35

a) Se busca en que clase o categora se ubica el primer cuarto ( n/4= 20) de los
datos, sumando las frecuencias absolutas desde la primera clase hasta donde sea
necesario.
(3+7+10) = 20, el cuartil se encuentra en la tercera clase
n
f
122+121
4
q1 = LIR3 +
LIR3 =
= 121.5
*c
2
f q1

f
f q1

= 10

q1 = 121.5 +

= 3+7 = 10

c = 23

( 804 10)
11

23

q1 = 144.5

b) Se busca la clase donde se ubique los


3n
4 = 3(20)= 60

q3

LIR3 =

LIR5

3n
4

de los datos
(3+7+10+25+15) = 60

( 34n f )
f q3

q3 = 167.5 +

( 6046 )
20

23

q3 = 183.60

168+167
= 167.5
2

c) Para encontrar los percentiles se dividen los datos en centsimas partes (n/100) y se
aplica el mismo procedimiento de los cuartiles.
P50 =
n
100 =

80
100

50
= 0.80

( 100n )

= 50(0.80) = 40

(3+7+10+20) = 40

35

P50 = LIR4 +

P50 = 144.5 +

( 50100n f )
f P50

( 4021 )
25

145+144
LIR4 =
= 144.5
2

23

P50 = 161.98

d) P80 =?

f)

80

e)

( 100n )

g) P80 = LIR5 +

n
100

80
100

= 0.80

= 80(0.80) = 64

( 80100n f )
f P80

*c

LIR5 =

168+167
= 167.5
2

h)
i)

( 6446 )
20

P80=
*

167.5

j)
k) P80 = 188.20

23

35

l)
m)
n)
o) Una medida de tendencia central sola no proporciona generalmente una descripcin
satisfactoria de un conjunto de datos. Se requiere determinar el grado de
variabilidad de los datos individuales con respecto a una medida de centralizacin;
que generalmente es la media . A esta clase de medidas se les conoce como
medidas de variabilidad. La variabilidad es sinnimo la dispersin.
p) 4.5.1 RANGO
q) Una medida muy sencilla de variabilidad es el rango de la muestra, definido como
la diferencia entre la observacin ms grande y la ms pequea.
Sur)frmula es:
R=
Max
X de
Min
X Max:
observacin
ms
grande.
s) XEl
rango
una muestra
es fcil
de calcular,
pero
ese ignora toda la informacin que
hay en la muestra entre la observacin ms grande y la ms pequea.
X Min: observacin ms pequea.
t)
u)
v)EJEMPLO
w)

Si tenemos las siguientes muestras

x)

n= 5
y)
N 1

Muestra
aa)
,5,8,9

1,3

z)
N 2

Muestra
ab)
,5,5,9

1,5

ac)
R1= 9-1 = 8
ad)
R2= 9-1 = 8
ae)
af)
Las dos muestras poseen el mismo rango, sin embargo, en la segunda
muestra solo existe variabilidad en los valores extremos, mientras que en la primera
los tres valores intermedios cambian de manera considerable (esto no cambia el rango
R1).
ag) Los valores extremos no son tan propensos a aparecer en las muestras pequeas, y
si
en las grandes, en consecuencia, muestras pequeas tienden a tener rangos
pequeos y las muestras grandes rangos grandes.

ah) Para muestras pequeas (n10) la perdida de informacin no es tan seria; en control
de calidad estadstico las muestras son de tamao cuatro o cinco, por lo tanto se
aconseja el rango como medida de variabilidad.
ai) En general, lo que se desea es tener una medida de variabilidad que dependa de
todas las observaciones y no de unas cuantas como ocurre en el rango.
aj) 4.5.2 VARIANZA
ak) Las limitaciones del rango se pueden evitar con otras dos medidas de variabilidad
conocidas como varianza y desviacin estndar.
Laal)
desviacin estndar es la raz cuadrada positiva de la varianza.
am)
an) La varianza se puede calcular para la muestra o para toda la poblacin, cuando esta
es finita y est formada por N valores.
ao) Las formulas a usar son:

Varianza muestral para datos no agrupados

ap)

x i

n x i2( x i)
i =1

i=1

n(n1)

i=1
2

s =

Varianza poblacional para datos no agrupados


n

(xi u)2

aq) 2= i=1

Varianza muestral para datos agrupados

N x i( x i)
i=1

i=1

mi

2fi

ar)

i=1
2

s =

Varianza muestral para datos agrupados


k

as)

n mi2 f i ( mi f i )
i =1

i=1

n (n1)

Varianza poblacional para datos agrupados


k

(miu)2 f i

at)

2= i=1

Varianza poblacional para datos agrupados


k

au)

N mi2 f i( mi f i )
i=1

i=1

av) Las unidades de medicin de la varianza son iguales al cuadrado de las unidades
con que se mide la variable.
aw)

De esta manera, si X se mide en lbs., las unidades de


lb

s 2 sera

/plg la desviacin estndar tiene la ventaja de medirse en las unidades

originales de la variable de inters, para este caso X (lb/plg) .


ax)
ay)
az)
EJEMPLO
ba)

bb)
Dos maquinas en una lnea de produccin producen un mismo artculo. La
produccin para cada una es de 100 unidades. Un inspector de control de calidad
desea conocer la variabilidad de cada mquina, para esto establece la diferencia en
centmetros entre el largo de la pieza producida, contra el largo de la pieza prototipo,
como variable de control.
bc)

Xi = largo de la pieza prototipo(cm) largo de la pieza producida(cm)

bd)

La maquina A dio los siguientes resultados:


be)

Xi

bf) # de
piez
as
bj) 30
bn) 40

bi) 1
bm)
2
bq)3
bu)Tot
al
by)
bz)
ca)
cb)
cc)
cd)
ce)
cf)
cg)

br) 30
bv) 100

mi2
fi

bh)Mi
fi

bk) 30
bo) 160

bl) 30
bp) 80

bs) 270
bw)
460

bt) 90
bx) 200

bg)

La maquina B dio los siguientes resultados:


a) Xi
b) # de
c) mi2
d) mi
piez
fi
fi
as
e) 0
f) 20
g) 0
h) 0
i) 1
j) 10
k) 10
l) 10
m) 2
n) 30
o) 120
p) 60
q) 3
r) 30
s) 270
t) 90
u) 4
v) 10
w) 160
x) 40
y) Tot
z) 100
aa)560
ab)
al
200
Si encontramos la media y la varianza de la maquina A tenemos que:
k

ch)

mi f i
uA=

i =1

1 ( 30 ) +2 ( 40 ) +3 (3)
=2.0 cm
100

ci)

2
A

N mi2 f i( mi f i )
i=1

i=1

200

100 2

100 ( 460 )

cj)
ck)

Si encontramos la media y la varianza de la maquina B obtenemos:


0+10+60+90+ 40
=2.0 cm
100

cl)

uB =

cm)

200

100 2

100 (560 )
2B=

cn)
Para la mquina B las piezas tienen un promedio de 2.0 cm de diferencia
por debajo, y con respecto al patrn o prototipo, pero la maquina B exhibe una mayor
variabilidad.
co)

2B > 2a

1.6 c m2

0.6 c m2

cp)
cq) 4.5.3 COEFICIENTE DE VARIACIN
cr) En ocasiones es deseable expresar la variacin como una fraccin de la media. Para
hacer esto se utiliza una medida adimensional de variacin relativa, denominada
coeficiente de variacin muestral.
cs) El coeficiente de variacin muestral es:
ct) Cv= S/

Cv=

/u

cu) El coeficiente de variacin es til cuando se compara la variabilidad de dos o ms


conjuntos de datos que difieren de manera considerable en la magnitud de las
observaciones.

cv)
EJEMPLO
cw)
cx) Con un micrmetro, se realizan mediciones del dimetro de un tornillo, que tiene
una media de 44,03 mm y una desviacin estndar de 0,012 mm; con otro micrmetro se
toman mediciones de la longitud del tornillo, la media de la longitud es de 1,76 pulgadas
y una desviacin estndar de 0,0075 pulgadas.
cy) Los coeficientes de variacin son:

cz)

Cvd =

0.012 mm
=0.00 03
4 4 .03 mm

0.0030 < 0.0043

da)

db)
dc) CvL =

Cvd < CvL

0.0075 plg
=0.0043
1.76 plg

dd)
de)
df) En consecuencia, las mediciones hechas con el primer micrmetro exhiben una
variabilidad relativamente menor que las efectuadas con el otro micrmetro.
dg)
dh)
di)
dj)
dk) Los conceptos de asimetra ( sesgo) y apuntamiento hacen referencia a la
comparacin del polgono de frecuencia de los datos provenientes de la muestra
(n) y una curva terica o normal, observada en la mayora de los fenmenos
naturales, en especial cuando el nmero de observaciones es grande.
dl) Una distribucin es simtrica cuando la media, la mediana y moda son iguales, es
decir, cuando su polgono de frecuencia tiende a ser simtrico o normal, en este caso
sus dos colas son iguales.

dm)

dn) Media=Mediana=Moda
do)

X =~
X= ^
X

dp) Pero si la distribucin unimodal tiene una cola ms larga hacia una de los lados, se
dice que es asimtrica o deforme.
dq) Si la deformacin o alargamiento de la cola se presenta hacia valores ms grandes
de la variable, es decir, hacia la derecha se dir que la distribucin es asimtrica
positiva en caso contrario la asimetra ser negativa.

dr)

X =~
X= ^
X~
X^
X X X ~
X^
X
Simtrica

Asimtrica negativa

Asimtrica

positiva

ds)
dt) 4.6.1 SESGO
du) Se conoce como sesgo al grado de asimetra de una distribucin, es decir cuanto se
aparta de la simetra.
dv) La asimetra o sesgo que se representa por As es igual a:
As=

dw)

dx)

x i

i =1

m3=

m3
s3

Momento 3 con respecto a la media de datos no agrupados.

mi

3
f i

dy)
n

Momento 3 con respecto a la media de datos no agrupados.

i =1

m3=
dz) La curva normal es el referente terico y no tiene sesgo (As=0); entonces el sesgo de
una distribucin puede ser:
ea)

As

> 0 Asimtrica positiva

eb)

As

= 0 Simtrica

ec)

As

< 0 Asimtrica negativa

ed) 4.6.2 APUNTAMIENTO


ee) Es tambin conocido como curtosis y permite establecer el grado de apuntamiento o
achatamiento de la curva, o polgono de frecuencia; la curva normal tiene Ap =3
ef) La formula es:

eg)

mi

4
fi

xi

Ap=

i=1

i=1

m4=

m4=
eh)
ei)

ej)

Ap

> 3 Leptocrtica

ek)

Ap

= 3 Mesocrtica

el)

Ap

< 3 Platicrtica

em)
en)

m4
s4

eo)
ep) Para el ejemplo de la aleacin aluminio-litio:
eu)
eq) Tensi
er) N
es)
et)
fi(min (Psi)
u
fi
m
X )3
m
e
r
o
d
e
p
r
o
b
e
t
a
s
(f
i)
ex) 76 98
ey) 3
ez)
fa)
fb) 3
8
1.253.0
fe) 99
121

ff) 7

fg)
10

fh)
1

fl) 122
144

fm)1
1

fn)
21

fo)
1

fs) 145
167
fz)

168
190

gg) 191
213
gn) 214
236

ft) 2
5

fu)
46

fv)
1

ga) 2
0

gb)
66

gc)
1

gh) 9

go) 4

gi)
75
gp)
79

gj)
2
gq)
2

10,89
fi) 970.12
8,14
fp) 261.40
0,39
fw) 4.752,7
3
gd)
1
02.659,
06

ev)

fc)

fj)

fq)

fx)

ge)

gk)586.86
7,64

gl)

gr) 1.012.1
42,31

gs)

ew)

fi(miX )4

fd) 93.66
2.564,
07
fk) 50.20
4.131,
28
fr) 7.515.
261,2
3
fy) 27.32
8,22
gf) 1.770.
868,8
3
gm)
2
3.621.
422,5
4
gt) 64.01
8.001,
27

gu) 237
259

gv) 1

hb)Total

hc) 8
0

gw)
80

gx)
2

hd)

he)

ha)
gy)641.61
9,14
hf) 146.00
4,00

gz)

hg)

5
5.339.
650,8
8
hh)
2
96.15
9.228,
31

hi) Tabla 1.8

hj)

m 3=

146 , 004.00
=1,825.05
80

hk)

m 4=

296.159 .228,31
=3,701,990
80

hl)
hm)
hn)

S= 33.64 psi
ho)

Sesgo =

hp)

m3
s

Curtosis =

m4
s

1,825.05
=0.04
(33.64 )3

3 3 . 64 4

3,701,990

hq)
hr) El sesgo para el ejemplo de la aleacin aluminio-litio nos indica que el polgono de
frecuencias es bastante simtrico con una ligera cola a la izquierda y el
apuntamiento o curtosis es casi 3.
hs)
ht)

Estadstica
Estadstica descriptiva
Estadstica Inferencial
Variable

Variable continua
Variable discreta
Variable cuantitativa
Variable cualitativa
Poblacin, Muestra
Distribucin de frecuencia absoluta
Distribucin de frecuencia acumulada absoluta
Distribucin de frecuencia acumulada relativa
Polgonos de frecuencia
Media
Mediana
Moda
Varianza
Cuartiles
Percentiles
Coeficiente de variacin
Sesgo
Curtosis

You might also like