You are on page 1of 12

Control Estadístico de Procesos

Conceptos Estadísticos Fundamentales

Hasta ahora hemos visto el caso de fenómenos o experimentos


cuyo espacio muestral asociado tiene un número pequeño de
elementos. Esto nos sirvió para introducir la noción de probabilidad.

Pero en muchos casos es necesario trabajar con experiencias o


procesos que generan un número muy grande de datos o resultados
numéricos, es decir, espacios muestrales con un número infinito o
muy grande de elementos. Cuando tenemos un conjunto muy grande
de datos numéricos para analizar decimos que tenemos un Universo
o Población de observaciones.

26 30 29
31
29 31
32 30
33 29 29 27
26 27
27 30
25 28
32
31 31
28 32 30
30
30
29 30
31 28
33 31 34

Población o Universo

Cada dato numérico es un elemento de la población o universo. Una


Muestra es un subconjunto pequeño de observaciones extraídas de
un universo o población:
Extraemos un dato
30 de la Población
26 29
29 30 31
31
33 32
29 27 29 30
27 26 28 30
32 25 27 30
31
28 30 32 31
29 30 30
31 28
34
33 31

Población o Universo

La Estadística trabaja con poblaciones de datos y con muestras


extraídas de las mismas.
Los conceptos de población y muestra a
veces resultan ambiguos en su aplicación
práctica. Por ejemplo, supongamos que en
una ciudad de 5000 habitantes se realiza un
censo médico en el cual se mide el peso, la
altura y se relevan otros datos de todos los
habitantes de la ciudad. Alguien podría
referirse al universo o población censada
teniendo in mente el conjunto de los
habitantes de la ciudad. Pero cuando hablamos en términos
estadísticos, nos referimos a poblaciones o universos de datos.

Por ejemplo, el conjunto de todas las mediciones de altura (De los


habitantes de la ciudad) es un conjunto de datos y por lo tanto
constituye un universo o población de datos desde el punto de vista
estadístico. Otro universo o población de datos son los pesos
medidos (De los habitantes de la ciudad). Pero la población de
habitantes, es decir, las personas que habitan la ciudad no son la
población a la que nos estamos refiriendo desde el punto de vista
estadístico.

Supongamos que en una empresa se fabrica


un lote muy grande, digamos 10 toneladas de
un producto químico, y un técnico debe
controlar la calidad del mismo.

El técnico toma una pequeña porción, por ejemplo,


100 gramos y dirá que tomó una muestra del producto
para analizar en el laboratorio. Hasta el momento, la
muestra no fue analizada y por lo tanto no tenemos
ningún dato numérico.

Cuando el laboratorio efectúa algún ensayo en la


muestra y obtiene un resultado numérico, recién ahí
tenemos un dato que puede ser analizado desde el
punto de vista estadístico. Vamos a suponer
hipotéticamente que el técnico continúa sacando
otras muestras del producto, hasta agotar el lote y
cada una es ensayada en el laboratorio, el cual nos
da los resultados. Como teníamos 10 ton. de
producto y las muestras son aproximadamente de
100 gr., el técnico seguramente extraerá alrededor de 100000
muestras y el laboratorio nos entregará alrededor de 100000
resultados. Este conjunto de datos numéricos es nuestro universo o
población de datos.

Si nosotros tomamos al azar 10 de esos resultados, podemos


decir que tenemos una muestra de 10 elementos de ese universo o
población. No debemos confundir esta muestra (Desde el punto de
vista estadístico) con la muestra de material que extrajo el técnico
para ser analizada en laboratorio.
Ahora bien, nuestro universo o población de datos a veces no
existe en la realidad, sino que es un concepto o abstracción que
utilizamos para referirnos al universo o población que
hipotéticamente podría existir.

Veamos el ejemplo anterior. Supongamos que el técnico toma


solamente 5 muestras y las envía para analizar al laboratorio. El
laboratorio nos enviará sólo 5 resultados, y nosotros diremos que
tenemos una muestra de datos extraída del universo o población de
datos total. Y estamos pensando en el universo o población que
tendríamos si se hubieran extraído y analizado las 100000 muestras
de material.
Muchas veces resulta difícil imaginarse cual es el universo del
cual extrajimos los datos. Supongamos que tenemos una máquina
que produce piezas de plástico en serie y un técnico toma 5 piezas
sucesivas y les mide la altura con un calibre. Tenemos, entonces, 5
resultados, es decir una muestra de 5 elementos. Cuál es el universo
al cual pertenece esa muestra de datos?.

Debemos imaginar lo siguiente: Si la máquina continuara trabajando


en las mismas condiciones (Es decir, a la misma velocidad, con las
mismas materias primas, a la misma temperatura, manejada por el
mismo operario, etc.) ...y a cada pieza que produce se le mide la
altura tendríamos un conjunto muy grande de resultados numéricos.
Ese conjunto muy grande de resultados numéricos que no existe,
pero que podría obtenerse en esas condiciones es el universo o
población del cual extrajimos la muestra de 5 observaciones.

Veamos otro ejemplo. Supongamos que el


sindicato de la industria textil desea saber cual
es el sueldo promedio que gana un operario en
esa industria. Entonces, encarga una encuesta a
una empresa especializada, que entrevista a 20
operarios de la industria textil y averigua sus
salarios.Estos datos son una muestra de 20
observaciones del universo o población formado
por los salarios de todos los operarios de la industria textil del país.
Aunque el encuestador no disponga de esos datos, sabemos que
existen miles de operarios que ganan un salario determinado y por lo
tanto podemos hablar de un universo o población cuyos elementos
son los salarios de los operarios de la industria textil en el país.
Además, esa población de datos es seguramente diferente de la
población de salarios de los operarios de la industria textil chilena o
brasileña (Usando una misma moneda de referencia).

Qué representa una Población de datos? El análisis estadístico de


una población o universo de datos tiene como objetivo final descubrir
las características y propiedades de aquello que generó los datos.
Por ejemplo, se tiene una población de escolares (Población física,
población humana) y se les mide la altura. El conjunto de datos de
altura constituye una población o universo estadístico. El análisis de
estos datos de altura (Universo estadístico) sirve para caracterizar y
estudiar a la población de estudiantes (Que no es una Población
estadística).

Supongamos que un instituto dedicado a estudios económicos ha


realizado una encuesta de ingresos en el país. El universo de datos
generados por la encuesta sirve a los fines de caracterizar a la
población física, a la población real del país, desde un punto de vista
económico.

Salarios
800 $
1250 $
950 $
2150 $
1780 $
1340 $
1500 $
2100 $
...

Población real Población estadística


Un ingeniero controla un proceso industrial, que genera a diario
muchos lotes de un producto (Población de lotes). Para cada lote se
mide una característica de calidad, obteniéndose una gran cantidad
de resultados numéricos (Población de datos).

Proceso
Muestra

Producto

Medición

Resultados
Numéricos

El ingeniero realiza esta tarea no porque esté interesado en jugar


con números, sino porque a través de los datos numéricos obtenidos
se puede evaluar el comportamiento del proceso, que es lo que
realmente le interesa.

Entonces, es importante destacar que detrás de un universo o


población de datos se encuentra una población física subyacente,
formada por elementos de la realidad que nos rodea, de la cual, a
través de algún tipo de medición, se obtuvieron los datos numéricos.
Es esa población física subyacente (Elementos de la realidad, seres
humanos, lotes de material, etc.) la que deseamos estudiar y
caracterizar por medio del análisis estadístico de los datos obtenidos.
La población estadística está representando, entonces, una
población física o natural formada por elementos de la realidad, con
respecto a una característica o propiedad de esa población física.

Es muy importante, al utilizar métodos estadísticos, no confundir


la población física, formada por elementos de la realidad que
estamos estudiando, con la población o universo de datos generados
a partir de la primera. De aquí en adelante, cuando utilicemos los
términos población o universo sin otro aditamento nos estaremos
refiriendo a población o universo de datos numéricos (También
llamados observaciones o mediciones o valores).

La Distribución de Frecuencias

Vimos que una Población o Universo de datos es un conjunto muy


grande de números. Estos números pueden estar en un gran listado
o puede ser un conjunto hipotético, es decir, podemos imaginar los
números pero no los tenemos realmente. Una gran tabla de números
ordenados al azar prácticamente no nos muestra información acerca
de la población de datos. Suponiendo que disponemos de los datos
del universo, cómo podemos clasificar y ordenar los números para
obtener más información acerca de ese universo de datos?

Una forma sería escribir los números desde el menor


hasta el mayor y colocar encima de cada uno tantas cruces o
cuadraditos como veces que figure repetido en la población:

30 29
26
29 30 31
31
33 32
29 27 29 30
27 26 28 30 27
32 25
31
28 30 32 31
29 30 30
31 34 28
33 31
Población o Universo
24 25 26 27 28 29 30 31 32 33 34 35
El número de veces que aparece repetido cada dato es la frecuencia
de dicho valor. La representación gráfica que hemos visto se
denomina Distribución de Frecuencias de la población.

La representación gráfica nos permite ver información que antes


no aparecía tan evidente. Por ejemplo, sin hacer ningún cálculo nos
damos cuenta donde está aproximadamente el promedio de la
población:

30 29
29 26
31 30 31 Promedio
33 32
29 27 29 30
27 26 28 30 27
32 25
31
28 30 32 31
29 30 30
31 34 28
33 31

Población o Universo 24 25 26 27 28 29 30 31 32 33 34 35
También nos muestra cuales son los valores máximo y mínimo de la
población, es decir, el rango:

30 29
26
29 30 31
31
33 32
29 27 29 30
27 26 28 30 27
32 25
31
28 30 32 31
29 30 30
31 34 28
33 31
24 25 26 27 28 29 30 31 32 33 34 35
Rango

En el caso anterior, los datos de la población son números enteros.


Cuando los números no son enteros o cuando tenemos un número
muy grande de datos, se divide el rango total en subintervalos y se
cuenta el número de valores que cae dentro de cada subintervalo.

Vamos a suponer, ahora, que tenemos una cierta población de N =


500 datos, por ejemplo el peso de varones adultos de 40 años. Una
manera de caracterizar esta población es construir una distribución
de frecuencias o gráfico de frecuencias. Para ello seguimos los
pasos siguientes:
1) Tomamos nota del valor máximo y el valor mínimo de la serie de
datos que estamos considerando.
2)Subdividimos el intervalo entre el máximo y el mínimo en algún
número de intervalos (15 ó 20) mas pequeños iguales entre sí.
3) Contamos el número de datos que encontramos dentro de cada
intervalo (Frecuencia). Por ejemplo, supongamos que en el intervalo i
hay ni observaciones (Σ ni = N).
4)Para construir el gráfico, colocamos en el eje de abcisas
(Horizontal) los intervalos y levantamos en cada intervalo un
rectángulo de altura proporcional al número ni de datos dentro del
mismo.

Si hacemos el área del rectángulo levantado sobre el intervalo i−


ésimo igual a la frecuencia relativa n /N, el área total bajo el
i
histograma será igual a la unidad:

ni ni N
AreaTotal Ai 1
N N N

Obtenemos así una representación gráfica (Llamada también


histograma) que nos muestra la distribución de frecuencias de la
población:

Gráfico de Distribución de Frecuencias


0,20
0,18
0,16
Frecuencia Relativa

0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
60 66 72 78 84 90 96

Peso Kg.
Esta distribución de frecuencias nos muestra las características de
una población, por ejemplo, si hay resultados que son mas
frecuentes que otros. Nos muestra si los valores están ubicados
alrededor de un valor central, si están muy dispersos o poco
dispersos. Podemos observar que fracción de todas las mediciones
cae por ejemplo, entre 70 y 80 Kg. (Zona rayada en el gráfico):

Gráfico de Distribución de Frecuencias


0,20
0,18
0,16
Frecuencia Relativa

0,14
0,12
0,10
0,08
0,06
0,04
0,02
0,00
60 66 72 78 84 90 96

Peso Kg.

Si elegimos una persona del grupo y la pesamos, el


resultado es un dato que pertenece a la población de datos
representada en el gráfico. Decimos, entonces, que estamos
extrayendo un dato de la población de datos. Pero hay distintas
maneras de elegir la persona, es decir, distintas maneras de realizar
la extracción del dato.

Si nos paramos frente al grupo y elegimos una persona,


estaremos seleccionando al más gordo, al más flaco o al más alto (y
por lo tanto pesa más que otros), de acuerdo a criterios subjetivos
que no podemos evitar.
En cambio, si escribimos los nombres de todas las personas en una
etiqueta, metemos todas las etiquetas en una caja y luego le
pedimos a alguien que retire una etiqueta, la selección no estará
influída por nuestra subjetividad. En este caso, decimos que la
extracción es aleatoria.

Juan

Una extracción aleatoria es aquella en que cada miembro de la


población tiene la misma posibilidad de ser elegido. Supongamos
que realizamos una extracción aleatoria de la población antedicha y
obtenemos el valor y.

Entonces:
1) La probabilidad P(y<70) de que y sea menor que 70 Kg. es igual
al área del histograma a la izquierda de 70 Kg.

2) La probabilidad P(y>70) de que y sea mayor que 70 Kg. es igual


al área del histograma a la derecha de 70 Kg.

3) La probabilidad P(y>70, y<80) de que y sea mayor que 70 Kg.


pero menor que 80 Kg. es igual al área del histograma entre 70 y 80
Kg.

−−−−−−−−−−−−−−−−−−−−−−−−−−−−

You might also like