Professional Documents
Culture Documents
BASES ESTADISTICAS
PARA EL CONTROL
DESCRIBIR
¡ Esto se debe a la creciente facilidad
con la cual se pueden manejar
grandes cantidades de datos
numéricos, debido al uso de …
CONCEPTOS BÁSICOS
ESTADISTICA: Es una colección de métodos
para planear experimentos, obtener datos, y
después organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones
basadas en los datos.
¡ Población: es la colección de todas
las posibles mediciones u
observaciones a estudiar. Se dice
que la colección es completa, pues
incluye a todos los sujetos que se
estudian o que pueden hacerse de
una variable bajo estudio.
¡ Se clasifica en dos categorías:
¡ Muestra:
l Es un conjunto de mediciones u
observaciones tomadas o seleccionados a
partir de una población.
l Es un subconjunto de la población.
TIPOS DE DATOS
¡ Variables:
l Son las características o lo que se estudia de
cada individuo de la muestra. Ej: sexo,
edad, peso, estatura, color de ojos, estado
civil, temperatura, cantidad de nacimientos,
presión, grosor, diámetro, ...
¡ Datos:
l Son los valores que toma la variable en cada
caso.
l Son las observaciones recolectadas (como
mediciones, géneros, respuestas de
encuestas).
l
PARAMETRO: Es una medición numérica que describe
algunas características de una población.
EJEMPLO:
Azar simple
Azar
PROBALISTICO O sistemático
ALEATORIOS Estratificado
CLASIFICACION Conglomerados
DEL TIPO DE
MUESTREO
NO Casual o accidental
PROBALISTICOS Intencional
(Determinístico) Por cuotas
TIPOS DE MUESTREO
Los métodos de muestreo más comunes
son:
a) Aleatorio,
b) Aleatorio simple,
c) Sistemático,
d) Por conveniencia,
e) Estratificado,
f) Por conglomerados o racimos.
¡ Muestra aleatoria: se considera aleatoria
siempre y cuando cada observación,
medición o miembro de la población
tenga la misma probabilidad de ser
seleccionado.
¡ A menudo se usan computadoras para
generar números telefónicos aleatorios.
MUESTREO ALEATORIO
SIMPLE
Se selecciona una muestra de tamaño de n sujetos de
manera que cada posible muestra del mismo
tamaño n tenga la misma posibilidad de ser elegida.
Se utiliza n
resultados
fáciles de
obtener.
MUESTREO ESTRATIFICADO
Estrato 1 Estrato 2
La población se divide en
grupos homogéneos,
llamamos estratos. La
proporción de cada estrato Población
en la población se mantiene
en la muestra. Cada uno de
los estrato de la muestra se
obtiene por muestreo
aleatorio simple sobre el
estrato correspondiente de la
población. Muestra
Los estratos más grandes tienen mayor
probabilidad de ser representados.
Se divide el área de la
población en secciones
(conglomerados o
racimos ). Se eligen al
azar unas pocas de
estas secciones y luego
se toman todos los
elementos o miembros
de las secciones
elegidas para formar la
Para dividir la población en muestra.
secciones podemos usar las
provincias.
Heterogéneos en su interior; diferentes entre sí
en propiedades y tamaño.
Grupo 1A
Grupo 5C
Grupo 2A
Grupo 3B
ORGANIZACIÓN DE DATOS NO AGRUPADOS
78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29
Solución:
1. Ordenar datos de menor a mayor:
29 30 31 34 34 34 35 35 38 39
39 39 41 42 42 42 42 43 43 43
44 45 48 49 49 68 70 73 75 76
76 77 78 78 78 78 80 80 81 82
82 82 84 84 84 85 85 86 87 91
2. Determinar el :
Valor mínimo (Vmin) = 29 Valor máximo (Vmax) = 91
Indican la mayor o menor concentración de
los datos con respecto
a las medidas de centralización.
Desviación típica, coeficiente de
variación, Rango, Varianza
Posición
Dividen un conjunto ordenado de datos en grupos
con la misma cantidad de individuos.
Percentiles, Cuartiles, Decilesy
mediana.
Forma
Asimetría
Apuntamiento o curtosis
36
MEDIDAS DE TENDENCIA CENTRAL
l Mediana.
l Moda.
¡ Son valores que se encuentran en el centro o a la
mitad de los datos, o representa el valor al que
tienden a concentrarse los datos de una muestra o
de un proceso.
¡
MEDIA ARITMÉTICA
∑x
x 1 + x 2 + ... + x n i = 1
i
µ=X= =
n n
Ejemplo: datos no agrupados
En un área de servicios dentro de una empresa de
manufactura se hace una encuesta para evaluar la calidad
del servicio proporcionada y el nivel de satisfacción de los
clientes internos. La encuesta consiste de 10 preguntas,
donde cada una de ellas evalúa diferentes aspectos del
servicio proporcionado. Las respuestas para cada pregunta
es un número entre 0 y 10. Para hacer un primer análisis de
los resultados obtenidos, se suman los puntos obtenidos de
las 10 preguntas para cada cuestionario. A continuación se
muestran los puntos obtenidos en 50 cuestionarios.
¡ Encontrar la media en la distribución
78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29
Solución..
¡ Encontrar la media en la distribución:
¡29
30 31 34 34 34 35 35 38 39
39 39 41 42 42 42 42 43 43 43
44 45 48 49 49 68 70 73 75 76
76 77 78 78 78 78 80 80 81 82
82 82 84 84 84 85 85 86 87 91
n
∑x i = 2990 =59.80
X = i =1
50
n
MEDIANA –PERCENTIL 50
x ( ( n + 1) 2 ) si n es impar
Md = x
( n 2 ) +x ((n 2) 1+ )
si n es par
2
Ejemplo: datos no agrupados
En un área de servicios dentro de una empresa de
manufactura se hace una encuesta para evaluar la calidad del
servicio proporcionada y el nivel de satisfacción de los clientes
internos. La encuesta consiste de 10 preguntas, donde cada una
de ellas evalúa diferentes aspectos del servicio proporcionado. Las
respuestas para cada pregunta es un número entre 0 y 10. Para
hacer un primer análisis de los resultados obtenidos, se suman los
puntos obtenidos de las 10 preguntas para cada cuestionario. A
continuación se muestran los puntos obtenidos en 50
cuestionarios.
a) Ordenar los datos de menor a mayor.
b) Calcular mediana de los datos.
78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29
Solución:
78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29
Solución:
78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29
Datos no estan ordenados
REPRESENTACIÓN DE DATOS
CURVAS
EJERCICIO:
A continuación se presentan las calificaciones de
60 estudiantes en el año 2009:
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
(fi).
l Frecuencia acumulada de la clase
(Fi).
l Frecuencia relativa de la clase
(fri)= fi/n
l Frecuencia relativa acumulada de
Ejemplo:
En un área de servicios dentro de una empresa de
manufactura se hace una encuesta para evaluar la calidad
del servicio proporcionada y el nivel de satisfacción de los
clientes internos. La encuesta consiste de 10 preguntas,
donde cada una de ellas evalúa diferentes aspectos del
servicio proporcionado. Las respuestas para cada pregunta
es un número entre 0 y 10. Para hacer un primer análisis de
los resultados obtenidos, se suman los puntos obtenidos de
las 10 preguntas para cada cuestionario. A continuación se
muestran los puntos obtenidos en 50 cuestionarios.
78 78 82 85 81 86 80 73 84 78
68 84 75 78 76 76 82 85 91 80
70 87 77 82 84 48 49 39 39 43
35 42 34 44 49 34 30 43 31 34
41 42 45 42 35 38 39 42 43 29
Solución:
1. Ordenar datos de menor a mayor:
29 30 31 34 34 34 35 35 38 39
39 39 41 42 42 42 42 43 43 43
44 45 48 49 49 68 70 73 75 76
76 77 78 78 78 78 80 80 81 82
82 82 84 84 84 85 85 86 87 91
2. Determinar el :
Valor mínimo (Vmin) = 29 Valor máximo (Vmax) = 91
INTERVALOS
FRONTERAS I FRONTERAS
DE CLASE LIMITE LIMITE SUPERIOR
(I) INFERIOR (Li) (Ls) Li Ls
1 29 37
1 X X+(A-1) 2 38 46
2 X+(A-1) X+2(A-1) 3 47 55
3 X+2(A-1) X+3(A-1) 4 56 64
5 65 73
6 74 82
7 83 91
6. Determinar las fronteras o límites reales de
cada clase.
Li: Limite inferior --- Li = Vm – ½ u
Ls: Limite superior – Ls = Li + A
u: unidad, si es entero es 1, decimal es 0.1,
centesimal 0.01, ect.
Ø Limite inferior --- Li = Vmin – ½ u
Li = 29 – (1/2) (1) = 28.5
Ø Limite superior --- Ls = Li + A
I FRONTERAS
Li Ls
Ls = 28.5 + 9 = 37.5
1 28.5 <37.5
2 37.5 <46.5
INTERVALOS DE FRONTERAS
CLASE
(I)
LIMITE LIMITE
INFERIOR (Li) SUPERIOR
3 46.5 <55.5
(Ls) 4 55.5 <64.5
1 X X+A 5 64.5 <73.5
2 X+A X+2A 6 73.5 <82.5
3 X+2A X+3A 7 82.5 <91.5
7. Contar los datos que pertenecen a cada clase.
8. Elaborar la tabla de frecuencias absolutas (fi).
29 30 31 34 34 34 35 35 38 39
39 39 41 42 42 42 42 43 43 43
44 45 48 49 49 68 70 73 75 76
76 77 78 78 78 78 80 80 81 82
82 82 84 84 84 85 85 86 87 91
∑xf i i
X =i =
1
k
∑fi
i=
1
Donde:
xi : punto medio de la clase i (marca de clase) = (Li + Ls)/2
fi : frecuencia absoluta de la clase i
n : número de datos
Ejercicio: datos agrupados
¡ Calcule la media de la distribución:
I FRONTERAS FRECUENCIA
MARCA
CLASE Xi*fi k
Li Ls fi Xi ∑x f i i
1 29 37 8 33 264 X= i =1
k
2 38 46 14 42 588 ∑ fi
i =1
3 47 55 3 51 153
4 56 64 0 60 0 = 3000/50
5 65 73 3 69 207 = 60
6 74 82 14 78 1092
7 83 91 8 87 696 Xi= (Li+Ls)/2
TOTAL 50 3,000
Cálculo de la mediana
Ø Datos agrupados:
l La clase mediana es la que contiene a la
observación que ocupa la posición N/2.
¡
N
− Faa
Md = Li + ( 2 ) * Ic
fm
Donde:
Li: límite inferior de la clase mediana.
Faa: frecuencia acumulada de la clase anterior a la clase mediana.
fm: frecuencia absoluta de la clase mediana.
Ic :amplitud de la clase mediana
I FRONTERAS FRECUENCIA FRECUENCIA
ABSOLUTA
1. ABSOLUTA ACUMULADA
Li Ls fi Faa
2. 2 37.5 <46.5 14 22
3 46.5 <55.5 3 25
4 55.5 <64.5 0 25
N
− Faa
Li + ( 2
Md = Ic
)*
fm
Ø Limite real inferior de la clase mediana o frontera de
clase es: Li = 47 - 0.5 = 46.5
Ø Factor es: N/2 = número de datos/2 = N/2 = 50/2 = 25
Ø Frecuencia acumulada de la clase anterior es: Faa = 22
Ø Frecuencia de la clase de la mediana o frecuencia
absoluta es: fm = fi = 3
Ø Ancho o amplitud de clase es: Ic = 9
Ø Sustituyendo valores en la ecuacion se tiene que la
mediana es:
Md = 46.5 + ( 50/2 – 22 ) * 9 = 55.5
3
Ø
Cálculo de la moda
¡ Para datos agrupados:
∆1
Mo = Li + Ic
∆1 + ∆ 2
Donde:
Li: límite inferior de la clase modal.
∆ 1: diferencia entre fi de la clase modal y la anterior.
∆ 2: diferencia entre fi de la clase modal y la posterior.
Ic: amplitud de la clase modal (clase de mayor frecuencia).
Ejemplo: datos agrupados
¡ Calcular la moda de las distribuciones
anteriores.
I FRONTERAS FRECUENCIA
ABSOLUTA ∆1
Li Ls Fi Mo = Li + Ic
1 28.5 <37.5 8 ∆1 + ∆ 2
2 37.5 <46.5 14
3 46.5 <55.5 3
4 55.5 <64.5 0 Mo2 = 40.7≈41
5 64.5 <73.5 3
6 73.5 <82.5 14
Mo6 = 79.3 ≈79
7 82.5 <91.5 8
TOTAL 50
∆1
Mo = Li + Ic
∆1 + ∆ 2
Ø El intervalo de clase donde mas se repiten los datos es
en: Fi2 = Fi6=14
Ø Limite real inferior de la clase modal es:
Li2 = 38 - 0.5=37.5 Li6 = 74 – 0.5 =73.5
Ø Diferencia entre la frecuencia de la clase modal y la clase
pre modal es:
Δ21 =14 - 8 = 6 Δ61 =14 - 3 = 11
Ø Diferencia entre la frecuencia de la clase modal y la clase
post modal es:
Δ22 =14 - 3 = 11 Δ62 =14 - 8 = 6
Ø Ancho o amplitud de clase es: Ic = 9
Ø Mo2= 37.5 + ( 6 )* 9 Mo6= 73.5 + ( 11 )*9
6 + 11 11 + 6
Mo2= 40.7≈41 Mo6= 79.3≈79
REPRESENTACIÓN GRÁFICA DE LOS DATOS
Histograma OJIVA
POLIGONO DE FRECUENCIAS
l Barras CURVAS
l Sectores
BARRAS
PASTEL O CIRCULAR
Continuación….
Construir para el ejercicio anterior, el grafico
que corresponda, considerando el tipo de datos.
Solución:
El grafico que representa esos datos es el HISTOGRAMA
I FRONTERAS fi
Li Ls
1 29 37 8
2 38 46 14
3 47 55 3
4 56 64 0
5 65 73 3
6 74 82 14 29 38 47 56 65 74 83 92
7 83 91 8
RELACIÓN ENTRE LA MEDIA,
LA MEDIANA Y LA MODA
Permiten estudiar la forma de la curva,
dependiendo de cómo se agrupan los datos.
79
Relación entre Tendencia Central y la
Simetría de la distribución
Simetría Relación
Simétrica o insesgada Moda = Mediana = Media
Forma bimodal
Con anomalías
Forma en U
29 38 47 56 65 74 83 92
Mo = 41 Mo = 79
X = 60
CONCLUSIÓN:
Comparación de los resultados obtenidos en
las medidas de tendencia central
MEDIDAS DE DATOS NO DATOS
TENDENCIA CENTRAL AGRUPADOS AGRUPADOS
Moda (Mo) 42 y 78 41 y 79
Conclusión:
EJERCICIO:
A continuación se presentan las calificaciones de
60 estudiantes en el año 2009:
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Media Aritmética(¯) X
Mediana (Md)
Moda (Mo)
Conclusión: