You are on page 1of 32

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

(Universidad del Perú, DECANA DE AMERICA)


Facultad de Ingeniería Industrial

TRABAJO DE INVESTIGACION
ASIGNATURA: ESTADISTICA Y PROBABILIDADES
DOCENTE: ING. WILLIAM LEON VELASQUEZ

ALUMNO CODIGO
Cárdenas Marroquín, Joe Manuel 16170301
Carrasco Suriqchaqui, Billy Joel 15170260
Chileno Aquino, Marcos Enrique 16170280
Norabuena Torre, Florián Noel 12170034
Sánchez Llasaca, Angelo Rafael 15170289
I. PLANTEAMIENTO DEL PROBLEMA

La diabetes es una enfermedad en la que los niveles de glucosa en la sangre están muy
elevados. La insulina es una hormona encargada de mantener los niveles de glucosa en
sangre dentro de un rango y de su conversión en glucógeno para su almacenamiento en
el hígado y músculos. En la diabetes tipo 1, el cuerpo no produce insulina. En la diabetes
tipo 2, la más común, el cuerpo no produce o no usa la insulina de manera adecuada.
Con el tiempo, el exceso de glucosa en la sangre puede causar problemas serios. Puede
dañar los ojos, los riñones y los nervios. La diabetes también puede causar enfermedades
cardíacas, derrames cerebrales y la necesidad de amputar un miembro.
La diabetes mellitus tipo 2 es una enfermedad que por sus síntomas, complicaciones o
tratamiento puede repercutir en la capacidad de la persona para realizar algunas tareas del
puesto de trabajo, por lo que aun siendo una enfermedad común puede originar daño
laboral como factor co-causal de un accidente laboral o de una enfermedad relacionada
con el trabajo.
Algunos de los riesgos de la accidentalidad laboral asociados con la diabetes o su
tratamiento incluyen:
 Mareo
 Perdida de consciencia
 Alteraciones de la visión
 Dificultad para el movimiento
 Temblor
 Reducción de la coordinación motora
 Alteración del estado de animo
 Aumento del tiempo de reacción
 Reducción de la atención
 Alteraciones del sueño
La diabetes tipo 2 constituye un síndrome de amplia repercusión laboral, bien como
condicionante de limitaciones en la aptitud laboral del trabajador afectado, o como factor
de riesgo específico de accidentes laborales traumáticos y daño laboral no traumático.
Este efecto de potencial incremento de siniestralidad guarda relación con las limitaciones
de la enfermedad y sus complicaciones, y con las polimedicaciones a las que el trabajador
diabético ha de someterse.
II. CUADRO
PRESENTACION DE LOS DATOS
A continuación, se muestran los datos recopilados correspondientes a las concentraciones
de glucosa en sangre (mg/dL) de cada uno de los trabajadores del área de producción de
la empresa papelera “ATLAS”, los cuales fueron obtenidos en ayunas.

89 131 103 88 99 75 84 99 87 83
92 75 89 77 79 81 82 89 86 84
74 73 122 106 86 93 93 116 75 81
92 111 106 73 74 103 86 74 96 88
95 98 112 106 121 87 91 88 96 77
96 84 73 86 79 76 93 104 113 91

III. DESARROLLO

3.1.GENERAL

3.1.1. TABLA UNIDIMENSIONAL DE DISTRIBUCION DE FRECUENCIAS


Tiene como propósito organizar el conjunto de datos recopilados (concentración de
glucosa en sangre de cada uno de los trabajadores), en una forma adecuada para su
comprensión y análisis posterior.
3.1.1.1.IDENTIFICACION
 Población: Todos los trabajadores del área de producción de la empresa
“ATLAS”
 Muestra: Sesenta trabajadores del área de producción
 Unidad estadística: Un trabajador
 Variable estadística: Concentración de glucosa en sangre (mg/dL)
 Tipo de Variable: Cuantitativa Continua

3.1.1.2.CONSTRUCCION

 Determinar el número de elementos de la muestra (𝑛)


𝑛 = 60
 Hallar el valor máximo (𝑉𝑚𝑎𝑥)
𝑉𝑚𝑎𝑥 = 131
 Hallar el valor mínimo (𝑉𝑚𝑖𝑛)
𝑉𝑚𝑖𝑛 = 73
 Calcular el Rango (𝑅)
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 131 − 73
𝑅 = 58
 Calcular en número de intervalos (k)
𝑘 ≥ 1 + 3.3 ∗ log⁡(𝑛)
𝑘 ≥ 1 + 3.3 ∗ log⁡(60)
𝑘 ≥ 6,87
𝑘≅7
 Hallamos la Amplitud de cada intervalo (A)
R
𝐴=
𝑘
58
𝐴=
7
𝐴 = 8,29 ≅ 9
 Al tratarse de una variable cuantitativa continua, sabemos que tendrá limites
reales e intervalos semiabiertos, por lo tanto:

𝐴 = 𝐿𝑅𝑠 − 𝐿𝑅𝑖
9 = 𝐿𝑅𝑠 − 𝐿𝑅𝑖

LRi LRs Xi fi Fi hi Hi hi% Hi%


73 82 77,5 16 16 0,267 0,267 26,67 26,67
82 91 86,5 17 33 0,283 0,550 28,33 55,00
91 100 95,5 14 47 0,233 0,783 23,33 78,33
100 109 104,5 6 53 0,100 0,883 10,00 88,33
109 118 113,5 4 57 0,067 0,950 6,67 95,00
118 127 122,5 2 59 0,033 0,983 3,33 98,33
127 136 131,5 1 60 0,017 1,000 1,67 100,00
60 1 100
3.1.2. GRAFICOS ESTADISTICOS
3.1.2.1.HISTOGRAMA
El histograma se construye dibujando barras contiguas que tienen como base la amplitud
de cada intervalo y como alturas las frecuencias respectivas.
3.1.2.2.POLIGONO DE FRECUENCIAS
Se utiliza para variable discreta. Es especialmente útil para comparar la distribución de
dos variables numéricas a la misma vez. Cuando se tiene intervalos, en el eje X se colocan
las marcas de clase.

3.1.3. MEDIDAS DESCRIPTIVAS


3.1.3.1.MEDIDAS DE TENDENCIA CENTRAL
3.1.3.1.1. MEDIA ARITMETICA (𝑥̅ )

Es el valor que tomaría cada uno de los datos si el total de los valores se repartiera
uniformemente entre el número de ellos.
∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
𝑥̅ =
𝑛
77,5(16) + 17(86,5) + 95,5(14) + 104,5(6) + 113,5(4) + 122,5(2) + 131,5(1)
𝑥̅ =
60
5505
𝑥̅ = = 91,75 ≅ 92
60
En promedio los trabajadores tienen una concentración de glucosa en sangre de 92 mg/dL.
3.1.3.1.2. MEDIANA (𝑀𝑒)
Es el valor que divide al total de las observaciones, ordenadas en forma ascendente o
descendente en dos partes de igual tamaño.

Li Ls Xi fi Fi
73 82 77,5 16 16
82 91 86,5 17 33 clase mediana
91 100 95,5 14 47
100 109 104,5 6 53
109 118 113,5 4 57
118 127 122,5 2 59
127 136 131,5 1 60

𝑛
− 𝐹𝑗−1
𝑀𝑒 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [2 ]
𝑓𝑗

30 − 16
𝑀𝑒 = 82 + (91 − 82) [ ]
17
𝑀𝑒 = 82 + (9)(0,82)
𝑀𝑒 = 89,412 ≈ 89
El 50% de los trabajadores tiene una concentración de glucosa en sangre por debajo de
89 mg/dL, el 50% restante tiene una concentración superior o igual a 89 mg/dL.

3.1.3.1.3. MODA (𝑀𝑜)


Es el valor de la variable que se presenta con mayor frecuencia.

Li Ls Xi fi
73 82 77,5 16
82 91 86,5 17 clase modal
91 100 95,5 14
100 109 104,5 6
109 118 113,5 4
118 127 122,5 2
127 136 131,5 1
(𝑓𝑗 − 𝑓𝑗−1 )
𝑀𝑜 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [ ]
(𝑓𝑗 − 𝑓𝑗−1 ) + (𝑓𝑗 − 𝑓𝑗+1 )
(17 − 16)
𝑀𝑜 = 82 + (91 − 82) [ ]
(17 − 16) + (17 − 14)

𝑀𝑜 = 82 + (9)(0,25)
𝑀𝑜 = 84,25 ≈ 84

La mayoría de los trabajadores tiene una concentración de glucosa en sangre de


aproximadamente 84 mg/dL.

3.1.3.2.MEDIDAS DE DISPERSION
3.1.3.2.1. MEDIDAS DE DISPERSION ABSOLUTAS
Cuantifican el grado de concentración o de dispersión de los valores de la variable en
torno de un promedio de la distribución.
A. RANGO O RECORRIDO (𝑅)
Es la diferencia entre los valores máximo y mínimo de los datos.
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 131 − 73 = 58

B. VARIANZA (𝑆 2 )
Es un valor numérico que cuantifica el grado de dispersión de los valores de una variable
respecto a su media aritmética.

Li Ls Xi fi Xi*fi Xi*Xi*fi
73 82 77,5 16 1240 96100
82 91 86,5 17 1470,5 127198,25
91 100 95,5 14 1337 127683,5
100 109 104,5 6 627 65521,5
109 118 113,5 4 454 51529
118 127 122,5 2 245 30012,5
127 136 131,5 1 131,5 17292,25
60 5505 515337

2
2
∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖2 ∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖
𝑆 = −( )
𝑛 𝑛
2
515337 5505 2
𝑆 = −( )
60 60
𝑆 2 = 8588,95 − (91,75)2
𝑆 2 = 8588,95 − 8418,0625
𝑆 2 = 170,8875 ≈ 171

En promedio las concentraciones de glucosa en sangre de estos trabajadores se alejan con


respecto a su promedio aritmético en aproximadamente 171 mg/dL al cuadrado.

C. DESVIACION ESTANDAR (S)


Es la raíz cuadrada positiva de la varianza.
𝑆 2 = 170,8875

S = √170,8875
S = 13,072 ≈ 13

En promedio las concentraciones de glucosa en sangre de estos trabajadores se alejan con


respecto al promedio en aproximadamente 13 mg/dL.

3.1.3.2.2. MEDIDA DE DISPERSIO RELATIVA


A. COEFICIENTE DE VARIACION (CV)
 Mide la variabilidad relativa a la media.
 Expresa la proporción de variabilidad de una característica por cada unidad de la
media.
INTERPRETACION
CV (%) VARIABILIDAD ESTABILIDAD
0 Nula Muy alta
0< CV≤ 20 Baja Alta
20< CV≤ 60 Moderada Moderada
60< CV≤ 90 Alta Baja
90< CV Muy alta Nula

𝑆
CV = ⁡𝑥100%
𝑋̅
13,072
CV = ⁡𝑥100%
91,75
CV = 14,274%
La variabilidad relativa a la media es baja, ya que el coeficiente de variación (14,274%)
se encuentra comprendido en el intervalo <0;20].

3.1.3.3.MEDIDAS DE FORMA
Son medidas que recorren dos aspectos de la población:
 su asimetría, alrededor de una medida de tendencia central
 su curtosis o grado de apuntamiento de la distribución.

3.1.3.3.1. ASIMETRIA O SESGO


Una distribución es asimétrica cuando sus datos tienden a agruparse hacia uno de los
extremos de la distribución.
 Cuando una curva es asimétrica tiene un sesgo.
 Existen dos tipos de asimetría o sesgo: positiva y negativa.
 X=Mo  La curva es simétrica.
 X>Mo  (Sk>0) Asimétrica positiva.
 X<Mo  (Sk<0) Asimétrica negativa.

𝑋̅ − 𝑀𝑜
𝑆𝐾 =
𝑆
91,75 − 84,25
𝑆𝐾 =
13,072
𝑆𝐾 = 0,574

Sk>0, el sesgo es positivo. Significa, además, que la diferencia entre la media y la moda
equivale a 0,574 veces la desviación estándar.
3.1.3.3.2. CURTOSIS O APUNTAMIENTO
Mide el grado de elevación o de agudeza de una distribución comparada con la curva
normal.
Según su grado de curtosis, una distribución puede ser:
a) Platicúrtica o achatada, en la medida en que los diferentes tramos de la variable
presenten frecuencias muy similares en todo su recorrido, entonces podemos
afirmar que existe poca curtosis o concentración de los datos. Esta situación
contribuye a que la dispersión sea alta (𝐴4 - 3 < 0)
b) Leptocúrtica o apuntada, si existe una cantidad muy significativa de datos que se
encuentran concentrados en algún tramo de la variable, entonces decimos que la
distribución es altamente concentrada o que tiene alta curtosis (𝐴4 - 3 > 0)
c) Mesocúrtica o moderada, si la concentración es intermedia entre las dos
situaciones anteriores. Una distribución con esta característica es propia de la
distribución normal (⁡𝐴4 - 3 = 0)

Li Ls Xi fi Xi-Mx (Xi-Mx) ^4 fi*(Xi-Mx) ^4


73 82 77,5 16 -14,25 41234,379 659750,063
82 91 86,5 17 -5,25 759,691 12914,754
91 100 95,5 14 3,75 197,754 2768,555
100 109 104,5 6 12,75 26426,566 158559,398
109 118 113,5 4 21,75 223788,129 895152,516
118 127 122,5 2 30,75 894088,441 1788176,88
127 136 131,5 1 39,75 2496597,504 2496597,5
60 6013919,67
(∑ 𝑓 ∗ (𝑋𝑖 − 𝑋̅)4 /𝑛
𝐴4 =
𝑆⁴
6013919,67/60
𝐴4 =
170,88752
100231,995
𝐴4 =
29202,538
𝐴4 = 3,432

𝐴4 − 3 > 0
3,432 − 3 > 0
0,432 > 0

La distribución es ligeramente apuntada o con poca concentración de los datos. No


obstante, observamos, que el valor “0.432” es muy cercano a cero, lo cual quiere decir,
que la distribución es casi una distribución mesocúrtica.

3.1.3.4.MEDIDAS DE POSICION
3.1.3.4.1. CALCULO DE PORCENTAJE DE VALORES
Muchas veces necesitamos conocer el porcentaje de valores que está por debajo o por
encima de un valor dado.
Esto es, dado un cierto valor en la abscisa determinar en la ordenada el tanto por ciento
de valores inferiores y superiores al valor dado.
Ejemplo: La tabla muestra una distribución de concentraciones de glucosa en sangre y
las correspondientes cantidades de trabajadores, determinar qué porcentaje de personas
tienen concentraciones de glucosa en sangre por debajo de 100 mg/dL y por encima de
125 mg/dL
Li Ls Xi fi Fi
73 82 77,5 16 16
82 91 86,5 17 33
91 100 95,5 14 47
100 109 104,5 6 53
109 118 113,5 4 57
118 127 122,5 2 59
127 136 131,5 1 60

𝑓𝑖 (𝑃𝑒𝑟𝑐 − 𝐿𝑅𝑖) 100


𝑃 = (𝐹𝑗−1 + )
A 𝑛
6(100 − 100) 100 47
𝑃 = (47 + ) = = 78,3%
9 60 60

2(125 − 118) 100


𝑃 = (57 + ) = 97,6%
9 60

El 78,3% de los trabajadores tienen una concentración de glucosa en sangre inferior a 100
mg/dL.
El 2,4% de los trabajadores tienen una concentración de glucosa en sangre igual o por
encima de 125 mg/dL
3.2.VARONES
3.2.1. TABLA UNIDIMENSIONAL DE DISTRIBUCION DE FRECUENCIAS
 Determinar el número de elementos de la muestra
𝑛 = 37
 Hallar el valor máximo
𝑉𝑚𝑎𝑥 = 131
 Hallar el valor mínimo
𝑉𝑚𝑖𝑛 = 73
 Calcular el Rango
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 131 − 73
𝑅 = 58
 Calcular en número de intervalos (k)
𝑘 ≥ 1 + 3.3 ∗ log⁡(𝑛)
𝑘 ≥ 1 + 3.3 ∗ log⁡(37)
𝑘 ≥ 6,175
𝑘≅7
 Hallamos la Amplitud de cada intervalo (A)
R
𝐴=
𝑘
58
𝐴=
7
𝐴 = 8,29 ≅ 9

Li Ls Xi fi Fi hi Hi hi% Hi%
73 82 77,5 8 8 0,2162 0,2162 21,622 21,622
82 91 86,5 10 18 0,2703 0,4865 27,027 48,649
91 100 95,5 9 27 0,2432 0,7297 24,324 72,973
100 109 104,5 5 32 0,1351 0,8649 13,514 86,486
109 118 113,5 3 35 0,0811 0,9459 8,108 94,595
118 127 122,5 1 36 0,0270 0,9730 2,703 97,297
127 136 131,5 1 37 0,0270 1 2,703 100
37 1 100,00
3.2.2. MEDIDAS DESCRIPTIVAS

3.2.2.1.MEDIDAS DE TENDENCIA CENTRAL

3.2.2.1.1. MEDIA ARITMETICA (𝑥̅ )


∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
𝑥̅ =
𝑛
77,5(8) + 86,5(10) + 95,5(9) + 104,5(5) + 113,5(3) + 122,5(1) + 131,5(1)
𝑥̅ =
37
3461,5
𝑥̅ = = 93,55 ≅ 94
37

En promedio los trabajadores varones tienen una concentración de glucosa en sangre de


94 mg/dL.

3.2.2.1.2. MEDIANA (𝑀𝑒)

Li Ls Xi fi Fi
73 82 77,5 8 8
82 91 86,5 10 18
91 100 95,5 9 27 clase mediana
100 109 104,5 5 32
109 118 113,5 3 35
118 127 122,5 1 36
127 136 131,5 1 37
37
𝑛
− 𝐹𝑗−1
𝑀𝑒 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [2 ]
𝑓𝑗

37
− 18
𝑀𝑒 = 91 + (100 − 91) [ 2 ]
9

𝑀𝑒 = 91 + 0,5
𝑀𝑒 = 91,5 ≈ 92

El 50% de los trabajadores varones tiene una concentración de glucosa en sangre por
debajo de 92 mg/dL, el 50% restante tiene una concentración superior o igual a 92 mg/dL.
3.2.2.1.3. MODA (𝑀𝑜)

Li Ls Xi fi
73 82 77,5 8
82 91 86,5 10 clase modal
91 100 95,5 9
100 109 104,5 5
109 118 113,5 3
118 127 122,5 1
127 136 131,5 1
37

(𝑓𝑗 − 𝑓𝑗−1 )
𝑀𝑜 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [ ]
(𝑓𝑗 − 𝑓𝑗−1 ) + (𝑓𝑗 − 𝑓𝑗+1 )
(10 − 8)
𝑀𝑜 = 82 + (91 − 82) [ ]
(10 − 8) + (10 − 9)

𝑀𝑜 = 82 + 6 = 88
La mayoría de los trabajadores varones tiene una concentración de glucosa en sangre de
aproximadamente 88 mg/dL.

3.2.2.2.MEDIDAS DE DISPERSION
3.2.2.2.1. MEDIDAS DE DISPERSION ABSOLUTAS
A. RANGO O RECORRIDO (𝑅)
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 131 − 73
𝑅 = 58

B. VARIANZA (𝑆 2 )
Li Ls Xi fi Xi*fi Xi*Xi*fi
73 82 77,5 8 620 48050
82 91 86,5 10 865 74822,5
91 100 95,5 9 859,5 82082,25
100 109 104,5 5 522,5 54601,25
109 118 113,5 3 340,5 38646,75
118 127 122,5 1 122,5 15006,25
127 136 131,5 1 131,5 17292,25
37 3461,5 330501,25
2
2
∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖2 ∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖
𝑆 = −( )
𝑛 𝑛

2
330501,25 3461,5 2
𝑆 = −( )
37 37
𝑆 2 = 8932,466 − (93,554)2
𝑆 2 = 180,105 ≈ 180
En promedio las concentraciones de glucosa en sangre de los trabajadores varones se
alejan con respecto a su promedio aritmético en aproximadamente 180 mg/dL al
cuadrado.

C. DESVIACION ESTANDAR (S)


𝑆 2 = 180,105

S = √180,105
S = 13,42 ≈ 13
En promedio las concentraciones de glucosa en sangre de los trabajadores varones se
alejan con respecto al promedio aproximadamente 13 mg/dL.

3.2.2.2.2. MEDIDAS DE DISPERSION RELATIVAS


A. COEFICIENTE DE VARIACION
𝑆
CV = ⁡𝑥100%
𝑋̅
13,42
CV = ⁡𝑥100%
93,55
CV = 14,35%
La variabilidad relativa a la media es baja, ya que el coeficiente de variación (14,35%) se
encuentra comprendido en el intervalo <0;20].
3.3.MUJERES

Nombre Glucemia(mg/dl)
P-4 88
P-9 87
P-10 83
P-12 75
P-15 79
P-17 82
P-18 89
P-19 86
P-25 86
P-29 75
P-30 81
P-31 92
P-34 73
P-36 103
P-39 96
P-43 112
P-45 121
P-47 91
P-50 77
P-51 96
P-53 73
P-56 76
P-60 91
3.3.1. TABLA UNIDIMENSIONAL DE DISTRIBUCION DE FRECUENCIAS

 Determinar el número de elementos de la muestra


𝑛 = 23
 Hallar el valor máximo
𝑉𝑚𝑎𝑥 = 121
 Hallar el valor mínimo
𝑉𝑚𝑖𝑛 = 73
 Calcular el Rango
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 121 − 73
𝑅 = 48
 Calcular en número de intervalos (k)
𝑘 ≥ 1 + 3.3 ∗ log⁡(𝑛)
𝑘 ≥ 1 + 3.3 ∗ log⁡(23)
𝑘 ≥ 5,494
𝑘≅6
 Hallamos la Amplitud de cada intervalo (A)
R
𝐴=
𝑘
48
𝐴=
5,494
𝐴 = 8,737 ≈ 9
Li Ls Xi fi Fi hi Hi hi% Hi%
73 82 77,5 8 8 0,3478 0,3478 34,78 34,78
82 91 86,5 7 15 0,3043 0,6522 30,43 65,22
91 100 95,5 5 20 0,2174 0,8696 21,74 86,96
100 109 104,5 1 21 0,0435 0,9130 4,35 91,30
109 118 113,5 1 22 0,0435 0,9565 4,35 95,65
118 127 122,5 1 23 0,0435 1 4,35 100
23 1 100
3.3.2. MEDIDAS DESCRIPTIVAS
3.3.2.1.MEDIDAS DE TENDENCIA CENTRAL
3.3.2.1.1. MEDIA ARITMETICA (𝑥̅ )
∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
𝑥̅ =
𝑛
77,5(8) + 86,5(7) + 95,5(5) + 104,5 + 113,5 + 122,5
𝑥̅ =
23
2043,5
𝑥̅ = = 88,85 ≅ 89
23

3.3.2.1.2. MEDIANA (𝑀𝑒)


Li Ls Xi fi Fi
73 82 77,5 8 8
82 91 86,5 7 15 clase mediana
91 100 95,5 5 20
100 109 104,5 1 21
109 118 113,5 1 22
118 127 122,5 1 23
𝑛
− 𝐹𝑗−1
𝑀𝑒 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [2 ]
𝑓𝑗

23
−8
𝑀𝑒 = 82 + (91 − 82) [ 2 ]
7

𝑀𝑒 = 82 + 4,5
𝑀𝑒 = 86,5 ≈ 87
3.3.2.1.3. MODA (Mo)

Mo=75
3.3.2.2.MEDIDAS DE DISPERSION
3.3.2.2.1. MEDIDAS DE DISPERSION ABSOLUTAS
A. RANGO O RECORRIDO (𝑅)
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 121 − 73
𝑅 = 48
B. VARIANZA (𝑆 2 )

Li Ls Xi fi Xi*fi Xi*Xi*fi
73 82 77,5 8 620 48050
82 91 86,5 7 605,5 52375,75
91 100 95,5 5 477,5 45601,25
100 109 104,5 1 104,5 10920,25
109 118 113,5 1 113,5 12882,25
118 127 122,5 1 122,5 15006,25
23 2043,5 184835,75

𝑘
2
1 ∑𝑘𝑖=1 𝑋𝑖 ∗ 𝑓𝑖 2
𝑆 = [∑ 𝑓𝑖 ∗ 𝑋𝑖 2 − 𝑛( ) ]
𝑛−1 𝑛
𝑖=1

1 2043,5 2
𝑆2 = [184835,75 − 23( ) ]
23 − 1 23
1
𝑆2 = [184835,75 − 23(88,848)2 ]
22
1
𝑆2 = [184835,75 − 181561,24]
22
1
𝑆2 = [3274,51]
22
𝑆 2 = 148,84 ≈ 149

En promedio las concentraciones de glucosa en sangre de las trabajadoras se alejan con


respecto a su promedio aritmético en aproximadamente 149 mg/dL al cuadrado.

C. DESVIACION ESTANDAR (S)


𝑆 2 = 148,84

S = √148,84

S = 12,2 ≈ 12

En promedio las concentraciones de glucosa en sangre de las trabajadoras se alejan con


respecto al promedio en aproximadamente 12 mg/dL.
3.3.2.2.2. MEDIDA DE DISPERSION RELATIVA

A. COEFICIENTE DE VARIACION (CV)


𝑆
CV = ⁡𝑥100%
𝑋̅
12,2
CV = ⁡𝑥100%
88,85
CV = 13,73%

La variabilidad relativa a la media es baja, ya que el coeficiente de variación (13,73%) se


encuentra comprendido en el intervalo <0;20].

3.4.CUADRO COMPARATIVO
HOMBRES MUJERES
Mx 93,55 88,85
Me 91,5 86,5
Mo 88 75
R 58 48
Vx 180,11 148,87
S 13,42 12,2
CV 14,35% 13,73%
3.5.DIAGRAMA DE CAJAS MULTIPLES
3.6.DISTRIBUCIONES BIDIMENSIONALES
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo
dos variables de cada elemento de la población. En este caso estudiaremos los Índices de
Masa Corporal (IMC) y las concentraciones de glucosa en sangre (mg/dL) de cada
trabajador.
3.6.1. TABLA BIDIMENSIONAL
3.6.2. COVARIANZA (𝑆𝑥𝑦 )

La covarianza mide la forma en que varía conjuntamente dos variables (IMC y


concentración de glucosa en sangre), donde interesa saber si existe algún tipo de relación
entre ellas.
 Si 𝑆𝑥𝑦 >0, hay dependencia directa (positiva), es decir las variaciones de las
variables tienen el mismo sentido.
 Si 𝑆𝑥𝑦 = 0, las variables están correlacionadas, es decir no hay relación lineal, pero
podría existir otro tipo de relación.
 Si 𝑆𝑥𝑦 < 0, hay dependencia inversa o negativa, es decir las variaciones de las
variables tienen sentido opuesto.

La covarianza no es un parámetro acotado, y puede tomar cualquier valor real, por lo que
su magnitud no es importante; lo significativo es el signo que adopte la misma.
∑𝑟𝑖=1(𝑋𝑖 − 𝑥̅) ∗ ∑𝑠𝑗=1(𝑦𝑗 − 𝑦̅) ∗ 𝑛𝑖𝑗
𝑆𝑥𝑦 =
𝑁
2448
𝑆𝑥𝑦 =
120
𝑆𝑥𝑦 = 20,4

Se ha obtenido un valor positivo para la covarianza que corresponde a una dependencia


directa.

3.6.3. CORRELACION
La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad
entre dos variables estadísticas (IMC y concentración de glucosa en sangre).
Se considera que dos variables cuantitativas están correlacionadas cuando los valores de
una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si
tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen
también los de B y viceversa.
La correlación entre dos variables no implica, por sí misma, ninguna relación de
causalidad.
Sea "𝑟" el coeficiente de correlación de Pearson el cual se calcula de la siguiente manera:
𝑆𝑥𝑦
𝑟=
𝑆𝑥 𝑆𝑦

Se observará que el signo del coeficiente de correlación es el mismo que el de la


covarianza y puede deducirse que el valor del mismo está comprendido entre -1 y 1.
 El signo de r es el mismo de la covarianza, luego si r es positivo la dependencia
es directa y si es negativo es inversa.
 Si r se acerca a -1 o a +1, la dependencia es fuerte y por tanto las predicciones que
se realicen a partir de la recta de regresión serán bastante fiables.
 Si r se acerca a 0 la dependencia es débil y por tanto las predicciones que se
realicen a partir de la recta de regresión serán poco fiables.
X Y X*Y X*X Y*Y
26 89 2314 676 7921
30 131 3930 900 17161
27 103 2781 729 10609
24 88 2112 576 7744
28 99 2772 784 9801
25 75 1875 625 5625
24 84 2016 576 7056
31 99 3069 961 9801
26 87 2262 676 7569
24 83 1992 576 6889
26 92 2392 676 8464
20 75 1500 400 5625
24 89 2136 576 7921
26 77 2002 676 5929
27 79 2133 729 6241
28 81 2268 784 6561
23 82 1886 529 6724
30 89 2670 900 7921
25 86 2150 625 7396
24 84 2016 576 7056
29 74 2146 841 5476
28 73 2044 784 5329
30 122 3660 900 14884
27 106 2862 729 11236
21 86 1806 441 7396
23 93 2139 529 8649
25 93 2325 625 8649
28 116 3248 784 13456
18 75 1350 324 5625
20 81 1620 400 6561
22 92 2024 484 8464
23 111 2553 529 12321
29 106 3074 841 11236
18 73 1314 324 5329
24 74 1776 576 5476
29 103 2987 841 10609
26 86 2236 676 7396
27 74 1998 729 5476
30 96 2880 900 9216
23 88 2024 529 7744
30 95 2850 900 9025
33 98 3234 1089 9604
25 112 2800 625 12544
30 106 3180 900 11236
22 121 2662 484 14641
24 87 2088 576 7569
21 91 1911 441 8281
26 88 2288 676 7744
23 96 2208 529 9216
21 77 1617 441 5929
26 96 2496 676 9216
22 84 1848 484 7056
22 73 1606 484 5329
27 86 2322 729 7396
24 79 1896 576 6241
20 76 1520 400 5776
25 93 2325 625 8649
28 104 2912 784 10816
28 113 3164 784 12769
26 91 2366 676 8281
SUMA 1521 5460 139635 39215 507860
𝑆𝑥𝑦 = 20,4
𝑘
1 2 ∑𝑘𝑖=1 𝑋𝑖 2
𝑉(𝑥) = [∑ 𝑋𝑖 − 𝑛( ) ]
𝑛−1 𝑛
𝑖=1

1 1521 2
𝑉(𝑥) = [39215 − 60( ) ]
60 − 1 60
1
𝑉(𝑥) = [39215 − 60(25,35)2 ]
59
1
𝑉(𝑥) = [39215 − 38557,35]
59
1
𝑉(𝑥) = [657,65] = 11,147
59
𝑆𝑥 = √11,147 = 3,34

𝑚
1 ∑𝑚
𝑗=1 𝑦𝑗 2
2
𝑉(𝑦) = [∑ 𝑦𝑗 − 𝑛( ) ]
𝑛−1 𝑛
𝑗=1

1 5460 2
𝑉(𝑦) = [507860 − 60( ) ]
60 − 1 60
1
𝑉(𝑦) = [507860 − 60(91)2 ]
59
1
𝑉(𝑦) = [507860 − 496860]
59
1
𝑉(𝑦) = [11000] = 186,441
59
𝑆𝑦 = √186,441 = 13,65

𝑆𝑥𝑦
𝑟=
𝑆𝑥 𝑆𝑦
20,4
𝑟=
(3,34)(13,65)
𝑟 = 0,447

"⁡𝑟 " se encuentra entre 0 y 0,5 por lo tanto existe una correlación positiva débil.
3.6.4. COEFICIENTE DE DETERMINACION
El coeficiente de determinación es una medida que da un significado más exacto en la
relación entre dos variables.
Se calcula elevando al cuadrado el coeficiente de correlación:
𝑟2
El Coeficiente de determinación es la proporción de la variación total en la variable
dependiente Y (concentración de glucosa en sangre) que es explicada por la variación en
la variable independiente X (IMC).
𝑟 = 0,447
𝑟 2 = 0,2
El 20% de la variación en los niveles de glucosa en sangre es explicado por la variación
en los Índice de Masa Corporal (IMC).

3.6.5. COEFICIENTE DE NO DETERMINACION


El coeficiente de no determinación es la proporción de la variación total en Y
(concentración de glucosa en sangre) que no está explicada por la variación en X(IMC).
Este coeficiente se calcula:
1 − 𝑟2
𝑟 2 = 0,2
1 − 𝑟 2 = 1 − 02 = 0,8
El 80% de la variación total en los niveles de glucosa en sangre no es explicado por la
variación en los Índice de Masa Corporal (IMC).
IV. APENDICE
Nombre Sexo Edad Talla(cm.) Peso(kg.) IMC Glucemia(mg/dl)
P-1 Masculino 31 174 78.8 26 89
P-2 Masculino 36 172 89.4 30 131
P-3 Masculino 29 168 75.7 27 103
P-4 Femenino 27 161 61.2 24 88
P-5 Masculino 28 171 81.5 28 99
P-6 Masculino 33 167 69.9 25 75
P-7 Masculino 43 168 67.3 24 84
P-8 Masculino 52 173 93.4 31 99
P-9 Femenino 42 169 73.2 26 87
P-10 Femenino 34 171 68.7 24 83
P-11 Masculino 24 176 81.4 26 92
P-12 Femenino 37 162 51.3 20 75
P-13 Masculino 32 182 79.3 24 89
P-14 Masculino 27 174 78.3 26 77
P-15 Femenino 43 170 77.9 27 79
P-16 Masculino 26 171 82.5 28 81
P-17 Femenino 23 165 61.4 23 82
P-18 Femenino 22 162 79.3 30 89
P-19 Femenino 31 161 65.8 25 86
P-20 Masculino 27 179 75.3 24 84
P-21 Masculino 51 168 82.4 29 74
P-22 Masculino 38 167 77.1 28 73
P-23 Masculino 42 172 88.9 30 122
P-24 Masculino 45 174 82.3 27 106
P-25 Femenino 34 158 51.4 21 86
P-26 Masculino 25 167 65.3 23 93
P-27 Masculino 43 175 76.2 25 93
P-28 Masculino 43 170 82.2 28 116
P-29 Femenino 34 163 48.9 18 75
P-30 Femenino 33 160 52.2 20 81
P-31 Femenino 47 164 59.1 22 92
P-32 Masculino 54 181 73.9 23 111
P-33 Masculino 23 183 97.4 29 106
P-34 Femenino 34 163 48.2 18 73
P-35 Masculino 29 169 67.3 24 74
P-36 Femenino 50 159 71.2 29 103
P-37 Masculino 29 184 87 26 86
P-38 Masculino 36 173 82.1 27 74
P-39 Femenino 26 174 89.5 30 96
P-40 Masculino 38 186 68.2 23 88
P-41 Masculino 40 178 93.9 30 95
P-42 Masculino 36 173 98.1 33 98
P-43 Femenino 42 171 72.5 25 112
P-44 Masculino 29 167 84.3 30 106
P-45 Femenino 32 161 56.7 22 121
P-46 Masculino 47 169 67.2 24 87
P-47 Femenino 24 160 54.8 21 91
P-48 Masculino 30 164 69.6 26 88
P-49 Masculino 28 168 64.8 23 96
P-50 Femenino 40 159 52.2 21 77
P-51 Femenino 44 163 68.5 26 96
P-52 Masculino 25 171 64.8 22 84
P-53 Femenino 41 161 56.3 22 73
P-54 Masculino 47 179 87.2 27 86
P-55 Masculino 39 172 69.9 24 79
P-56 Femenino 36 173 59.2 20 76
P-57 Masculino 27 173 74.5 25 93
P-58 Masculino 33 167 76.6 28 104
P-59 Masculino 28 174 85.8 28 113
P-60 Femenino 35 159 65.1 26 91

You might also like