Professional Documents
Culture Documents
TRABAJO DE INVESTIGACION
ASIGNATURA: ESTADISTICA Y PROBABILIDADES
DOCENTE: ING. WILLIAM LEON VELASQUEZ
ALUMNO CODIGO
Cárdenas Marroquín, Joe Manuel 16170301
Carrasco Suriqchaqui, Billy Joel 15170260
Chileno Aquino, Marcos Enrique 16170280
Norabuena Torre, Florián Noel 12170034
Sánchez Llasaca, Angelo Rafael 15170289
I. PLANTEAMIENTO DEL PROBLEMA
La diabetes es una enfermedad en la que los niveles de glucosa en la sangre están muy
elevados. La insulina es una hormona encargada de mantener los niveles de glucosa en
sangre dentro de un rango y de su conversión en glucógeno para su almacenamiento en
el hígado y músculos. En la diabetes tipo 1, el cuerpo no produce insulina. En la diabetes
tipo 2, la más común, el cuerpo no produce o no usa la insulina de manera adecuada.
Con el tiempo, el exceso de glucosa en la sangre puede causar problemas serios. Puede
dañar los ojos, los riñones y los nervios. La diabetes también puede causar enfermedades
cardíacas, derrames cerebrales y la necesidad de amputar un miembro.
La diabetes mellitus tipo 2 es una enfermedad que por sus síntomas, complicaciones o
tratamiento puede repercutir en la capacidad de la persona para realizar algunas tareas del
puesto de trabajo, por lo que aun siendo una enfermedad común puede originar daño
laboral como factor co-causal de un accidente laboral o de una enfermedad relacionada
con el trabajo.
Algunos de los riesgos de la accidentalidad laboral asociados con la diabetes o su
tratamiento incluyen:
Mareo
Perdida de consciencia
Alteraciones de la visión
Dificultad para el movimiento
Temblor
Reducción de la coordinación motora
Alteración del estado de animo
Aumento del tiempo de reacción
Reducción de la atención
Alteraciones del sueño
La diabetes tipo 2 constituye un síndrome de amplia repercusión laboral, bien como
condicionante de limitaciones en la aptitud laboral del trabajador afectado, o como factor
de riesgo específico de accidentes laborales traumáticos y daño laboral no traumático.
Este efecto de potencial incremento de siniestralidad guarda relación con las limitaciones
de la enfermedad y sus complicaciones, y con las polimedicaciones a las que el trabajador
diabético ha de someterse.
II. CUADRO
PRESENTACION DE LOS DATOS
A continuación, se muestran los datos recopilados correspondientes a las concentraciones
de glucosa en sangre (mg/dL) de cada uno de los trabajadores del área de producción de
la empresa papelera “ATLAS”, los cuales fueron obtenidos en ayunas.
89 131 103 88 99 75 84 99 87 83
92 75 89 77 79 81 82 89 86 84
74 73 122 106 86 93 93 116 75 81
92 111 106 73 74 103 86 74 96 88
95 98 112 106 121 87 91 88 96 77
96 84 73 86 79 76 93 104 113 91
III. DESARROLLO
3.1.GENERAL
3.1.1.2.CONSTRUCCION
𝐴 = 𝐿𝑅𝑠 − 𝐿𝑅𝑖
9 = 𝐿𝑅𝑠 − 𝐿𝑅𝑖
Es el valor que tomaría cada uno de los datos si el total de los valores se repartiera
uniformemente entre el número de ellos.
∑𝑘𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
𝑥̅ =
𝑛
77,5(16) + 17(86,5) + 95,5(14) + 104,5(6) + 113,5(4) + 122,5(2) + 131,5(1)
𝑥̅ =
60
5505
𝑥̅ = = 91,75 ≅ 92
60
En promedio los trabajadores tienen una concentración de glucosa en sangre de 92 mg/dL.
3.1.3.1.2. MEDIANA (𝑀𝑒)
Es el valor que divide al total de las observaciones, ordenadas en forma ascendente o
descendente en dos partes de igual tamaño.
Li Ls Xi fi Fi
73 82 77,5 16 16
82 91 86,5 17 33 clase mediana
91 100 95,5 14 47
100 109 104,5 6 53
109 118 113,5 4 57
118 127 122,5 2 59
127 136 131,5 1 60
𝑛
− 𝐹𝑗−1
𝑀𝑒 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [2 ]
𝑓𝑗
30 − 16
𝑀𝑒 = 82 + (91 − 82) [ ]
17
𝑀𝑒 = 82 + (9)(0,82)
𝑀𝑒 = 89,412 ≈ 89
El 50% de los trabajadores tiene una concentración de glucosa en sangre por debajo de
89 mg/dL, el 50% restante tiene una concentración superior o igual a 89 mg/dL.
Li Ls Xi fi
73 82 77,5 16
82 91 86,5 17 clase modal
91 100 95,5 14
100 109 104,5 6
109 118 113,5 4
118 127 122,5 2
127 136 131,5 1
(𝑓𝑗 − 𝑓𝑗−1 )
𝑀𝑜 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [ ]
(𝑓𝑗 − 𝑓𝑗−1 ) + (𝑓𝑗 − 𝑓𝑗+1 )
(17 − 16)
𝑀𝑜 = 82 + (91 − 82) [ ]
(17 − 16) + (17 − 14)
𝑀𝑜 = 82 + (9)(0,25)
𝑀𝑜 = 84,25 ≈ 84
3.1.3.2.MEDIDAS DE DISPERSION
3.1.3.2.1. MEDIDAS DE DISPERSION ABSOLUTAS
Cuantifican el grado de concentración o de dispersión de los valores de la variable en
torno de un promedio de la distribución.
A. RANGO O RECORRIDO (𝑅)
Es la diferencia entre los valores máximo y mínimo de los datos.
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 131 − 73 = 58
B. VARIANZA (𝑆 2 )
Es un valor numérico que cuantifica el grado de dispersión de los valores de una variable
respecto a su media aritmética.
Li Ls Xi fi Xi*fi Xi*Xi*fi
73 82 77,5 16 1240 96100
82 91 86,5 17 1470,5 127198,25
91 100 95,5 14 1337 127683,5
100 109 104,5 6 627 65521,5
109 118 113,5 4 454 51529
118 127 122,5 2 245 30012,5
127 136 131,5 1 131,5 17292,25
60 5505 515337
2
2
∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖2 ∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖
𝑆 = −( )
𝑛 𝑛
2
515337 5505 2
𝑆 = −( )
60 60
𝑆 2 = 8588,95 − (91,75)2
𝑆 2 = 8588,95 − 8418,0625
𝑆 2 = 170,8875 ≈ 171
S = √170,8875
S = 13,072 ≈ 13
𝑆
CV = 𝑥100%
𝑋̅
13,072
CV = 𝑥100%
91,75
CV = 14,274%
La variabilidad relativa a la media es baja, ya que el coeficiente de variación (14,274%)
se encuentra comprendido en el intervalo <0;20].
3.1.3.3.MEDIDAS DE FORMA
Son medidas que recorren dos aspectos de la población:
su asimetría, alrededor de una medida de tendencia central
su curtosis o grado de apuntamiento de la distribución.
𝑋̅ − 𝑀𝑜
𝑆𝐾 =
𝑆
91,75 − 84,25
𝑆𝐾 =
13,072
𝑆𝐾 = 0,574
Sk>0, el sesgo es positivo. Significa, además, que la diferencia entre la media y la moda
equivale a 0,574 veces la desviación estándar.
3.1.3.3.2. CURTOSIS O APUNTAMIENTO
Mide el grado de elevación o de agudeza de una distribución comparada con la curva
normal.
Según su grado de curtosis, una distribución puede ser:
a) Platicúrtica o achatada, en la medida en que los diferentes tramos de la variable
presenten frecuencias muy similares en todo su recorrido, entonces podemos
afirmar que existe poca curtosis o concentración de los datos. Esta situación
contribuye a que la dispersión sea alta (𝐴4 - 3 < 0)
b) Leptocúrtica o apuntada, si existe una cantidad muy significativa de datos que se
encuentran concentrados en algún tramo de la variable, entonces decimos que la
distribución es altamente concentrada o que tiene alta curtosis (𝐴4 - 3 > 0)
c) Mesocúrtica o moderada, si la concentración es intermedia entre las dos
situaciones anteriores. Una distribución con esta característica es propia de la
distribución normal (𝐴4 - 3 = 0)
𝐴4 − 3 > 0
3,432 − 3 > 0
0,432 > 0
3.1.3.4.MEDIDAS DE POSICION
3.1.3.4.1. CALCULO DE PORCENTAJE DE VALORES
Muchas veces necesitamos conocer el porcentaje de valores que está por debajo o por
encima de un valor dado.
Esto es, dado un cierto valor en la abscisa determinar en la ordenada el tanto por ciento
de valores inferiores y superiores al valor dado.
Ejemplo: La tabla muestra una distribución de concentraciones de glucosa en sangre y
las correspondientes cantidades de trabajadores, determinar qué porcentaje de personas
tienen concentraciones de glucosa en sangre por debajo de 100 mg/dL y por encima de
125 mg/dL
Li Ls Xi fi Fi
73 82 77,5 16 16
82 91 86,5 17 33
91 100 95,5 14 47
100 109 104,5 6 53
109 118 113,5 4 57
118 127 122,5 2 59
127 136 131,5 1 60
El 78,3% de los trabajadores tienen una concentración de glucosa en sangre inferior a 100
mg/dL.
El 2,4% de los trabajadores tienen una concentración de glucosa en sangre igual o por
encima de 125 mg/dL
3.2.VARONES
3.2.1. TABLA UNIDIMENSIONAL DE DISTRIBUCION DE FRECUENCIAS
Determinar el número de elementos de la muestra
𝑛 = 37
Hallar el valor máximo
𝑉𝑚𝑎𝑥 = 131
Hallar el valor mínimo
𝑉𝑚𝑖𝑛 = 73
Calcular el Rango
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 131 − 73
𝑅 = 58
Calcular en número de intervalos (k)
𝑘 ≥ 1 + 3.3 ∗ log(𝑛)
𝑘 ≥ 1 + 3.3 ∗ log(37)
𝑘 ≥ 6,175
𝑘≅7
Hallamos la Amplitud de cada intervalo (A)
R
𝐴=
𝑘
58
𝐴=
7
𝐴 = 8,29 ≅ 9
Li Ls Xi fi Fi hi Hi hi% Hi%
73 82 77,5 8 8 0,2162 0,2162 21,622 21,622
82 91 86,5 10 18 0,2703 0,4865 27,027 48,649
91 100 95,5 9 27 0,2432 0,7297 24,324 72,973
100 109 104,5 5 32 0,1351 0,8649 13,514 86,486
109 118 113,5 3 35 0,0811 0,9459 8,108 94,595
118 127 122,5 1 36 0,0270 0,9730 2,703 97,297
127 136 131,5 1 37 0,0270 1 2,703 100
37 1 100,00
3.2.2. MEDIDAS DESCRIPTIVAS
Li Ls Xi fi Fi
73 82 77,5 8 8
82 91 86,5 10 18
91 100 95,5 9 27 clase mediana
100 109 104,5 5 32
109 118 113,5 3 35
118 127 122,5 1 36
127 136 131,5 1 37
37
𝑛
− 𝐹𝑗−1
𝑀𝑒 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [2 ]
𝑓𝑗
37
− 18
𝑀𝑒 = 91 + (100 − 91) [ 2 ]
9
𝑀𝑒 = 91 + 0,5
𝑀𝑒 = 91,5 ≈ 92
El 50% de los trabajadores varones tiene una concentración de glucosa en sangre por
debajo de 92 mg/dL, el 50% restante tiene una concentración superior o igual a 92 mg/dL.
3.2.2.1.3. MODA (𝑀𝑜)
Li Ls Xi fi
73 82 77,5 8
82 91 86,5 10 clase modal
91 100 95,5 9
100 109 104,5 5
109 118 113,5 3
118 127 122,5 1
127 136 131,5 1
37
(𝑓𝑗 − 𝑓𝑗−1 )
𝑀𝑜 = 𝐿𝑅𝐼𝑗 + 𝐴𝑗 [ ]
(𝑓𝑗 − 𝑓𝑗−1 ) + (𝑓𝑗 − 𝑓𝑗+1 )
(10 − 8)
𝑀𝑜 = 82 + (91 − 82) [ ]
(10 − 8) + (10 − 9)
𝑀𝑜 = 82 + 6 = 88
La mayoría de los trabajadores varones tiene una concentración de glucosa en sangre de
aproximadamente 88 mg/dL.
3.2.2.2.MEDIDAS DE DISPERSION
3.2.2.2.1. MEDIDAS DE DISPERSION ABSOLUTAS
A. RANGO O RECORRIDO (𝑅)
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 131 − 73
𝑅 = 58
B. VARIANZA (𝑆 2 )
Li Ls Xi fi Xi*fi Xi*Xi*fi
73 82 77,5 8 620 48050
82 91 86,5 10 865 74822,5
91 100 95,5 9 859,5 82082,25
100 109 104,5 5 522,5 54601,25
109 118 113,5 3 340,5 38646,75
118 127 122,5 1 122,5 15006,25
127 136 131,5 1 131,5 17292,25
37 3461,5 330501,25
2
2
∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖2 ∑𝑘𝑖=1 𝑓𝑖 ∗ 𝑋𝑖
𝑆 = −( )
𝑛 𝑛
2
330501,25 3461,5 2
𝑆 = −( )
37 37
𝑆 2 = 8932,466 − (93,554)2
𝑆 2 = 180,105 ≈ 180
En promedio las concentraciones de glucosa en sangre de los trabajadores varones se
alejan con respecto a su promedio aritmético en aproximadamente 180 mg/dL al
cuadrado.
S = √180,105
S = 13,42 ≈ 13
En promedio las concentraciones de glucosa en sangre de los trabajadores varones se
alejan con respecto al promedio aproximadamente 13 mg/dL.
Nombre Glucemia(mg/dl)
P-4 88
P-9 87
P-10 83
P-12 75
P-15 79
P-17 82
P-18 89
P-19 86
P-25 86
P-29 75
P-30 81
P-31 92
P-34 73
P-36 103
P-39 96
P-43 112
P-45 121
P-47 91
P-50 77
P-51 96
P-53 73
P-56 76
P-60 91
3.3.1. TABLA UNIDIMENSIONAL DE DISTRIBUCION DE FRECUENCIAS
23
−8
𝑀𝑒 = 82 + (91 − 82) [ 2 ]
7
𝑀𝑒 = 82 + 4,5
𝑀𝑒 = 86,5 ≈ 87
3.3.2.1.3. MODA (Mo)
Mo=75
3.3.2.2.MEDIDAS DE DISPERSION
3.3.2.2.1. MEDIDAS DE DISPERSION ABSOLUTAS
A. RANGO O RECORRIDO (𝑅)
𝑅 = 𝑉𝑚𝑎𝑥 − 𝑉𝑚𝑖𝑛
𝑅 = 121 − 73
𝑅 = 48
B. VARIANZA (𝑆 2 )
Li Ls Xi fi Xi*fi Xi*Xi*fi
73 82 77,5 8 620 48050
82 91 86,5 7 605,5 52375,75
91 100 95,5 5 477,5 45601,25
100 109 104,5 1 104,5 10920,25
109 118 113,5 1 113,5 12882,25
118 127 122,5 1 122,5 15006,25
23 2043,5 184835,75
𝑘
2
1 ∑𝑘𝑖=1 𝑋𝑖 ∗ 𝑓𝑖 2
𝑆 = [∑ 𝑓𝑖 ∗ 𝑋𝑖 2 − 𝑛( ) ]
𝑛−1 𝑛
𝑖=1
1 2043,5 2
𝑆2 = [184835,75 − 23( ) ]
23 − 1 23
1
𝑆2 = [184835,75 − 23(88,848)2 ]
22
1
𝑆2 = [184835,75 − 181561,24]
22
1
𝑆2 = [3274,51]
22
𝑆 2 = 148,84 ≈ 149
S = √148,84
S = 12,2 ≈ 12
3.4.CUADRO COMPARATIVO
HOMBRES MUJERES
Mx 93,55 88,85
Me 91,5 86,5
Mo 88 75
R 58 48
Vx 180,11 148,87
S 13,42 12,2
CV 14,35% 13,73%
3.5.DIAGRAMA DE CAJAS MULTIPLES
3.6.DISTRIBUCIONES BIDIMENSIONALES
Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo
dos variables de cada elemento de la población. En este caso estudiaremos los Índices de
Masa Corporal (IMC) y las concentraciones de glucosa en sangre (mg/dL) de cada
trabajador.
3.6.1. TABLA BIDIMENSIONAL
3.6.2. COVARIANZA (𝑆𝑥𝑦 )
La covarianza no es un parámetro acotado, y puede tomar cualquier valor real, por lo que
su magnitud no es importante; lo significativo es el signo que adopte la misma.
∑𝑟𝑖=1(𝑋𝑖 − 𝑥̅) ∗ ∑𝑠𝑗=1(𝑦𝑗 − 𝑦̅) ∗ 𝑛𝑖𝑗
𝑆𝑥𝑦 =
𝑁
2448
𝑆𝑥𝑦 =
120
𝑆𝑥𝑦 = 20,4
3.6.3. CORRELACION
La correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad
entre dos variables estadísticas (IMC y concentración de glucosa en sangre).
Se considera que dos variables cuantitativas están correlacionadas cuando los valores de
una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si
tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen
también los de B y viceversa.
La correlación entre dos variables no implica, por sí misma, ninguna relación de
causalidad.
Sea "𝑟" el coeficiente de correlación de Pearson el cual se calcula de la siguiente manera:
𝑆𝑥𝑦
𝑟=
𝑆𝑥 𝑆𝑦
1 1521 2
𝑉(𝑥) = [39215 − 60( ) ]
60 − 1 60
1
𝑉(𝑥) = [39215 − 60(25,35)2 ]
59
1
𝑉(𝑥) = [39215 − 38557,35]
59
1
𝑉(𝑥) = [657,65] = 11,147
59
𝑆𝑥 = √11,147 = 3,34
𝑚
1 ∑𝑚
𝑗=1 𝑦𝑗 2
2
𝑉(𝑦) = [∑ 𝑦𝑗 − 𝑛( ) ]
𝑛−1 𝑛
𝑗=1
1 5460 2
𝑉(𝑦) = [507860 − 60( ) ]
60 − 1 60
1
𝑉(𝑦) = [507860 − 60(91)2 ]
59
1
𝑉(𝑦) = [507860 − 496860]
59
1
𝑉(𝑦) = [11000] = 186,441
59
𝑆𝑦 = √186,441 = 13,65
𝑆𝑥𝑦
𝑟=
𝑆𝑥 𝑆𝑦
20,4
𝑟=
(3,34)(13,65)
𝑟 = 0,447
"𝑟 " se encuentra entre 0 y 0,5 por lo tanto existe una correlación positiva débil.
3.6.4. COEFICIENTE DE DETERMINACION
El coeficiente de determinación es una medida que da un significado más exacto en la
relación entre dos variables.
Se calcula elevando al cuadrado el coeficiente de correlación:
𝑟2
El Coeficiente de determinación es la proporción de la variación total en la variable
dependiente Y (concentración de glucosa en sangre) que es explicada por la variación en
la variable independiente X (IMC).
𝑟 = 0,447
𝑟 2 = 0,2
El 20% de la variación en los niveles de glucosa en sangre es explicado por la variación
en los Índice de Masa Corporal (IMC).