You are on page 1of 32

Escuela de Ciencias Administrativas, Contables, Económicas y de Negocios – Universidad

Nacional Abierta y a Distancia.

Nombre de la actividad:

Análisis de la información

Curso:

Estadística descriptiva

Docente:

Milton Fernando Ortegón

Estudiantes:

María Sofía Florián

Farith Cortes

Juan David Medina

Santiago Zapata

24 de julio del 2018

Medellín
Contenido

Introducción

Justificación

Objetivos

Cálculo e interpretación de las medidas univariantes de tendencia central y de dispersión


para la variable discreta.

Cálculo e interpretación de las medidas univariantes de tendencia central y de dispersión


para la variable continua.

Análisis e interpretación de la información obtenida.

Conclusiones

Referencias
INTRODUCCIÓN

JUSTIFICACIÓN

Esta investigación tiene como objetivo principal, analizar distintas variables cualitativas a
cerca de la problemática de los accidentes automovilísticos y cuáles son los principales
factores que influyen en estos, Se ha recopilado información y una base de datos consolidada
a partir de fuentes como lo es la secretaria de tránsito.

En el desarrollo de este trabajo estudiaremos los textos de consulta puestos a disposición por
nuestro tutor. En los cuales buscamos obtener conocimientos básicos referente a la estadística
descriptiva, los temas a tratar son: histograma de frecuencia, polígono de frecuencias,
intervalos, marca de clases, frecuencia absoluta, frecuencia relativa, y estudio y aplicación
de los siguientes conceptos: población, tamaño de nuestra, instrumento de recolección de
información, ubicación espacio temporal de estudio, unidad estática.

Es necesario realizar este trabajo porque la estadística descriptiva ayuda a un razonamiento


analítico de cada uno de los ejercicios puestos en consideración aumentando nuestra
capacidad de análisis y de desarrollo de problemas, de igual manera es necesario este tipo de
ciencia porque con este conocimiento tenemos herramientas para llevar datos estáticos de
diferentes problemáticas o registros que queramos llevar en nuestro futuro como
profesionales integrales.

OBJETIVOS

OBJETIVO GENERAL
Interpretar la problemática del de los accidentes vehiculares ocurridos, utilizando medidas
univariantes de tendencia central y de dispersión para variables discretas y continúas
suministradas en la base de datos de la secretaria de tránsito.

OBJETIVOS ESPECÍFICOS
Para datos no Agrupados:

 Elegir una variable discreta de la base de datos suministrada por la secretaria de tránsito,
que sea representativa.
 Elaborar una tabla de frecuencias.
 Representar gráficamente variable discreta.
 Calcular las medidas de tendencia central para la variable discreta tales como: media,
mediana, moda, los cuartiles, decil 5; percentil 50.
 Interpretar los resultados obtenidos.

Para datos Agrupados:

 Elegir una variable Continua de la base de datos suministrada por la secretaria de tránsito,
que sea representativa.
 Diseñar una tabla de frecuencia para datos
 Representar gráficamente la variable continua con un histograma de frecuencias y un
polígono de frecuencias
 Calcular las medidas de tendencia central, determinar el tipo de asimetría, los cuartiles,
decil 5; percentil 50.
 Interpretar sus resultados obtenidos.

Variable cuantitativa discreta


VELOCIDAD

Tabla de frecuencia para datos no agrupados


NUMERO DE VELOCIDAD VELOCIDAD CATEGORIAS f F h H
ACIDENTE 33 1 1 1 0,01 0,01
1 66 38 2 1 2 0,01 0,02
2 111 40 3 1 3 0,01 0,03
3 66 45 4 1 4 0,01 0,04
4 80 48 5 1 5 0,01 0,05
5 75 50 6 3 8 0,03 0,08
6 66 51 7 1 9 0,01 0,09
7 45 55 8 7 16 0,07 0,16
8 88 60 9 3 19 0,03 0,19
9 55 62 10 1 20 0,01 0,2
10 70 63 11 1 21 0,01 0,21
11 105 65 12 2 23 0,02 0,23
12 88 66 13 6 29 0,06 0,29
13 69 67 14 2 31 0,02 0,31
14 48 68 15 4 35 0,04 0,35
15 70 69 16 6 41 0,06 0,41
16 83 70 17 7 48 0,07 0,48
17 138 71 18 1 49 0,01 0,49
18 68 72 19 2 51 0,02 0,51
19 77 73 20 2 53 0,02 0,53
20 81 74 21 3 56 0,03 0,56
21 50 75 22 5 61 0,05 0,61
22 88 76 23 1 62 0,01 0,62
23 71 77 24 3 65 0,03 0,65
24 55 78 25 2 67 0,02 0,67
25 78 79 26 4 71 0,04 0,71
26 80 80 27 6 77 0,06 0,77
27 68 81 28 2 79 0,02 0,79
28 74 83 29 6 85 0,06 0,85
29 75 85 30 1 86 0,01 0,86
30 83 86 31 1 87 0,01 0,87
31 65 88 32 4 91 0,04 0,91
32 60 95 33 2 93 0,02 0,93
33 83 100 34 1 94 0,01 0,94
34 95 105 35 1 95 0,01 0,95
35 86 108 36 1 96 0,01 0,96
36 68 111 37 1 97 0,01 0,97
37 55 138 38 2 99 0,02 0,99
38 88 150 39 1 100 0,01 1
39 63 TOTAL 100 1
40 70
41 78
42 83
43 138
44 55
45 66
46 108
47 69
48 72
49 74
50 69
51 79
52 65
53 74
54 77
55 51
56 75
57 72
58 77
59 67
60 55
61 40
62 73
63 69
64 70
65 75
66 55
67 69
68 50
69 73
70 38
71 60
72 50
73 100
74 75
75 80
76 95
77 70
78 66
79 69
80 67
81 83
82 70
83 150
84 55
85 66
86 68
87 79
88 79
89 60
90 33
91 85
92 80
93 81
94 62
95 79
96 76
97 80
98 70
99 80
100 83
Tendencia Central
Media 66
Mediana 72
Moda 55
Mínimo 33
Máximo 150
Suma 7371
Cuenta 100

Decil 5 72
Percentil 50 66

Cuartiles
Tamaño de la
población: 100
Primer cuartil (xL): 66
Mediana (xm): 72
Tercer cuartil (xU): 80

 El percentil 50 nos indica que el 50% de los accidentes ocurre con una velocidad
superior a 66 kilómetros por hora.
 Gran parte de los accidentes ocurre en velocidades alrededor de 55 kilómetros por
hora.
 33 kilómetros por hora, aunque puede parecer baja velocidad, puede considerarse
una velocidad ya peligrosa para la ocurrencia de accidentes.

Variable cuantitativa discreta “número de muertos por accidente”

NUMERO DE ACIDENTE NUMERO DE MUERTOS

1 0
2 2
3 1
4 0
5 0
6 2
7 1
8 2
9 0
10 1
11 1
12 3
13 1
14 2
15 1
16 0
17 2
18 1
19 1
20 1
21 0
22 2
23 1
24 3
25 1
26 0
27 1
28 0
29 1
30 2
31 2
32 2
33 1
34 2
35 0
36 2
37 1
38 4
39 0
40 2
41 0
42 2
43 3
44 1
45 0
46 1
47 0
48 1
49 0
50 0
51 1
52 1
53 0
54 1
55 1
56 0
57 0
58 1
59 0
60 1
61 0
62 1
63 0
64 2
65 1
66 1
67 1
68 0
69 0
70 1
71 0
72 2
73 1
74 1
75 0
76 0
77 2
78 0
79 1
80 0
81 1
82 0
83 4
84 2
85 3
86 1
87 0
88 0
89 1
90 2
91 0
92 1
93 2
94 0
95 1
96 2
97 0
98 1
99 0
100 0

Columna1

Media 0,98
Error típico 0,095325069
Mediana 1
Moda 1
Mínimo 0
Máximo 4
Suma 98
Cuenta 100

Cuartil

N 100
Q1 0
Q2 1
Q3 2

Decil
Decil Posición Valor
D1 10 1
D2 20 0,5
D3 30 2
D4 40 1
D5 50 0,5

Percentil

Percentil Posición Valor


P1 1 1
P2 2 1,5
P3 3 0,5
P4 4 0
P5 5 1
P6 6 1,5
P7 7 1,5
P8 8 1
P9 9 0,5
P10 10 1
P11 11 2
P12 12 1,5
P13 13 1,5
P14 14 1,5
P15 15 0,5
P16 16 1
P17 17 1,5
P18 18 1
P19 19 1
P20 20 0,5
P21 21 1
P22 22 1,5
P23 23 2
P24 24 2
P25 25 0,5
P26 26 0,5
P27 27 0,5
P28 28 0,5
P29 29 1,5
P30 30 2
P31 31 2
P32 32 1,5
P33 33 1,5
P34 34 1
P35 35 1
P36 36 1,5
P37 37 2,5
P38 38 2
P39 39 1
P40 40 1
P41 41 1
P42 42 2,5
P43 43 2
P44 44 0,5
P45 45 0,5
P46 46 0,5
P47 47 0,5
P48 48 0,5
P49 49 0
P50 50 0,5
Interpretación de resultados.

 En el estudio realizado por la secretaria de transito se concluye que El 50% de los


accidentes de tránsito ocasionan entre 1 y 2 personas fallecidas y el otro 50% entre
0 y 1 personas fallecidas.

 Teniendo en cuenta los cuartiles solo en un 25% de los accidentes no se registran


pérdidas de vida.

Cálculo e interpretación de las medidas univariantes de tendencia central y de


dispersión para la variable continua.

Variable cuantitativa continua EDAD

NUMERO DE EDAD
ACIDENTE Tabla de frecuencias para datos no agrupados
Frecuencia Frecuencia Frecuencia
Frecuencia absoluta Frecuencia relativa relativa
1 29 Categorías absoluta acumulada relativa acumulada porcentual
2 38 Xi fi Fi hi H hi %
3 52 17 5 5 0,05 0,05 5%
4 46 18 4 9 0,04 0,09 4%
5 21 19 3 12 0,03 0,12 3%
6 18 21 5 17 0,05 0,17 5%
7 54 22 6 23 0,06 0,23 6%
8 33 23 2 25 0,02 0,25 2%
9 52 24 1 26 0,01 0,26 1%
10 38 29 5 31 0,05 0,31 5%
11 46 30 1 32 0,01 0,32 1%
12 29 31 2 34 0,02 0,34 2%
13 17 32 3 37 0,03 0,37 3%
14 22 33 6 43 0,06 0,43 6%
15 55 34 2 45 0,02 0,45 2%
16 60 35 4 49 0,04 0,49 4%
17 33 36 3 52 0,03 0,52 3%
18 32 38 6 58 0,06 0,58 6%
19 46 42 3 61 0,03 0,61 3%
20 55 43 2 63 0,02 0,63 2%
21 19 44 1 64 0,01 0,64 1%
22 21 45 3 67 0,03 0,67 3%
23 42 46 12 79 0,12 0,79 12%
24 46 48 1 80 0,01 0,8 1%
25 36 50 1 81 0,01 0,81 1%
26 35 52 5 86 0,05 0,86 5%
27 43 53 1 87 0,01 0,87 1%
28 32 54 5 92 0,05 0,92 5%
29 24 55 5 97 0,05 0,97 5%
30 44 56 2 99 0,02 0,99 2%
31 31 60 1 100 0,01 1 1%
32 50 100 1 100%
33 30
34 48
35 53
36 35
37 46
38 45
39 32
40 45
41 31
42 33
43 23
44 56
45 18
46 54
47 33
48 52
49 38
50 46
51 29
52 17
53 22
54 54
55 17
56 21
57 46
58 55
59 19
60 21
61 42
62 46
63 36
64 35
65 56
66 22
67 23
68 45
69 43
70 34
71 38
72 18
73 54
74 33
75 52
76 38
77 46
78 29
79 17
80 22
81 34
82 46
83 55
84 19
85 21
86 42
87 46
88 36
89 35
90 55
91 22
92 18
93 54
94 33
95 52
96 38
97 46
98 29
99 17
100 22

Tendencia Central
Media 29
Mediana 36
Moda 46
Mínimo 17
Máximo 60
Suma 3667
Cuenta 100

CUARTIL
Los cuartiles son los tres valores de las
variables que dividen a un conjunto de
𝑘∗𝑁
datos ordenados en cuatro partes Q= = 1,2,3
4
iguales. El 25%, 50% y 75%
Donde K es el número del cuartil 1,2,3; N=100 y Q nos indica la
posición
CUARTIL POSICION VALOR
Q1 25 23,5
Q2 50 36
Q3 75 46
DECIL (5)
Los cuartiles son los nueve valores que
dividen la serie de datos ordenados en 𝑘∗𝑁
diez partes iguales. Correspondientes al D= = 1,2,...9
10
10%, 20%,…, y 90% de los datos.
Donde K es el número del decil 1,2,…, 9; N=100 y Q nos indica
la posición
DECIL POSICION VALOR
D1 10 19
D2 20 22
D3 30 29
D4 40 33
D5 50 36

PERCENTIL (50)
Los cuartiles son los noventa y nueve
valores que dividen la serie de datos
ordenados en cien partes iguales. 𝑘∗𝑁
P= = 1,2,...,99
Correspondientes al 1%, 2%,…, y 99% 100

de los datos.
Donde K es el número del decil 1,2,…, 99; N=100 y Q nos
indica la posición
PERCENTIL
(50) POSICION VALOR
P1 1 17
P2 2 17
P3 3 17
P4 4 17
P5 5 17,5
P6 6 18
P7 7 18
P8 8 18
P9 9 18,5
P10 10 19
P11 11 19
P12 12 20
P13 13 21
P14 14 21
P15 15 21
P16 16 21
P17 17 21,5
P18 18 22
P19 19 22
P20 20 22
P21 21 22
P22 22 22
P23 23 22,5
P24 24 23
P25 25 23,5
P26 26 26,5
P27 27 29
P28 28 29
P29 29 29
P30 30 29
P31 31 29,5
P32 32 30,5
P33 33 31
P34 34 31,5
P35 35 32
P36 36 32
P37 37 32,5
P38 38 33
P39 39 33
P40 40 33
P41 41 33
P42 42 33
P43 43 33,5
P44 44 34
P45 45 34,5
P46 46 35
P47 47 35
P48 48 35
P49 49 35,5
P50 50 36
Histograma de Frecuencias
70

60

50

40

30

20

10

0
13

61
1
4
7
10

16
19
22
25
28
31
34
37
40
43
46
49
52
55
58

64
67
70
73
76
79
82
85
88
91
94
97
100
Interpretación de resultados

 Según los datos recopilados por la secretaría de transportes la edad promedio para la
participación en accidentes de tránsito es de 36 años. Las personas de 46 años
fueron las que más accidentes presentaron, así como que el 50% de las personas
accidentadas tienen una edad comprendida entre los 17 y 36 años.
 A partir del estudio estadístico realizado podemos afirmar que: Según los cuartiles el
25% de los accidentes están en los 17 a los 23,5 años; y el 75% de los accidentes
están entre los 17 a los 46 años y el resto están entre los 46 años hasta los 60 años;
según las edades en las que se presentaron accidentes el año anterior. Como se puede
apreciar en las gráficas el Q2, el D5 y el P50 equivale a la mediana, es decir, el 50%
de las personas accidentadas están entre los 17 a los 36 años.

Variable cuantitativa continua grados de alcohol.

NUMERO DE ACIDENTE GRADOS DE ALCOHOL DEL CONDUCTOR


1 1,2
2 3,0
3 0,0
4 0,6
5 0,0
6 0,0
7 3,0
8 1,4
9 2,1
10 0,0
11 1,6
12 2,2
13 3,0
14 1,1
15 2,4
16 0,6
17 1,6
18 0,0
19 0,0
20 2,1
21 1,4
22 2,6
23 3,0
24 2,7
25 0,6
26 0,0
27 2,9
28 0,6
29 1,8
30 0,0
31 1,1
32 2,4
33 0,6
34 0,0
35 2,9
36 1,3
37 1,4
38 2,1
39 0,8
40 0,0
41 1,2
42 3,0
43 0,0
44 0,6
45 1,9
46 2,7
47 1,1
48 2,4
49 0,6
50 1,6
51 0,0
52 1,4
53 2,1
54 0,8
55 1,1
56 2,4
57 0,0
58 1,6
59 1,2
60 3,0
61 2,7
62 0,6
63 0,0
64 3,0
65 1,1
66 2,4
67 0,0
68 1,6
69 0,0
70 0,8
71 0,3
72 1,1
73 2,4
74 0,6
75 0,0
76 1,2
77 3,0
78 2,7
79 0,6
80 1,9
81 1,1
82 0,0
83 0,6
84 1,6
85 2,1
86 0,8
87 0,5
88 2,7
89 1,1
90 2,4
91 0,6
92 1,6
93 1,4
94 2,1
95 0,0
96 3,0
97 0,0
98 0,6
99 1,9
100 1,4

Diseñar una tabla de frecuencia para datos agrupados a partir del (rango, número de
Intervalos, amplitud), representarla gráficamente por medio de un histograma de
frecuencias, un polígono de frecuencias

calcular las medidas de tendencia central,

Columna1

Media 1,343
Error típico 0,10087751
Mediana 1,2
Moda 0
Desviación estándar 1,00877513
Varianza de la
muestra 1,01762727
-
Curtosis 1,20947727
Coeficiente de
asimetría 0,19005606
Rango 3
Mínimo 0
Máximo 3
Suma 134,3
Cuenta 100

Determinar el tipo de asimetría, los cuartiles, decil 5, percentil 50

Cuartiles

N 100
Q1 0,6
Q2 1,2
Q3 2,175

Deciles

Decil Posición Valor


D1 10 0,8
D2 20 1,75
D3 30 0,55
D4 40 0,6
D5 50 0,8

Percentil

Percentil Posición Valor


P1 1 2,1
P2 2 1,5
P3 3 0,3
P4 4 0,3
P5 5 0
P6 6 1,5
P7 7 2,2
P8 8 1,75
P9 9 1,05
P10 10 0,8
P11 11 1,9
P12 12 2,6
P13 13 2,5
P14 14 1,75
P15 15 1,5
P16 16 1,1
P17 17 0,8
P18 18 0
P19 19 1,05
P20 20 1,75
P21 21 2
P22 22 2,8
P23 23 2,85
P24 24 1,65
P25 25 0,3
P26 26 1,45
P27 27 0,7
P28 28 1,4
P29 29 0,9
P30 30 0,55
P31 31 1,75
P32 32 1,5
P33 33 0,3
P34 34 1,45
P35 35 2,1
P36 36 1,35
P37 37 1,75
P38 38 1,45
P39 39 0,4
P40 40 0,6
P41 41 1,6
P42 42 1,5
P43 43 0,3
P44 44 1,25
P45 45 2,3
P46 46 1,9
P47 47 1,8
P48 48 1,5
P49 49 1,1
P50 50 1,2

Grados de alcohol.
25

20

15

10

0
Poligono de frecuencia para grados de alcohol.
25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11

Tabla de frecuencia para datos no agrupados

Grados de
alcohol f F h H
0,0 20 20 0,20833333 0,20833333
0,3 1 21 0,01041667 0,21875
0,5 1 22 0,01041667 0,22916667
0,6 13 35 0,13541667 0,36458333
0,8 4 39 0,04166667 0,40625
1,1 8 47 0,08333333 0,48958333
1,2 4 51 0,04166667 0,53125
1,3 1 52 0,01041667 0,54166667
1,4 5 57 0,05208333 0,59375
1,6 7 64 0,07291667 0,66666667
1,8 1 65 0,01041667 0,67708333
1,9 3 68 0,03125 0,70833333
2,1 5 73 0,05208333 0,76041667
2,2 0 73 0 0,76041667
2,4 7 80 0,07291667 0,83333333
2,6 1 81 0,01041667 0,84375
2,7 5 86 0,05208333 0,89583333
2,9 2 88 0,02083333 0,91666667
3,0 8 96 0,08333333 1
Total 96 1

Interpretación de resultados

 En el estudio realizado por la secretaria de tránsito se puede observar que desde el


25% de los accidentes se ha manejado en estado de embriaguez, arrojando datos
como que el primer 25% de los accidentados estaban bajo 0,6 grados de alcohol.
 Como se puede observar en las gráficas la mediana, es decir el 50% de los
accidentes estaban bajo 1,2 grados de alcohol.

Análisis e interpretación de la información obtenida.

La secretaria de transito de Medellín realizo un estudio sobre 100 accidentes de tránsito


ocurridos en el año 2017, arrojando los siguientes resultados:

En la edad que se es más propenso en tener un accidente de tránsito es en los 36 y 37 años,


sin embargo, las se evidencia que las personas entre los 46 años son las que más ocasionan
accidentes de tránsito.

Conclusiones

Referencias

You might also like