Professional Documents
Culture Documents
Nombre de la actividad:
Análisis de la información
Curso:
Estadística descriptiva
Docente:
Estudiantes:
Farith Cortes
Santiago Zapata
Medellín
Contenido
Introducción
Justificación
Objetivos
Conclusiones
Referencias
INTRODUCCIÓN
JUSTIFICACIÓN
Esta investigación tiene como objetivo principal, analizar distintas variables cualitativas a
cerca de la problemática de los accidentes automovilísticos y cuáles son los principales
factores que influyen en estos, Se ha recopilado información y una base de datos consolidada
a partir de fuentes como lo es la secretaria de tránsito.
En el desarrollo de este trabajo estudiaremos los textos de consulta puestos a disposición por
nuestro tutor. En los cuales buscamos obtener conocimientos básicos referente a la estadística
descriptiva, los temas a tratar son: histograma de frecuencia, polígono de frecuencias,
intervalos, marca de clases, frecuencia absoluta, frecuencia relativa, y estudio y aplicación
de los siguientes conceptos: población, tamaño de nuestra, instrumento de recolección de
información, ubicación espacio temporal de estudio, unidad estática.
OBJETIVOS
OBJETIVO GENERAL
Interpretar la problemática del de los accidentes vehiculares ocurridos, utilizando medidas
univariantes de tendencia central y de dispersión para variables discretas y continúas
suministradas en la base de datos de la secretaria de tránsito.
OBJETIVOS ESPECÍFICOS
Para datos no Agrupados:
Elegir una variable discreta de la base de datos suministrada por la secretaria de tránsito,
que sea representativa.
Elaborar una tabla de frecuencias.
Representar gráficamente variable discreta.
Calcular las medidas de tendencia central para la variable discreta tales como: media,
mediana, moda, los cuartiles, decil 5; percentil 50.
Interpretar los resultados obtenidos.
Elegir una variable Continua de la base de datos suministrada por la secretaria de tránsito,
que sea representativa.
Diseñar una tabla de frecuencia para datos
Representar gráficamente la variable continua con un histograma de frecuencias y un
polígono de frecuencias
Calcular las medidas de tendencia central, determinar el tipo de asimetría, los cuartiles,
decil 5; percentil 50.
Interpretar sus resultados obtenidos.
Decil 5 72
Percentil 50 66
Cuartiles
Tamaño de la
población: 100
Primer cuartil (xL): 66
Mediana (xm): 72
Tercer cuartil (xU): 80
El percentil 50 nos indica que el 50% de los accidentes ocurre con una velocidad
superior a 66 kilómetros por hora.
Gran parte de los accidentes ocurre en velocidades alrededor de 55 kilómetros por
hora.
33 kilómetros por hora, aunque puede parecer baja velocidad, puede considerarse
una velocidad ya peligrosa para la ocurrencia de accidentes.
1 0
2 2
3 1
4 0
5 0
6 2
7 1
8 2
9 0
10 1
11 1
12 3
13 1
14 2
15 1
16 0
17 2
18 1
19 1
20 1
21 0
22 2
23 1
24 3
25 1
26 0
27 1
28 0
29 1
30 2
31 2
32 2
33 1
34 2
35 0
36 2
37 1
38 4
39 0
40 2
41 0
42 2
43 3
44 1
45 0
46 1
47 0
48 1
49 0
50 0
51 1
52 1
53 0
54 1
55 1
56 0
57 0
58 1
59 0
60 1
61 0
62 1
63 0
64 2
65 1
66 1
67 1
68 0
69 0
70 1
71 0
72 2
73 1
74 1
75 0
76 0
77 2
78 0
79 1
80 0
81 1
82 0
83 4
84 2
85 3
86 1
87 0
88 0
89 1
90 2
91 0
92 1
93 2
94 0
95 1
96 2
97 0
98 1
99 0
100 0
Columna1
Media 0,98
Error típico 0,095325069
Mediana 1
Moda 1
Mínimo 0
Máximo 4
Suma 98
Cuenta 100
Cuartil
N 100
Q1 0
Q2 1
Q3 2
Decil
Decil Posición Valor
D1 10 1
D2 20 0,5
D3 30 2
D4 40 1
D5 50 0,5
Percentil
NUMERO DE EDAD
ACIDENTE Tabla de frecuencias para datos no agrupados
Frecuencia Frecuencia Frecuencia
Frecuencia absoluta Frecuencia relativa relativa
1 29 Categorías absoluta acumulada relativa acumulada porcentual
2 38 Xi fi Fi hi H hi %
3 52 17 5 5 0,05 0,05 5%
4 46 18 4 9 0,04 0,09 4%
5 21 19 3 12 0,03 0,12 3%
6 18 21 5 17 0,05 0,17 5%
7 54 22 6 23 0,06 0,23 6%
8 33 23 2 25 0,02 0,25 2%
9 52 24 1 26 0,01 0,26 1%
10 38 29 5 31 0,05 0,31 5%
11 46 30 1 32 0,01 0,32 1%
12 29 31 2 34 0,02 0,34 2%
13 17 32 3 37 0,03 0,37 3%
14 22 33 6 43 0,06 0,43 6%
15 55 34 2 45 0,02 0,45 2%
16 60 35 4 49 0,04 0,49 4%
17 33 36 3 52 0,03 0,52 3%
18 32 38 6 58 0,06 0,58 6%
19 46 42 3 61 0,03 0,61 3%
20 55 43 2 63 0,02 0,63 2%
21 19 44 1 64 0,01 0,64 1%
22 21 45 3 67 0,03 0,67 3%
23 42 46 12 79 0,12 0,79 12%
24 46 48 1 80 0,01 0,8 1%
25 36 50 1 81 0,01 0,81 1%
26 35 52 5 86 0,05 0,86 5%
27 43 53 1 87 0,01 0,87 1%
28 32 54 5 92 0,05 0,92 5%
29 24 55 5 97 0,05 0,97 5%
30 44 56 2 99 0,02 0,99 2%
31 31 60 1 100 0,01 1 1%
32 50 100 1 100%
33 30
34 48
35 53
36 35
37 46
38 45
39 32
40 45
41 31
42 33
43 23
44 56
45 18
46 54
47 33
48 52
49 38
50 46
51 29
52 17
53 22
54 54
55 17
56 21
57 46
58 55
59 19
60 21
61 42
62 46
63 36
64 35
65 56
66 22
67 23
68 45
69 43
70 34
71 38
72 18
73 54
74 33
75 52
76 38
77 46
78 29
79 17
80 22
81 34
82 46
83 55
84 19
85 21
86 42
87 46
88 36
89 35
90 55
91 22
92 18
93 54
94 33
95 52
96 38
97 46
98 29
99 17
100 22
Tendencia Central
Media 29
Mediana 36
Moda 46
Mínimo 17
Máximo 60
Suma 3667
Cuenta 100
CUARTIL
Los cuartiles son los tres valores de las
variables que dividen a un conjunto de
𝑘∗𝑁
datos ordenados en cuatro partes Q= = 1,2,3
4
iguales. El 25%, 50% y 75%
Donde K es el número del cuartil 1,2,3; N=100 y Q nos indica la
posición
CUARTIL POSICION VALOR
Q1 25 23,5
Q2 50 36
Q3 75 46
DECIL (5)
Los cuartiles son los nueve valores que
dividen la serie de datos ordenados en 𝑘∗𝑁
diez partes iguales. Correspondientes al D= = 1,2,...9
10
10%, 20%,…, y 90% de los datos.
Donde K es el número del decil 1,2,…, 9; N=100 y Q nos indica
la posición
DECIL POSICION VALOR
D1 10 19
D2 20 22
D3 30 29
D4 40 33
D5 50 36
PERCENTIL (50)
Los cuartiles son los noventa y nueve
valores que dividen la serie de datos
ordenados en cien partes iguales. 𝑘∗𝑁
P= = 1,2,...,99
Correspondientes al 1%, 2%,…, y 99% 100
de los datos.
Donde K es el número del decil 1,2,…, 99; N=100 y Q nos
indica la posición
PERCENTIL
(50) POSICION VALOR
P1 1 17
P2 2 17
P3 3 17
P4 4 17
P5 5 17,5
P6 6 18
P7 7 18
P8 8 18
P9 9 18,5
P10 10 19
P11 11 19
P12 12 20
P13 13 21
P14 14 21
P15 15 21
P16 16 21
P17 17 21,5
P18 18 22
P19 19 22
P20 20 22
P21 21 22
P22 22 22
P23 23 22,5
P24 24 23
P25 25 23,5
P26 26 26,5
P27 27 29
P28 28 29
P29 29 29
P30 30 29
P31 31 29,5
P32 32 30,5
P33 33 31
P34 34 31,5
P35 35 32
P36 36 32
P37 37 32,5
P38 38 33
P39 39 33
P40 40 33
P41 41 33
P42 42 33
P43 43 33,5
P44 44 34
P45 45 34,5
P46 46 35
P47 47 35
P48 48 35
P49 49 35,5
P50 50 36
Histograma de Frecuencias
70
60
50
40
30
20
10
0
13
61
1
4
7
10
16
19
22
25
28
31
34
37
40
43
46
49
52
55
58
64
67
70
73
76
79
82
85
88
91
94
97
100
Interpretación de resultados
Según los datos recopilados por la secretaría de transportes la edad promedio para la
participación en accidentes de tránsito es de 36 años. Las personas de 46 años
fueron las que más accidentes presentaron, así como que el 50% de las personas
accidentadas tienen una edad comprendida entre los 17 y 36 años.
A partir del estudio estadístico realizado podemos afirmar que: Según los cuartiles el
25% de los accidentes están en los 17 a los 23,5 años; y el 75% de los accidentes
están entre los 17 a los 46 años y el resto están entre los 46 años hasta los 60 años;
según las edades en las que se presentaron accidentes el año anterior. Como se puede
apreciar en las gráficas el Q2, el D5 y el P50 equivale a la mediana, es decir, el 50%
de las personas accidentadas están entre los 17 a los 36 años.
Diseñar una tabla de frecuencia para datos agrupados a partir del (rango, número de
Intervalos, amplitud), representarla gráficamente por medio de un histograma de
frecuencias, un polígono de frecuencias
Columna1
Media 1,343
Error típico 0,10087751
Mediana 1,2
Moda 0
Desviación estándar 1,00877513
Varianza de la
muestra 1,01762727
-
Curtosis 1,20947727
Coeficiente de
asimetría 0,19005606
Rango 3
Mínimo 0
Máximo 3
Suma 134,3
Cuenta 100
Cuartiles
N 100
Q1 0,6
Q2 1,2
Q3 2,175
Deciles
Percentil
Grados de alcohol.
25
20
15
10
0
Poligono de frecuencia para grados de alcohol.
25
20
15
10
0
1 2 3 4 5 6 7 8 9 10 11
Grados de
alcohol f F h H
0,0 20 20 0,20833333 0,20833333
0,3 1 21 0,01041667 0,21875
0,5 1 22 0,01041667 0,22916667
0,6 13 35 0,13541667 0,36458333
0,8 4 39 0,04166667 0,40625
1,1 8 47 0,08333333 0,48958333
1,2 4 51 0,04166667 0,53125
1,3 1 52 0,01041667 0,54166667
1,4 5 57 0,05208333 0,59375
1,6 7 64 0,07291667 0,66666667
1,8 1 65 0,01041667 0,67708333
1,9 3 68 0,03125 0,70833333
2,1 5 73 0,05208333 0,76041667
2,2 0 73 0 0,76041667
2,4 7 80 0,07291667 0,83333333
2,6 1 81 0,01041667 0,84375
2,7 5 86 0,05208333 0,89583333
2,9 2 88 0,02083333 0,91666667
3,0 8 96 0,08333333 1
Total 96 1
Interpretación de resultados
Conclusiones
Referencias