You are on page 1of 16

Trabajo colaborativo

Presentado por:

c.c

sepresentado a :

Institución universitaria politécnico gramcolombiano

Administración de empresas

Estadística ll

2018
Introducción

El siguiente trabajo colaborativo pretende dar respuesta general hacia los temas
vistos en los módulos de estadística ll, como una forma de comprensión y
conocimiento de diferentes conceptos sobre identificación de población, muestra y
variable, hallazgo de las medidas de tendencia central, análisis de datos y
resultados presentes en gráficas, histogramas y los polígonos de frecuencia, dando
como resultado respuesta a variadas investigaciones obteniendo datos y analizar la
información presentada en Excel para dar un fácil acceso, con el terminación de una
correcta interpretación de resultados.

Se realiza con el fin que los estudiantes entiendan de diferentes maneras el análisis
de los datos y variables de acuerdo a la teoría suministrada en el transcurso del
periodo académico de estadística ll, permitiendo extraer datos numéricos de
encuestas para resolver los problemas propuestos por los profesores.
Objetivos

 Desarrollar capacidades para diseñar y analizar los problemas expuestos


por el tutor
 Verificar cada desarrollo conceptual y procedimentales acerca de la
fundamentación estadística ll, por medio de un trabajo investigativo y
practico utilizando el paquete de Microsoft Word y Excel
 Dar respuesta a las relaciones variables continuas mediante métodos de
estadística ll
 Desarrollar métodos para el mostrar los resultados estadísticos validos de
datos de una población “descripciones”
Actividad semana 3

Contexto
A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares
(GEIH), realizada por el DANE[1]. Esta encuesta se hace en las 13 ciudades
principales del Colombia (Bogotá, Medellín, Cali, barranquilla, Bucaramanga,
Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11
ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva,
Riohacha, Santa Marta, Armenia, Sincelejo, San Andrés). Esta encuesta, se solicita
información sobre las condiciones de empleo de las personas (si trabajan, en qué
trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando
empleo), además de las características generales de la población como sexo, edad,
estado civil y nivel educativo, se pregunta sobre sus fuentes de ingresos. La GEIH
proporciona al país información a nivel nacional, cabecera - resto, regional,
departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información


sobre las características generales de las personas que respondieron en un mes en
particular. Para este trabajo colaborativo, realice lo siguiente:

(semana 3) Selección de muestra


En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos
los elementos de una población), se selecciona una muestra, entendiendo por tal
una parte representativa de la población. En ese sentido, escoja un tipo de muestreo
y argumente la viabilidad de esta técnica para la base de datos dada. Úselo como
herramienta para elegir una muestra representativa.

Solución

Tamaño de muestra: se utiliza la variable de edad (P6040) se realiza el siguiente


procedimiento.

 Un histograma y describí la información según la forma y curtosis de los


datos propuestos en Excel por el profesor, realizamos una descripción
numérica y descripción como es la población.
 Se tiene en cuanta la variable anterior mencionada se procede a realizar el
cálculo del tamaño de muestra, utilizando la formula.
𝑛0
𝑛= 𝑛
1+ 0
𝑁

n Z2 S2
0=
δ2

Concepto Respuesta
Z Es el cantil de la distribución normal
estándar al nivel de significancia que se
establezca
S Desviación estándar de la variable
𝛿 Margen de error absoluto
Resultado Se calcula el tamaño de la muestra , se
utiliza un nivel de confianza del 95 % y
un margen de error de absoluto que no
supere el 0.5 %
DATOS:
P6040
“edad” CLASES
44 0
33 1
0 2
52 3
49 4
29 5
27 6
17 7
8 8
37 9
33 10
9 11
8 12
46 13
27 14
9 15
21 16
36 17
8 18
0 19
45 20
45 21
18 22
8 23
25 24
63 25
33 26
26 27
82 28
36 29
36 30
11 31
9 32
32 33
13 34
11 35
62 36
28 37
37 38
3 39
53 40
55 41
16 42
14 43
24 44
5 45
4 46
55 47
28 48
11 49
24 50
6 51
4 52
45 53
39 54
20 55
9 56
37 57
59 58
37 59
17 60
56 61
54 62
86 63
50 64
40 65
13 66
19 67
1 68
41 69
69 70
80 71
84 72
59 73
22 74
93 75
53 76
61 77
46 78
21 79
70 80
66 81
40 82
27 83
11 84
8 85
7 86
82 87
73 88
18 89
2 90
21 91
6 92
4 93
52 94
22 95
47 96
54 97
54 98
22 99
46 100
11 101

HISTOGRAMA:
Histograma DATOS P6040
1400
1200
1000
Frecuencia

800
600
400 Frecuencia

200
0

100
0
5

20

45

70

95
10
15

25
30
35
40

50
55
60
65

75
80
85
90
Clase

Clase Frecuencia
0 964
1 861
2 966
3 995
4 989
5 1044
6 1044
7 977
8 1103
9 1069
10 1102
11 1225
12 1123
13 1161
14 1140
15 1167
16 1164
17 1151
18 1162
19 1078
20 1139
21 1170
22 1132
23 1031
24 1018
25 1077
26 1016
27 1052
28 910
29 968
30 917
31 878
32 916
33 815
34 807
35 802
36 758
37 724
38 754
39 787
40 804
41 780
42 841
43 814
44 768
45 817
46 753
47 720
48 791
49 765
50 703
51 698
52 671
53 612
54 593
55 563
56 534
57 525
58 477
59 499
60 405
61 394
62 411
63 411
64 354
65 338
66 329
67 325
68 255
69 254
70 255
71 257
72 232
73 244
74 225
75 204
76 208
77 166
78 147
79 132
80 120
81 132
82 89
83 97
84 75
85 82
86 68
87 58
88 42
89 32
90 41
91 21
92 14
93 14
94 9
95 10
96 4
97 4
98 6
99 5
100 2
101 1

Descripción Descripción numérica


Los datos presentan un sesgo a la derecha  Posee una mediana
donde predomina los valores más pequeños poblacional de 30,9
para la variable escogida que es P6040 en la  Mediana de 28
población. De acuerdo a la curtosis obtenida  Una moda de 11
MENOR A CERO dando como resultado poca  Desviación estándar
concentración alrededor de la medida siendo poblacional de 20,7
entonces platicurtrtica.

CURTOSIS - MEDIA 30,97


0,49818654 POBLACIONAL
MEDIANA 28
error
MODA 11
N S^2 Z absoluto
DESV. EST. 20,75
60356 20,88 1,96 0,05
CV% 67,01

Tamaño de la
n0 muestra
32088,59 20950,27
MEDIA
MUESTRAL 31,05
MEDIANA 28,00
MODA 17,00
DESV. EST. 20,63
CV% 66,45

n 370
Vmax 90
Vmin 0
r 90
ni 9
i 10
n 380
ni 9
r' 90
Vmax 90
Vmin 0
i'-1 9
Lim Lim
inf sup xi ni fi Ni Fi Asimetria Curtosis
-
1 0 9 4,5 55 15% 55 15% 1381966,1 40477060
2 10 19 14,5 63 17% 118 31% -452169,9 8722120,08
3 20 29 24,5 70 18% 188 50% -56114,0 521269,693
4 30 39 34,5 43 11% 231 61% 15,4 10,9594592
5 40 49 44,5 48 13% 279 74% 58975,8 631661,617
6 50 59 54,5 52 14% 331 87% 461930,6 9566826,25
7 60 69 64,5 22 6% 353 93% 637212,8 19569139
8 70 79 74,5 19 5% 372 98% 1281957,9 52189179,5
9 80 89 84,5 7 2% 379 100% 912835,2 46290355,1
379 100% 1462677,6 177967622

Media 33,79
Moda 22
Asimetria 0,381 Positiva
Mediana 31
Curtosis 2,141 Leptocurtica
Desv.
Estan. 21,64
RESULTADOS:

EDADES
22 5 55 2 51 45 63 21 63 20 59
0 26 67 42 18 15 24 20 27 36 29
31 57 24 14 25 2 38 49 10 36 3
5 17 42 81 29 18 64 61 22 71 5
6 57 0 19 11 2 75 13 65 1 62
54 35 21 45 70 71 19 34 1 5 31
8 1 42 90 29 49 22 18 42 68 49
27 4 16 19 5 51 62 5 39 55 54
73 8 78 7 53 42 14 8 59 22 13
15 49 19 27 19 1 24 56 35 65 31
29 46 31 87 15 32 71 75 39 72
68 27 25 44 8 5 2 36 17 52
43 24 7 37 75 31 39 66 54 29
41 12 80 25 32 56 40 25 50 5
17 10 22 20 59 36 38 52 44 1
41 22 3 33 40 9 19 6 48 47
38 58 50 22 15 52 53 48 25 20
6 20 20 59 10 51 83 25 38 66
11 40 45 17 39 13 48 67 76 54
14 38 45 32 29 55 45 22 23 18
37 18 45 48 80 10 21 57 10 9
60 14 21 13 9 13 14 86 56 27
13 15 44 40 68 52 7 33 14 51
43 54 26 48 14 48 54 55 36 23
1 59 6 54 65 50 6 17 12 15
59 7 27 46 22 27 20 25 67 8
47 21 19 11 39 4 1 47 21 28
76 25 3 53 40 47 55 50 46 24
0 54 4 71 37 15 51 48 16 83
47 1 10 62 22 10 42 2 31 52
56 37 53 25 53 26 13 36 76 14
37 29 21 48 19 28 16 38 58 74
18 70 31 22 5 18 10 31 19 9
21 33 35 75 22 18 53 50 72 22
69 23 51 55 1 25 4 22 66 41
46 9 55 32 22 41 36 22 45 29
3 16 6 25 73 18 36 9 18 64

Distribución de edades

80

70

60

50
FRECUENCIA

40

30

20

10

0 Histograma
4.5 14.5 24.5 34.5 44.5
EDAD 54.5 64.5 74.5 84.5

Pastel

5% 2%
14%
6%

14%
Media 33,5
17% Moda 45
Mediana 31

13%

18%
11%

09 10 19 20 29 30 39 40 49
50 59 60 69 70 79 80 89

En la gran encuesta integrada de hogares realizada por el DANE en la sección de


edades de la población se puede evidenciar lo siguiente:
 La mayor cantidad de la población es población joven puesto que el 18% de
la población está situada entre el rango de edad de los 20 a los 29 años
 También en el rango de entre 50 y 59 años con un 14% y entre 40 y 49 años
un 13%, siendo la variación de un grupo de edad a otro de pocos puntos
porcentuales.
 Sin embargo, también se encuentra una población significativa en otros
grupos de edades, como, por ejemplo, un 17% está ubicado en edades más
maduras, entre los 10 y los 19 años.
 . Notamos también que a partir de los 69 años la cantidad de personas
disminuye significativamente al punto en que el rango de personas en edad
de adulto mayor es decir de 60 a 89 años representa dentro de la población
total únicamente el 13%. Lo que puede llegar a pensar que la esperanza de
vida de la población se encuentra ubicada al rededor de entre los 70 a los 90
años
 Únicamente el 2% de la población se encuentra en edades entre los 80 y 89
años.
 que dentro de la población la mayor cantidad de las personas tiene 45 años
de edad, sin embargo, el promedio de edades de la población es de 33,5
años.
NOTA: La mayoría mayoría de la población son personas jóvenes en edad
estudiantil, seguido de adultos, jóvenes en etapa productiva, y la edad más alta es
de 89 años evento de poca concurrencia en los datos obtenidos.

(semana 4) Intervalo de confianza para dos variables numéricas


Un investigador, cree determinar que existen diferencias entre los niveles de estudio
de los hombres y las mujeres en Colombia. Para determinar lo anterior, use la
“muestra” encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un


histograma para los hombres y mujeres. Segun los resultados, ¿Existen
diferencias?

Se realiza el histograma y las diferencias son muy excasas, se tomó una muestral
de 380 personas, donde se muestral que las mujeres son más estudiadas
que los hombres, la diferencia entre hombres y mujeres es bastante. En casi
todos los niveles las mujeres son más estudiadas que los hombres, el nivel
académico el bachiller es que más tiene las personas encuestadas siendo
las mujeres las mayores en este nivel, en la muestra de las personas los que
están en nivel escolar la mayoría son hombres dando como respuesta que
este sector hay más hombres niños que niñas.

P6020 Sexo
ESC Escolaridad

HOMBRES MUJERES
Clase Frecuencia Clase Frecuencia
0 21 0 26
1 6 1 1
2 9 2 5
3 12 3 11
4 8 4 6
5 21 5 25
6 8 6 10
7 9 7 11
8 10 8 11
9 6 9 7
10 3 10 7
11 30 11 47
12 1 12 7
13 4 13 7
14 2 14 8
15 2 15 3
16 9 16 13
17 1 17 0
18 1 18 1
19 0 19 1

Histograma Hombres
35

30

25
Frecuencia

20

15

10

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Clase

Histograma Mujeres
50
45
40
35
Frecuencia

30
25
20
15
10
5
0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Clase

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del
95% y determine, la escolaridad de los hombres y de las mujeres de forma
individual.

De la muestra de 380 personas que se encuestaron arrojo resultado que hay 56%
mujeres, 44% hombres, datos a niveles académicos 32% tienen nivel académico de
media, 27% básica primaria, 14% básica secundaria, 12% nivel académico de
superior o universitario, 10% preescolar, 4% para personas que no decidieron
estudiar.

Media 6,77 Media 7,95


Mediana 6,00 Mediana 8,00
Moda 11,00 Moda 11,00
Desv. Desv.
Est. 4,78 Est. 4,81
Curtosis -0,82 Curtosis -0,89
Coef. Coef.
Var. 70,65 Var. 60,57
Asimetria 0,31 Asimetria -0,09
G. L. 162 G. L. 206
Intervalo de Intervalo de
confianza confianza
6,03 7,51 7,29 8,61

368

-1,18 1,9679 0,25215681


0,50215218
- -
2,16817402 0,19180346
t hombres t mujeres
1,9759 1,9719

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al


95% para la diferencia de los niveles de escolaridad para los hombres y
mujeres.

De las 380 personas encuestadas se tomó una muestra y no tomamos encuesta la


edad, solamente escolaridad y sexo dando como resultado de las personas
encuestadas, nivel académico media teniendo en cuenta desde el grado 10° y 13°
para mujeres un 34% y para hombres un 30%, deferencia del 4% con más personas
en este nivel académico, en básico primaria se tiene en cuenta desde el grado 1° y
5° para hombres con 28% y para las mujeres con 26% “ la diferencia es que hay
más mujeres encuestadas en este nivel”, el nivel técnico de básico segundaria hay
más hombres con estudio con 17%, sobre el nivel académico universitario o superior
son las mujeres con 13%. NOTA: sobre nivel académico las mujeres están más alto
niveles académicos que los hombres y hay más mujeres en la población.

(semana 5) Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial
que las mujeres en Colombia. Para determinar lo anterior, use la “muestra”
encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial


(P6175) y sexo (P6020), realice un diagrama de barras comparativo para los
hombres y mujeres en un solo gráfico. Según los resultados, ¿Existen
diferencias?
2. Con un nivel de confianza del 95%, realice una estimación de los hombres y
de las mujeres que asisten a un establecimiento oficial.
3. Realice una prueba de hipótesis para determinar la afirmación del
investigador. Utilice un nivel de significancia del 5%. ¿Qué se puede decir de
lo anterior?

Hombres Mujeres
CLASES Frecuencia Proporcion Clase Frecuencia Proporcion
Si 12 0,27 Si 13 0,24
No 33 0,73 No 41 0,76
Histograma comparativo entre hombres
y mujeres
50

40
FRECUENCIA

30

20

10

0
Si No
ASISTE A UN ESTABLECIMIENTO OFICIAL

Hombres Mujeres
Conclusiones

El trabajo colaborativo nos permite entender de manera más clara acerca de


la estadística ll y lo esencial que esta es para analizar una población, muestra
y variable de un teme especial con datos, la estadística ll ayuda a la
comprensión y entendimiento para organizar, analizar y tomar decisiones que
estén de acuerdo con los análisis efectuados por encuestas como medidas
de tendencia central, análisis de datos y resultados presentes en un gráfico,
histograma y polígonos de frecuencia, permitiendo hallar respuestas a
numerosas investigaciones, con el fin de obtener datos y analizar la
información presentada para su fácil acceso o manipulación por ultimo dando
un resultado de correcta interpretación de estos…

You might also like