You are on page 1of 11

INSTITUCIÓN UNIVERSITARIA POLITECNICO GRANCOLOMBIANO

TRABAJO COLABORATIVO

ESTADSITICA II

INTEGRANTES:
JORGE LUIS DIAZ
GLORIA INES BONILLA
LUZ MARINA LARA
JESSICA TATIANA LOPEZ
JEFFERSON ANDREY CALDERON

PROFESOR:
PATRICIA CASTILLO

AÑO 2018
ACTIVIDAD
Parte 1

1. En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos


los elementos de una población), se selecciona una muestra, entendiendo por tal una
parte representativa de la población. En ese sentido, escoja un tipo de muestreo y
argumente la viabilidad de esta técnica para la base de datos dada. Para seleccionar
una muestra debe tenerse en cuenta el cómo seleccionar los elementos que formarán
parte de la muestra (tipo de muestreo) y cuántos elementos debemos seleccionar
(Tamaño de muestra).
TIPO DE MUESTREO ESCOGIDO: Con el fin de obtener una muestra representativa,
confiable y aleatoria, donde todos los datos de la población tengan la misma probabilidad
de ser escogidos, yo propongo utilizar el Muestreo Aleatorio Simple. Este método
además tiene la ventaja de facilitar el armado de la muestra. Adicionalmente al obtener la
muestra mediante este método aseguramos que las generalizaciones serán razonables.
Ahora en cuanto a Cómo seleccionar la muestra pues en este caso debe ser
aleatoriamente, para lo cual podemos usar la generación de números aleatorios que es
una facilidad de Excel. Posteriormente tomaremos de la población total la cantidad de
registros que nos arroje el tamaño de la muestra.
Ahora voy a trabajar para obtener el tamaño de la muestra resolviendo los puntos
planteados en el numeral 2.
2. Utilizando la variable género P(6020) determine el tamaño de la muestra seleccionando
adecuadamente y justificando:
Bueno debemos aclarar que esta variable es de tipo cualitativo y que la Población es finita.
a) Fórmula a desarrollar: Teniendo en cuenta que la variable Género es cualitativa y que
la Población es finita, utilizaremos la siguiente fórmula:

donde :
n = Tamaño de la muestra que es lo que estamos buscando
N= Tamaño de la Población que es = 60.356 registros
b) Estimación de la Proporción de mujeres: Dentro de la fórmula se denota con p.
Observamos en la Población total la cantidad de registros cuyo género es Mujer. Esto es 31.969
registros por lo tanto:
Estos registros serán escogidos de la población total mediante la generación de números
aleatorios y constituirá la Muestra.

2. Intervalo de confianza para dos variables numéricas

Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los
hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base
de la hoja “muestra” y realizar lo siguiente:

● Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los
hombres y mujeres. Según los resultados, ¿Existen diferencias?

● Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice


lectura de resultados.

● Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y
determine, la escolaridad de los hombres y de las mujeres de forma individual.
● Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para
la diferencia de los niveles de escolaridad para los hombres y mujeres.

RTA:
HOMBRES MUJERES
Clase Frecuencia Clase Frecuencia
0 21 0 26
1 6 1 1
2 9 2 5
3 12 3 11
4 8 4 6
5 21 5 25
6 8 6 10
7 9 7 11
8 10 8 11
9 6 9 7
10 3 10 7
11 30 11 47
12 1 12 7
13 4 13 7
14 2 14 8
15 2 15 3
16 9 16 13
17 1 17 0
18 1 18 1
19 0 19 1

Media 6,77 Media 7,95


Mediana 6,00 Mediana 8,00
Moda 11,00 Moda 11,00
Desv. Est. 4,78 Desv. Est. 4,81
Curtosis -0,82 Curtosis -0,89
Coef. Var. 70,65 Coef. Var. 60,57
Asimetria 0,31 Asimetria -0,09
G. L. 162 G. L. 206
Intervalo de confianza Intervalo de confianza
6,03 7,51 7,29 8,61
Histograma Hombres
35

30

25
Frecuencia

20

15

10

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Clase

Histograma Mujeres
50
45
40
35
Frecuencia

30
25
20
15
10

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Clase

t hombres t mujeres
1,9759 1,9719

Se realizó el histograma y las diferencias son muy pocas, se tomó una muestra de 380
personas, podemos ver que las mujeres son más estudiadas que los hombres. Si hay
diferencias entre hombres y mujeres, las mujeres en la mayoría de niveles son las más
estudiadas que los hombres. También podemos ver dentro de los niveles académicos el
bachiller es que más tienen las personas encuestadas siendo las mujeres las mayores es este
nivel, además podemos darnos cuenta que de la muestra de las personas los que están en
niel escolar la mayoría son hombre esto quiere decir que es ese sector hay más hombres niños
que niñas.

De la muestra de 380 personas que se encuestaron arrogo resultado que hay 56% corresponde
a mujeres y el 44% corresponde a Hombres por lo anterior también arrogo datos importantes
de los niveles académicos, que el 32% tienen el nivel académico de media, siguiendo con la
básica primaria con un 27% , siguiendo con básica secundaria con un 14%, nivel académico
de superior o universitaria con un 12%, preescolar con un 10% y personas de la cuales porque
son bebes o porque no decidieron estudiar un porcentaje de 4%.
Adema de eso estos resultados de nivel académico según hombre y mujer arrogan los
siguientes resultados:

De los 380 personas encuestadas se tomó una muestra y no tomamos encuentra la edad, solo
escolaridad y sexo de los cuales según las personas encuestadas en el nivel académico Media
que esta desde el grado 10° al 13° tiene el 34% para mujeres y el 30% para los hombres, es
una diferencia de un 4% además de ser el nivel con más personas con ese nivel académico,
continuando el orden el nivel académico de básica primaria comprendido entre los grados 1°
y 5° con un 28% para hombres y un 26% donde se refleja diferencia debido a que según los
encuestados son más mujeres; del nivel técnico de básica segundaria hay más hombres con
estudios de básica secundaria con un 17% y sobre el nivel académico universitario o superior
son malas mujeres con este nivel con un 13%. En conclusión podemos darnos cuenta Sobre
el nivel académico los mueres con las que más estas con mejores niveles académicos que los
hombres, además que la población es mayor que el de los hombres.

● Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la
escolaridad de los hombres y de las mujeres de forma individual.

Intervalo de Confianza para la población de mujeres

𝑍𝛼/2 = 1,96
𝜎 𝜎
(𝑥̅ − 𝑍𝛼 ∗ , 𝑥̅ − 𝑍𝛼 ∗ )
2 √𝑛 2 √𝑛
4,72 4,72
(6,94 − 1,96 ∗ , 6,94 + 1,96 ∗ )
√159 √159
(6,2063 , 7,67)

Intervalo de Confianza para la población de hombres

𝑍𝛼/2 = 1,96
𝜎 𝜎
(𝑥̅ − 𝑍𝛼 ∗ , 𝑥̅ − 𝑍𝛼 ∗ )
2 √𝑛 2 √𝑛
4,70 4,70
(8,14 − 1,96 ∗ , 8,14 + 1,96 ∗ )
√202 √202
(7,49 , 8,78)

● Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los
niveles de escolaridad para los hombres y mujeres.

𝑍𝛼/2 = 1,96

2
(𝑛𝑚 − 1)𝑠𝑚 + (𝑛ℎ − 1)𝑠ℎ2 (159 − 1)(4,72)2 + (202 − 1)(4,70)2
𝑆2 = = = 22,172
𝑛𝑚 + 𝑛ℎ − 2 159 + 202 − 2

1 1 1 1
(𝑥
̅̅̅
ℎ − ̅̅̅̅
𝑥𝑚 − 𝑍𝛼 ∗ 𝑆√ + ,𝑥
̅̅̅
ℎ − ̅̅̅̅
𝑥𝑚 + 𝑍𝛼 ∗ 𝑆√ + )
2 𝑛ℎ 𝑛𝑚 2 𝑛ℎ 𝑛 𝑚

1 1 1 1
(8,14 − 6,94 − 1,96 ∗ √22,172 ( + ), 8,14 − 6,94 + 1,96 ∗ √22,172 ( + ) )
202 159 202 159

(0,22 , 2,178)

Parte 2

Prueba de hipótesis para dos variables nominales

Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las
mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja de
“muestra” y realizar lo siguiente:

● Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo


(P6020), realice un diagrama de barras comparativo para los hombres y mujeres en un
solo gráfico. Según los resultados, ¿Existen diferencias?
● Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten a
un establecimiento oficial.
● Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten a
un establecimiento oficial.
● Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice
un nivel de significancia del 5%. ¿Qué se puede decir de lo anterior?

Comparativo

Hombres Mujeres
CLASES Frecuencia Proporcion Clase Frecuencia Proporcion
Si 12 0,27 Si 13 0,24
No 33 0,73 No 41 0,76

● Con un nivel de confianza del 95%, realice una estimación de los hombres que asisten a un establecimiento
oficial.

𝑍 = 1,96
𝑛 = 45
𝑝 = 0,73

𝑝(1 − 𝑝) 0,73(1 − 0,73)


𝑃 = 𝑝 ± 𝑍√ = 0,73 ± 1,96√
𝑛 45
Frecuencia

𝑃1 = 0,8597
hombres y mujeres
𝑃2 = 0,6002
El intervalo de confianza será
0,6002 < 𝑃 < 0,8497
(0.6002 , 0.8497)

● Con un nivel de confianza del 95%, realice una estimación de las mujeres que asisten a un establecimiento
Mujeres
oficial.

𝑍 = 1,96
𝑛 = 54
𝑝 = 0,76

𝑝(1 − 𝑝) 0,76(1 − 0,76)


𝑃 = 𝑝 ± 𝑍√ = 0,76 ± 1,96√
𝑛 54
𝑃1 = 0,8739
𝑃2 = 0,6460
El intervalo de confianza será:
0,6460 < 𝑃 < 0,8739
(0.6460, 0.8739)
● Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de significancia
del 5%. ¿Qué se puede decir de lo anterior?

Prueba de hipótesis de dos proporciones


𝐻𝑜 : 𝑝1 > 𝑝2
𝐻𝑎 : 𝑝1 ≤ 𝑝2

𝑛1 𝑝1 + 𝑛2 𝑝2 45(0,73) + 54(0,76)
𝑃= = = 0,74
𝑛1 + 𝑛2 45 + 54
𝑝1 − 𝑝2
𝑍𝑜 =
1 1
√𝑃(1 − 𝑃) ( + )
𝑛1 𝑛2
0,76 − 0,73
𝑍0 = = 0,3388
√0,74(1 − 0,74) ( 1 + 1 )
54 45
𝑍𝑜 < 𝑍
0,33 < 1,96
Se acepta 𝐻0 , la proporción de hombres que asisten al colegio oficial es mayor que la proporción de mujeres en
Colombia

CONCLUSIONES

El anterior trabajo colaborativo nos permite entender der más acerca de la estadística y lo
importante que es para análisis una población o un tema específico, la estadística hace que
más fácil su comprensión y entendimiento ya que la estadística da a entender, organizar y
tomar decisiones que estén de acuerdo con los análisis efectuados.