You are on page 1of 4

Facultad de Ingeniería y Ciencia Básicas

Estadística II
Modalidad Virtual

En el siguiente trabajo, cada estudiante debe contribuir a la solución de los ejercicios planteados y esta
se debe evidenciar en una participación activa dentro de las semanas 3, 4 y 5.

● La evaluación de su participación semanal se basará en los siguientes rubrica: https://goo.gl/aSnGcD


● La evaluación del consolidado del Trabajo final se basará en la siguiente rubrica: https://goo.gl/S1LuKc

Tenga presente que para cada uno de los ejercicios debe ser explícito con la solución que obtiene, son
necesarios procedimientos.

Contexto
A continuación, se tiene la información de la Gran Encuesta Integrada de Hogares (GEIH), realizada por el
DANE[1]. Esta encuesta se hace en las 13 ciudades principales del Colombia (Bogotá, Medellín, Cali,
barranquilla, Bucaramanga, Manizales, Pasto, Pereira, Ibagué, Cúcuta, Villavicencio, Montería, Cartagena) y 11
ciudades intermedias (Tunja, Florencia, Popayán, Valledupar, Quibdó, Neiva, Riohacha, Santa Marta, Armenia,
Sincelejo, San Andrés). Esta encuesta, se solicita información sobre las condiciones de empleo de las personas
(si trabajan, en qué trabajan, cuánto ganan, si tienen seguridad social en salud o si están buscando empleo),
además de las características generales de la población como sexo, edad, estado civil y nivel educativo, se
pregunta sobre sus fuentes de ingresos. La GEIH proporciona al país información a nivel nacional, cabecera -
resto, regional, departamental, y para cada una de las capitales de los departamentos.

Base de datos: en el archivo de Excel ( https://goo.gl/zB3Ntf ) se tiene información sobre las características
generales de las personas que respondieron en un mes en particular. Para este trabajo colaborativo, realice lo
siguiente:

Parte 1 (semana 3 - 5)

(semana 3) Selección de muestra


En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los elementos de una
población), se selecciona una muestra, entendiendo por tal una parte representativa de la población. En ese
sentido, escoja un tipo de muestreo y argumente la viabilidad de esta técnica para la base de datos dada. Úselo
como herramienta para elegir una muestra representativa.
Calculo de la muestra:
Como la población que tenemos es finita se trabaja la fórmula:
𝑁 ∗ 𝑍2 ∗ 𝑝 ∗ 𝑞
𝑛= 2
𝑒 (𝑁 − 1) + 𝑍 2 ∗ 𝑝 ∗ 𝑞

𝑛 =Tamaño de la muestra buscado.


𝑁 =Tamaño de la población o universo. N=60356
𝑍 2 = Parámetro estadístico que depende del nivel de confianza. Z=1.96
Nota: como el nivel de confianza lo determina el investigador, escogemos el 95%; por lo tanto, tenemos
un valor de parámetro estadístico de 1.96. Según la siguiente tabla.

𝑒 2 = Margen de error. Lo establece el investigador. 𝑒 = 2%


𝑝 = Probabilidad de que ocurra el evento estudiado (éxito). 𝑝 = 50%
𝑞 = Probabilidad de que no ocurra el evento estudiado (fracaso). 𝑞 = 50%
Nota: como no se conoce datos anteriores se toma como probabilidad de 50%, para p y q.

Link para ver el cálculo de la muestra BaseDatos.xlsx

60356 ∗ 1.962 ∗ 50% ∗ 50% 57965.9024


𝑛= = = 1048.59
3%2 (60356 − 1) + 1.962 ∗ 50% ∗ 50% 55.2799

𝑛 ≈ 1049
Muestreo aleatorio en Excel:
 Es el mas sencillo y de fácil comprensión.
 Existen paquetes informáticos para analizar datos como en Excel.
 Es utilizado cuando se pose un listado de la población como lo es en nuestro trabajo.
Pasos para realizar el muestreo en Excel:
 se le asigna a cada encuestado un numero aleatorio con la herramienta Aleatorio.
 se ordena de menor a mayor.
 Por último, se escogen los 1049 encuestados que van a ser nuestra muestra.
Link para ver el muestreo BaseDatos.xlsx
(semana 4) Intervalo de confianza para dos variables numéricas
Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las
mujeres en Colombia. Para determinar lo anterior, use la “muestra” encontrada en la semana 3:

1. Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y
mujeres. Según los resultados, ¿Existen diferencias?

2. Asumiendo que los datos son normales, calcule un intervalo de confianza del 95% y determine, la
escolaridad de los hombres y de las mujeres de forma individual.

3. Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los
niveles de escolaridad para los hombres y mujeres.

(semana 5) Prueba de hipótesis para dos variables nominales


Un investigador, cree determinar que los hombres asisten más a un colegio oficial que las mujeres en Colombia.
Para determinar lo anterior, use la “muestra” encontrada en la semana 3:

1. Utilizando la variable si actualmente asiste a un establecimiento oficial (P6175) y sexo (P6020), realice un
diagrama de barras comparativo para los hombres y mujeres en un solo gráfico. Según los resultados,
¿Existen diferencias?
2. Con un nivel de confianza del 95%, realice una estimación de los hombres y de las mujeres que asisten a
un establecimiento oficial.
3. Realice una prueba de hipótesis para determinar la afirmación del investigador. Utilice un nivel de
significancia del 5%. ¿Qué se puede decir de lo anterior?

Parte 2 (Semana 5)

En esta semana, los integrantes del grupo Consolidar la información del Parte 1 en un archivo PDF con los
soportes de Excel, el cual debe ser subido en el Foro: Desarrollo del trabajo colaborativo. Este archivo debe
tener:

-Portada: Solo los estudiantes que participaron en el desarrollo de la actividad (semana 3, 4 y 5)


-Objetivos
-Desarrollo de la actividad
-Conclusiones
-Referencias
[1] http://www.dane.gov.co/files/investigaciones/fichas/empleo/ficha_metodologica_GEIH-01_V10.pdf

You might also like