Professional Documents
Culture Documents
Realizado por:
Sección 1A
Agosto, 2016
INTRODUCCIÓN.
En este trabajo se habla sobre diversos temas de interés estadístico, uno de ellos es la
prueba de hipótesis, que es una prueba estadística que se utiliza para determinar si existe
suficiente evidencia en una muestra de datos para inferir que cierta condición es válida para
toda la población. Una prueba de hipótesis examina dos hipótesis opuestas sobre una
población: la hipótesis nula y la hipótesis alternativa. También se hablan de otras pruebas
como la prueba de regresión y de correlación, las cuales con explicadas con detalle en el
desarrollo de la investigación.
Finalmente se explica acerca de las series cronológicas las cuales se usan para estudiar la
relación causal entre diversas variables que cambian con el tiempo y se influyen entre sí.
Desde el punto de vista probabilístico una serie temporal es una sucesión de variables
aleatorias indexadas según parámetro creciente con el tiempo.
PRUEBA DE HIPÓTESIS.
Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis,
hipótesis es una aseveración de una población elaborado con el propósito de poner a
prueba, para verificar si la afirmación es razonable se usan datos. En el análisis estadístico
se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas
para verificar la aseveración o para determinar que no es verdadera. Por tanto, la prueba de
hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad;
se emplea para determinar si la hipótesis es una afirmación razonable.
La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
Nivel de significancia.
Tipos de prueba
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200
H0 : µ ≥ 200 H0 : µ ≤ 200
Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al probar un
valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el
valor de la media muestral. Si el valor crítico que se establece es un valor de z, entonces se
transforma la media muestral en un valor de z.
Etapa 6.- Tomar la decisión. Se compara el valor observado de la estadística muestral con
el valor (o valores) críticos de la estadística de prueba. Después se acepta o se rechaza la
hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá
efecto sobre otras decisiones de los administradores operativos, como por ejemplo,
mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia
utilizar.
Tipos de errores
Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación
de la Ho o de la H1, puede incurrirse en error:
Ejemplo.
Una muestra aleatoria de 100 muertes registradas en Estados Unidos el año pasado muestra
una vida promedio de 71.8 años. Suponga una desviación estándar poblacional de 8.9 años.
Queremos probar si la vida media hoy en día es mayor a 70 años con base en esa muestra.
La muestra parecería indicar que es así pero ¿Cuál es la probabilidad de que la media de la
muestra no refleje la verdadera media de la población?
Solución:
1. Datos:
m =70 años
a = 0.05
2. Establecemos la hipótesis.
3. Nivel de significancia
a = 0.05, zα = 1.645
4. Regla de decisión:
Si z ≤ 1.645 no se rechaza Ho. Si z > 1.645 se rechaza Ho.
5. Cálculos:
6. Decisión y justificación.
Como 2.02 >1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que
la vida media hoy en día es mayor que 70 años.
PRUEBA DE REGRESIÓN.
Donde:
β0, β1, β2,… βP: parámetros, miden la influencia que las variables explicativas tienen sobre
el regrediendo.
Los valores escogidos como estimadores de los parámetros βk, son los coeficientes de
regresión sin que se pueda garantizar que coincida n con parámetros reales del proceso
generador. Por tanto, en
Para poder crear un modelo de regresión lineal es necesario que se cumpla con los
siguientes supuestos:
Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros:
Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros. Son
de la forma:
donde ɛi es el error asociado a la medición del valor Xi y siguen los supuestos de modo que
ɛi ~ N(0, σ2)(media cero, varianza constante e igual a un σ y ɛi ┴ ɛj con i ≠ j).
Dado el modelo de regresión simple anterior, si se calcula la esperanza (valor esperado) del
valor Y, se obtiene:
La regresión lineal permite trabajar con una variable a nivel de intervalo o razón. De la
misma manera, es posible analizar la relación entre dos o más variables a través de
ecuaciones, lo que se denomina regresión múltiple o regresión lineal múltiple.
donde ɛi es el error asociado a la medición i del valor Xip y siguen los supuestos de modo
que ɛi ~ N(0, σ2 (media cero, varianza constante e igual a un σ y ɛi / ɛj con i ≠ j).
Rectas de Regresión
Las rectas de regresión son las rectas que mejor se ajustan a la nube de puntos (o también
llamado diagrama de dispersión) generada por una distribución binomial.
Matemáticamente, son posibles dos rectas de máximo ajuste:
La correlación ("r") de las rectas determinará la calidad del ajuste. Si r es cercano o igual a
1, el ajuste será bueno y las predicciones realizadas a partir del modelo obtenido serán muy
fiables (el modelo obtenido resulta verdaderamente representativo); si r es cercano o igual a
0, se tratará de un ajuste malo en el que las predicciones que se realicen a partir del modelo
obtenido no serán fiables (el modelo obtenido no resulta representativo de la realidad).
Ambas rectas de regresión se intersecan en un punto llamado centro de gravedad de la
distribución.
PRUEBA DE CORRELACIÓN.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el
coeficiente de correlación de Pearson se simboliza con la letra px,y, siendo la expresión que
nos permite calcularlo:
Donde:
Interpretación
Varios grupos de puntos (x, y), con el coeficiente de correlación para cada grupo. Nótese
que la correlación refleja la no linealidad y la dirección de la relación lineal. En la figura
del centro, la varianza de y es nula, por lo que la correlación es indeterminada.
Uno de los usos más habituales de las series de datos temporales es su análisis para
predicción y pronóstico (así se hace por ejemplo con los datos climáticos, las acciones de
bolsa, o las series de datos demográficos). Resulta difícil imaginar una rama de las ciencias
en la que no aparezcan datos que puedan ser considerados como series temporales. Las
series temporales se estudian en estadística, procesamiento de señales, econometría y
muchas otras áreas.
Componentes
El análisis más clásico de las series temporales se basa en que los valores que toma la
variable de observación es la consecuencia de cuatro componentes, cuya actuación conjunta
da como resultado los valores medidos, estos componentes son:
Notación
Ésta es una de las comunes que representa una Serie de Tiempo X que es indexada por
números naturales. También estamos acostumbrados a ver:
CONCLUSIONES.
Los conceptos antes mencionados han sido analizados e investigados de tal manera de
hacer más fácil su comprensión y entendimiento, se pudo concluir que: