You are on page 1of 11

FACULTAD DE INGENIERIA

ESCUELA ACADEMICO PROFESIONAL DE ING. MECANICA

CURSO:
ESTADISTICA

ALUMNO:
Snchez Ore, Juan Carlos

CODIGO:
2012-37214

TACNA PER
2017
Universidad Nacional Jorge Basadre Grohmann

INDICE

INDICE..2
INTRODUCCION...3
1. Regresin Lineal4
1.1. Definicin...4

2. Intervalo de confianza para el intercepto 0 .5

3. Prueba de hiptesis para el intercepto 0 .....5

4. Intervalo de confianza para la pendiente 1 ......6

5. Pruebas de hiptesis para la pendiente 1 ...7

6. Correlacin..8

7. Bibliografa

ESTADISTICA Pgina 2
Universidad Nacional Jorge Basadre Grohmann

INTRODUCCION

Un modelo de regresin es un modelo que permite describir cmo influye una

variable X sobre otra variable Y.

X: Variable independiente o explicativa o exgena

Y: Variable dependiente o respuesta o endgena

El objetivo es obtener estimaciones razonables de Y para distintos valores de X

a partir de una muestra de n pares de valores (x1, y1),.., (xn, yn).

Ejemplos:

Estudiar cmo influye la estatura del padre sobre la estatura del hijo.

Estimar el precio de una vivienda en funcin de su superficie.

Predecir la tasa de paro para cada edad.

Aproximar la calificacin obtenida en una materia segn el nmero de

horas de estudio semanal.

Prever el tiempo de computacin de un programa en funcin de la

velocidad del procesador.

ESTADISTICA Pgina 3
Universidad Nacional Jorge Basadre Grohmann

1. Regresin Lineal

1.1. Definicin.-

Tiene como objetivo el estudiar cmo los cambios en una variable, no


aleatoria, afectan a una variable aleatoria, en el caso de existir una
relacin funcional entre ambas variables que puede ser establecida por
una expresin lineal, es decir, su representacin grfica es una lnea
recta.

Cuando la relacin lineal concierne al valor medio o esperado de la


variable aleatoria, estamos ante un modelo de regresin lineal simple. La
respuesta aleatoria al valor x de la variable controlada se designa por Yx
y, segn lo establecido, se tendr:

= 0 + 1 +
Dnde:

yi, representa el valor de la variable respuesta para la observacin


i-sima.
xi, representa el valor de la variable explicativa para la observacin
i-sima.
ei, representa el error para la observacin i-sima que se asume
normal.

~(0, )

0 1 son los coeficientes de regresin:

0 : intercepto
1 : pendiente

Los parmetros que hay que estimar son: 0 , 1

ESTADISTICA Pgina 4
Universidad Nacional Jorge Basadre Grohmann

2. Intervalo de confianza para el intercepto 0 de nivel 1-

3. Prueba de hiptesis para el intercepto 0

ESTADISTICA Pgina 5
Universidad Nacional Jorge Basadre Grohmann

4. Intervalo de confianza para la pendiente 1

ESTADISTICA Pgina 6
Universidad Nacional Jorge Basadre Grohmann

5. Pruebas de hiptesis para la pendiente 1

ESTADISTICA Pgina 7
Universidad Nacional Jorge Basadre Grohmann

6. Correlacin

La correlacin es la forma numrica en la que la estadstica ha podido evaluar


la relacin de dos o ms variables, es decir, mide la dependencia de una
variable con respecto de otra variable independiente.

Para poder entender esta relacin tendremos que analizarlo en forma grfica:
Si tenemos los datos que se presentan en la tabla y
edad peso
consideramos que la edad determina el peso de las
15 60 personas entonces podremos observar la siguiente grfica:
30 75 demanda

18 67 Donde los puntos 150


42 80 representan cada 1698 47
28 60 uno de los pares 100 2045 15
19 65 ordenados y la lnea 50 1348 100
podra ser una recta 1268 120
31 92
que represente la 0
tendencia de los datos, que en otras palabras podra 1000 1500 2000
decirse que se observa que a mayor edad mayor peso.

La correlacin se puede explicar con la pendiente de


esa recta estimada y de esta forma nos podemos dar
cuenta que tambin existe el caso en el que al crecer la
variable independiente decrezca la variable
dependiente. En aquellas rectas estimadas cuya pendiente sea cero entonces podremos decir
que no existe correlacin.

As en estadstica podremos calcular la correlacin para datos no


agrupados con la siguiente formula.

n n n
En donde:
n xi y i xi * y i R = coeficiente de correlacin
N = nmero de pares
r i 1 i 1 i 1
ordenados
n 2 n 2
n 2 n
2
X = variable independiente
n xi xi n y i y i Y = variable independiente
i 1 i 1 i 1 i 1
Ejemplo:

Edad (x) Peso (y) X2 Y2 X* Y


15 60 225 3600 900
30 75 900 5625 2250
18 67 324 4489 1206
42 80 1764 6400 3360
28 60 784 3600 1680
19 65 361 4225 1235
31 92 961 8464 2852
183 499 5319 36403 13483

Supngase que deseamos obtener la correlacin de los datos de la tabla anterior:

ESTADISTICA Pgina 8
Universidad Nacional Jorge Basadre Grohmann

Ahora podemos observar que:

n n n
n xi yi xi * yi
i 1 i 1 i 1 7 *13483 (183 * 499)
7 * 5319 (183)2 7 * 36403 (499)2
r 0.65638606
n 2 2
n n n
n x 2 x n y 2 y
i 1 i i 1 i i 1 i i 1 i

Se debe aclarar que el coeficiente de correlacin slo puede variar de la


siguiente manera: 1 r 1 y que para entenderlo mejor se debe obtener el
coeficiente de determinacin que se obtiene con r cuadrada, ya que este
representa el porcentaje que se explica y mediante los datos de x .

En nuestro ejemplo decimos que la correlacin es casi perfecta, ya que, esta


muy cerca de 1 y que el porcentaje de datos que explican a y es
(0.65638606)2= 0.430842 o sea el 43.08 %

En el caso de que fueran datos agrupados tendremos lo siguiente:

Primero tendremos que pensar que se genera una matriz, ya que, ahora
estamos juntando dos tablas de distribucin de frecuencias y por ello nuestros
clculos sern ms laboriosos, por lo que les recomiendo el uso de una hoja de
calculo o al menos una calculadora con regresin para datos agrupados.

De cualquier forma aqu tambien estamos evaluando numricamente si existe


relacin entre dos variables y lo haremos con la siguiente ecuacin.

k l l k En donde podemos
n f xi y i fx xi * fy y i encontrar k como el
j 1 i 1 i 1 i 1
r nmero de clases para
l l

2
k k

2
la variable "y" y l para
n f x x i f x x i n f y y i f y y i
2 2

i 1 i 1 i 1 i 1 el nmero de clases de
"x".
Tambin podemos observar que hay varios tipos de "f" es decir, la que se
encuentra sola (sin subndice) que nos habla de las frecuencias celdares (cada
una de las frecuencias que se encuentran en la interseccin entre una columna
y un rengln) y las "f" con subndices que representan las frecuencias de cada
una de las variables.

ESTADISTICA Pgina 9
Universidad Nacional Jorge Basadre Grohmann

Para entender el uso de esta formula usaremos un ejemplo:


Los resultados que se presentan en la siguiente tabla representan los pesos y
las estaturas de 48 alumnos entrevistados.

Marcas de clase de "x"


1.445 1.545 1.645 1.745 1.845 1.945 fy fx y fx y^2
44.5 3 1 4 178 7921
marcas 54.5 5 5 9 19 1035.5 56434.75
de clase 64.5 1 4 2 1 1 9 580.5 37442.25
de "Y" 74.5 5 1 1 7 521.5 38851.75
84.5 2 2 1 5 422.5 35701.25
94.5 1 3 4 378 35721
fx 0 9 12 17 7 3 48 3116 212072
fx x 0 13.90 19.74 29.665 12.915 5.835 82.06
5
fx x^2 0 21.48 32.47 51.765 23.8281 11.34 140.8982
3225 23 425 75 9075
f x y 5380.77

Correlacin= 0.695

La sustitucin de la frmula es la siguiente:

k l l k
n f x i y i f x x i * fy y i
j 1 i 1 i 1 i 1 48 * 5380.77 - (82.06 * 3116)
r 0.695
l
l

2
k

k
2
((48 * 140.8982) - 82.06 2 ) * (( 48 * 212072) - 31162 )
n f x x i f x x i n f y y i f y y i
2 2

i 1 i 1 i 1 i 1

Al interpretar nuestro resultado podemos concluir que si existe relacin entre el


peso y la estatura, es decir, que a mayor estatura mayor peso.

En muchas ocasiones el resultado de la correlacin es negativo y lo que


debemos pensar es que la relacin de las variables involucradas en el calculo
es inverso es decir que en la medida que crece la variable independiente la
variable dependiente decrece:
demanda

150
1698 47
100 2045 15
50 1348 100
1268 120
0
1000 1500 2000

ESTADISTICA Pgina 10
Universidad Nacional Jorge Basadre Grohmann

7. BIBLIOGRAFIA

Webgrafa:

- ) http://regresionsimple.galeon.com/
- ) https://www.google.com.pe/

Libros:

- ) Meyer, P. Probabilidad y aplicaciones estadsticas(1992)

- ) Newbold, P. Estadstica para los negocios y la


economa(1997)
Captulo 10.

- ) Pea, D. Regresin y anlisis de experimentos(2005)


Captulo 5.

ESTADISTICA Pgina 11

You might also like