Professional Documents
Culture Documents
Monografa
Asesor:
Vctor Ignacio Lpez Ros, Ph. D.
Profesor Asociado, Escuela de estadstica.
Este trabajo es dedicado con todo mi amor a mi madre y mis hermanos por sus
bendiciones, sus consejos y el apoyo incondicional que me brindan en cada
proyecto de mi vida.
AGRADECIMIENTOS
ABSTRACT
0 INTRODUCCIN ..................................................................................... 11
1. METODOLOGA .......................................................................................... 14
2. MARCO REFERENCIAL ............................................................................... 17
2.1. FUNDAMENTACIN TERICA .............................................................. 17
2.1.1. Sobre la teora de aprendizaje: El constructivismo .................................. 17
2.1.2. Sobre regresin lineal ........................................................................ 19
3. CONCEPTUALIZACIN ............................................................................... 22
3.1. Situacin problemtica .......................................................................... 22
3.1.1. Planificar la obtencin de los datos. ..................................................... 23
4. CONCLUSIONES ........................................................................................ 47
5. REFERENCIA BIBLIOGRAFICA .................................................................... 49
ANEXOS
La estadstica no es una forma de hacer sino una forma de pensar, que ayuda
a la solucin de problemas en las ciencias y la vida cotidiana. La enseanza de
1
1
la estadstica se debe iniciar con problemas reales donde los estudiantes
puedan desarrollar sus ideas, trabajando las diferentes etapas que conlleva la
resolucin de un problema real (planificar la solucin, recoger y analizar los
datos, comprobar las hiptesis inciales y tomar una decisin en consecuencia)
(Batanero, 2001).
Con esta monografa se pretende generar una propuesta didctica que facilite
el proceso de enseanza- aprendizaje en la comprensin del concepto de
regresin lineal simple, a travs de una situacin real, en donde el estudiante,
haciendo uso de los conceptos de estadstica descriptiva, pueda recoger y
tabular la informacin, y con los conocimientos tericos que adquiera de
regresin lineal construya su propio aprendizaje, genere sus propias
conclusiones y realice predicciones a partir de la construccin del modelo de
regresin. Tambin se pretende que haciendo uso de herramientas como
excel, el estudiante pueda ajustar un modelo de regresin lineal, realizar el
clculo del coeficiente de correlacin e interpretar los resultados con base al
grfico de dispersin.
1
4
mtodo de los mnimos cuadrados. Este texto aborda el tema de una manera
metodolgica y de fcil comprensin para el estudiante.
1
5
minitab recomendado para realizar anlisis preliminares de regresin, luego
se muestra el diagrama de dispersin realizado con los datos tabulados, se
muestra el modelo a formar, dando una explicacin de cada una de la variables
y constantes que forman dicho modelo, al igual que en el texto anterior se
explica como encontrar el intercepto y la pendiente y como se forma la
ecuacin de regresin, llamada por (Canavos, 1980) como ecuacin estimada
de regresin. Tambin se ilustran varios ejemplos haciendo uso del paquete
estadstico antes mencionado, en comparacin con los textos anteriores, este
texto es menos metdico y puede llegar a ser ms complejo para la
comprensin del estudiante ya que presenta ms rigor matemtico en cuanto al
tema de regresin lineal.
IT TEXTO
E
1 BERENSON y Levine. Estadstica Bsica en 5
Administracin
2 WALPOLE, Myers. Probabilidad y Estadstica 5
3 CANAVOS, George. Probabilidad y estadstica 4
2.1. FUNDAMENTACIN
TERICA
Desde hace aos las teoras de aprendizaje se han convertido en una pieza
fundamental para mejorar la enseanza en el aula, facilitando al docente
tcnicas y estrategias vlidas y novedosas para el aprendizaje, en donde el
estudiante en su proceso de enseanza aprendizaje de algunas ciencias, como
son la matemticas y la estadstica, es introducido a conceptos y smbolos, que
no son construidos por l mismo, y que se requiere de la interaccin de
facilitadores.
En primer lugar, los alumnos presentan una determinada disposicin para llevar a
cabo el aprendizaje que se les plantea. Esta disposicin o enfoque con el que abordan la
situacin de aprendizaje de nuevos contenidos no es, en general, algo inexplicable o
impredictible, sino que surge como resultado de la confluencia de numerosos factores de
ndole personal e interpersonal. El grado de equilibrio personal del alumno, su
autoimagen y autoestima, sus experiencias anteriores de aprendizaje, su capacidad de
asumir riesgos y esfuerzos, de pedir, dar y recibir ayuda son algunos aspectos de tipo
personal que desempean un papel importante en la disposicin del alumno frente al
aprendizaje.
En tercer lugar, los conocimientos que ya poseen respecto al contenido concreto que se
propone aprender, conocimientos previos que abarcan tanto conocimientos e
informaciones sobre el propio contenido como conocimientos que, de manera directa o
indirecta, se relacionan o pueden relacionarse con l. Cmo se justifica la necesidad de
considerar estos conocimientos previos en tanto que elemento fundamental del estado
inicial del alumno? La justificacin se encuentra, sin duda, en la propia definicin
constructivista del aprendizaje escolar. Desde esta perspectiva entendemos que el
aprendizaje de un nuevo contenido es, en ltimo trmino, el producto de una actividad
mental constructiva que lleva a cabo el alumno, actividad mediante la cual construye e
incorpora a su estructura mental los significados y representaciones relativos al nuevo
contenido. Ahora bien, dicha actividad mental constructiva no puede llevarse a cabo en
1
8
el vaco, partiendo de la nada. La posibilidad de construir un nuevo significado, de
asimilar un nuevo contenido; en definitiva, la posibilidad de aprender, pasa
necesariamente por la posibilidad de entrar en contacto con el nuevo conocimiento
1
el anlisis de variacin biolgica, como tambin el anlisis de variabilidad en el
estudio de la regresin y la correlacin de las medias. Galton afirmaba que
2
padres muy altos tenan tendencia a tener hijos de menor estatura, mientras
padres bajos solan tener hijo alto; hecho que fue anunciado como regresin a
la media.
Los modelos de regresin son usados con varios fines, que incluyen
(Montgomery, 1982).
Descripcin de datos.
Estimacin de
parmetros. Prediccin y
estimacin.
Control.
Cuando en un modelo de regresin existe una sola variable , este modelo se
denomina modelo de regresin lineal simple, en el caso donde hay ms de una
variable se le llama modelo de regresin lineal mltiple.
2
1
3. CONCEPTUALIZACIN
Son muchas las situaciones reales en las que una variable se relaciona con
otra. Para analizar esta relacin la estadstica proporciona los modelos de
regresin lineal.
3.1. Situacin
problemtica.
Una vez que se hayan tomado las medidas surgen las siguientes peguntas
por parte del estudiante. Se obtienen los mismos datos cuando cambia el
individuo que toma las mediciones, pero no el grupo objeto de estudio?, Qu
se debe hacer con los datos? Es importante aclarar que se deben obtener los
mismos datos si se tiene el mismo grupo en observacin ya que si se obtienen
datos diferentes pueden surgir errores en la medida, o si se trata de una
encuesta las personas pueden variar su pregunta. Para dar respuesta a la
1 7 1 1 7 1
2 7 6 0 7
2 6 1 1 6 1
9 6 7 3 5
3 7 1 1 7 1
0 8 8 0 6
4 7 1 1 6 1
1 7 9 3 6
5 7 1 2 6 1
0 6 0 9 6
6 7 1 2 6 1
5 7 1 9 6
7 7 1 2 7 1
0 6 2 6 7
8 6 1 2 7 1
8 6 3 0 6
9 6 1 2 7 1
5 5 4 9 8
1 6 1 2 6 1
0 8 6 5 7 5
1 6 1 2 6 1
1 5 6 6 6 6
1 7 1 2 7 1
2 4 8 7 2 8
1 7 1 2 6 1
3 2 7 8 9 6
1 7 1 2 7 1
4 9 8 9 3 7
1 7 1 3 7 1
5 3 7 0 1 7
Extensin
Estadsticos Estatura
del brazo
Media 70,3 169,3
Mediana 70 168,5
Moda 70 176
Mnimo 63 150
Mximo 79 186
Cuenta 30 30
Cmo se puede lograr una mejor visualizacin de los datos recolectados para
cada variable?
Para una mejor visualizacin de los datos y teniendo en cuenta que las
medidas realizadas son variables cuantitativas continuas se puede realizar la
tabla de frecuencias para datos continuos, ver tablas 4 y 5, en donde se
observa los intervalos y la frecuencia con que se repiten. Se pueden graficar
los datos?, cul sera la grfica adecuada? Una vez los datos se encuentren
agrupados como se muestra en las tablas 4 y 5 se pueden graficar. Para elegir
la grfica adecuada es necesario tener en cuenta que tipo de variable se est
usando. Para este caso, como se mencion antes, la variable es cuantitativa
4
continua por lo tanto la grfica a utilizar debe ser el histograma de frecuencias ,
ver las figuras 3 y 4.
6 6 6 2 2 6,67% 6,7%
3 5 4
6 6 6 3 5 10,00% 16,7%
5 7 6
6 6 6 3 8 10,00% 26,7%
7 9 8
6 7 7 1 1 33,33% 60,0%
9 1 0 0 8
7 7 7 5 2 16,67% 76,7%
1 3 2 3
7 7 7 3 2 10,00% 86,7%
3 5 4 6
7 7 7 2 2 6,67% 93,3%
5 7 6 8
7 7 7 2 3 6,67% 100,0%
7 9 8 0
3 100%
0
Tabla 4. Tabla de frecuencia datos continuos: Extensin del brazo.
Histograma de frecuencia
Frecuencia absoluta
63 65 67 69 71 73 75 77
Intervalos
Figura 3 .Histograma de frecuencias. Extensin del brazo.
El histograma de frecuencia permite ver con mejor claridad los datos, se puede
observar cada intervalo y la frecuencia en que se repite. Porejemplo el intervalo
comprendido entre 69 y 67cm tiene una frecuencia de tres, mientras que el
intervalo de 79 y 77 cm tiene una frecuencia dedos.
Estat
ura
(cm)
1 1 1 2 2 6,67% 6,7%
5 5 5
1 1 1 4 6 13,33% 20,0%
5 6 5
1 1 1 7 1 23,33% 43,3%
6 6 6 3
1 1 1 6 1 20,00% 63,3%
6 7 7 9
1 1 1 6 2 20,00% 83,3%
7 8 7 5
1 1 1 5 3 16,67% 100,0%
8 8 8 0
30 100%
Tabla 5. Tabla de frecuencias datos continuos: Estatura.
3
0
Histograma de frecuencia
Frecuencia absoluto
Estatura
8
7
6
5
4 7
3 6 6
5
2 4
1 2
0
156 162 168 174 180 186
3
1
5
variable es representada en el eje vertical .Estegrfico facilita identificar a
simple vista si existe o no un indicio de la posible relacin lineal entre las
variables en estudio.
170
160
150
140
130
120
50 55 60 65 70 75 80
De acuerdo al diagrama se observa que los puntos siguen una tendencia lineal,
esto puede indicar que hay seal de la existencia de una relacin directamente
proporcional entre la extensin del brazo y la estatura de una persona, tambin
se puede apreciar que la tendencia lineal de los datos se da en forma
creciente, hecho que permite concluir para estos datos, que a medida que la
extensin del brazo incrementa la estatura tambin lo hace.Adems, se puede
apreciar que los datos se encuentran muy cercanos. Todo esto conlleva a
preguntas tales como: Si el diagrama muestra el indicio de la relacin
existente se puede concluir que hay relacin entre las variables?, siempre los
datos deben estar cercanos entre ellos mismos?, qu pasa si los datos estn
1 7 1 12384 5 29584
2 2
6 7
1 1
11109 4 25921
3 9
7 6
1 7
12600 4 32400
4 0
7 8
1 9
12425 5 30625
5 1
7 7
1 0
11830 4 28561
6 0
7 6
1 9
12900 5 29584
7 5
7 7
1 6
11340 4 26244
8 0
6 6
1 9
11084 4 26569
8 6 6
9 6 1 9 4 22500
1 5
6 5
166 7 2
11288 4 27556
0
1 8
6 1 6
10595 4 26569
1
1 5
7 6
1 2
13320 5 32400
2
1 4
7 8
1 4
12456 5 29929
3
1 2
7 7
1 1
14694 6 34596
4
1 9
7 8
1 2
13067 5 32041
5
1 3
7 7
1 12320 3
4 30976
6
1 0
6 7
1 9
9 3 24336
7
1 3
7 5
1 8 9
11340 4 26244
8
1 0
6 6
1 9
10332 3 26896
9
2 3
6 6
1 9
11592 4 28224
0
2 9
6 6
1 7
11592 4 28224
1
2 9
7 6
1 7
13376 5 30976
2
2 6
7 7
1 7
11200 4 25600
3
2 0
7 6
1 9
14694 6 34596
4
2 9
6 8
1 2
10385 4 24025
5
2 7
6 5
1 4
10560 25600
6
2 6
7 6
1 3
13176 5 33489
7
2 2
6 8
1 1
11385 4 27225
8 9 6 7
2 7 1 12848 5 30976
9 3 7 3
3 71 174 12354 5 30276
0 0
2108 508 3578 1485 8627
0 24 76 42
6
Si el coeficiente de correlacin da una correlacin muy baja, no quiere decir que
no hay relacin entre las dos variables, puede que exista otro tipo de relacin
diferente a la lineal, por ejemplo, una relacin cuadrtica. En este caso debe
realizar otra prueba que no est al alcance de este documento.
Si el valor calculado de es igual a 0.5 que se puede concluir? Se puede
concluir que la relacin entre las variables en estudio es dbil debidoa que
valor de se encuentra muy cercano a 0
.
La Figura 6muestra otro tipo de relacin que se pueden dar entre las variables
consideradas.
Una vez verificada la relacin existente a travs del clculo del coeficiente de
correlacin qu se debe hacer?
Cuando se verifica que hay correlacin entre las variables observadas se
puede construir el modelo de regresin linealel cual se describe a continuacin.
Variable
independie
Variable nte
dependie
nte
Intercep
to
Pendiente
190
180
Estatura
170
160
150
140
130
120
50 55 60 65 70 75 80
Extensin del brazo
La ecuacin que modela los datos se encuentra a travs de los pasos descritos
a continuacin.
9
Para calcular los coeficientes de regresin se utilizan los datos calculados en
la tabla 6.
4
0
9En el anexo 2 se muestra un instructivo para que el lector realice los clculos
del coeficiente de correlacin y los coeficientes de regresin, utilizando la
herramienta de excel.
4
1
Paso 2:Se calcula el intercepto.
Valor de
Valor
la
del
pendien (6)
intercep
te
to
Recordar!
Reemplaza
mos a en
(6)
Donde
cm
A tener en cuenta
Pasos Procedimiento.
1 Identificar las variables en estudio.
2 Identificar las unidades de medida.
3 Establecer la variable regresora y de respuesta .
4 Recoleccin de datos.
5 Tabular la informacin.
6 Realizar el grfico de dispersin.
Hallar el coeficiente de correlacin lineal e interpretar el
7 valor
calculado.
8 Formar el modelo de regresin (si hay relacin).
9 Interpretar los coeficientes de regresin.
10 Realizar predicciones.
Agnelli H., Konic P, Paparelli S., Zon N. y Flores P. (2009). La funcin lineal
obstculo didctico para la enseanza de la regresin lineal.
5
0
ANEXOS
5
1
IT UNIVERSID PROGRAMA MATERI CONCEPTOS CONTENIDO EN REGRESIN
E AD A PREVIOS LINEAL
Anlisis de regresin
simple.
Distribuciones El mtodo de los mnimos
Pontifi cuadrados. El modelo lineal.
1 Administracin Estadsti de Frecuencia
cia ca I Modelos polinmicos
Medidas
Bolivar generales. Modelos
iana exponenciales y logartmicos.
descriptivas
Numricas. El modelo potencial.
Regresin Lineal:
Concepto de Variable
independiente y
dependiente.
informacin. Valores
ajustados.
5
2
IT UNIVERSID PROGRAMA MATERI CONCEPTOS CONTENIDO EN REGRESIN
E AD A PREVIOS LINEAL
Interpolaciones y
extrapolaciones.
Correlacin y determinacin
Manejo de funciones de
regresin con software
Regresin lineal Variable
independiente.
Representacin tabular
Variable
de la informacin.
dependiente.
Tabulacin para
Diagrama de dispersin.
datos continuos:
Tecnolgic Es comn para todos los Nocio
Ecuacin de regresin por el
tabulacin por
3 o pascual programas donde se nes
mtodo de los mnimos
intervalos
Bravo- IU dicta ( es electiva) de
cuadrados. Interpretacin de
representacin
estad
la pendiente y del intercepto.
grfica de la
stica
Valores ajustados.
informacin
medidas de Grfica de la recta de
medidas de Correlacin y
IT UNIVERSID PROGRAMA MATERI CONCEPTOS CONTENIDO EN REGRESIN
E AD A PREVIOS LINEAL
Regresin lineal simple
(mnimos
Tecnolg cuadrados).
4 Comn para todos los Estadsti Estadstica
ico de programas ca descriptiva Regresin
Antioqui cuadrtica.
a Correlacin simple y
Tipos de modelos de
regresin.
Nociones preliminares
de estadstica Error estndar de medicin.
Descripcin de Determinacin de la
conjunto de ecuacin. Correlacin.
Medicinde la auto
datos
correlacin.
Jaime Medidas de
5 Comn para todos los Estadsti Diagnstico de regresin.
resumen
Isaza programas ca
descriptivas Anlisis residual y de
Cadavid influencia.
Probabilidades
Variables aleatorias Desarrollo del modelo de
discretas y distribucin regresin mltiple.
de probabilidades Medicin de la asociacin del
discretas Estimacin modelo
de parmetros de regresin mltiple.
Pruebas de Anlisis residual de la
IT UNIVERSID PROGRAMA MATERI CONCEPTOS CONTENIDO EN REGRESIN
E AD A PREVIOS LINEAL
Excel.
Coeficiente de determinacin
parcial.
Estadstica Correlacin y
regresin lineal
I.
Mtodo de los mnimos
Estadstica
cuadrados El anlisis de
Estads regresin lineal normal
6 Antioquia Administrativas y descriptiva,
econmicas tica II Pronsticos
probabilidad,
Formas funcionales
alternativas
Esperanza
matemtica,
Distribuciones
de
IT UNIVERSID PROGRAMA MATERI CONCEPTOS CONTENIDO EN REGRESIN
E AD A PREVIOS LINEAL
Estadstica Modelo de regresin con dos
Matemtica I variables
Estadstica Estimacin
descriptiva y Propiedades de la recta de
Anlisis regresin Inferencia sobre
Estadst
Exploratorio de parmetros
7 Antioquia INGENIERAS ica
Datos
Matem
Distribuciones
tica II
mustrales
Estimacin
Puntual
Estimacin por Regresin Lineal
Estadstica simple:
Conceptos bsicos acerca de
Ingenie descriptiva.
Nacional ras. un modelo de regresin
Probabilidad
8 Administrativa, Estadsti lineal. Estimacin e inferencia
de
ca I
Colombia Industrial, Civil, Minas y y acerca de los parmetros del
Economa,
Estimacin:
Administracin de
Estimacin
Empresas,
puntual.
Administracin de Estads Estimaci
9 Medelln
Empresas Tursticas, tica n por
Mercadeo, Negocios Aplicad intervalos
Internacionales, a . Error
Ingeniera Civil,
muestral.
Ingeniera de Sistemas,
Error no muestral. (
Ingeniera Financiera,
Inferencia )
Ingeniera
Hiptesis de
de
investigacin.
Telecomunicaci
ones. Hiptesis
estadstica.
Errores en la
IT UNIVERSID PROGRAMA MATERI CONCEPTOS CONTENIDO EN REGRESIN
E AD A PREVIOS LINEAL
Muestreo simple
aleatorio. Muestreo
estratificado
aleatorio. Muestreo
por
conglomerados. (
Muestreo)
Anlisis El Modelo lineal
exploratorio de general
datos El mtodo de los mnimos
Distribuciones cuadrados para la estimacin
muestrales y de parmetros. Propiedades
teorema del lmite de los estimadores de
10 Eafit Ingeniera Matemtica Estadsti
ca I central mnimos
Estimacin puntual cuadrados.
y por intervalos Deduccin del coeficiente de
Propiedades de determinacin.
los estimadores Error y el vector de
estimadores.
puntuales y
Estadsti Descripcin
mtodos de Descripcin estadstica de
11 Eafit Ingenieras ca varias
estadstica
General variables
Anexo 2.Instructivo para graficar el diagrama de dispersin y calcular el
coeficiente de correlacin y los coeficientesde regresin usando la herramienta
excel.
Excel es una herramienta que se usa para realizar diversos grficos, entre
otros, los diagramas de dispersin.
5
Una vez realizado los pasos anteriores se muestra en la hoja de excel el grfico
elegido ver figura 2.
11
Figura 4. Formato de la escala numrica .
11
Las lneas horizontales que aparecen dentro del grfico se pueden eliminar de la
siguiente manera: Se da click sobre las lneas para seleccionarlas, y luego se
presiona la tecla suprimir para borrarlas.
6
1
Figura 5. Configurar escala numrica.
Calcular la pendiente.
12
Para calcular el intercepto se realiza el mismo procedimiento del clculo de la
pendiente.
Figura 9. Clculo de los coeficientes de regresin
Grfico 1 Grfico 2
Y
Y
X
X
Grfico 3 Grfico 4
Y Y
X X
Grfico 5 Grfico 6.
Y Y
X
X
Actividad 4.Taller complementario.
SEMANA REDUCCI
OBSERVA S DE N XY 2 2
ENTRENA DEL
X Y
CIN
MIENTO
X TIEMP
Y
1 1 1 1 1 2.
2 2 .2 .4 4 54
3 1 1 1 1 1
4 3 2 6 9 4.
5 2 .
1 .3 4 4
2.
6 3 .
2 7 9 2
6.
7 4 .4 1. 1 21
8 5 5 6
2 6
2 6
2
9 4 2 5
1 5
1 6.5
. 0 6 2
TOTAL 25 2 74.4 8 67.7
2 5 2
7
0
AOS QUE DAOS
PACIEN HA EN X
FUMADO PULMO X2 Y
TE X Y Y 2
1 2 5 1375 6 3025
2 5
3 5
6 2160 2
1296 3600
3 6
2 0
5 1100 4 2500
4 2
1 0
3 4 8
2 9
5 5
4 0
7 5
3600 2
2304 0
5625
6 8
3 5
7 2730 1521 4900
7 9
4 0
7 2940 1764 4900
8 2
3 0
5 1705 9 3025
9 1
2 5
3 8 6
7 9
10 8
3 0
3 4
1155 8
1089 0
1225
TOTA 3
319 5
530 1805 1105 3060
L 5 3 0
7
1