Professional Documents
Culture Documents
MARCO REFERENCIAL
Diagrama de dispersin y correlacin
Los diagramas de dispersin son una forma fenomenal de expresar datos de
dos variables, y hacer predicciones basadas en los datos. Al contrario de los
histogramas y los diagramas de caja, los de dispersin muestran valores de
datos individuales.
Este es el diagrama de dispersin que expresa la cantidad de dinero que se
gan Mateo cada semana trabajando en la tienda de su padre.
Correlacin
Con los diagramas de dispersin podemos ver cmo se relacionan ambas
variables entre s. Esto es lo que se conoce como correlacin. Hay tres tipos
de correlacin: positiva, negativa y nula (sin correlacin).
Sin correlacin: no hay una relacin aparente entre las variables. Los
puntos en tus videojuegos y tu talla de zapato no parece tener ninguna
correlacin; mientras una aumenta, la otra no tiene ningn efecto.
Lnea de ajuste
Usamos la "lnea de ajuste" para hacer predicciones basndonos en datos
pasados. Hay muchas y muy complicadas frmulas para encontrar esta recta,
pero por ahora solo la dibujaremos a travs de los puntos en la grfica para
que se ajuste a la tendencia que nos marcan los datos. Cuando se dibuje la
recta, es necesario asegurarse de que encaje con la mayor parte de los datos.
Si hay un punto que est muy por encima o muy por debajo con respecto al
resto (los atpicos) es recomendable colocarlos fuera de la recta.
Anlisis
Regresin
de
Para ello se propone un MODELO que relaciona una variable dependiente (Y)
con una variable independiente (X).
Modelo
Llamaremos MODELO MATEMTICO a la funcin matemtica que
proponemos como forma de relacin entre la variable dependiente (Y) y la o las
variables independientes.
La funcin ms simple para la relacin entre dos variables es la FUNCIN
LINEAL
Y =a+b X
Esta expresin es una aproximacin de la verdadera relacin entre X e
Y.
Para un dado valor de X el modelo predice un cierto valor para Y.
Mientras mejor sea la prediccin, mejor es el modelo para explicar el
fenmeno.
Donde:
b=
X =
-
Y =
X =
Y =
n=
Donde:
a=
b=
-
ordenada Y
pendiente de la ecuacin (hallada anteriormente)
X =
Y =
El coeficiente de determinacin
El coeficiente de determinacin es la principal forma en que podemos medir el
grado, o fuerza, de la asociacin que existe entre dos variables, X e Y. Debido a
que usamos una muestra de puntos para desarrollar rectas de regresin, nos
referimos a esta medida como el coeficiente de determinacin muestral.
El coeficiente de determinacin muestral se deriva de la relacin entre dos tipos
de variacin: la variacin de los valores Y en un conjunto de datos alrededor de
1. la recta de regresin ajustada;
2. su propia media.
Donde:
2
r =
a=
ordenada Y
b=
n=
X =
Y =
Y =
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube
el de la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable
disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto
ms se aproxime a -1.
Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir
otro tipo de correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto
quiere decir obligatoriamente que existe una relacin de causa-efecto entre las
dos variables, ya que este resultado podra haberse debido al puro azar.
MARCO CONCEPTUAL
1. Estimacin. Conjunto de tcnicas que permiten dar un valor aproximado
de un parmetro de una poblacin a partir de los datos proporcionados
por una muestra. Por ejemplo, una estimacin de la media de una
determinada caracterstica de una poblacin de tamao N podra ser la
media de esa misma caracterstica para una muestra de tamao n.