You are on page 1of 16

Instituto Tecnolgico de Minatitln.

UNIDAD 5: REGRESIN Y CORRELACIN.

Materia: Probabilidad y Estadstica.

Nombre del maestro: Ing. Martnez Prez Mara Otilia.

Nombre del alumno: De la O Silva Eliel.

2 semestre.

Numero de control: 11230837.

Carrera: Ingeniera Electrnica.

Periodo escolar: Ene.-Jun./2012.

Minatitln, Veracruz a 16 de mayo del 2012.

ndice.

Pagina

5.1 Control de calidad.

5.2 Diagrama de dispersin

5.3 Regresin lineal simple

5.4 Correlacin

5.5 Determinacin y anlisis de los coeficientes de correlacin y de determinacin.

5.6 Distribucin normal bidimensional

5.7 Intervalos de confianza y pruebas para el coeficiente de correlacin.

5.8 Errores de medicin. 10 Bibliografa.

5.1 CONTROL DE CALIDAD.

Definicin El control de calidad estadstico se refiere a la utilizacin de mtodos estadsticos en el seguimiento y mantenimiento de la calidad de los productos y servicios Un mtodo, conocido como muestreo de aceptacin, se puede utilizar cuando una decisin debe ser tomada para aceptar o rechazar un grupo de piezas o artculos basados en la calidad encontrado en una muestra. Un segundo mtodo, conocido como control estadstico de proceso, utiliza pantallas grficas conocidas como grficos de control para determinar si un proceso debe continuar o debe ajustarse para conseguir la calidad deseada. El Control Estadstico de la Calidad y la mejora de procesos. Comenzando con la aportacin del cientfico llamado Shewhart, sobre reconocer que en todo proceso de produccin existe variacin, podemos decir que no podan producirse dos partes con las mismas especificaciones, pues era evidente que las diferencias en la materia prima e insumos y los distintos grados de habilidad de los operadores provocaban variabilidad. Shewhart no propona suprimir las variaciones, sino determinar cul era el rango tolerable de variacin que evite que se originen problemas. Causas de variacin

Existen variaciones en todas las partes producidas en el proceso de manufactura. Hay dos fuentes de variacin: variacin aleatoria se debe al azar y no se puede eliminar por completo. variacin asignable es no aleatoria y se puede reducir o eliminar. Nota: la variacin puede cambiar y cambiar la forma, dispersin y tendencia central de la distribucin de las caractersticas medidas del producto.
o o

Diagramas de diagnstico Controles o registros que podran llamarse "herramientas para asegurar la calidad de una fbrica", esta son las siguientes:

Hoja de control (Hoja de recogida de datos) Histograma Anlisis paretiano (Diagrama de pareto) Diagrama de Ishikawa: Diagrama de causa y efecto (Espina de Pescado) Estratificacin (Anlisis por Estratificacin) Diagrama de scadter (Diagrama de Dispersin) Grfica de control

Como elaborar un diagrama de Pareto Partiendo de los descubrimientos del celebre economista y socilogo italiano Vilfredo Pareto El diagrama de Pareto es una comparacin ordenada de factores relativos a un problema. Esta comparacin nos va a ayudar a identificar y enfocar los pocos factores vitales diferencindolos de los muchos factores tiles. Esta herramienta es especialmente valiosa en la asignacin de prioridades a los problemas de calidad, en el diagnstico de causas y en la solucin de las mismas, el diagrama de Pareto se puede elaborar de la siguiente manera:

1. Cuantificar los factores del problema y sumar los efectos parciales hallando el total. 2. Reordenar los elementos de mayor a menor. 3. Determinar el % acumulado del total para cada elemento de la lista ordenada. 4. Trazar y rotular el eje vertical izquierdo (unidades). 5. Trazar y rotular el eje horizontal (elementos). 6. Trazar y rotular el eje vertical derecho (porcentajes). 7. Dibujar las barras correspondientes a cada elemento. 8. Trazar un grfico lineal representando el porcentaje acumulado. 9. Analizar el diagrama localizando el "Punto de inflexin" en este ltimo grfico. Se ha llegado a verificar la regularidad con la que se dan en las distintas actividades y fenmenos sociales y productivos, el hecho de que unos pocos factores son responsables de la mayora de los sucesos, en tanto que el resto mayoritario de los elementos o factores generan o poseen escasos efectos, es lo que ms comnmente se cataloga como los "pocos vitales y los muchos triviales". As en procesos tradicionales de produccin podemos tener que el 20% de las causas de imperfecciones o fallas originan o son responsables de entre un 70 y 80% de los defectos detectados. Y al revs, un 80% de las restantes causas generan tan slo entre un 30 y 20% de los defectos. Que importancia tiene ello? Pues bien, permite atacar unas pocas causas generando un importante impacto total.

5.2 DIAGRAMA DE DISPERSIN.

Definicin. Un diagrama de dispersin es un tipo de diagrama matemtico que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posicin en el eje horizontal y el valor de la otra variable determinado por la posicin en el eje vertical.[1] Un diagrama de dispersin se llama tambin grfico de dispersin. Caractersticas principales Impacto visual Un Diagrama de Dispersin muestra la posibilidad de la existencia de correlacin entre dos variables de un vistazo. Comunicacin Simplifica el anlisis de situaciones numricas complejas Gua en la investigacin El anlisis de datos mediante esta herramienta proporciona mayor informacin que el simple anlisis matemtico de correlacin, sugiriendo posibilidades y alternativas de estudio, basadas en la necesidad de conjugar datos y procesos en su utilizacin. Utilidad Los diagramas de dispersin pueden utilizarse para examinar: * Relaciones causa-efecto * Relaciones entre dos efectos * Posibilidad de utilizar un efecto como sustituto de otro * Relaciones entre dos posibles causas En las distribuciones bidimensionales a cada individuo le corresponden los valores de dos variables, las representamos por el par (xi, yi). Si representamos cada par de valores como las coordenadas de un punto, el conjunto de todos ellos se llama nube de puntos o diagrama de dispersin. Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresin. Pasos a seguir para elaborar un diagrama de dispersin. 1. Elaborar una teora admisible y relevante sobre la supuesta relacin entre dos variables.

2. Obtener los pares de datos correspondientes a las dos variables. 3. Determinar los valores mximo y mnimo para cada una de las variables. 4. Decidir sobre qu eje se representar a cada una de las variables. 5. Trazar y rotular los ejes horizontal y vertical. 6. Marcar sobre el diagrama los pares de datos. 7. Rotular el grfico.

Ejemplo Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes: Matemticas Fsica 2 1 3 3 4 2 4 4 5 4 6 4 6 6 7 4 7 6 8 7 10 9 10 10

5.3 REGRESIN LINEAL SIMPLE

INTRODUCCIN

Si sabemos que existe una relacin entre una variable denominada dependiente y otras denominadas independientes (como por ejemplo las existentes entre: la experiencia profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de personas, la produccin agraria y la cantidad de fertilizantes utilizados, etc.), puede darse el problema de que la dependiente asuma mltiples valores para una combinacin de valores de las independientes. ASPECTOS TERICOS La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para solucionar problemas comunes en los negocios. Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relacin Funcional entre dos o ms variables, donde una variable depende de la otra variable. Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresin Simple. "Y es una funcin de X" Y = f(X) Como Y depende de X, Y es la variable dependiente, y X es la variable independiente.

Conclusin La ecuacin de Regresin Lineal estimada para las variables estatura y peso muestran, de acuerdo a la prueba F, relacin. Esta relacin se ha estimado en un R = 93.7, que indica una fuerte relacin positiva. Adems si consideramos el coeficiente de determinacin R = 87.9 podemos indicar que el 87.9% de las variaciones que ocurren en el peso se explicaran por las variaciones en la variable estatura.

5.4 CORRELACIN

En probabilidad y estadstica, la correlacin indica la fuerza y la direccin de una relacin lineal y proporcionalidad entre dos variables estadsticas. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y viceversa. La correlacin entre dos variables no implica, por s misma, ninguna relacin de causalidad. Fuerza, sentido y forma de la correlacin La relacin entre dos super variables cuantitativas queda representada mediante la lnea de mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales de una lnea de ajuste y, por lo tanto, de una correlacin, son la fuerza, el sentido y la forma:

La fuerza extrema segn el caso, mide el grado en que la lnea representa a la nube de puntos: si la nube es estrecha y alargada, se representa por una lnea recta, lo que indica que la relacin es fuerte; si la nube de puntos tiene una tendencia elptica o circular, la relacin es dbil. El sentido mide la variacin de los valores de B con respecto a A: si al crecer los valores de A lo hacen los de B, la relacin es positiva; si al crecer los valores de A disminuyen los de B, la relacin es negativa. La forma establece el tipo de lnea que define el mejor ajuste: la lnea recta, la curva monotnica o la curva no monotnica.

Interpretacin geomtrica Dados los valores muestrales de dos variables aleatorias e

, que pueden ser consideradas como vectores en un espacio a n dimensiones, puden construirse los "vectores centrados" como: e .

El coseno del ngulo alfa entre estos vectores es dada por la frmula siguiente:

Pues es el coeficiente de correlacin muestral de Pearson. El coeficiente de correlacin es el coseno entre ambos vectores centrados:

Si r = 1, el ngulo Si r = 0, el ngulo Si r =-1, el ngulo opuesto.

, ambos vectores son colineales (paralelos). , ambos vectores son ortogonales. , ambos vectores son colineales de direccin

Ms generalmente:

Por supuesto, del punto vista geomtrica, no hablamos de correlacin lineal: el coeficiente de correlacin tiene siempre un sentido, cualquiera que sea su valor entre 1 y 1. Nos informa de modo preciso, no tanto sobre el grado de dependencia entre las variables, que sobre su distancia angular en la hiperesfera a n dimensiones. La Iconografa de las correlaciones es un mtodo de anlisis multidimensional que reposa en esta idea. La correlacion lineal se da cuando en una nube de puntos estos se encuentran o se distribuyen alrededor de una recta. Distribucin del coeficiente de correlacin El coeficiente de correlacin muestral de una muestra es de hecho una varible aleatoria, eso significa que si repetimos un experimento o consideramos diferentes muestras se obtendrn valores diferentes y por tanto el coeficiente de correlacin muestral calculado a partir de ellas tendr valores ligeramente diferentes. Para muestras grandes la variacin en dicho coeficiente ser menor que para muestras pequeas. R. A. Fisher fue el primero en determinar la distribucin de probabilidad para el coeficiente de correlacin. Si las dos variables aleatorias que trata de relacionarse proceden de una distribucin gaussiana bivariante entonces el coeficiente de correlacin r sigue una distribucin de probabilidad dada por:[1] [2]

donde: es la distribucin gamma es la funcin gaussiana hipergeomtrica.

Ntese que .

, por tanto r es estimador sesgado de

Puede obtenerse un estimador aproximado no sesgado resolviendo la ecuacin:

for Aunque, la solucn:

es subptima. Se puede obtener un estimador sesgado con mnima varianza para grandes valores de n, con sesgo de orden buscando el mximo de la expresin:

, i.e. En el caso especial de que , la distribucin original puede ser reescrita como:

donde

es la funcin beta.

10

5.5 DETERMINACIN Y ANLISIS DE LOS COEFICIENTES DE CORRELACIN Y DE DETERMINACIN.

El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que puede existir entre las varables es lineal (es decir, si representaramos en un gfico los pares de valores de las dos variables la nube de puntos se aproximara a una recta). No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc. En estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las variables, por lo que convendra utilizar otro tipo de coeficiente ms apropiado. Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es representar los pares de valores en un grfico y ver que forma describen. El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula: Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x,y) se multiplica la x menos su media, por la y menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamao de la muestra. Denominador se calcula el produto de las varianzas de x y de y, y a este produto se le calcula la raz cuadrada. Los valores que puede tomar el coeficiente de correlacin r son: 1 < r < 1 Si r > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1. Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms. Si r < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a 1. Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos. Si r = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de correlacin (parablica, exponencial, etc.) De todos modos, aunque el valor de r fuera prximo a 1 o 1, tampoco esto quiere decir obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que este resultado podra haberse debido al puro azar.

11

5.6 Distribucin normal bidimensional. La distribucin normal n-dimensional Nn (m,S) es una generalizacin de la distribucin normal univariante. La funcin de densidad de una variable n-dimensional normal X=(X1, X2, ..., Xn) de parmetros m y S es

para

(i

1,2,..,n),

donde

es

el

vector

de

medias

con y S es la matriz de varianzas-covarianzas (simtrica y definida positiva)

con y

Propiedades:

Para n=1 la funcin de densidad anterior es la de la distribucin normal unidimensional. Si m = 0 y S = I (matriz identidad) entonces la distribucin se denomina normal n-dimensional estndar, Nn(0,I) Si Z=(Z1,...,Zn) tiene una distribucin normal n-dimensional estndar, A=(aij) es una matriz cuadrada de orden n con determinante no nulo y m=(m1,..,mn)' es una matriz columna nx1 entonces la variable X=AZ+m

sigue una distribucin normal n-dimensional Nn(m,S) donde S = A A'. Si X=(X1,...,Xn) tiene una distribucin normal n-dimensional Nn(m,S) y B y C son dos matrices de nmeros reales (B de dimensin pxn y C de dimensin px1) tal que BSB' es una matriz definida positiva entonces la variable Z=BX+C

12

tiene una distribucin normal p-dimensional Np(Bm+C, BSB'). Si X=(X1,...,Xn) tiene una distribucin normal n-dimensional Nn(m,S), la variable formada por cualquier subconjunto de k variables de las n, sigue una distribucin normal k-dimensional con los parmetros correspondientes. En particular con k=1, tenemos que la distribucin marginal de cualquiera de las Xi es una distribucin normal unidimensional .

Sean X1, X2,..,Xn variables aleatorias independientes con distribuciones normales unidimensionales . Entonces, la variable aleatoria X=(X1,...,Xn) tiene una distribucin normal n-dimensional Nn(m,S) con

parmetros y . Sea X=(X1,...,Xn) una variable aleatoria con distribucin normal n-dimensional Nn(m,S). Sus n variables componentes X1, X2,..,Xn son independientes si, y slo si, estn incorrelacionadas. Sea X=(X1,...,Xn) una variable aleatoria con distribucin normal n-dimensional Nn(m,S). Si dividimos sus componentes en dos grupos ,por

ejemplo y y de igual forma particionamos las matrices m y S (con los parmetros correspondientes a cada grupo), condicionada por y es una entonces la distribucin de normal p-dimensional de media .

y matriz de varianzas-covarianzas

Normal bidimensional: Esta distribucin es un caso particular de la distribucin normal n-dimensional para n=2 por lo que todos los resultados vistos anteriormente son tambin vlidos. No obstante, mostraremos de forma explcita dichos resultados sin recurrir a la notacin matricial. As bien, la funcin de densidad de una variable aleatoria (X,Y) normal bidimensional es

13

para y , donde mX y mY son las medias de X e Y respectivamente, sX y sY sus desviaciones tpicas y r el coeficiente de correlacin lineal entre las dos variables.

Propiedades:

Si mX y mY son cero sX y sY son 1 y r es cero entonces la distribucin se denomina normal bidimensional estndar, y su funcin de densidad es

Si (X,Y) tiene una distribucin normal bidimensional y (U,V) es una transformacin de ella del tipo U=aX+bY+c y V=dX+eY+f , de manera que la matriz dos). tiene determinante distinto de cero (rango

Entonces la variable aleatoria (U,V) tambin sigue una distribucin normal

bidimensional

, donde

14

En particular, si (X,Y) tiene una distribucin normal bidimensional estandar y (U,V) es una transformacin de ella del tipo anterior (con rg(B)=2) entonces (U,V) sigue una distribucin normal bidimensional

Si (X,Y) tiene una distribucin normal bidimensional, tanto X como Y siguen distribuciones normales, en concreto X tiene una distribucin N(mX,sX) e Y tiene una distribucin N(mY,sY). Si X e Y son variables aleatorias independientes con distribuciones normales unidimensionales N(mX,sX) y N(mY,sY). Entonces, la variable aleatoria (X,Y)

tiene distribucin normal bidimensional . Sea (X,Y) una variable aleatoria normal bidimensional. Entonces, X e Y son independientes si, y slo si, estn incorrelacionadas. Sea (X,Y) una variable aleatoria normal bidimensional. La distribucin de Y condicionada por X=x es normal unidimensional .

15

Bibliografa http://es.wikipedia.org/wiki/Correlaci%C3%B3n http://www.monografias.com/trabajos27/regresion-simple/regresion-simple.shtml http://www2.eco.uva.es/estadmed/probvar/d_multivar/dnvar7.htm

16

You might also like