You are on page 1of 21

ESCUELA ACADMICO PROFESIONAL DE INGENIERA DE MINAS

INFORME DE ANALISIS
BIDIMENSIONAL DE DATOS

ASIGNATURA : Anlisis Estadstico de Datos Mineros


ESTUDIANTES : Angel Anthony Flores Pauca
CODIGO : 07-31116
DOCENTE : Ing. Jorge Segura
AO : Tercero

TACNA PER
2012
INTRODUCCIN
Estadstica, disciplina que estudia cuantitativamente los fenmenos de masa o colectivos, o
sea, aquellos fenmenos cuyo estudio solo puede efectuarse a travs de una coleccin de
observaciones; es decir , La Estadstica es una disciplina que utiliza recursos matemticos
para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir
conclusiones respecto de ellos.

En muchas ocasiones no basta con estudiar la descripcin de un fenmeno y sus


variaciones, es conveniente conocer a qu son debidas esas variaciones. Puede resultar
interesante e incluso necesario estudiar los cambios producidos en una variable en relacin
con otras, o cmo influyen unas variables para que otra cambie. Cuando se estudian
conjuntamente varias variables se entra en el campo de la estadstica multivariable (muchas
variables). Si el estudio se reduce a dos variables, como en este tema, se llama estadstica
bidimensional.

La estadstica bidimensional estudia fenmenos en los que intervienen dos variables


conjuntamente, buscando la relacin que existe entre ambas. As, por ejemplo, se puede
estudiar la influencia que tienen los ingresos de una determinada familia en los gastos que
tiene, o cmo influye la velocidad de un cierto automvil en su consumo de combustible, o
qu relacin existe entre la ley de cabeza de mineral y el costo de ella. Una variable
bidimensional se representa por un par (X, Y), donde X es la primera variable y toma los
valores X1, X2, X3,...,Xn e Y la segunda y toma los valores, Y1, Y2, Y3, ...,Yn.

Sin embargo, al considerar dos variables de una poblacin o muestra, no podemos afirmar
que se trata de una variable bidimensional porque la relacin entre las variables puede no
ser estadstica.
ANALISIS BIDIMENSIONAL

En numerosas ocasiones interesa estudiar simultneamente dos (o ms) caracteres de una


poblacin. En el caso de dos (o ms) variables estudiadas conjuntamente se habla de variable
bidimensional; si se trata de dos caracteres cualitativos, de par de atributos.

1. Notacin:

M = {(X1, Y1) (X2, Y2),,(Xn, Yn)}

2. Anlisis cualitativo:

En el estudio visto de regresin y correlacin se ha tratado solo el caso de variables


cuantitativas (ingresos, salarios, precios, etc.). Con variables de tipo cualitativo se puede
construir tablas de contingencia, a travs de las cuales se puede estudiar la
independencia estadstica entre los distintos atributos.

Si dos atributos son dependientes, se pueden construir una serie de coeficientes que nos
midan el grado asociacin o dependencia entre los mismos.

a) Diagrama de dispersin

En un problema de este tipo, se observan los valores (xi, yj) y se representan en


un sistema de ejes coordenados, obteniendo un conjunto de puntos sobre el
plano, llamado diagrama de dispersin o nube de puntos.

En los diagramas de arriba se puede observar cmo en el de la izquierda, una


lnea recta inclinada puede aproximarse a casi todos los puntos, mientras que en
el otro, cualquier recta deja a muchos puntos alejados de ella. As pues, el hacer
un anlisis de regresin lineal slo estara justificado en el ejemplo de la
izquierda.

Como se puede ver en ambos diagramas, ninguna recta es capaz de pasar por
todos los puntos, y seguir siendo recta. De todas las rectas posibles, la recta de
regresin de y sobre x es aquella que minimiza un cierto error, considerando a X
como variable explicativa o independiente y a Y como la explicada o
dependiente.
b) Grfico QQ plot

Los diagramas de cuantiles comparan en un sistema de coordenadas


cartesianas, los cuantiles muestrales (eje X) con los cuantiles esperados bajo la
hiptesis normalidad. Si la distribucin de partida es normal dichos diagramas
tendern a ser rectas que pasan por el origen. Cuanto ms se desven de una
recta menos normal sern los datos. En la Figura se muestran posibles
diagramas de cuantiles segn la forma de la distribucin de frecuencias.

Diagramas de cuantiles correspondientes


a distintos tipos de distribuciones

3. Anlisis cuantitativo:

Las variables cuantitativas son las que pueden expresarse numricamente. Una primera
clasificacin, basada en el tipo de valores que puede tomar, permite distinguir entre
variables cuantitativas discretas que son, frecuentemente el resultado de contar y, por
tanto, toman slo valores enteros y continuas, que resultan de medir y pueden contener
cifras decimales.

Las variables cuantitativas discretas con un nmero pequeo de valores se trataran de


manera similar a las variables cualitativas antes descritas.

a) Covarianza
Para las variables estadsticas bidimensionales se define la covarianza como
la media aritmtica de los productos de las desviaciones respecto de la media de
cada una de las variables componentes. Es decir:

Cxy = sumatoria (x*y) (x prom.*y prom.)

Una covarianza positiva y alta indica que ambas variables crecen o decrecen
simultneamente, es decir, presentan una fuerte correlacin. Cuando mayor sea
la covarianza, ms estrecha es la relacin entre las variables.

Cxy > 0 correlacin positiva


Una covarianza alta y negativa indica que cuando una variable crece, la otra
decrece y viceversa, es decir, presentan una fuerte correlacin inversa. Cuanto
menor sea la covarianza, puesto que es negativa, ms estrecha es esta relacin
entre las variables.

Cxy < 0 correlacin negativa

La covarianza cero o prxima a cero indica que no existe relacin entre las
variables.

Cxy = 0 correlacin nula

b) Coeficiente de correlacin

Un coeficiente de correlacin expresa el grado de relacin entre variables. Su


valor o magnitud flucta de +1 (perfecta correlacin positiva) a -1 (Perfecta
correlacin negativa). Si X e Y denotan las dos variables que se consideran, un
diagrama de dispersin muestra la localizacin de los puntos (X,Y) en un
sistema de coordenadas rectangulares. Si todos los puntos en este diagrama de
dispersin parecen encontrarse cerca de una recta, como en (a) y (b) la
correlacin se dice lineal. Si Y tiende a incrementarse cuando se incrementa X,
como en (a) la correlacin se dice positiva o correlacin directa. Si Y tiende a
disminuir cuando se incrementa X, como en (b) la correlacin se dice negativa o
correlacin inversa.

Si todos los puntos parecen estar cerca de una curva, la correlacin se dice no
lineal y una ecuacin no lineal es la apropiada para la regresin o estimacin,
una correlacin no lineal puede ser a veces positiva o negativa. Si no hay
ninguna relacin entre las variables (c) se dice que no hay correlacin entre
ellas, es decir no estn correlacionadas.

Asi por ejemplo, la correlacin que existe entre inteligencia y rendimiento es


positiva, dado a que los alumnos ms inteligentes tienden a obtener altos
rendimientos acadmicos.

El que una correlacin sea estadsticamente significativa quiere decir que


conocemos la probabilidad de error cuando sabemos que X e Y correlacionan.
Es decir, conocemos el mrgen de error en el sentido de que la relacin entre X
e Y se deba simplemente a una casualidad o al azar y no a factores causales
estructurales que asocian a las variables.
PROCESO PRCTICO - EXCEL

ANALISIS BIDIMENSIONAL DE DATOS


MODELO NO LINEAL

MINIMOS CUADRADOS
N X Y
XY X Y
Y* ei
1 240 25 6000 57600 625 34,10985915 82,98953382
2 236 31 7316 55696 961 31,73840376 0,545240107
3 290 45 13050 84100 2025 63,75305164 351,6769459
4 274 60 16440 75076 3600 54,26723005 32,86465133
5 301 65 19565 90601 4225 70,27455399 27,8209198
6 316 72 22752 99856 5184 79,16751174 51,3732245
7 300 80 24000 90000 6400 69,68169014 106,4675183
8 296 84 24864 87616 7056 67,31023474 278,5482644
9 267 75 20025 71289 5625 50,1171831 619,1545769
10 276 60 16560 76176 3600 55,45295775 20,67559326
11 288 50 14400 82944 2500 62,56732394 157,9376311
12 261 38 9918 68121 1444 46,56 73,2736
3345 685 194890 939075 43245 685 1803,3277
promedio 278,75 57,0833333 16240,8333 78256,25 3603,75 57,08333333 150,2773083

ANALISIS CUANTITATIVO
VARIABLE VALOR
COVARIANZA 328,8541667
D.E. DE (X) 23,5518046
D. E. DE (Y) 18,5807173
C.CORRELACION 0,751478714
C.CORRELACION 0,751478714
R 0,751465235
VARIANZA DE X 605,1136364
VARIANZA DE Y 376,6287879
POR MATRICES
12 3345 a 685
[ 3345 939075 ] [ b ] = [ 194890 ]
MATRIZ INVERSA
11,75680751 -0,041877934 a -108,177465
[ -0,041877934 0,000150235 ] [ b ] = [ 0,59286385 ]

GRAFICO DE DISPERCION
90

80

70

60

50
Series1
40 Linear (Series1)
30

20 y = 0.5929x - 108.18
R = 0.5647
10

0
0 100 200 300 400

MODELO NO LINEAL
PROCESO PRCTICO - MANUAL

ANALISIS BIDIMENSIONAL DE DATOS


MODELO NO LINEAL
VACULO DE Y*

Y=bx+na
XY = b x2 + a x
___________________________________
685 = b*3345 + 12*a (-278,75)
194890 = b *939075 + 3345*a
___________________________________
-190943,75 = 932418,75*b - 3345*a
194890 = 939075*b + 3345*a
___________________________________
3946,25 = 6656,25*b

b = 0,5928
a = -108,159

Y* = b x + a
Y* = (0,5928) x + (+108,159)

Y* = 34,113
Y* = 31,742
Y* = 63,753
Y* = 54,268
Y* = 70,274
Y* = 79,166
Y* = 69,681
Y* = 67,309
Y* = 50,118
Y* = 55,454
Y* = 62,567
Y* = 46,562

CALCULO DE LA COVARIANZA

Cxy = XY X Y
Cxy = 16240,8 (278,75) (57,08)
Cxy = 329,75
CALCULO DEL COEFICIENTE DE CORRELACION

P = Cxy = 329,75 = 0,7531


SxSy (23,552) (18,591)

Sx2 = x2 nx2 = 939075 12 (278,75)2 = 554,6875


n 12
Sx = 554,6875 = 23,552

Sy2 = y2 ny2 = 43245 12 (57,08)2 = 345,6236


n 12
Sy = 345,6236 = 18,591

CALCULO DE LA VARIANZA Y DESVIACION ESTANDAR

S2 = ei2 = 1803,384 = 180,3384


n-2 12-2

SE = 180,3384 = 13,429
PROCESO PRCTICO - EXCEL

ANALISIS BIDIMENSIONAL DE DATOS


REGRESION MULTIPLE
REGISTROS DE PLANTA CONCENTRADORA

Rec. Planta Cu-T CuS Zn Ag


86 1,2 0,3 0,01 0,003
89 1 0,4 0,01 0,002
83 1,6 0,3 0,02 0,004
80 1,8 0,4 0,01 0,003
88 1,2 0,7 0,04 0,001
86 1,3 0,6 0,03 0,005
82 1,5 0,5 0,01 0,003

COVARIANZA
x1 x2 x3 x4
x1 -0,00836735 -0,00061224 0,000114286
x2 0,00122449 -4,28571E-05
x3 -1,42857E-06
x4

COEFICIENTE DE CORRELACION
x1 x2 x3 x4
x1 -0,23465763 -0,2136544 0,375340516
x2 0,777713771 -0,256173769
x3 -0,10625593
x4
PERCENTILES RANGO X1 X2 X3 X4
0,05 5 1,06 0,3 0,01 0,0013
0,1 10 1,12 0,3 0,01 0,0016
0,15 15 1,18 0,3 0,01 0,0019
0,2 20 1,2 0,32 0,01 0,0022
0,25 25 1,2 0,35 0,01 0,0025
0,3 30 1,2 0,38 0,01 0,0028
0,35 35 1,21 0,4 0,01 0,003
0,4 40 1,24 0,4 0,01 0,003
0,45 45 1,27 0,4 0,01 0,003
0,5 50 1,3 0,4 0,01 0,003
0,55 55 1,36 0,43 0,013 0,003
0,6 60 1,42 0,46 0,016 0,003
0,65 65 1,48 0,49 0,019 0,003
0,7 70 1,52 0,52 0,022 0,0032
0,75 75 1,55 0,55 0,025 0,0035
0,8 80 1,58 0,58 0,028 0,0038
0,85 85 1,62 0,61 0,031 0,0041
0,9 90 1,68 0,64 0,034 0,0044
0,95 95 1,74 0,67 0,037 0,0047
GRAFICOS DE DISPERCION

X1 X2

0.8

0.7

0.6

0.5

0.4
Series1
0.3

0.2

0.1

0
0 0.5 1 1.5 2

X1 X3

0.045

0.04

0.035

0.03

0.025

0.02 Series1

0.015

0.01

0.005

0
0 0.5 1 1.5 2
X1 X4

0.006

0.005

0.004

0.003
Series1

0.002

0.001

0
0 0.5 1 1.5 2

X2 X3

3.5

2.5

2
Series1
1.5

0.5

0
0 10 20 30 40 50 60 70
X2 X4

0.006

0.005

0.004

0.003
Series1

0.002

0.001

0
0 0.2 0.4 0.6 0.8

X3 X4

0.006

0.005

0.004

0.003
Series1

0.002

0.001

0
0 0.01 0.02 0.03 0.04 0.05
GRAFICOS QQ PLOT

X1 X2

0.8

0.7

0.6

0.5

0.4
Series1
0.3

0.2

0.1

0
0 0.5 1 1.5 2

X1 X3

0.04

0.035

0.03

0.025

0.02
Series1
0.015

0.01

0.005

0
0 0.5 1 1.5 2
X1 X4

0.005
0.0045
0.004
0.0035
0.003
0.0025
Series1
0.002
0.0015
0.001
0.0005
0
0 0.5 1 1.5 2

X2 X3

0.04

0.035

0.03

0.025

0.02
Series1
0.015

0.01

0.005

0
0 0.2 0.4 0.6 0.8
X2 X4

0.005
0.0045
0.004
0.0035
0.003
0.0025
Series1
0.002
0.0015
0.001
0.0005
0
0 0.2 0.4 0.6 0.8

X3 X4

0.005
0.0045
0.004
0.0035
0.003
0.0025
Series1
0.002
0.0015
0.001
0.0005
0
0 0.01 0.02 0.03 0.04
PROCESO PRCTICO - EXCEL

ANALISIS BIDIMENSIONAL DE DATOS


REGRESION MULTIPLE

TABLA DE DATOS
N Y X1 X2 X1Y X2Y X1^2 X2^2 X1X2
1 0,46 8,4 3,7 3,864 1,702 70,56 13,69 31,08
2 0,35 9,3 3,6 3,255 1,26 86,49 12,96 33,48
3 0,41 7,7 2,8 3,157 1,148 59,29 7,84 21,56
4 0,43 9,8 4,2 4,214 1,806 96,04 17,64 41,16
5 0,4 7,3 2,5 2,92 1 53,29 6,25 18,25
6 0,33 8,5 3 2,805 0,99 72,25 9 25,5
7 0,38 9,5 2,5 3,61 0,95 90,25 6,25 23,75
8 0,49 7,4 3,8 3,626 1,862 54,76 14,44 28,12
9 0,42 7,8 4 3,276 1,68 60,84 16 31,2
3,67 75,7 30,1 30,727 12,398 643,77 104,07 254,1

COVARIANZA
x1 x2
x1 0,10283951
x2

COEFICIENTE DE CORRELACION
x1 x2
x1 0,18899957
x2
POR MATRICES

9 75,7 30,1 a0 3,67


75,7 643,77 254,1 a1 = 30,727
30,1 254,1 104,07 a2 12,398

MATRIZ INVERSA

11,68 -1,10 -0,68 a0 0,48


-1,10 0,15 -0,04 a1 = -0,03
-0,68 -0,04 0,30 a2 0,04

PERCENTILES RANGO X1 X2
0,05 5 7,34 2,5
0,1 10 7,38 2,5
0,15 15 7,46 2,56
0,2 20 7,58 2,68
0,25 25 7,7 2,8
0,3 30 7,74 2,88
0,35 35 7,78 2,96
0,4 40 7,92 3,12
0,45 45 8,16 3,36
0,5 50 8,4 3,6
0,55 55 8,44 3,64
0,6 60 8,48 3,68
0,65 65 8,66 3,72
0,7 70 9,3 3,76
0,75 75 9,3 3,8
0,8 80 9,38 3,88
0,85 85 9,46 3,96
0,9 90 9,56 4,04
0,95 95 9,68 4,12
GRAFICOS DE DISPERCION

4.5

3.5

2.5

2 Series1

1.5

0.5

0
0 2 4 6 8 10 12

GRAFICOS QQ PLOT

4.5

3.5

2.5

2 Series1

1.5

0.5

0
0 2 4 6 8 10 12
CONCLUSIONES

El estudio de la relacin entre dos caracteres de una variable estadstica bidimensional


es el objeto de la regresin lineal.

Las medidas de dispersin son utilizadas para indicar el grado de uniformidad


(homogeneidad) entre los datos de la variable en estudio. Permiten determinar el grado
de desviacin (dispersin) que tienen los datos con respecto a la media o a la mediana.
Las dos ms comunes son varianza y desviacin estndar.

Es importante recordar que mientras mas fuerte sea la correlacin entre dos variables
mayor el poder predictivo existente entre ellas. El trmino "correlacin", se utiliza cuando
las variables involucradas en la relacin son de tipo intervalo (proporcional), es decir
cuantitativas en sentido estricto, pero adems la "correlacin", busca mediante la medida
de co-variacin de variables, predecir a partir del conocimiento de una de ellas el
comportamiento de la otra variable.

La nube de puntos de una distribucin bidimensional nos da una primera idea de la


relacin existente entre los datos de la misma.

Cuando la nube de puntos del diagrama de dispersin permita deducir algn tipo de
dependencia entre las dos variables X, Y, concentrndose los puntos alrededor de una
cierta lnea (lnea de regresin) se plantean dos cuestiones:

a) Definir la lnea.

b) Medir el nivel de aproximacin de dicha lnea.

c) S la lnea es una recta, el problema es un caso tpico de regresin lineal.

You might also like