You are on page 1of 7

Visualizacin de datos

bivariables.
Tablas de frecuencias
Dos variables binarias u ordinales

Una variable ordinal y una variable relativa/absoluta


World Nickel Production 1999

World Nickel Production 1999


CEI
(Russie)

Cub a
Indonsie
Nlle
Caldonie

Autres

Nlle

Cuba

Indonsie

CEI

Canada

Autres

Australie

25
20
15
10
5
0

Canada
Australie

Prof. Eric PIRARD (ULg)

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Visualizacin de datos
bivariables.
Dos variables relativas o absolutas
Nube de puntos en un espacio homogneo

Prof. Eric PIRARD (ULg)

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Visualizacin de
datos bivariables.
Dos variables relativas o absolutas
Nube de puntos en un espacio heterogneo
scatter plot

"

#!
$

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

%
Prof. Eric PIRARD (ULg)

Visualizacin de datos
bivariables.
Nube de puntos mejorada

% &'
%'(
Prof. Eric PIRARD (ULg)

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Visualizacin de datos
bivariables.
Interpretacin de la forma de una nube de puntos

,&
' -

) *

.
/
0

" ) +
Existe una relacin neta
#
ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Prof. Eric PIRARD (ULg)

Anlisis de datos bivariables.


Cuantificacin de una nube de puntos
Nocin de posicin la longitud de la abscisa (TAMAO)
Centro de Gravedad [(x);(y)]

1
N

i =N

1
(y) =
N

i =N

(x) =

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

i =1

i =1

xi
yi

Prof. Eric PIRARD (ULg)

Anlisis de datos bivariables.


Cuantificacin de una nube de puntos
Nocin de dispersin alrrededor del centro de gravedad
Momentos de Inercia => Varianzas y Covarianza
2

(x) =

xx

1 i =N
(xi (x))
N i =1

(y) =

yy

1 i =N
(y i (y))
N i =1

xy

1 i =N
(xi (x))(. y i (y))
N i =1
,

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

1'

Prof. Eric PIRARD (ULg)

Anlisis de datos bivariables.


Notas sobre el uso de momentos
la covarianza tiene sentido en un espacio homogneo
xx;yyxy: momentos de una elipse de inercia equivalente
Correlacin : parmetro adimensional [-1,1]
xy

xy =

xy
xx . yy

>0

xy

<0

xy

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

=0

xy

1
0

Prof. Eric PIRARD (ULg)

Anlisis de datos bivariables.

2
3
4

2
#
++
!
"
#
!
#

!
"
#
++
#
!
$%

3
#
#
#
++
#

4
!
#
!
$%
#
#
++

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Prof. Eric PIRARD (ULg)

Anlisis de datos bivariables.


Pseudo-correlaciones
efecto de fuerza o atraccin de los valores extremos
crecimiento de al pasar a logaritmos

= 0,39
Prof. Eric PIRARD (ULg)

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Anlisis de datos bivariables.


Pseudo-correlaciones
Desviacin en la morfologa elptica
presencia de varias correlaciones

= 0,61
= 0,52

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Prof. Eric PIRARD (ULg)

Anlisis de datos bivariables.


Datos cerrados
los datos de composicin (=100% ) inducen a una
correlacin negativa entre los datos mayores (carece de
significado)
Trabajar en lo posible con valores absolutos (nb fsiles)
Normalizar por la variable (e.g. Niggli = X % / [100-SiO2] %)
Normalizar por una variable independiente del proceso
Aitchison x =ln(x/y) con e.g. y= SiO2

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Prof. Eric PIRARD (ULg)

Modelizacin de datos bivariables


Interpolacin exacta
Funcin que pasa por todos los puntos experimentales
Polilnea : interpolacin lineal entre xn-1 et xn
Polinomio de grado N que pasa por N+1 puntos
Capacidad de extrapolacin ?
Line Plot (test.STA 1v*20c)
45

35

VAR1

25

15

-5

10 11 12 13 14 15 16 17 18 19 20 21

Prof. Eric PIRARD (ULg)

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Modelizacin de datos bivariables


Interpolacin exacta
Lnea suavizada (e.g. inverso de la distancia al cuadrado)
Cubic Splines : interpolacin polinomial (de 3er grado) entre
xn-1 et xn con la condicin de igualdad en las derivas1era y 2da en
los puntos de unin.
Line Plot (test.STA 1v*20c)
y=Spline + eps
35
30
25

VAR1

20
15
10
5
0
-5

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

10

11

12

13

14

15

16

17

18

19

20

21

Prof. Eric PIRARD (ULg)

Modelizacin de datos bivariables


Ajustamiento de una ley
Toda desviacin en esta ley es :
un error (aproximacin determinista)
una variacin natural (aproximacin probabilstica)

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Prof. Eric PIRARD (ULg)

Modelizacin de datos bivariables


Ajustamiento de una ley determinista (regresin)
Modelo lineal (y=b0+b1x)
Modelo polinomial (y=b0+b1x+b2x2++bnxn)
Modelos logartmicos; exponenciales;...

Prof. Eric PIRARD (ULg)

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Modelizacin de datos bivariables


Criterio de ajustamiento
Minimizacin de la suma del cuadrado de las desviaciones
respecto a la ley (regresin clsica de y sobre x)

y *i

(y

SSD =

y i*

yi
Prof. Eric PIRARD (ULg)

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

Modelizacin de datos bivariables


Evaluacin de la calidad del ajustamiento (R2)

y i* = b0 + b1 x i

yi

Parte debida a la regresin SS R =


i

yi

( yi y )2

Suma del cuadrado de las desvianciones SST =

(y

(y

*
i

(y y )

ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

* 2
i

SS R
=
SST

(y y )

Parte debida a la dispersin SS D =


Calidad de la regresin R 2 =

*
i

Prof. Eric PIRARD (ULg)

Modelizacin de datos bivariables


Otros criterios de ajustamiento
Regresin estructural
Componente Principal (desviacin a la recta)
Eje Principal Reducido (min. rea triangular)

.
!
ANALYSE
ANALYSE STATISTIQUE DES
DONNEES GEOLOGIQUES

0( !

7
Prof. Eric PIRARD (ULg)

You might also like