You are on page 1of 89

MCR-ALS:

Un algoritmo versátil para la resolución de


diversos problemas complejos
MCR-ALS
Resolución Multivariada de Curvas
R. Tauler 1993

 Resolución de respuestas de componentes múltiples en mezclas desconocidas no


resueltas
 No es necesario disponer de información previa de la composición o naturaleza del
sistema
 Datos en forma de tabla o matriz que puedan ser descritos por un modelo bilineal

Todo tipo de procesos y mezclas Diversas respuestas multivariadas


Reacciones químicas HPLC-GC-CE-FIA/ DAD-FLD-MS
Procesos industriales EEM
Eluciones cromatográficas Señales electroquímicas
Imágenes espectroscópicas
Datos medioambientales
Procesos de plegamiento de proteínas

 Método poderoso que tiene pocos requisitos


MCR-ALS
Cuadrados Mínimos Alternantes

 Resolución de ecuaciones de manera iterativa

 Flexibilidad en la introducción de información durante la optimización de los perfiles:


RESTRICCIONES

 Capacidad de adaptación a diversos problemas químicos y estructuras de datos

 Rápida implementación
DATOS INSTRUMENTALES DE SEGUNDO ORDEN

MUESTRA MATRIZ SUPERFICIE

D D D
 dt1 ,1 dt1 ,2 . . dt1 ,NC   dpH1 ,1 dpH1 ,2 . . dpH1 ,NC   dx1 ,e1 dx1 ,e2 . . dx1 ,NC 
     
d d t 2 , 2 . . dt 2 ,NC   dpH2 ,1 dpH2 ,2 . . dpH2 ,NC   dx 2 ,1 dx 2 ,2 . . dx 2 ,NC 
t  t2 ,1 pH  Ex  .
. . . . .  . . . . .  . . . . 
     
 dt , dtNR ,2 . . dtNF ,NC   dpH , dpH , . . dpHNR ,NC   dx , dx , . . dxNR ,NC 
 NR 1  NR 1 NR 2  NR 1 NR 2

  Em
DATOS INSTRUMENTALES DE SEGUNDO ORDEN

D(NF,NC)

 d1,1 d1, 2 . . d1,NC 


FILAS
 
Variación en
 d2,1 d2, 2 . . d2,NC 
la composición
 . . . . . 
del sistema
 
d . dNF ,NC 
 NF ,1 dNF , 2 .

COLUMNAS
Variación en la respuesta
OBJETIVO
Aislar las contribuciones de todas las especies involucradas en el sistema, a través de la
obtención de sus perfiles de concentración y espectros puros.

Información TOTAL Información de los COMPONENTES PUROS

C ST

Perfiles de concentración puros Señales puras


Modelo químico Información cualitativa:
Evolución de procesos Identificación de compuestos
Contribución de los componentes
Información cuantitativa:
Calibración, validación, predicción

D = CST + E
MODELO BILINEAL

espectro

cromatograma D = DA + DB + E

s A s B

D = cA + cB

ST
D = C × D = CST + E
Determinación de tartrazina por oxidación con bromato de potasio catalizada por Fe(II),
en presencia de una interferencia causada por azul brillante

250

200
D
150

100 =
50

0
0 50 100 150 200 250 300

C ST
×

Second-order advantage from kinetic-spectroscopic data matrices in the presence of extreme spectral overlapping. A
multivariate curve resolution-Alternating least-squares approach. María J. Culzoni, Héctor C. Goicoecheaa, Gabriela A.
Ibañez, Valeria A. Lozano, Nilda R. Marsili, Alejandro C. Olivieri, Ariana P. Pagani. Analytica chimica acta 614 (2008) 46–57
Muestra de calibración: tartrazina

Muestra de validación: tartrazina + interferencia azul brillante


Muestra de calibración: tartrazina

Muestra de validación: tartrazina + interferencia azul brillante


PROCESO DE RESOLUCIÓN MEDIANTE MCR-ALS

1 Matriz experimental D

2 Estimación del nº de componentes: SVD

3 Estimaciones iniciales: SIMPLISMA, EFA

4 Optimización mediante ALS RESTRICCIONES

5 Obtención de las señales puras: perfiles de concentración y espectros


MATRIZ EXPERIMENTAL D

 Una única matriz


matriz de
de datos
datos

Análisis simultáneo de varias matrices de datos

• Matriz aumentada en columnas


• Matriz aumentada en filas
• Matriz aumentada en columnas y filas
PANTALLA PRINCIPAL DE LA INTERFAZ GRÁFICA PARA APLICAR MCR-ALS
En MatLab: mcr_main
UNA ÚNICA MATRIZ: V4A
MATRIZ EXPERIMENTAL D

 Una única matriz de datos

Análisis
Análisis simultáneo
simultáneode
devarias
variasmatrices
matricesde
dedatos
datos

• Matriz aumentada en columnas


• Matriz aumentada en filas
• Matriz aumentada en columnas y filas
MATRIZ EXPERIMENTAL D: ANÁLISIS SIMULTÁNEO DE VARIAS MATRICES DE DATOS

MATRIZ D AUMENTADA EN COLUMNAS

D1 C1 ST
Varios experimentos
monitorizados con la misma
D2 C2
técnica = C2

Espectros puros
D3 C3 comunes a todos los
C3
experimentos
D C

Los perfiles de concentración


pueden ser distintos
MATRIZ EXPERIMENTAL D: ANÁLISIS SIMULTÁNEO DE VARIAS MATRICES DE DATOS

MATRIZ D AUMENTADA EN COLUMNAS

t
ESTIMACIONES INICIALES
ESPECTROS
PANTALLA PRINCIPAL DE LA INTERFAZ GRÁFICA PARA APLICAR MCR-ALS

MATRIZ D AUMENTADA EN COLUMNAS:


diferenciación a partir de ESPECTROS
MATRIZ EXPERIMENTAL D: ANÁLISIS SIMULTÁNEO DE VARIAS MATRICES DE DATOS

MATRIZ D AUMENTADA EN COLUMNAS

t
ESTIMACIONES INICIALES
 CINÉTICAS
PANTALLA PRINCIPAL DE LA INTERFAZ GRÁFICA PARA APLICAR MCR-ALS

MATRIZ D AUMENTADA EN COLUMNAS:


diferenciación a partir de CINÉTICAS
MATRIZ EXPERIMENTAL D: ANÁLISIS SIMULTÁNEO DE VARIAS MATRICES DE DATOS

MATRIZ D AUMENTADA EN FILAS

Un mismo experimento S1 T S2 T S3 T
monitorizado por D1 D2 D3
diferentes técnicas = ST

D C
Espectros puros
correspondientes a cada
técnica
Perfiles de concentración
comunes a todos los experimentos

ST

C
MATRIZ EXPERIMENTAL D: ANÁLISIS SIMULTÁNEO DE VARIAS MATRICES DE DATOS

MATRIZ D AUMENTADA EN FILAS Y EN COLUMNAS

S1T S2T S3T

Varios experimentos D11 D2 D3 C1


ST
monitorizados con varias técnicas
=
D4 D5 D6 C2

D C
PROCESO DE RESOLUCIÓN MEDIANTE MCR-ALS

1 Matriz experimental D

2 Estimación del nº de componentes: SVD

3 Estimaciones iniciales: SIMPLISMA, EFA

4 Optimización mediante ALS RESTRICCIONES

5 Obtención de las señales puras: perfiles de concentración y espectros


ESTIMACIÓN DEL NÚMERO DE COMPONENTES: RANGO QUÍMICO

El rendimiento de la resolución depende en gran medida del conocimiento de las


propiedades locales y globales de los datos.

RANGO DE UNA MATRIZ

RANGO MATEMÁTICO
Número de filas o columnas linealmente independientes

RANGO QUÍMICO
Número de componentes presentes en una mezcla

Se puede estimar a través de los métodos de análisis de factores (PCA, SVD), los que se
diseñaron para matrices de rango completo:

Rango detectado = Nº componentes químicos que contribuyen a la variancia


ESTIMACIÓN DEL NÚMERO DE COMPONENTES: RANGO QUÍMICO

ANÁLISIS DE COMPONENTES PRINCIPALES


Modelo abstracto bilineal que describe la variación de los datos

p1
p2
= PT
t1 t2
D T

Contribuciones relevantes RANGO = 2


24

22

20

18

16
Contribuciones debidas al ruido
14

12
1 2 3 4 5 6 7
MODELOS BILINEALES: PCA vs. MCR

Modelo MCR: Resolución Modelo PCA: Exploración


sA p1
sB p2
= ST = PT
cA cB t1 t2
D C D T
C ST T PT

 C y ST deben su forma a las restricciones Soluciones únicas


matemáticas y químicas aplicadas  No tienen sentido químico
 No existen soluciones únicas
 Grado desconocido de ambigüedad
 Significado químico
ESTIMACIÓN DEL NÚMERO DE COMPONENTES: RANGO QUÍMICO

DESCOMPOSICIÓN EN VALORES SINGULARES

D = TPT = USVT
Matriz diagonal
Magnitud del valor singular = importancia de la contribución
5
x 10
2.5
Valores singulares

1.5

4 contribuciones RANGO = 4
0.5

0
1 2 3 4 5 6 7 8 9 10

Número de componentes
DEFICIENCIA DE RANGO

Rango detectado < Nº de componentes químicos = MATRICES DEFICIENTES DE RANGO

Compuestos con perfiles de concentración o señales muy similares

ST
D = C
Espectros con la misma forma
D  L (enantiómeros)
Perfiles de concentración Espectro D = Espectro L = Rango 1
con la misma forma
A+BC
[A] = [B]= Rango 2

Compuestos con señales no medibles


Compuestos minoritarios

La deficiencia de rango puede estar asociada a C o ST


DEFICIENCIA DE RANGO
 Varias contribuciones comparten la misma señal o hay grandes similitudes entre ellas

Second-order advantage from kinetic-spectroscopic data matrices in the presence of extreme spectral overlapping. A multivariate
curve resolution-Alternating least-squares approach. María J. Culzoni, Héctor C. Goicoecheaa, Gabriela A. Ibañez, Valeria A. Lozano,
Nilda R. Marsili, Alejandro C. Olivieri, Ariana P. Pagani. Analytica Chimica Acta 614 (2008) 46–57.

 Los perfiles de concentración de varias contribuciones son idénticos

Chemometric resolution of fully overlapped CE peaks: Quantitation of carbamazepine in human serum in the presence of several
interferences. Luciana Vera-Candioti, María J. Culzoni, Alejandro C. Olivieri, Héctor C. Goicoechea. Electrophoresis 29 (2008) 4527–4537.
DEFICIENCIA DE RANGO – MATRICES AUMENTADAS

 La deficiencia de rango se puede romper construyendo matrices aumentadas: el


apilamiento de información de rango completo a matrices deficientes de rango permite
la detección de todas las contribuciones químicas

 No es necesario añadir matrices de rango completo de todos los analitos presentes en la


muestra

Matriz Rango químico SVD Condición


aumentada

[M] 3 1 Deficiencia de rango


[M,C] 3 2 Deficiencia de rango
[M,E,C] 3 2 Deficiencia de rango
[M,L,C] 3 2 Deficiencia de rango
[M,E,L,C] 3 3 Rango completo
ESTIMACIÓN DEL NÚMERO DE COMPONENTES: RANGO QUÍMICO
ESTIMACIÓN DEL NÚMERO DE COMPONENTES: RANGO QUÍMICO
ESTIMACIÓN DEL NÚMERO DE COMPONENTES: RANGO QUÍMICO
PROCESO DE RESOLUCIÓN MEDIANTE MCR-ALS

1 Matriz experimental D

2 Estimación del nº de componentes: SVD

3 Estimaciones iniciales: SIMPLISMA, EFA

4 Optimización mediante ALS RESTRICCIONES

5 Obtención de las señales puras: perfiles de concentración y espectros


CONSTRUCCIÓN DE LAS ESTIMACIONES INICIALES (C o ST)
Aproximaciones a los perfiles de concentración o espectros reales, a partir de los que
comenzará la iteración.
EXPERIMENTALMENTE
Gradiente de pH: espectros a pH extremos
Cinética: espectros a t inicial y final
HPLC con DAD o FLD: espectros de los picos cromatográficos puros

PURE (SIMPLISMA: Simple-to-use Interactive Self-modelling analysis)


W. Windig and J. Guilment. Anal. Chem., 63, 1425-1432 (1991).

EFA (Evolving Factor Analysis)


H. Gampp, M. Maeder, C.J. Meyer and A.D. Zuberbühler. Talanta, 32, 1133-1139 (1985).
M. Maeder. Anal. Chem. 59, 527-530 (1987).
A. De Juan, S. Navea, J. Diewok, R. Tauler. Chemom. Intell. Lab. Syst., 70, 11-21 (2004).
EFARD (Evolving Factor Analysis for rank-deficient data sets)
FSMW-EFA (Fixed Size Moving Window-Evolving Factor Analysis)
H.R. Keller and D.L. Massart. Anal. Chim. Acta, 246, 379-390 (1991).

“ARTESANALMENTE”
• Combinación de señales reales y las restantes obtenidas por PURE o EFA
• Utilización de matrices sopt (ST) obtenidas en análisis previos por MCR-ALS
• …
Pure

 Selecciona las filas (estimaciones iniciales de ST) o columnas (estimaciones iniciales


de C) más puras (diferentes) en una matriz de datos
 Válida para todo tipo de datos (que correspondan o no a procesos) y estructuras
(matriz única o arreglos de matrices)
 No se aconseja su uso para señales negativas

Estimaciones ST  [sp,imp]=pure(d,nr,f )
Filas más diferentes
Columnas más diferentes

Entrada
d: matriz de datos
Estimaciones C

nr: Nº de variables puras a seleccionar


f: % de ruido en los datos
D
D Salida
sp: perfiles más puros
imp: posición de las variables más puras
CONSTRUCCIÓN DE LAS ESTIMACIONES INICIALES: Pure
CONSTRUCCIÓN DE LAS ESTIMACIONES INICIALES: Pure
PROCESAMIENTO DE UNA ÚNICA MATRIZ

Matriz
estimada Estimaciones
por CM iniciales

PCA de D
CONSTRUCCIÓN DE LAS ESTIMACIONES INICIALES: Pure
CONSTRUCCIÓN DE LAS ESTIMACIONES INICIALES: Pure
PROCESAMIENTO DE UNA ÚNICA MATRIZ

Estimaciones Matriz
iniciales estimada
por CM
PROCESAMIENTO SIMULTÁNEO DE VARIAS MATRICES
MATRIZ D AUMENTADA EN COLUMNAS

Matrices
Estimaciones
estimadas
iniciales
por CM

PCA de D
PROCESAMIENTO SIMULTÁNEO DE VARIAS MATRICES
MATRIZ D AUMENTADA EN COLUMNAS

Matrices
Estimaciones
estimadas
iniciales
por CM
EFA: efa.m
 Monitorización quimiométrica por pasos de un proceso químico: permite investigar la
aparición y desaparición de las especies involucradas en el proceso.
 Realiza análisis SVD sucesivos en matrices agrandadas en la dirección del proceso
mediante la adición de una nueva fila a la vez.
• Forward EFA (desde el principio hasta el final)
• Backward EFA (desde el final hasta el principio)
 Técnica versátil para obtener información de rango local en sistemas en evolución.

 [e,eforward,ebackward]=efa(d,ns )
Espectro
Entrada
d: matriz de datos
Cromatograma

ns: Nº de filas de la matriz de datos a incluir en el


análisis.
DD
Salida
e: estimaciones iniciales construidas combinando
los gráficos de efa forward y backward.
eforward: resultados de efa forward
ebackward: resultados de efa backward
PROCESAMIENTO SIMULTÁNEO DE VARIAS MATRICES
MATRIZ D AUMENTADA EN COLUMNAS

Input rows from external variable?


Si las matrices no tienen igual número de filas, construir un vector fila que provea el número
de filas de cada matriz en el orden en el que están ubicadas en la matriz D aumentada
Ejemplo para matriz D aumentada que contiene 5 matrices: ro=[125 125 128 130 125]
PROCESO DE RESOLUCIÓN MEDIANTE MCR-ALS

1 Matriz experimental D

2 Estimación del nº de componentes: SVD

3 Estimaciones iniciales: SIMPLISMA, EFA

4 Optimización mediante ALS RESTRICCIONES

5 Obtención de las señales puras: perfiles de concentración y espectros


OPTIMIZACIÓN MEDIANTE ALS

 Dadas D y las estimaciones iniciales C, se realizará el cálculo de ST:


S  C C C D
T T

1 T
S T  C D

 Dadas D y las estimaciones iniciales ST, se realizará el cálculo de C:

C  DS S S   T 1
CDS  T 

La descomposición matemática de una matriz de datos está sujeta a ambigüedades:


muchos pares de C y ST pueden reproducir los datos originales con la misma calidad de
ajuste.
La correcta reproducción de los datos originales se puede alcanzar utilizando perfiles de
respuesta diferentes en FORMA (ambigüedad rotacional) o MAGNITUD (ambigüedad en
intensidad) de los reales.
OPTIMIZACIÓN MEDIANTE ALS
AMBIGÜEDAD EN INTENSIDAD (o ESCALA)

Diferentes juegos de matrices C y ST que difieren solo en el factor de escala de los perfiles
proveen el mismo ajuste de los datos.

2 15000
c1 C T
1.5 s2 S
D = C ST 1 c2
10000
s1
n
1 T
D   k i ci  si 
5000
0.5

 ki 
0 0
i 1 0 20 40 60 0 50 100

D = C’ S’T 4
k1c1
30000
(1/k2)s2
3
20000
2
k2c2
ki= escalar; k1=2; k2=0.5
1
10000
(1/k1)s1
0 0
0 20 40 60 0 50 100

Normalización de los espectros


Clausura (C)
OPTIMIZACIÓN MEDIANTE ALS
AMBIGÜEDAD ROTACIONAL

Diferentes juegos de matrices C y ST que difieren en las formas de los perfiles proveen el
mismo ajuste de los datos.
Equivalentes MATEMÁTICAMENTE, pero totalmente diferentes QUÍMICAMENTE.
2 15000

1.5
C ST
10000

D = C ST
1
5000
0.5

D = C (TT-1)ST 0
0 20 40 60
0
0 50 100

D = (C T)(T-1 ST) 4 6000

CT T-1 ST
D = C’ S’T
3 4000

2 2000

1 0

0 -2000
0 20 40 60 0 50 100

Un método de resolución provee tantas soluciones como matrices T existan, es decir,


INFINITAS, a menos que C y S sean forzadas a obedecer ciertas RESTRICCIONES.
MCR-BANDS
EVALUACIÓN DEL GRADO DE AMBIGÜEDAD ROTACIONAL DE LA RESOLUCIÓN POR MCR-ALS

Se basa en el cálculo de la contribución relativa de cada componente en una mezcla según:

Escalar que provee la contribución de la señal relativa de un


componente particular a la señal total de la mezcla de N
componentes (n= 1,…,N)

• fn dependerá de la matriz T considerada, ya que afecta al producto

• Para un set de perfiles C y ST, dado que la aplicación de restricciones hace posible solo
algunas matrices T, se buscan las matrices Tnmax y Tnmin que proveen fnmax y fnmin para cada
componente del sistema

• El set de perfiles cn y snT que proveen fnmax y fnmin, llamados cnmax snTmax y cnmin snTmin,
respectivamente, se grafican junto con los perfiles iniciales propuestos, cn y snT, para
inspeccionarlos visualmente

Ambigüedad rotacional eliminada mediante la aplicación de restricciones:


cn y snT no cambian durante la optimización, se mantienen prácticamente constantes
Presencia de ambigüedad rotacional:
fnmax y fnmin difieren apreciablemente de fn, y cnmaxsnTmax y cnminsnTmin de cn snT
MCR-BANDS
EVALUACIÓN DEL GRADO DE AMBIGÜEDAD ROTACIONAL DE LA RESOLUCIÓN POR MCR-ALS
OPTIMIZACIÓN MEDIANTE ALS
RESTRICCIONES

 Cualquier propiedad que se cumple sistemáticamente por todo el sistema o


por algunas de sus contribuciones puras
 Puede ser de origen químico o matemático
 Son traducidas a lenguaje matemático y fuerzan al proceso de optimización
iterativo a modelar los perfiles respetando las condiciones deseadas

• No negatividad
• Unimodalidad
• Clausura (cierre o balance de masas)
• Modelado rígido
• Igualdad (rango local/selectividad)
• Trilinealidad

 La aplicación debe ser prudente: una restricción solo debe aplicarse cuando
se tiene total seguridad de su validez
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
UNA ÚNICA MATRIZ
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
UNA ÚNICA MATRIZ
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
MATRIZ D AUMENTADA
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
MATRIZ D AUMENTADA
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones

No negatividad (C, S)

Previene la presencia de valores no


negativos en los perfiles

0.3 0.35
0.25 0.3
0.2 0.25
0.15
0.2
0.1
0.15
0.05
0 0.1
-0.05 0.05
-0.1
0 10 20 30 40 50 00 10 20 30 40 50
Tiempo Tiempo

forced to zero: reemplaza valores negativos por ceros


nnls: cuadrados mínimos no negativos
fnnls: cuadrados mínimos no negativos rápidos
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
Unimodalidad (C)

Vertical
Horizontal
0.35 0.35

0.3 0.3 Average


0.25 0.25

0.2 0.2

0.15 0.15

0.1 0.1

0.05 0.05

00 00 5 10 15 20 25 30 35 40 45 50
5 10 15 20 25 30 35 40 45 50
Tiempo Tiempo

Fuerza la presencia de un solo máximo en el perfil de las especies


Se aplica a procesos en los que los perfiles de concentración muestran una forma de
aparición-desaparición

Tolerancia: define qué tan estricta será la restricción, permitiendo desviaciones locales.
En general: valores entre 1.0 (no hay desviaciones) y 1.1
1.5 significa que se permite 50% de desviación local: en pendientes decrecientes del pico principal un
punto particular puede aumentar como máximo 50% del valor previo antes de que la restricción se aplique
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones

Clausura (C)
 Ecuaciones de balance de masa en sistemas
S = c total de reacción cerrados

Balance de masa  La concentración total del sistema


0.35
(constante de clausura) se puede establecer
0.3

0.25
c total 0.3

0.25
c total a un valor fijo o variable
0.2
0.2

0.15
0.15

0.1

0.05
0.1

0.05
 No se puede aplicar cuando existen
5 10 15 20 25 30 35
0
0 5 10 15 20 25 30 35
especies no absorbentes, debido a que las
especies que contribuyen a la señal medible
no conforman un sistema cerrado
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
Igualdad (C, S)
Posibilidad de fijar valores conocidos en los perfiles de concentración o en los espectros
durante la optimización.
Señales puras de componentes conocidos
Información de selectividad o rango local: si se sabe que algunos componentes están
ausentes en ciertas regiones
A B C  x x x ... x x x 
Región selectiva
para el compuesto C
0 0 1.32
T
S sel   k k k ... k k k


0 0 1.28
NaN NaN 1.26  x x x ... x x x 
NaN NaN 1.24
NaN: valores no NaN NaN 1.22
restringidos NaN NaN 1.04 Perfil conocido
NaN NaN 1.04
Fijando un espectro
NaN 0 1.04 conocido
Información de
NaN 0 1.04
rango local
NaN 0 1.04 Csel y STsel tienen que ser del mismo
(ausencia de B) NaN 0 1.04
tamaño de C y ST
Csel
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones

Trilinealidad

 Se aplica en la resolución simultánea de varias matrices

 Los perfiles resueltos de un mismo componente en diferentes matrices para una


dirección particular (C o ST) tienen la misma forma

 Se puede implementar para cada especie de manera separada

 Cuando es aplicable asegura la unicidad de la solución: los perfiles resueltos no


presentan ambigüedad
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones

TEST DE TRILINEALIDAD

D1

Rango D1 D2 D3 = Rango D2 Trilineal

D D3

D
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
RESTRICCIONES PARA LA RESOLUCIÓN SIMULTÁNEA DE VARIAS MATRICES
Datos trilineales

Datos no trilineales
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones

Trilinealidad
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones

Modelado rígido (C)

Modelo
1 1
0.9 0.9
0.8 fisicoquímico 0.8
0.7 0.7
0.6 0.6
0.5 0.5
0.4 0.4
0.3 0.3
0.2 0.2
0.1 0.1
0
2 3 4 5 6 7 8 9 02 3 4 5 6 7 8 9
pH pH

Se aplica cuando se conoce la ley química (cinética o termodinámica) asociada a un


proceso particular

Los perfiles de concentración asociados a componentes se fuerzan a presentar la forma


descrita por dicha ley
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
RESTRICCIONES PARA LA RESOLUCIÓN SIMULTÁNEA DE VARIAS MATRICES
Correspondencia entre especies
Información sobre la presencia o ausencia de componentes en los diferentes experimentos
apilados (en matrices aumentadas por columnas), dada por una matriz binaria.

Matriz isp (nº de experimentos × nº de componentes):


A B C D Nº total de componentes
1 1 1 1
  1: PRESENCIA
isp_matrix= 1 0 0 0 Nº de submatrices
0: AUSENCIA
0 1 0 0 

Cuando no se tiene conocimiento sobre las especies presentes en cada experiencia o cuando
todas están presentes en todos los experimentos se deja libre el espacio y se genera
automáticamente una matriz de unos de dimensiones apropiadas.
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones
RESTRICCIONES PARA LA RESOLUCIÓN SIMULTÁNEA DE VARIAS MATRICES
Correspondencia entre especies
D=[D1;D2;D3] C ST

D1
C1

A B C
 isp1=[1 1 1
D2 C2 1 0 0
0 0 1];

D3
C3
OPTIMIZACIÓN MEDIANTE ALS: aplicación de restricciones

cknown =

0.5000 NaN NaN


1.0000 NaN NaN
1.5000 NaN NaN
2.0000 NaN NaN
2.5000 NaN NaN
NaN NaN NaN
NaN NaN NaN
NaN NaN NaN
NaN NaN NaN

 Útil para evaluar la calidad de la regresión cuando se trabaja con datos de primer orden
(un espectro por muestra)
 Se debe generar una matriz de las dimensiones de la isp_matrix que contenga las
concentraciones nominales de las muestras de calibración para el analito de interés, y en
el resto de las posiciones NaN
 Solo se puede aplicar la restricción de no negatividad
 No es compatible con la normalización de los espectros
Restricciones para el sistema Tartrazina - Fe
UNA ÚNICA MATRIZ
Restricciones para el sistema Tartrazina - Fe
UNA ÚNICA MATRIZ
Restricciones para el sistema Tartrazina - Fe
RESTRICCIONES PARA LA RESOLUCIÓN SIMULTÁNEA DE VARIAS MATRICES

TI
isp1=[1 1
11
11
11
11
10
10
10
10
1 0 ];
Restricciones para el sistema Tartrazina - Fe
RESTRICCIONES PARA LA RESOLUCIÓN SIMULTÁNEA DE VARIAS MATRICES
OPTIMIZACIÓN MEDIANTE ALS

 Aparece cuando no se seleccionó la restricción de clausura para evitar


indeterminaciones en la optimización

 Si no se selecciona algún tipo de normalización, la escala de los perfiles


durante la optimización puede resultar errática o problemática
OPTIMIZACIÓN MEDIANTE ALS

Criterio de convergencia:
La convergencia se alcanza cuando en
dos ciclos iterativos consecutivos las
diferencias relativas en las desviaciones
estándares de los residuos entre los
valores experimentales y los calculados
por ALS son menores a un valor
previamente seleccionado, denominado
TOLERANCIA, usualmente del 0.1%

copt y sopt: matriz de perfiles de concentración y espectros puros resueltos (única o aumentada)
Std. dev: % óptimo de LOF en unidades de desviación estándar relativa (el primer elemento es la LOF de
los resultados de la resolución con respecto a la matriz reproducida por PCA, mientras que el segundo es la
LOF entre los resultados de la resolución y los datos originales)
Residuals: residuos entre los datos originales y los perfiles de concentración y espectros resueltos
Area opt: áreas bajo los perfiles de concentración de cada especie en cada submatriz C
Ratio opt: información cuantitativa relativa (cociente entre las áreas de ciertas especies en las diferentes
submatrices C y el área de las especies en la primer submatriz C tomada como referencia)
PROCESO DE RESOLUCIÓN MEDIANTE MCR-ALS

1 Matriz experimental D

2 Estimación del nº de componentes: SVD

3 Estimaciones iniciales: SIMPLISMA, EFA

4 Optimización mediante ALS RESTRICCIONES

5 Obtención de las señales puras: perfiles de concentración y espectros


OBTENCIÓN DE SEÑALES PURAS: perfiles de concentración y espectros
OBTENCIÓN DE SEÑALES PURAS: perfiles de concentración y espectros

 A’

T en las muestras
Interferencia

1.0396 2.0036
1.8654 1.9967
0.7403 2.7204
1.7130 2.8123
1.3399 2.4678
0.2949 0
1.0234 0
2.5277 0
3.0366 0
4.3459 0

Se obtiene información separada para cada componente: Testigos T


 Modelo de calibración pseudounivariado para cada analito
 Cálculo de cifras de mérito
 No se necesita contar con las interferencias en las muestras de calibración: VENTAJA DE SEGUNDO ORDEN
OBTENCIÓN DE SEÑALES PURAS: convergencia

Desviación estándar de los residuos respecto de los datos experimentales ():

 d  dij 
* 2
dij= elemento de la matriz experimental D
 ij
dij *= elemento de la matriz D reproducida por MCR-ALS
nfilasncolumnas nfilas y ncolumnas = número de filas y columnas de la matriz D

Falta de ajuste (LOF,%): diferencia entre la matriz de entrada D y la reproducida mediante


el producto CST obtenido por MCR-ALS

 d  d  * 2

LOF%  100 ij ij ij

d 2
ij ij

Variancia explicada (R2%):

R2   d 2*
ij

d 2
ij
MCR-ALS

Pocos requisitos

 Datos con estructura bilineal


• No es necesario conocer la evolución de los perfiles de concentración
• No se necesitan patrones definidos en el sentido de la concentración
• No es necesaria la identificación previa de los componentes involucrados en un proceso

Gran flexibilidad

 En los arreglos de los datos


• Análisis de múltiples técnicas
• Análisis de múltiples experimentos
• Análisis de múltiples experimentos mediante múltiples técnicas

 En la introducción de la información
• Aplicación de restricciones
• Adaptable a compuestos y/o experimentos individuales
CONSIDERACIONES GENERALES

Determinación del número de componentes:


• Cuando se duda sobre el número de componentes del sistema, se recomienda probar
diferentes números de componentes. El número óptimo se corrobora observando el
ajuste del modelo y la información provista por los perfiles obtenidos.

Estimaciones iniciales:
• Pure: el nivel de ruido seleccionado debe ser mayor al nivel de ruido de los datos,
para obtener estimaciones iniciales libres de ruido y con la forma esperada. Probar
diferentes opciones hasta encontrar el nivel de ruido que provea estimaciones iniciales
adecuadas.
• EFA: cuando se trabaja con múltiples experimentos, no se recomienda aplicar EFA a la
matriz D aumentada. Las estimaciones iniciales deben obtenerse para cada matriz
individual y luego concatenarse, respetando la correspondencia de especies en la matriz D.

Aplicación de restricciones:
• Es importante aplicar las restricciones que realmente describen los datos, para
obtener soluciones reales.
• En el caso de trabajar con una matriz D aumentada en columnas, se recomienda el
uso de la matriz de identificación de especies (isp), pero teniendo especial cuidado
en la asignación de los componentes.
APLICACIÓN

Desarrollo de un método analítico por HPLC-FSFD para la determinación de las pteridinas


NEO, BIO, ISO, XAN y PT en orina como biomarcadores para el diagnóstico diferencial y el
seguimiento de enfermedades.

 Separación dificultosa: resoluciones pobres, similitud estructural

 Baja selectividad: espectros idénticos (NEO-BIO-PT)

Determination of marker pteridines in urine by HPLC with fluorimetric detection and second-order multivariate calibration using MCR-
ALS. A. Mancha de Llanos, M.M. De Zan, M.J. Culzoni, A. Espinosa-Mansilla, F. Cañada-Cañada, A. Muñoz de la Peña, H.C. Goicoechea.
Anal. Bioanal. Chem. 399 (2011) 2123 - 2135.

Enhanced MCR-ALS modeling of HPLC with fast scan fluorimetric detection second-order data for quantitation of metabolic disorder
marker pteridines in urine. M.J. Culzoni, A. Mancha de Llanos, M.M. de Zan, A. Espinosa Mansilla, F. Cañada Cañada, A. Muñoz de la
Peña, H. C. Goicoechea. Talanta 85 (2011) 2368– 2374.
COMPLEJIDAD DEL SISTEMA

Simplificación de los datos

Otros
componentes
de la orina
ESTRATEGIA 1  Aumento en modo temporal
 Inicialización con espectros
Un modelo para cada región:
los analitos con espectros idénticos quedan espectros
en distintas regiones

cromatogramas
15 calibradores
5 niveles (n=3)

ST
t D C
 Espectros puros

Calibración Pseudounivariada Perfiles de concentración


Perfiles espectrales Perfiles temporales
Identificación Cuantificación

NEO
2
 Aumento en modo espectral
ESTRATEGIA 2
 Inicialización con cromatogramas

Modelo único cromatogramas


Datos trilineales

espectros
15 calibradores
5 niveles (n=3)

CT
 D S
t Cromatogramas

Calibración Pseudounivariada Perfiles de concentración


Perfiles temporales Perfiles espectrales
Identificación Cuantificación

1 2
MCR-ALS

• http://www.mcrals.info/

• Interfaz gráfica (MATLAB)

• J. Jaumot, R. Gargallo, A. de Juan, R. Tauler, Chemom. Intell. Lab. Syst., 2005, 76,
101-110.

• J. Jaumot, A. de Juan, R. Tauler, Chemom. Intell. Lab. Syst., 2015, 140, 1-12.

You might also like