You are on page 1of 61

Mtodos de Simulacin en

Qumica y Bioqumica
Tpicos de Fisicoqumica de
Sistemas Biolgicos 2007
Simulacin molculas pequeas aisladas (fase gaseosa)
ha llegado niveles de precisin muy altos. (QM)

Sin embargo, procesos reactivos en solucin y/o entornos
complejos como biomolculas son mucho ms difciles
de investigar.
ESE ES NUESTRO OBJETIVO!!!!
Desarrollo metodologas
Aplicaciones: reacciones en
biomolculas
Aplicaciones a reacciones
en solucin.
Desafo:

Introducir en las predicciones realizadas, los
efectos del entorno y de la temperatura.

Cuando se logre ese objetivo, la Qumica
Computacional ser capaz de realizar
predicciones realmente relevantes.
METODOS DE SIMULACION COMPUTACIONAL
(en Qumica y Bioqumica)
Herramientas informticas (homologas, bases de datos, etc)

Herramientas fisicoqumicas implementadas en programas
1) Modelos: recetas para evaluar
superficie energa potencial (SEP).
(potenciales clsicos, QM, etc)
2) Esquemas para extraer informacin de SEP.
Monte Carlo, Dinmica Molecular.
MODELOS CUANTICOS

Modelos basados en la mecnica cuntica:
Resuelven (o tratan!) ecuacin Schrdinger.

Aproximacin bsica: Born-Oppenheimer
Distintos niveles aproximacin:
semiempricos, HF, DFT, etc

Indispensable para: procesos reactivos, estados excitados.

En principio: vlido para cualquier sistema.

En la prctica: limitaciones computacionales en
cuanto tamaos.
Aproximacin fundamental: Orbital
Funcin de onda: determinante de
Slater. Equivale a asignar un electrn
a cada orbital.

Matemticamente: ecuaciones de
Hartree-Fock. (SCF)
Orbitales: se expanden con
funciones de base.
Nmero de funciones: determina
calidad del resultado.

Base infinita: lmite de HF (no es
correcto)

Siglas usuales: 3-21G, 6-31G,
6-31G**, etc.
Costo computacional:
Crece con N
4
(eso es mucho!!!)

Qu se hace?

Mtodos aproximados: semiempricos:
Usa HF, pero desprecia algunas integrales, y
mete resultados experimentales.
Mtodos semiempricos
Muy eficientes.
Problemas con metales, estados de
transicin.

AM1, PM3, ZINDO, etc
Siglas: distintos niveles de
aproximacin y parametrizaciones
diferentes.
Mtodos post-HF
Corrigen error en aproximacin
orbital..
Son muy costosos
computacionalmente.

MP2 (perturbativo)
CI (variacional). Sirve para estados
excitados.
Mtodo alternativo: DFT
Teora del funcional de la densidad

Variable fundamental: densidad

Eficiente computacionalmente. Da
muy bien. Preferido en biologa.
QM: DFT
y
con:
Exchange-
correlation
Que cosas se calculan?
Distribucin de cargas.
Factibilidad de reacciones (E y
barreras)
Propiedades estructurales
(optimizacin de geometras)
MODELOS CLASICOS

Modelos basados en la ideas clsicas:
(ley Coulomb, resortes, etc)

Distintos niveles aproximacin segn complejidad
funcin propuesta, ejemplo, potenciales polarizables.

Numricamente muy eficientes.

En principio: no son vlidos para procesos reactivos.

Parametrizacin es clave y requiere artesana!

Qumica Cuntica Tradicional: optimizaciones
de geometra
Corresponde a analizar mnimos de la SEP (0 K)

Cmo incluimos T?

Existe una gran experiencia en mtodos de
simulacin clsicos en los ltimos 20 aos,
y ms recientemente tambin con modelos
cunticos.
Ejemplos de fenmenos de inters qumico y/o biolgico
que se pueden investigar mediante tcnicas de simulacin:
1) Reacciones qumicas en solucin.

2) Reacciones enzimticas.
3) Interacciones de macromolculas con ligandos.

4) Prediccin de estructura de macromolculas.

5) Interaccin entre macromolculas.
QM
MM
Cmo extraigo informacin de la SEP?
Termodinmica Estadstica
Promedio temporal propiedad A:
Promedio configuracional propiedad A
Promedio sobre ensamble de sistemas:
Densidad probabilidad
Probabilidad encontrar
configuracin R
}

= > < dt )) t ( P ), t ( R ( A lim A
t t
}
= > < ) P , R ( ) P , R ( A dP dR A
r
V= V(R1, R2, R3, ..,Rn)
Ensambles:

Microcannico: NVE constantes

Cannico: NVT constantes

Otros algo menos usuales:

Isotrmico-isobrico: NPT

Gran cannico: potencial quimico, V, T
Corresponden a situaciones experimentales diferentes
y se pueden implementar en esquemas de simulacin.
Funcin de
particin
A N,T y V constantes:
Q
) kT / ) P , R ( E exp(
) P , R (

=
}
= } kT / ) P , R ( E exp{ dP dR cte Q
) R ( V ) P ( K ) P , R ( E + =
Energa
cintica
Energa
Potencial (SEP)
( )
}
=
t
) kT / ) r ( V exp( dr Q
/ N
h
kT
2 3
2
2

Trmino K
Siempre igual!
Trmino V, depende
del sistema
En casos normales V depende slo de R
Q / ) kT / ) R ( V exp( ) r ( =
En principio si conozco Q en forma analtica, puedo obtener
todas las propiedades termodinmicas de mi sistema!
Por ejemplo
V
T
Q ln
kT U
|
.
|

\
|
c
c
=
2
Q ln kT F =
Esto slo se puede hacer para gases ideales, adems
suponiendo modelos simplificados para grados de
libertad internos (oscilador armnico, rotor rgido, etc),
}

= > < dt )) t ( P ), t ( R ( A lim A
t t
}
= > < ) P , R ( ) P , R ( A dP dR A
r
Volviendo a las ecuaciones bsicas:
HIPOTESIS ERGODICA :
t r
A A > =< > <
En principio equivalentes.
}
= > < ) P , R ( ) P , R ( A dP dR A
r
Ecuacin muy elegante, pero como no conozco Q, no conozco
Manera aproximada de sacar cosas de esa ecuacin:
Esquema Monte Carlo (MC), Metropolis et al 1952
}

= > < dt )) t ( P ), t ( R ( A lim A
t t
Manera aproximada
de usar esta otra:
Dinmica Molecular
(MD)
MC
MD
DINAMICA MOLECULAR
Leyes Newton: F=m a
Conociendo superficie de energia potencial: saco F=Grad E
Se usan mtodos de diferencias finitas, expandiendo en
Serie de Taylor:

r(t+h)=r(t) + h v(t) + h
2
a(t) +
r(t-h)=r(t) h v(t) + h
2
a(t) +

Sumando da:
r(t +h) = 2 r(t) r(t-h) + h
2
a(t)
ALGORITMO
VERLET
Receta para calcular posiciones a tiempo t+h,
conociendo las aceleraciones a tiempos t-h , t y
la aceleracion= Fuerza/masa para cada tomo del sistema.
Se parte de r(t), y r(t-h), y velocidades salen de:
v(t)=[r(t+h)-r(t-h)]/(2h)
Alternativa ms usada: Velocity Verlet
r(t+h)=r(t)+hv(t) +1/2 h
2
a(t)

v(t+h)=v(t)+1/2 h [a(t)+a(t+h)]
Mejor, condiciones iniciales posiciones y velocidades.
MD: muestrea configuraciones a E constante
(ensamble microcannico). Se puede demostrar
fcilmente.

Como se si hago las cosas bien?
Se debe conservar E total. Tpicamente 1 en 10
4

K(t)= (p
i
(t))
2
/(2mi) = kT(3N-Nc)/2
Definicion microscpica de T

V(t)= dada por SEP, E(t)=V(t)+K(t)

3N-Nc: grados de libertad internos del sistema
Como influimos?. Eleccin de time step h
Ver escalas.
Fluctuaciones E total
Deben ser menores a
1/10
4
Movimiento lento
Movimiento rpido
h
h
1-2 fs
0.1-05 fs
Time step:
0.1-0.2 fs vibraciones enlaces covalentes
1-2 fs doblamientos, torsiones, rotaciones, etc.

Tiene que ver con escalas de tiempo de movimientos.
Uniones fuertes: movimientos rpidos , menor h preciso
para integrar bien.
Truco: usar uniones rgidas: constraint dynamics
Metodo usual: SHAKE, Ciccotti et al 1977.

Se agrega una fuerza extra, debido al constraint (ejemplo
unin HO =1 angstrom)
Matemticamente: se usan multiplicadores de Lagrange
MD: tambien se puede adaptar para muestrear
en el ensamble Cannico (mas parecido a
situacin experimental) T constante

Esquemas ms simplificados:
1) Escalar velocidades directamente!

K(t)= m
i
v
i
(t)
2
/2 = kT(3N-Nc)/2

Multiplicar velocidades por x=sqrt(Tdeseada/T(t))
Eso se hace en equilibracin, pero no en corridas
de produccin.

2) Algoritmo de Berendsen
Se usa mucho en protenas. Es algo ms riguroso.
El cambio en temperatura entre dos pasos es:

AT=1 + h/t (Tdeseada/T(t) 1), con
t parmetro acoplamiento
Entre el termostato y el sistema.

Esquema correcto para hacer MD en el conjunto
cannico: se denomina algoritmo de Nose (1984)
Se agrega grado de libertad para el termostato o
Reservorio y es algo ms complicado, pero ms riguroso.
Se agrega K y V para el reservorio a E total.
Esquemas escalamiento tipo Berendsen:
problemas: no equilibran (distribuyen E
entre distintos grados de libertad).
Pueden haber modos calientes y modos fros.
Qu se puede
aprender de esto?
Propiedades estructurales
distancias, angulos,
fluctuaciones, etc.
Propiedades termodinmicas.
valores medios E, cv.
Cambios G.
Propiedades dependientes
del tiempo
Predicciones que se pueden realizar dependen
del modelo empleado para la descripcin de la
superficie de energa potencial.

Reacciones qumicas: necesito Mecnica Cuntica.
Muy costoso!!

Procesos que no involucran ruptura o formacin
uniones covalentes:

Pueden usar potenciales clsicos. Hay muchos
trabajos en la Literatura en Bioqumica y
Ciencias de Materiales.
Ejemplo: Bovine Pancreatic Trypsin Inhibitor (BPTI).

Protena pequea:
536 tomos
Muy estudiada
Medidas estructurales globales:
Otras medidas estructurales:
funciones de correlacin radial g(r).
Por ejemplo para ver interacciones especficas
(uniones H).
Probabilidad de encontrar un tomo a una distancia r
de otro tomo, comparada con una distribucion ideal.

Dist. Ideal:
Volumen de capa de ancho h es:
4t/3(r + h)
3
- 4t/3(r)
3
~ 4tr
2
h ;

Nro partculas est dado por: 4tr
2
h ,
donde densidad (N/V)
Se calcula haciendo histogramas de toda la simulacin.

Ej: H
2
O, g(HO), se toman todas las distancias HO
en cada paso, y se acumulan en un histograma.

Luego se normaliza con el factor de volumen ideal.
Grfico tiene este aspecto:
Primer pico: interacciones directas.
Slido: muchos picos. Gas, estructura se pierde rpido.
H...O(nitrato)
O ...N(nitrato)
O...O(nitrato)
Ejemplo de proceso dinmico: estudian la
dinmica del plegado (Folding) y comparan la
estructura plegada con la experimental
obtenida por RMN
Mtodo de Monte Carlo
A partir de una configuracin de partida, se generan
configuraciones nuevas, moviendo las coordenadas de
cada tomo segn: x
i
= x
i-1
+ o w, donde o es un
parmetro fijo, y w es un nmero generado al azar
entre 0 y 1. (Idem para y, z).

Para cada configuracin i-sima se evala
p= exp(-AE)/kT), donde AE=E
i
- E
i-1


Si p > 1, se acepta la movida.
Si p< 1, se compara p con otro nmero al azar
entre 0 y 1, ww. Si p< ww, se acepta la movida.
Qu quiere decir aceptar movida?

= > <
M
i
MC
) Ri ( A
M
A
1
Si acepto movida, uso esa configuracin para la
suma.
Si rechazo movida, vuelvo a poner en la suma la
configuracin anterior.

Notar que si hice M movidas, la suma tendr M
trminos, independientemente del nmero de
aceptaciones.
Detalles Tcnicos:
Elijo cun lejos me muevo con el parmetro o

Si me muevo mucho, voy a rechazar casi todo, y
eso no es bueno.

Habitualmente, se elige o, como para que se acepte
alrededor del 50% de las movidas.

Muestreo en el ensamble cannico (NVT)
Ms detalles de MC:

no necesito programar fuerzas (derivadas)

Idea es consistente con que los sistemas visitan
con mayor probabilidad configuraciones de
menor energa, pero que eventualmente pueden
visitar otras de mayor energa.

Configuraciones de muy baja energa darn
origen a muchos rechazos, y por eso se cuentan
muchas veces en suma

Problema: difcil que ocurran movimientos
concertados
Esquema MC convencional: til en sistemas sencillos.
Ejemplo: clculo solvatacin en solutos orgnicos.
Protena corismato mutasa
Sistema simulado
Resultados: efecto cataltico
enzima
d
1
d
2
=d
1
-d
2
Preguntas fundamentales en Qumica:


1) un dado proceso es factible?
2) si lo es, cun rpido es?
Para responder se pueden determinar:

E, E activacin, o perfiles de energa. OK a T= 0 K.
(Qumica Cuntica Tradicional)


A T finita, necesitamos G y G activacin.
Dos tipos problemas energa libres:
Proceso reactivo.
F(x), donde x es coordenada de reaccin.
Se llama potencial fuerza media. Info cintica y
termodinmica. Umbrella sampling (muestreo sesgado)
AF procesos complejos, como binding
droga-receptor. Varias tcnicas, la
Ms empleada es FEP (free energy
perturbation)
Free Energy Perturbation
Considerar 2 estados: i.e receptor unido a droga
A y droga B
AF= -kT ln(Q
A
/Q
B
)

F y A se usan indistintamente.
Se hace la corrida con una droga unida, y en cada configuracion se
Recalcula E con los parmetros de la otra droga.

Promedio en el espacio de configuraciones del primer sistema.
Problema: si espacios configuraciones son muy distintos, puede
muestrearse poco yo mal.
TRUCO: Ir de a poco y armoniosamente!
AF=(F(A)-F(N))+(F(N)-F(N-1))+ ..... ((F(1)-F(B))

Dividir el cambio entre A y B en varias etapas.
Se hace un V(), donde =0 corresponde a A y =1 a B.

Cada etapa: AF(i i+1) = -kT ln <exp(-(H
i+1
H
i
)/kT))>
Ejemplo:
unin melatonina
a calmodulina.

(se hizo desaparecer
Mel en H
2
O y Mel
en calmodulina
y se obtuvo AF
de la diferencia.
Este tipo de simulaciones tiene una enorme importancia
econmica en la industria farmacutica.
(diseo de frmacos)
Procesos qumicos: potencial de fuerza media.
Clave: eleccin coordenada de reaccin.
Tpico: transferencia de protn.
Fuerza bruta:

Muestrear y sacar AF(
1
-
2
) = -RT ln(P(
1
)/ P(
1
))
Histograma: cuntas veces aparecen configuraciones
con un dado valor de
Problema: salvo que pueda correr mucho, si la barrera es
alta nunca voy a muestrear bien zonas de alta energa (baja
probabilidad)
Si coordenada de reaccin es distancia entre 2 tomos:
F(r)=-kT ln g(r) + cte
Muestreo sesgado: umbrella sampling
Obligo al sistema a muestrear zonas de alta energa
V(r) = V(r ) + W(r) =V(r ) + k( -
o
)
2
Con esto obligo a muestrear en zonas cercanas a =
o
Promedios corregidos se sacan de acuerdo a:
De ah puedo sacar P corregidos y si se hacen varias
simulaciones a valores distintos de
o,

w kT / ) r ( W exp[
w ] kT / ) r ( W exp[ ) r ( X
X =
F versus coordenada
de reaccin.
en el caso del dmero
del cido frmico.


= d
1
-d
2
Del perfil de F saco
info cintica
y termodinmica !!

You might also like