Psi4 + Antechamber进行Sigma Hole的RESP电荷拟合

分子力场中,为描述复杂分子体系的电荷分布,常常会引入带有电荷的哑原子进行描述。最经典的哑原子分子比如TIP4P和TIP5P的水分子力场,4点水模型TIP4P将O的负电荷在H-O-H的夹角内的哑原子上,O的质量则留在O原子处;5点水模型TIP5P则将O的负电荷拆分在O原子的Lone Pair处,模拟O的孤电子对。

除去水分子外,AmberTools的MDGX模块提供了添加哑原子,或虚位点(Virtual Site)的方法,如教程35中对氯苯的苯环上哑原子,及Sigma Hole哑原子添加的方法。不过MDGX使用较为复杂,MDGX的电荷拟合教程也较复杂。本文将从Antechamber的RESP电荷拟合讲起,讨论添加哑原子后直接使用Antechamber进行哑原子电荷拟合的方法。

分子力场中的Sigma Hole

生物体系模拟中的常用力场大部分不带有Sigma Hole的哑原子电荷,需要专业技术人员的手动添加和拟合。在CHARMM general force field (CGenFF) 于2016年发表的文章中,提出了一个非常简单的策略,即在Cl,Br,I的反键方向的固定距离上,添加+0.05的正电荷,从而在宏观模拟中的液体性质和分子间相互作用获得较大的提升。OPLS力场则有一系列文章讨论不同原子Sigma Hole的描述和影响。从原理上看,这一策略理应可以直接移植到GAFF力场中,也会有一个从无到有的提升。

但是固定电荷固定距离的方法从原理上是有瑕疵的,Br,I的原子半径更大,原子核对外层电子的吸引力更弱,因此成键后形成的Sigma Hole应该更大。卤素连接不同强弱的吸电子基团时,Sigma Hole的大小和位置也会发生变化。另外,噻唑或噻吩的S原子的S-C键的反键轨道上也存在Sigma Hole,而CGenFF中并没有添加此类Sigma Hole的拟合。因此本文提供一种操作简单且通用的Sigma Hole或Lone Pair的RESP电荷拟合流程。对此我们首先需要了解Antechamber中RESP电荷拟合的流程,并在这一流程中添加哑原子的坐标进行电荷拟合。

Antechamber做了什么

查阅AmberTools的官方文档,可以发现Antechamber本质是一个流程软件,会调用atomtypebondtypesqmam1bccespgenrespgenresp等等。其中atomtype指认GAFF力场的原子类型,bondtype指认GAFF的键类型,sqm和am1bcc进行AM1-BCC电荷计算,espgen读入量化软件输出转化为Antechamber ESP文件,respgen生成resp输入参数文件,resp则进行两步RESP电荷拟合。resp程序就是直接分发的RESP电荷提出者开发的软件。

衔接上篇文章中RESP计算,运行以下命令:

1
antechamber -i gas.gesp -fi gesp -o gas.mol2 -fo mol2 -c resp -nc 0

我们可以看到一些中间文件,其中3个文件比较重要,ANTECHAMBER.ESPANTECHAMBER_RESP1.INANTECHAMBER_RESP2.IN,分别是Antechamber的ESP文件,和RESP的Stage 1和Stage 2的RESP拟合输入参数文件。这三个文件都是resp程序进行拟合时的输入文件,关于三类文件的文档见RESP文档

首先是ANTECHAMBER.ESP

1
2
3
4
5
6
7
8
9
10
11
12
 5 2969    0
3.9180400E-01 -2.9493350E-01 -4.1242982E-01
1.0778168E+00 1.2750690E+00 -2.2276858E+00
-7.5427347E-01 -2.2568430E+00 -1.4459914E+00
2.4412971E+00 -1.0985077E+00 7.6446693E-01
-1.6365765E+00 1.2314168E+00 1.7220899E+00
1.7824967E-02 -4.4653786E-02 -3.3698060E+00 2.0564255E+00
1.8504019E-02 -2.5800629E+00 5.7536765E-01 -2.8921194E+00
1.8678736E-02 3.0070043E+00 -1.9761605E+00 -2.8921194E+00
1.7194282E-02 2.2923005E+00 -1.8891786E+00 -3.5204864E+00
1.5290645E-02 2.8283736E+00 2.8668085E+00 4.4832095E-01
.... Another 2964 Lines, 2969 Lines in total

ANTECHAMBER.ESP文件格式就是精简版的GESP文件,单位均为原子单位AU。该文件中第一行共3列,第一列为原子数,第二列为ESP格点数,第三列为电荷值;第二行开始为原子坐标,每行3列;最后一部分为ESP格点,为4列,第1列为静电势,其余三列为格点坐标。

然后是ANTECHAMBER_RESP1.IN,即Stage 1的非烷烃H原子对称限制下的RESP拟合步:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Resp charges for organic molecule

&cntrl

nmol = 1,
ihfree = 1,
ioutopt = 1,
qwt = 0.00050,

&end
1.0
Resp charges for organic molecule
0 5
6 0
9 0
9 2
9 2
17 0

具体文档见RESP文档,我们主要注意的是Resp charges for organic molecule后的内容。这一部分第一行共2列,第一列为Net Charge,第二列为原子数,每列宽度为5。接下来N行为原子的元素和组编码(ivary),组编码用于对称性限制。这里的对称限制指等价原子电荷应当相等,如亚甲基CH2的两个H化学环境相同,一般应该带有相等的电荷才复合实际模拟情况。本文例子CF3Cl中,三个F原子化学环境等价,应该限制为相等电荷。因此参数文件中的第3、4号原子(F原子)信息 9 2写入的组编码都为2,即与2号原子(F原子)电荷一致。其余组编码为0的原子则代表不启用对称性限制。

最后是ANTECHAMBER_RESP2.IN,即Stage 2的烷烃H原子对称限制下的RESP拟合步:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Resp charges for organic molecule

&cntrl

nmol = 1,
ihfree = 1,
ioutopt = 1,
iqopt = 2,
qwt = 0.00100,

&end
1.0
Resp charges for organic molecule
0 5
6 -99
9 -99
9 -99
9 -99
17 -99

第二步拟合时没有对称限制,因此组编码均为-99/-1时即不启用,且固定电荷在拟合中不再变化。所以事实上这一步运行前后不会对电荷进行任何拟合。注意:RESP电荷拟合原文中明确指出第一步是完全非对称限制的,允许原子电荷最大程度自由拟合,第二步是其他原子不再拟合,对sp3杂化的C原子拟合,以及对应的氢加对称限制拟合。但是上文中提及的Antechamber中的运行步骤是第一步直接使用对称限制,第二步大部分原子电荷直接固定,少量原子再进行对称或非对称拟合,其中原理阅读Antechamber中生成RESP参数的respgen.c源码可以得出大致结论:RESP Stage1对非与C相连的H原子以外其余对称原子也添加对称限制,RESP Stage2则与论文一致,将sp3杂化的C和与C相连的对称H原子添加对称性质的同时固定其他电荷。CF3Cl中没有连接对称H原子的sp3杂化C,因此RESP Stage2的组编码均为-99。目前我们仍然以Antechamber的中间文件作为参考进行后续修改以保持与官方的拟合一致性。

基于以上文档,我们可以明白,只需要在ESP文件中添加一行哑原子坐标,在RESP的两个参数文件添加一行哑原子的的元素类型(0)和组编码即可完成对Sigma Hole哑原子的电荷拟合。

简单手动添加哑原子的过程

仍然使用上篇文章中Psi4 RESP计算样例CF3Cl,运行以下命令:

1
antechamber -i gas.gesp -fi gesp -o gas.mol2 -fo mol2 -c resp -nc 0

获得ANTECHAMBER.ESPANTECHAMBER_RESP1.INANTECHAMBER_RESP2.IN三个文件,然后在ESP中添加一行哑原子坐标,坐标位置我们使用CGenFF中的Cl元素Sigma Hole的位置,即Cl-C键反键方向1.64 Å,这里使用原子单位,转换为Bohr为3.157 Bohr,笛卡尔坐标系下为-1.6365765E+00 1.2314168E+00 1.7220899E+00。修改后ANTECHAMBER.ESP变为下边的样子。

1
2
3
4
5
6
7
8
9
10
11
12
13
 6 2969    0
3.9180400E-01 -2.9493350E-01 -4.1242982E-01
1.0778168E+00 1.2750690E+00 -2.2276858E+00
-7.5427347E-01 -2.2568430E+00 -1.4459914E+00
2.4412971E+00 -1.0985077E+00 7.6446693E-01
-1.6365765E+00 1.2314168E+00 1.7220899E+00
-3.5318981E+00 2.6569549E+00 3.7170913E+00
1.7824967E-02 -4.4653786E-02 -3.3698060E+00 2.0564255E+00
1.8504019E-02 -2.5800629E+00 5.7536765E-01 -2.8921194E+00
1.8678736E-02 3.0070043E+00 -1.9761605E+00 -2.8921194E+00
1.7194282E-02 2.2923005E+00 -1.8891786E+00 -3.5204864E+00
1.5290645E-02 2.8283736E+00 2.8668085E+00 4.4832095E-01
.... Another 2964 Lines, 2969 Lines in total

然后在ANTECHAMBER_RESP1.INANTECHAMBER_RESP2.IN也添加哑原子的元素ID(0)和组编码信息

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Resp charges for organic molecule

&cntrl

nmol = 1,
ihfree = 1,
ioutopt = 1,
qwt = 0.00050,

&end
1.0
Resp charges for organic molecule
0 5
6 0
9 0
9 2
9 2
17 0
0 0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Resp charges for organic molecule

&cntrl

nmol = 1,
ihfree = 1,
ioutopt = 1,
iqopt = 2,
qwt = 0.00100,

&end
1.0
Resp charges for organic molecule
0 5
6 -99
9 -99
9 -99
9 -99
17 -99
0 -99

最后调用两次resp命令,即可获得

1
2
3
4
5
6
7
8
9
10
11
12
mkdir MOD1; mkdir MOD2

# RESP 1 in MOD1
cd MOD1/
resp -i ../ANTECHAMBER_RESP1_MOD.IN -o output -p punch -t qout -e ../ANTECHAMBER_MOD.ESP -s esout

# RESP 2 in MOD2
cd ../MOD2/
resp -i ../ANTECHAMBER_RESP2_MOD.IN -o output -p punch -q ../MOD1/qout -t qout -e ../ANTECHAMBER_MOD.ESP -s esout

cat qout

qout文件中的电荷

1
0.540036 -0.141469 -0.141469 -0.141469 -0.176623  0.060993

最后一个电荷为虚原子电荷,为+0.0609,比CGenFF中的+0.05略大,也比后文氯苯中的+0.0550略大,符合CF3Cl中F原子的强拉电子作用的预期影响。

进一步将点电荷的静电势进行可视化复现 (Figure 2),可以看到没有Sigma Hole哑原子的ffESP情况下,CF3Cl的整体静电势趋于低估,无法体现Sigma Hole效应和足够的偶极矩。在添加Sigma Hole的ffESPSH情况下,体现出了Sigma Hole效应和偶极矩。从数据角度看,添加Sigma Hole后,分子的偶极从0.371 Debye增加到0.440 Debye,非常接近量化计算的0.442 Debye;ESP拟合的relative RMS从0.76降低到0.31,也更接近量化计算的ESP。

Figure. 1

Figure 1. RESP Model for CF3Cl With or Without Sigma Hole

结论

本文介绍了一种简单修改Antechamber中间文件进行Sigma Hole电荷拟合的方法,该方法也可以扩展到其他哑原子电荷拟合中。除本文例子中的CF3Cl分子外,我还测试了其他分子,如噻吩的S原子Sigma Hole电荷为0.026,碘苯的I原子Sigma Hole电荷为0.065,与化学经验和量化计算结果吻合。但是邻位酰胺取代的噻吩的S原子Sigma Hole电荷为0.016,这显然是因为S与酰胺的O形成氢键后,一侧的Sigma Hole不明显,强行对称化S的一对Sigma Hol导致的低估。尽管如此,这一做法仍然比没有Sigma Hole时更好地描述了邻位酰胺取代的噻吩的最低能量构象。这一问题单一构象RESP一定无法解决,需要多构象RESP拟合,但是此例低能量构象占权重较大时,这一问题仍然存在,希望读者提供一些建议。

本文中并没有讨论合理的Sigma Hole的反键距离多少合适,这是一个多参数的优化问题。考虑到计算成本的问题,使用CGenFF的距离是一种简便方法。另外,本文也没有写明如何将虚原子添加在Amber力场文件中,我这里提供一份CF3Cl分子的Gromacs ITP文件的哑原子描述方法,即使用Gromacs的[ virtual_sites2 ]模式添加反键方向的哑原子,供参考。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
; opt_GMX.itp created by acpype (v: 2023.10.27) on Wed Feb 14 23:50:46 2024

[ atomtypes ]
DLP DLP 0.0000 0.050 A 0.00000000000e+00 0.000000e+00
;name bond_type mass charge ptype sigma epsilon Amb
c3 c3 0.00000 0.00000 A 3.39771e-01 4.51035e-01 ; 1.91 0.1078
f f 0.00000 0.00000 A 3.03422e-01 3.48109e-01 ; 1.70 0.0832
cl cl 0.00000 0.00000 A 3.46595e-01 1.10374e+00 ; 1.95 0.2638

[ moleculetype ]
;name nrexcl
opt 3

[ atoms ]
1 c3 1 UNL C 1 0.540036 12.01000
2 f 1 UNL F 2 -0.141469 19.00000
3 f 1 UNL F1 3 -0.141469 19.00000
4 f 1 UNL F2 4 -0.141469 19.00000
5 cl 1 UNL CL 5 -0.176623 35.45000
6 DLP 1 UNL DLP1 6 0.060994 0.0000

[ virtual_sites2 ]
; Site from funct d
6 1 5 2 0.346 ; 0.164 + 0.184(Cl-C Bond Length)


[ bonds ]
; ai aj funct r k
1 2 1 1.3500e-01 2.9506e+05 ; C - F
1 3 1 1.3500e-01 2.9506e+05 ; C - F1
1 4 1 1.3500e-01 2.9506e+05 ; C - F2
1 5 1 1.8040e-01 1.3012e+05 ; C - CL

[ angles ]
; ai aj ak funct theta cth
2 1 3 1 1.0736e+02 1.0175e+03 ; F - C - F1
2 1 4 1 1.0736e+02 1.0175e+03 ; F - C - F2
2 1 5 1 1.0911e+02 7.8743e+02 ; F - C - CL
3 1 4 1 1.0736e+02 1.0175e+03 ; F1 - C - F2
3 1 5 1 1.0911e+02 7.8743e+02 ; F1 - C - CL
4 1 5 1 1.0911e+02 7.8743e+02 ; F2 - C - CL

补充 20240219

补充几个化合物的计算样例。

样例1. 芳香化合物的Sigma Hole

对氯苯,溴苯和碘苯以及噻吩和噻唑的Sigma Hole进行RESP拟合。

Figure. 2

Figure 2. RESP Model Systems for Sigma Hole

不同方法计算后的RESP(m06-2x-d3zero2b/def2-tzvp)电荷和CGenFF电荷对比。

Table. 1

Table 1. RESP Model Systems for Sigma Hole

根据表1,Cl, Br, I的Sigma Hole所带的正电荷依次增加。噻唑对比噻吩,S的两侧化学环境是非对称的,左侧的Sigma Hole由于间位N的吸电子效应,从0.0264增加到0.0315,绝对值变大;右侧的Sigma Hole从0.0264减小到0.0140,变小。以上计算结果与化学家的化学直觉和实验观测是较为一致的。

样例2. 2-乙酰基噻吩的最低能量构象

2-乙酰基噻吩有一个可旋转键,因为羰基与噻吩环共轭,所以理论上会有两个能量较低的构象,即羰基和S同侧或异侧。

Figure 3. 2-乙酰基噻吩

根据量化(B3LYPD3/6-311G*)对2-乙酰基噻吩的二面角进行势能面扫描,如Figure 3所示,两个局部能量极小点中,S和羰基同侧的构象为全局能量极小点,相比S和羰基对侧能量低1.8 kcal/mol。可以从静电势角度进行解释,即噻唑S的Sigma Hole带有正电,与羰基氧同侧时能够形成静电吸引,从而降低了同侧构象的自由能。因此,含有Sigma Hole的力场模型才有可能正确描述这一构象分布情况。

Figure. 4

Figure 4. 2-乙酰基噻吩不同力场或电荷模型下二面角势能面扫描

对此我们也通过对GAFF, GAFF+Sigma Hole (GAFF_SH)及OPLS3e力场分别进行2-乙酰基噻吩的二面角势能面扫描。没有Sigma Hole的GAFF力场给出了完全相反的能量排序,认为S和羰基氧同侧时能量更高,这显然是不合理的。添加Sigam Hole电荷描述后,GAFF_SH给出了最接近量化计算的能量差,~1.8 kcal/mol;但是与GAFF类似,势能面整体表现较差。OPLS3e也很好的描述了S和羰基氧同侧时能量最低,同时它的自由能面整体上比GAFF更接近量化计算结果,不会出现阻转异构现象。后续进一步分析认为是GAFF的二面角参数过大导致势能面能垒过高,产生了阻转异构,这会导致长时间模拟下分子无法发生翻转。因此,单纯修改电荷模型仍然不足,需要同时修改GAFF的二面角参数,来提高分子模拟的准确性。

参考文献

[1] https://ambermd.org/tutorials/advanced/tutorial35/index.php Tutorial 35

[2] https://ambermd.org/tutorials/advanced/tutorial28/index.php Tutorial 28

[3] Ignacio Soteras Gutiérrez b, et al… Parametrization of halogen bonds in the charmm general force field: improved treatment of ligand–protein interactions. Bioorganic & Medicinal Chemistry (2016), 24( 20), 4812-4825.

[4] Jorgensen, et al. Improved Description of Sulfur Charge Anisotropy in OPLS Force Fields: Model Development and Parameterization. Journal of Physical Chemistry B Condensed Matter Materials Surfaces Interfaces & Biophysical (2017).

[5] Jorgensen, W. L., & Schyman, P. (2012). [Treatment of Halogen Bonding in the OPLS-AA Force Field; Application to Potent Anti-HIV Agents].(https://pubmed.ncbi.nlm.nih.gov/23329896) Journal of chemical theory and computation, 8(10), 3895–3801.

[6] https://ambermd.org/Manuals.php Amber Reference Manuals

[7] https://upjv.q4md-forcefieldtools.org/RED/resp/ RESP version 2.2