计算生物学入门资料整理

计算生物学的定义

“Computational biology involves the development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems.”

------From Wikipedia, the free encyclopedia

1. 计算生物学的研究内容

  • 量子化学计算(略)
  • 蛋白结构预测
  • 分子对接
  • 分子动力学模拟

2. 计算生物学的入门教材

1. 《Molecular Modelling: Principles and Applications》Andrew R. Leach

Valverde J R. Molecular Modelling: Principles and Applications[M]. Longman, 2001.
分子模拟的圣经,主要的内容包括量子力学介绍,分子力学,分子模拟和少量的蛋白结构预测和分子对接。

2. 《计算机辅助药物分子设计》侯廷军, 徐筱杰

侯廷军, 徐筱杰. 计算机辅助药物分子设计[M]. 化学工业出版社, 2004.
内容详细全面,主要基于分子力场、分子模拟、分子对接及定量构效关系等。附录中对分子对接软件的介绍十分实用,但需要注意时效。

3. 《分子模拟的理论与实践》陈正隆

陈正隆. 分子模拟的理论与实践[M]. 化学工业出版社, 2007.
国内著名的分子模拟方面的教材,侧重点在分子力场和分子模拟。有少量分子对接内容。数学公式较多。

4. 《计算机辅助药物设计:原理、方法及应用》陈凯先

陈凯先. 计算机辅助药物设计·计算机辅助药物设计:原理、方法及应用[M]. 上海科学技术出版社, 2000.
偏向药物设计的计算生物学教材,内容囊括了量化计算、定量构效关系及分子对接。

其他软件手册

很多的计算生物学软件的手册都会介绍使用的算法和原理,因此在使用软件和研读手册过程中,能够更好地了解分子力学的相应背景。

3. 蛋白结构预测

蛋白质建模是通过序列对未知蛋白或未知的蛋白构象进行预测的研究手段。蛋白预测的研究方法主要有从头预测(ab initio),同源建模(homology modelling)等。对于从头预测,我们可以根据物理、化学原理,通过计算来进行结构预测。但是在实际中,这种方法往往不适合,特别是较大的体系无法适用。因此目前在研究中主要使用的是同源建模。同源模型化方法通过同源序列分析或者模式匹配预测蛋白质的空间结构或者结构单元。一对自然进化的蛋白质,如果它们的序列具有25~30%的等同部分或者更多,则可以假设这两个蛋白质折叠成相似的空间结构,进而预测未知序列的结构模型。
相关的介绍可以参见wiki百科�https://en.wikipedia.org/wiki/Protein_structure_prediction

蛋白质结构预测的软件

蛋白结构预测的软件列表可以在wiki上查看�List of protein structure prediction software

1. Modeller

蛋白结构预测的软件有很多,这里推荐的首先是较为著名的Modeller软件,来源于UCSF的教授Andrj Sali。学术使用需要申请License。
官网地址https://salilab.org/modeller/

2. HHpred

HHpred是一个在线蛋白预测的服务器,分为比对和建模。建模部分使用了Modeller作为服务器。优势在于寻找同源模板的序列的Profile-Profile比对,可以找到远源的同源结构。

3. I-TASSER

目前最好的蛋白结构预测服务器,2006–2012 CASP的最佳server。由U Michigan的Yang Zhang教授开发维护。学术免费。
http://zhanglab.ccmb.med.umich.edu/I-TASSER/

4. 分子对接(Docking)

分子对接是通过受体的特征以及受体和药物分子之间的相互作用方式来进行药物设计的方法。主要研究分子间(如配体和受体)相互作用,并预测其结合模式和亲合力的一种理论模拟方法。在计算机辅助药物设计中可以研究小分子和蛋白结合的结构模式,也可以通过对接软件进行高通量筛选。
介绍见wiki:https://en.wikipedia.org/wiki/Docking_(molecular)

分子对接软件

分子对接的软件和服务器wiki列表
https://en.wikipedia.org/wiki/List_of_protein-ligand_docking_software

1. Autodock / Autodock Vina

Scripps开发的Autodock是使用最广泛的开源分子对接软件,也是发表论文对多的对接软件。Autodock vina是AutoDock团队较为新的对接软件,精度和速度均有了提升。学术免费。
http://autodock.scripps.edu/

2. UCSF DOCK

UCSF DOCK是非常著名的对接软件,可以和UCSF Chimera视图软件联用,也可以与ZINC数据库进行联用。ZINC库是著名的小分子结构数据库,其中的分子已经针对DOCK进行参数化,非常适合对快速的虚拟筛选。学术免费。
http://dock.compbio.ucsf.edu/

3. Glide

Schrodinger开发的软件套装,目前最好的对接软件,精度和速度都很好。商业软件,需要付费使用。
https://www.schrodinger.com/Glide/

4. HADDOCK

最好的对接服务器之一,可以进行蛋白-蛋白对接和蛋白-小分子分子对接
http://www.bonvinlab.org/software/haddock2.2/

5. 分子动力学模拟(Molecular Dynamic,MD)

分子动力学是基于经典物理学理论来使用计算机模拟原子的动态过程。
https://en.wikipedia.org/wiki/Molecular_dynamics

分子立场

分子动力学模拟软件

1. Gromacs

免费的分子动力学软件,可以使用GPU加速。支持包括Amber,Charmm,Gromos和OPLS在内的多种立场。
使用是可以通过Charmm-Gui服务器构建Charmm立场体系,用户友好。

2. Amber

AmberTools已经开始学术免费,除了GPU加速的Amber程序外,均可使用。

3. NAMD

免费的分子动力学软件,可以使用GPU加速,可以与VMD联用,完成多种模拟。

6. 其他

分子展示软件

生物信息学数据库