本
文
摘
要
计算机辅助药物设计(computer-aided drug design,CADD)是近年来发展起来的研究与开发新药的一种崭新技术,它大大加快了新药设计的速度,节省了创制新药工作的的人力和物力,使药物学家能够以理论为指导,有目的地开发新药。CADD是一个相当大的论题,涉及到结构化学、药物化学、分子药理学、生物化学、结构生物学、分子生物学、化学生物学、细胞生物学、生理学、病理学、生物物理学、组合化学、量子化学、分子力学、分子动力学、分子图形学、计算化学、化学信息学、生物信息学、X射线晶体学、核磁共振技术、计算机图形技术、数据库技术和人工智能技术等基础学科和应用学科与技术。融合这些学科知识与技术,CADD在药物作用和药理活性预测、药效基团研究、药物构效分析、全新药物设计、高通量虚拟筛选及合成数据库设计等方面展示了强大的威力,大大地提高了药物设计水平,并趋向于定向化和合理化,开辟了广阔的前景。
通常意义上的CADD仅指基于分子模拟(计算化学)的分子设计技术,又可分为基于受体结构的药物设计(receptor-based or structure-based drug design, SBDD)和基于配体的药物设计(ligand-based drug design, LBDD)。SBDD从受体的结构和性质出发寻找可以与其特异结合的配体分子,所以也称为直接药物设计,包括基于受体结构的分子对接、活性位点分析、从头药物设计(生长或连接算法)等具体方法;LBDD根据已知活性的先导分子,构建结构-活性关系或药效基团模型,称为间接药物设计,包括定量构效关系(QSAR)、药效基团模型、受体映射、基于分子形状的叠合等具体的方法。在实际工作中,根据已知信息的多少可以选择相应的研究方法,当然已知信息越多越准确的时候,结果就越可靠。
采用计算机辅助药物设计方法帮助进行药物筛选,即在进行生物活性筛选之前,利用计算机上的分子对接软件模拟目标靶点与候选药物之间的相互作用,计算两者之间的亲和力大小,以降低实际筛选化合物数目,同时提高先导化合物发现效率。对含大量分子的虚拟组合库进行处理和评估,利用软件筛选和物化性质排除等方法,寻找可能与配体结合的小分子化合物从而得到活性较高的化合物。
基于配体的筛选是根据一个或者一系列已知的具有靶标活性的小分子的结构等信息,到数据库中去寻找新的活性化合物"在这个过程中,采用的方法通常有相似性搜索(simility Searching),子结构搜索(Substructure searehing),药效团匹配(Pharmacophore matching),三维形状匹配(3D shape matehing)等。
基于受体的筛选是在已知受体结构的情况下,对数据库中的小分子用分子对接(Molecular docking)或者基于配体的药效团搜索的方法,评估小分子可能对受体结构的作用方式以及与结合口袋的匹配程度,最终根据打分(Score)等信息挑选命中化合物(Hit)。如对化合物再进行聚类分析,将结构相似的化合物聚类到相关的家族中,并从每个聚类(或聚类分支)中选择少量分子。(该方法有个bug就是不同聚类化合物之间横向比较产生困难)。
1. LBDD和SBDD方法的对应
药物设计中SBDD和LBDD的对应甚至可以体现在整体水平上——蛋白质设计与改造vs配基设计。药物设计是根据蛋白质的结构设计小分子配体,蛋白质设计是设计或改造基因序列,使表达后的蛋白具有特定的功能(如结合或催化底物),二者都是基于分子之间的相互作用。蛋白质改性、设计是一个十分重要并充满挑战的领域,并有可能藉此推动生命起源研究的发展。在蛋白设计发展到一定阶段说不定会出现潜在活性的蛋白库(虚拟的或者实体商品库)。到那时,将会出现与现在配体库的分析相对应的蛋白质的定量结构功能关系、蛋白商品库的多样性分析、生物相关性、稳定性研究等等研究方向。
可见,SBDD、LBDD这两种出发点完全不同的药物设计方法确实存在着微妙的对应关系。认识到这种对应关系不仅为药物设计方法的发展研究提供了素材,而且更为重要的是为今后药物设计方法的创新提供了重要的提示。例如,可以根据某种SDBB方法设计对应的LBDD方法,反之亦然。这为今后的药物设计方法的开发指出了一个捷径。
2. LBDD和SBDD方法的整合
SBDD以锁匙模型为基础,寻找可以与靶标结合的配体分子;而SBDD以相似性原理为基础,寻找与已知抑制剂具有潜在相同作用方式的配体分子。SBDD结果准确,可直接预测结合能,缺点是需要受体结构,速度慢;LBDD速度快,无需蛋白结构,但是有时由于缺乏具体结合方式的指导,结果外推时常常误差很大。这两种方法、理论是独立发展,各有其适用条件和利弊的。同时,这两类方法也是紧密联系的,将两种方法结合使用,特别是基于分子对接的三维定量构效关系研究(CoMFA based on Docking)常见于报道。
LBDD和SBDD方法整合的趋势也体现在数据库的设计上,不仅大分子数据库加入了抑制剂等配基的信息,将小分子数据库中加入活性数据(PubChem,ChemBL,DrugBank)上,而且在系统生物学的高度上,将大小分子信息整合为一个生物代谢调控的网络,并用于药物设计和生物基础研究。
此外,不同的LBDD或SBDD方法之间还可以相互整合,如多拷贝子结构搜寻(MCSS,in Insight II or Discovery Studio)、多片段搜寻(MFS,in MOE)是基于片段的药物设计方法和基于格点的药物设计方法的整合。基于药效团的QSAR是LBDD中内部结合使用的例子。现在将两种方法结合使用的趋势越来越受到重视。
所有的SBDD都是基于互补的筛选,而所有的LBDD方法是基于相似性的筛选。各种筛选方法有不同的条件限制和速度,应采用先粗筛、再精筛的策略,在有限的时间内完成先导化合物的发现。
当然咯,虚拟筛选也有一定的弊端。
首先第一点,就是要承认虚拟筛选跟其他方法一样,也不是万能的。
虚拟筛选可以看作是对化学空间的挖掘,其目标是将具备目标性质的分子与不具备目标性质的分子区分开来。与大多数预测方法一样,不应该假定虚拟筛选能以完美无瑕的方式实现这一目标。虚拟筛选高度依赖于可用数据的数量和质量以及底层算法的预测/区分能力。如果没有很好的已知条件,也是巧妇难为无米之炊。一般而言,我们可能会有几个误区:
1、期望选出高新合力的化合物
虚拟筛选的主要目的是识别出对特定靶点具有生物活性的新化合物。然而,有时实验者和审稿人期望虚拟筛选能得到具有强活性的化合物。发现强活性的苗头化合物固然是好,然而这不是虚拟筛选成功的必要条件,因为亲和性的优化典型地发生在寻找先导化合物和先导化合物优化阶段。就这一点来说,虚拟筛选和高通量筛选一样主要目标是获得尽可能数量和种类多的起始化合物,而不是活性尽可能强的化合物。评估虚席筛选算法时设置一个二分的活性阈值是困难且武断的。设置阈值这种评价虚拟筛选方法的缺陷不仅与比较研究中基准数据的选择有关(像MDL药物数据库之类的数据经常没有数字的活性值),还与药物筛选实际使用的阈值有关(结果因具体实验的活性阈值的选择而不同)。
2、对筛选结果挑选的主观性
在实践中,虚拟筛选工作结束后,虚拟筛选命中得到的化合物会被相关研究人员再挑选,这些化合物中的一部分会进行物理筛选。我们的经验表明,某些妥协和潜在的主观的决策在这里发挥了重要作用。例如一个基于配体的虚拟筛选实验使用含有500,000分子结构的内部化合物库进行,这个虚拟筛选命中了1000个得分较高的化合物结构。然而,生物筛选实验实在低通量模式下进行,且只有100个分子的筛选能力,同时化合物需要进行人工挑选,在这种情况下正确的处理方法是什么?简单地从排名前100位的结构中选择,可能会选择到一组在结构多样性上有冗余的类似物。更好的方法是对这些化合物进行聚类分析,将结构相似的化合物聚类到相关的家族中,并从每个聚类(或聚类分支)中选择少量分子。虽然这种方法相当合理,但是他在虚拟筛选过程中引入了偏好(或主观性),使得不同化合物间的横向比较产生困难。