滚动信息2
发布时间:2026-06-10 22:05:59
摘要:药物-靶点相互作用(DTI)预测是药物发现的核心环节。本文阐述DTI的基本概念与传统方法局限,评述机器学习、深度学习及图神经网络等智能计算模型的应用进展,并展望AI赋能的精准药物发现前景。
关键词:药物-靶点相互作用;智能计算;深度学习;图神经网络;药物重定位
1、药物发现的核心——药物-靶点相互作用
药物与靶点的相互作用是药物发现的核心环节。药物靶点通常是生物体内具有特定功能的蛋白质(如酶、受体、离子通道等),药物通过与其特异性结合调控生物活性,从而发挥治疗作用。准确识别DTI对于加速药物开发、降低研发成本具有重要意义。
药物与靶点的结合涉及氢键、疏水作用、范德华力等多种分子间作用力。相较传统高通量筛选(HTS)方法耗时漫长(平均10-15年)、成本高昂(超过26亿美元),智能计算方法能够在海量化学空间中快速筛选潜在药物-靶点,兼具成本低、效率高的优势,为精准药物发现提供新路径。
2、药物-靶点相互作用预测
传统方法依赖分子对接(Molecular Docking)和定量构效关系(QSAR),需要靶点的三维结构信息,且计算量大、难以处理大规模数据。机器学习方法通过分析药物分子指纹(Morgan指纹、MACCS键等)和蛋白质序列特征,利用相似性度量或统计模型预测相互作用;协同过滤和矩阵分解方法则利用已知的药物-靶点关联网络推断新的相互作用。
但传统方法存在局限:基于结构的方法依赖实验解析的蛋白质三维结构,而大部分靶点缺乏结构信息;基于序列的方法忽略了分子的结构特征;浅层机器学习模型难以捕捉复杂的非线性相互作用关系。
3、药物-靶点相互作用预测的智能计算时代
随着人工智能技术的发展,智能计算方法主要包括机器学习、深度学习、图神经网络等,能够处理和分析海量化学和生物数据,挖掘隐藏的相互作用模式。
3.1、机器学习模型:传统有监督学习方法(如支持向量机、随机森林、梯度提升树等)被广泛应用,通常将DTI预测建模为二分类问题,结合分子描述符、蛋白质序列特征、基因本体注释等多维度特征训练预测模型。基于网络的方法利用药物-药物相似性、靶点-靶点相似性和已知的DTI网络,通过网络传播或矩阵分解推断新的相互作用,在数据稀疏场景下实用性高。
3.2、深度学习模型:深度学习模型可以自动学习数据的层次化特征。DeepConv-DTI模型将蛋白质序列作为输入,通过一维卷积神经网络自动提取序列局部特征,结合药物分子指纹进行相互作用预测。MolTrans模型则提出分子相互作用Transformer架构,通过知识启发的子结构模式挖掘算法和增强的Transformer编码器,从大规模未标记生物医学数据中提取语义关系,实现了更准确和可解释的DTI预测。
3.3、图神经网络模型:图神经网络(GNN)充分考虑了药物分子和靶点蛋白的结构特性,将它们看作图结构数据。通过构建分子图(原子为节点、化学键为边)和蛋白质相互作用网络,利用图卷积操作聚合邻域信息,学习结构感知的表示。HiGraphDTI模型提出层次化图表示学习方法,从原子-基序-分子三个层次学习药物表示,通过注意力机制融合不同感受野的信息,在多个基准数据集上取得最优性能。DrugMAN模型则整合多重复异构功能网络,利用图注意力网络学习药物和靶点的低维特征,通过互注意力网络捕获交互信息。
4、智能计算模型实例
4.1、HiGraphDTI模型:聚焦于层次化分子特征挖掘,将药物分子表示为三层级图结构(原子级、基序级、分子级),通过图神经网络分别学习各层级的化学信息。该模型采用注意力特征融合模块整合不同感受的信息,能够识别关键的分子片段,为解释相互作用机制提供互补视角。实验结果表明,HiGraphDTI在DTI预测任务中显著优于现有最先进方法,尤其在缺乏完整结构数据的新药筛选中表现突出[1]。
4.2、EviDTI模型:基于证据深度学习(Evidential Deep Learning, EDL)构建,整合药物的二维拓扑图和三维空间结构信息以及靶标蛋白的序列特征。该模型利用预训练模型(ProtTrans和MG-BERT)提取多维度表示,通过证据层输出预测概率及不确定性估计。EviDTI不仅能够校准预测误差,还能通过不确定性指导优先选择高置信度的DTI进行实验验证,在酪氨酸激酶调节剂的案例研究中成功识别出针对FAK和FLT3的新型潜在调节剂[2]。
5、药物与靶点的相互作用机制
在药物与靶点的"博弈"中,双方形成了复杂的相互作用网络:
靶点层面的多样性: 同一靶点可能存在多种构象状态,药物与不同构象的结合亲和力差异显著。靶点的翻译后修饰(磷酸化、糖基化等)也会改变其药物结合能力。此外,靶点突变(如肿瘤中的耐药突变)是导致药物失效的重要原因。
脱靶效应与多药理学: 药物往往不仅作用于单一靶点,而是与多个靶点相互作用,这既是产生副作用的原因,也是药物重定位(Drug Repositioning)的基础。多靶点药物在复杂疾病(如癌症、神经系统疾病)治疗中显示出优势。
药物代谢与转运: 药物在体内的吸收、分布、代谢、排泄(ADME)过程受多种酶和转运蛋白调控。细胞色素P450酶系(CYP450)是药物代谢的主要酶系,其活性差异导致个体间药物反应差异。
6、智能计算赋能药物发现的新征程
随着智能计算技术的发展,其在药物-靶点相互作用预测中的应用前景广阔。未来将从三方面优化:
融合多维度生物特征: 整合蛋白质三维构型(AlphaFold预测结构)、药物三维构象、转录组数据、蛋白质-蛋白质相互作用网络等多维度信息,提升模型对药物-靶点关系的全面表征能力。
结合迁移学习与预训练大模型: 利用分子预训练模型(如ChemBERTa、MolBERT)和蛋白质语言模型(如ESM、ProtTrans)捕获海量未标记数据中的先验知识,通过迁移学习快速适应新任务并增强泛化能力[3]。
深入解析耐药机制与个性化医疗: 结合基因组学和结构生物学,预测靶点突变对药物结合的影响,为设计克服耐药性的新一代药物提供理论支撑,推动精准医疗发展。
参考文献:
[1]彭杨, 朱小飞, 胡冬冬. 基于注意力感知和模态融合的药物-靶点相互作用预测方法[J]. 太原理工大学学报, 2025, 56(3): 533-542.
[2]廖俊, 徐洁洁, 皮志鹏, 等. 深度学习在药物研发中的研究进展[J]. 中国药科大学学报, 2023, 54(1): 1-15.
[3]左乐, 张琪. 基于图神经网络预测药物–靶标相互作用的方法综述[J]. 计算生物学, 2024, 14(4): 415-428.
廖生勇 高嵩 康大强 杜浩然 王相儒
广西大学

冀公网安备 13010802000382号