AI+Drug Snapshot | 250322 | AMCGRL通过跨域解码器和层次化互注意力机制捕捉复杂分子间相互作用模式
关注
MindDance
微信公众号,每日推送AI+Drug的最新文章和资讯,获取领域最新的技术进展
1. Attention-augmented multi-domain cooperative graph representation learning for molecular interaction prediction
Neural Networks
本文提出了名为AMCGRL的多领域协同图表示学习框架,用于分子相互作用预测,创新点在于借助跨域解码器和层次化互注意力机制捕捉复杂分子间相互作用模式。方法上,结合图卷积网络和图变换器,从域内和域间图中学习分子表示。实验在PepPI3966、MLI3099和RPI7317等数据集上开展,结果显示AMCGRL在分子表示学习能力上优于现有方法。总结表明,AMCGRL在分子相互作用预测任务中表现出色,具备广泛的应用潜力。
2. PocketDTA: A pocket-based multimodal deep learning model for drug–target affinity prediction
Computational Biology and Chemistry
本文提出了基于口袋的多模态深度学习模型PocketDTA,用于药物 - 靶标亲和力预测,创新点在于通过口袋图结构和预训练的蛋白质语言模型提取蛋白质的结构信息。该方法结合序列和结构编码器,利用关系图卷积网络提取药物和蛋白质的结构特征。实验在Davis、Filtered Davis、KIBA和PDBbind v2020等数据集上进行,结果表明PocketDTA在亲和力预测任务中优于现有方法。总结显示,PocketDTA通过结合序列和结构信息,提升了预测的准确性和泛化能力。
3. Leveraging AI to Explore Structural Contexts of Post-Translational Modifications in Drug Binding
biorxiv
本文利用AI技术探索翻译后修饰(PTMs)在药物结合中的结构背景,创新点在于借助AlphaFold3、RoseTTAFold All-Atom和Chai-1等工具生成PTM修饰的蛋白质模型,并预测其对小分子结合的影响。该方法通过计算配体的均方根偏差(RMSD)和局部距离差异测试(lDDT-PLI)评估PTMs对药物结合的影响。实验在DrugDomain数据库中的6141个PTMs上进行,结果表明某些PTMs(如NADPH-Cytochrome P450 Reductase的磷酸化)显著影响药物结合。总结表明,AI方法能有效预测PTMs对药物结合的影响,为药物发现提供了新视角。
4. Predicting the conformational flexibility of antibody and T-cell receptor CDRs
biorxiv
本文提出预测抗体和T细胞受体CDR3环结构灵活性的新方法ITsFlexible,创新点在于利用ALL-conformations数据集和图形神经网络(GNN)进行高精度分类。方法包括从PDB中提取CDR3环结构,构建包含120万结构的ALL-conformations数据集,并训练ITsFlexible模型。实验结果显示,ITsFlexible在晶体结构和分子动力学模拟数据集上均表现出色,成功预测了三个新CDRH3环的灵活性,并通过冷冻电镜验证了其中两个预测的正确性。总结表明,ITsFlexible为抗体和TCR的灵活性预测提供了有力工具,有助于优化治疗性抗体的设计。
5. From Atoms to Fragments: A Coarse Representation for Efficient and Functional Protein Design
biorxiv
本文提出基于片段的蛋白质表示方法,创新点在于通过40个进化保守的片段显著降低蛋白质表示的维度,同时保留功能信息。方法包括将蛋白质结构分解为片段,构建片段图或片段集,并应用于功能聚类、数据库搜索和蛋白质设计。实验结果表明,片段表示在功能聚类和数据库搜索中优于传统方法,且片段引导的RFDiffusion骨架生成恢复率超过40%。总结表明,片段表示为下一代蛋白质设计工具提供了高效且可解释的替代方案。
6. DeorphaNN: Virtual screening of GPCR peptide agonists using AlphaFold-predicted active state complexes and deep learning embeddings
biorxiv
本文开发了DeorphaNN,一种基于AlphaFold预测的活性状态复合物和深度学习的图神经网络,用于预测GPCR肽激动剂,创新点在于结合AF-Multimer的结构预测、原子间相互作用和蛋白质表示。方法包括使用AF-Multimer生成GPCR - 肽复合物,并训练DeorphaNN模型进行激动剂分类。实验结果表明,DeorphaNN在C. elegans、Platynereis和人类数据集上均表现出色,成功预测并实验验证了两个孤儿GPCR的激动剂。总结表明,DeorphaNN为GPCR去孤儿化提供了有效的计算工具,加速了肽激动剂的发现。
7. Interpretable High-order Knowledge Graph Neural Network for Predicting Synthetic Lethality in Human Cancers
arxiv
本文提出基于知识图谱和图神经网络的合成致死性预测模型DGIB4SL,创新点在于引入多样性图信息瓶颈(DGIB)和基于模体的图编码器,生成多个解释并捕捉高阶结构信息。该方法结合图信息瓶颈(GIB)和行列式点过程(DPP)约束,使用13个模体邻接矩阵来编码基因对的高阶结构。实验在SynLethDB 2.0数据集上进行,结果表明DGIB4SL在准确性和解释多样性上均优于现有方法。总结来说,DGIB4SL为合成致死性预测提供了更可靠的多重解释和高阶结构编码。
8. Drug target affinity prediction based on multi-scale gated power graph and multi-head linear attention mechanism
PLOS One
本文提出基于多尺度门控幂图和多头线性注意力机制的药物靶点亲和力预测模型MAPGraphDTA,创新点在于通过多尺度门控幂图和多头线性注意力机制捕捉全局特征。该方法使用多尺度GCN和多头线性注意力机制分别提取药物和蛋白质的特征,并通过全连接层进行预测。实验在Davis、Kiba、Metz和DTC数据集上进行,结果表明MAPGraphDTA在所有评估指标上均优于其他模型,且在冷启动实验中表现出色。总结来说,MAPGraphDTA在药物靶点亲和力预测中展现出优异的全局特征捕捉能力。
9. Prediction of drug target interaction based on under sampling strategy and random forest algorithm
PLOS One
本文提出基于欠采样策略和随机森林算法的药物靶点相互作用预测方法,创新点在于通过随机投影降维和NearMiss欠采样策略处理不平衡数据集。该方法提取多种药物分子指纹和蛋白质序列特征,使用随机投影降维后通过NearMiss进行欠采样,最终输入随机森林进行分类。实验在Gold Standard Dataset的四个子数据集(酶、GPCR、离子通道和核受体)上进行,结果表明该方法在auROC指标上优于现有方法。总结来说,该方法通过降维和欠采样策略有效提升了药物靶点相互作用预测的准确性。
10. LeScore: a scoring function incorporating hydrogen bonding penalty for protein–ligand docking
Journal of Molecular Modeling
本文提出新的蛋白质 - 配体对接评分函数LeScore,创新点在于引入氢键惩罚项(HBP)以提高在水环境中结合能预测的准确性。该方法通过线性组合范德华相互作用、氢键能、配体应变能和HBP等描述符,并使用PDBbind 2019数据集进行多线性回归优化。实验结果表明,LeScore在训练集和测试集上的Pearson相关系数分别为0.53和0.52,并在DUD-E子集上表现出优于无HBP模型的筛选能力,AUC达到0.71。总结来说,LeScore为虚拟筛选提供了更准确的工具,特别是在氢键对配体结合至关重要的场景中。
11. MVGNCDA: Identifying Potential circRNA-Disease Associations Based on Multiview Graph Convolutional Networks and Network Embeddings
Interdisciplinary Sciences: Computational Life Sciences
本文提出新的计算框架MVGNCDA,创新点在于结合多视图图卷积网络(GCN)和基于随机游走的网络嵌入来预测circRNA与疾病的关联。该方法通过计算疾病语义相似性、circRNA功能相似性及其高斯相互作用谱(GIP)核和余弦相似性,构建异质网络并学习全局节点嵌入,最终通过双线性解码器评估关联。实验在五个公开数据集上进行了五折交叉验证,结果显示MVGNCDA在AUC和AUPR指标上均优于现有方法,并在案例研究中验证了其识别未知circRNA - 疾病关联的能力。总结来说,MVGNCDA为circRNA - 疾病关联预测提供了一种高效的计算工具。
12. Challenges in predicting PROTAC-mediated Protein-Protein interfaces with AlphaFold reveal a general limitation on small interfaces
Bioinformatics Advances
本文研究AlphaFold在预测PROTAC介导的蛋白质 - 蛋白质界面时的局限性,创新点在于揭示AlphaFold对小界面预测的普遍困难。方法包括使用AlphaFold2和AlphaFold3对326个蛋白质异二聚体和28个PROTAC介导的二聚体进行预测,并通过DockQ评分评估模型质量。实验结果表明,AlphaFold2在界面小于1000 Ų的预测中表现较差,且AlphaFold3在PROTAC介导的界面预测上并未显著改善。总结来说,AlphaFold对小界面的预测能力有限,这对PROTAC设计及其他涉及小界面的预测任务提出了挑战。
13. Blend the Separated: Mixture of Synergistic Experts for Data-Scarcity Drug-Target Interaction Prediction
arxiv
本文提出名为MoseDTI的新方法,用于在输入数据和/或标签稀缺的情况下进行药物 - 靶点相互作用预测,创新点在于设计两个分别处理内在和外在数据的专家模型,并通过相互监督的方式生成伪标签来弥补数据稀缺问题。该方法采用混合协同专家模型架构,通过门控模型自适应地融合两个专家的输出,并利用大量未标记数据进行优化。实验在三个真实世界数据集上进行,包括DGIDB::BLOCKER、DGIDB::AGONIST和GNBR::E-,结果显示MoseDTI在不同程度的数据稀缺情况下均显著优于现有方法,最大提升达53.53%。总结表明,MoseDTI在数据稀缺情况下表现出色,且在没有数据稀缺时仍优于现有方法。
14. Towards Unified Latent Space for 3D Molecular Latent Diffusion Modeling
arxiv
本文提出名为UAE-3D的统一变分自编码器,用于3D分子生成,创新点在于将多模态特征压缩到统一的潜在空间中,并通过扩散变换器进行生成建模,解决多模态和SE(3)等变性问题。该方法结合关系变换器和投影门控卷积,通过SE(3)增强训练模型以保持等变性,并使用扩散变换器进行潜在生成。实验在GEOM-Drugs和QM9数据集上进行,结果显示UAE-3D在从头生成和条件生成任务中均达到新的基准,显著提高了生成效率和质量。总结表明,UAE-3D通过统一的潜在空间有效解决了3D分子生成中的多模态和等变性挑战。
15. Lyra: An Efficient and Expressive Subquadratic Architecture for Modeling Biological Sequences
arxiv
本文提出名为Lyra的次二次架构,用于生物序列建模,创新点在于结合投影门控卷积和状态空间模型,高效地捕捉局部和全局序列关系,解决传统Transformer模型在计算复杂性和局部模式建模上的不足。该方法通过状态空间模型捕捉全局依赖关系,并结合投影门控卷积提取局部特征,实现次二次计算复杂度。实验在超过100个生物任务上进行,包括蛋白质适应性预测、RNA结构分析和CRISPR引导设计等,结果显示Lyra在多个任务中达到最先进的性能,且推理速度和参数数量显著优于现有模型。总结表明,Lyra通过高效的次二次架构在生物序列建模中表现出色,显著降低了计算资源需求。
16. Uni-3DAR: Unified 3D Generation and Understanding via Autoregression on Compressed Spatial Tokens
arxiv
本文提出通过自回归预测统一3D生成与理解的框架,创新性地引入层次化tokenization和掩码下一token预测机制,显著提升3D结构生成与理解的效率和性能。该方法利用八叉树压缩3D空间,并通过两层次子树压缩和掩码预测策略优化模型,成功将分子、蛋白质、聚合物和晶体等多种3D结构任务统一在一个自回归框架内。实验在QM9、GEOM-DRUG、Carbon-24、MP-20等数据集上进行,结果表明Uni-3DAR在生成质量和推理速度上均大幅超越现有扩散模型,尤其在晶体结构预测和PXRD引导的晶体生成任务中表现突出。总体而言,Uni-3DAR为3D结构生成与理解提供了一个高效且通用的解决方案。
17. KoGNER: A Novel Framework for Knowledge Graph Distillation on Biomedical Named Entity Recognition
arxiv
本文提出名为KoGNER的新框架,通过将知识图谱蒸馏引入命名实体识别(NER)模型,显著提升生物医学领域的实体识别性能。该方法采用两步策略:首先通过知识蒸馏将外部知识源转化为轻量级表示,再通过实体感知增强将知识图谱信息融入图神经网络(GNN),从而提升模型对实体关系的理解能力。实验在BMG、GENIA、NCBI等多个生物医学数据集上进行,结果表明KoGNER在零-shot任务中表现优异,尤其在BMG数据集上显著优于传统NER模型和大型语言模型(LLMs)。总结而言,KoGNER通过整合知识图谱信息,有效提升了生物医学NER的准确性和泛化能力,为知识驱动的自然语言处理提供了新的研究方向。
18. AIMI: Leveraging Future Knowledge and Personalization in Sparse Event Forecasting for Treatment Adherence
arxiv
本文提出基于未来知识和个性化训练的稀疏事件预测系统AIMI,用于提高心血管疾病患者的药物依从性预测准确性,创新点在于首次将未来知识(如预定服药时间)引入特征集。方法上,AIMI结合智能手机传感器数据和历史服药记录,采用CNN和LSTM模型进行预测,并通过增量学习算法在资源受限环境中进行训练。实验使用27名心血管疾病患者的药物依从性数据集,结果显示LSTM模型在加入未来知识特征后,预测准确率达到0.932,F1得分为0.936。总结而言,AIMI通过引入未来知识和个性化训练,显著提升了药物依从性预测的准确性,为个性化医疗干预提供了有效工具。