近日,中山大学智能工程学院教授、智能医疗中心主任陈语谦团队在国家自然科学基金项目的支持下,提出了一种具有图注意力网络的元学习架构去预测低数据药物发现中的分子特性。相关研究发表于ieee transactions on neural networks and learning systems。陈语谦为该论文通讯作者,吕秋杰为第一作者。
药物发现是一项高投入、长周期、高风险的系统工程。药物发现中关键任务就是寻找一个具有良好药理活性、低毒性和适当药代动力学特性的候选分子。然而,在候选分子优化的初始阶段,新分子或类似分子并没有太多真实的理化性质和生物活性记录。这表明将深度神经网络应用于小样本药物发现仍然是一项科学难题。
研究人员发现,图注意力网络通过三重注意力机制在原子层面捕获原子团的局部影响,从而使图注意力网络学习原子团对化合物性质的影响。在分子层面,图注意力网络将整个分子视为连接分子中每个原子的超虚拟节点,隐含地捕捉不同原子团之间的相互作用。双向循环神经网络侧重于将有限的分子信息抽象或转化为更高层次的特征向量或元知识,提高了图注意力网络感知分子中化学环境和连通性的能力,从而有效降低样本复杂度。
研究人员进一步开发了一种基于双层优化的元学习策略,将元知识从其他属性预测任务迁移到低数据场景下的目标任务,使模型能够快速适应样本少的分子属性预测。实验表明,元学习架构在多个公共基准数据集上实现了对少数样本分子新特性的准确预测。这些优势表明元学习架构很可能成为低数据药物发现的可行选择。
该研究为小样本药物发现提供比较可靠的推动力,有助于从根本上解决药物发现中样本少的问题。所提出的元学习算法通过多个预测任务训练一个初始化良好的参数,并在此基础上进行一步或多步的梯度调整,以达到快速适应新的只有少量数据的任务的目的。
该研究提出元学习算法用以解决在小样本数据场景中,对小分子药物进行提高准确度的预测所需的数据量,这种新的学习范式未来可以应用于小样本学习的药物发现领域。(来源:中国科学报 朱汉斌)
相关论文信息: