RNA二级结构的打分函数在RNA二级结构预测中扮演着越来越重要的角色。目前对RNA二级结构的打分函数并没有很好地抓住RNA的折叠机制。我们认为递归神经网络层与层之间的信息传递方式和RNA的折叠方式有相似之处。提出使用双向LSTM(Long Sh...RNA二级结构的打分函数在RNA二级结构预测中扮演着越来越重要的角色。目前对RNA二级结构的打分函数并没有很好地抓住RNA的折叠机制。我们认为递归神经网络层与层之间的信息传递方式和RNA的折叠方式有相似之处。提出使用双向LSTM(Long Short term Memory)神经网络对RNA二级结构进行打分。在数据集ASE(长度小于500),以及CRW(大部分长度大于1 000)上,进行了三项实验。通过拟合SEN(Sensitivity)与PPV(Specificity)打分函数确定了在目标函数为mean_squared_error时拟合效果最好;进而对比较复杂的打分函数MCC(Matthews correlation coefficient)进行拟合;最后实验得出双层双向LSTM模型的结果优于单层双向LSTM模型的结果。通过实验,得到的打分函数包含了碱基序列的全局属性。实验结果表明LSTM深度神经网络模型可以很好地拟合RNA二级结构的打分函数。展开更多
定量计算药物-靶标亲合性一直是分子靶向药物设计中的核心问题之一.亲合性打分函数适用范围宽、计算速度快且精度良好,特别适合与分子对接等方法联用,在药物研发中得到了广泛的应用.经过20多年的发展,目前存在数量繁多的打分函数,这些...定量计算药物-靶标亲合性一直是分子靶向药物设计中的核心问题之一.亲合性打分函数适用范围宽、计算速度快且精度良好,特别适合与分子对接等方法联用,在药物研发中得到了广泛的应用.经过20多年的发展,目前存在数量繁多的打分函数,这些方法难免良莠不齐.建立客观公正的针对打分函数性能的评价体系,不仅可以帮助用户做出合理的选择,也为发展打分函数的理论研究人员提供依据,因此是打分函数研究领域中的一个基础问题.近年来,我们逐步发展了评价药物-靶标亲合性打分函数性能的方法体系(comparative assessment of scoring functions,CASF),为解决该问题提供了一种可行的方案.我们提出了一整套衡量打分函数性能的基本指标,为每种指标设计了相应的定量方法,并确立了将打分过程与构象采样过程分开处理的原则.我们的方法体系中所使用的测试集,源自对PDBbind-CN数据库中蛋白-配体复合物样本的层层筛选,质量较高并且具备结构多样性的特点.与前人的类似工作相比,我们的方法体系具有较强的系统性和先进性,受到了国内外同行的广泛认可和应用.本文介绍了我们建立的CASF方法体系的设计思想、获得的重要研究成果以及学术影响.展开更多
目的开发基于机器学习的人类快速延迟整流性钾通道基因(the human Etherh-à-go-go-Reloted Gene,hERG)特异性打分函数(RF-hERG-Score),用于预测化合物对hERG的抑制活性(pIC_(50))。方法采用随机森林算法,以AutoDock Vina(传统打分...目的开发基于机器学习的人类快速延迟整流性钾通道基因(the human Etherh-à-go-go-Reloted Gene,hERG)特异性打分函数(RF-hERG-Score),用于预测化合物对hERG的抑制活性(pIC_(50))。方法采用随机森林算法,以AutoDock Vina(传统打分函数)分子对接生成的1847个化合物-hERG复合体结构和实验测定的半抑制浓度(pIC_(50))数据作为训练集进行训练。结果在十倍交叉验证中,RF-hERG-Score比RF-Score(通用打分函数)和AutoDock Vina更准确,其预测的pIC_(50)与实验值的皮尔逊相关系数(Rp)为0.603、斯皮尔曼等级相关系数(Rs)为0.623、均方根误差(RMSE)为0.849。在两组外部测试集中,RF-hERG-Score的Rp、Rs和RMSE也高于其他2种方法,并且优于相应文献报道模型的预测性能。结论RF-hERG-Score提高了hERG抑制剂结合亲和力的预测准确度,为利用计算模拟方法实现药物心脏毒性的较准确预测提供一种新的方案。展开更多
文摘RNA二级结构的打分函数在RNA二级结构预测中扮演着越来越重要的角色。目前对RNA二级结构的打分函数并没有很好地抓住RNA的折叠机制。我们认为递归神经网络层与层之间的信息传递方式和RNA的折叠方式有相似之处。提出使用双向LSTM(Long Short term Memory)神经网络对RNA二级结构进行打分。在数据集ASE(长度小于500),以及CRW(大部分长度大于1 000)上,进行了三项实验。通过拟合SEN(Sensitivity)与PPV(Specificity)打分函数确定了在目标函数为mean_squared_error时拟合效果最好;进而对比较复杂的打分函数MCC(Matthews correlation coefficient)进行拟合;最后实验得出双层双向LSTM模型的结果优于单层双向LSTM模型的结果。通过实验,得到的打分函数包含了碱基序列的全局属性。实验结果表明LSTM深度神经网络模型可以很好地拟合RNA二级结构的打分函数。
文摘定量计算药物-靶标亲合性一直是分子靶向药物设计中的核心问题之一.亲合性打分函数适用范围宽、计算速度快且精度良好,特别适合与分子对接等方法联用,在药物研发中得到了广泛的应用.经过20多年的发展,目前存在数量繁多的打分函数,这些方法难免良莠不齐.建立客观公正的针对打分函数性能的评价体系,不仅可以帮助用户做出合理的选择,也为发展打分函数的理论研究人员提供依据,因此是打分函数研究领域中的一个基础问题.近年来,我们逐步发展了评价药物-靶标亲合性打分函数性能的方法体系(comparative assessment of scoring functions,CASF),为解决该问题提供了一种可行的方案.我们提出了一整套衡量打分函数性能的基本指标,为每种指标设计了相应的定量方法,并确立了将打分过程与构象采样过程分开处理的原则.我们的方法体系中所使用的测试集,源自对PDBbind-CN数据库中蛋白-配体复合物样本的层层筛选,质量较高并且具备结构多样性的特点.与前人的类似工作相比,我们的方法体系具有较强的系统性和先进性,受到了国内外同行的广泛认可和应用.本文介绍了我们建立的CASF方法体系的设计思想、获得的重要研究成果以及学术影响.