完全句法分析是自然语言处理(Natural language processing, NLP)中重要的结构化过程,由于中文电子病历(Chinese electronic medical record, CEMR)句法标注语料匮乏,目前还没有面向中文电子病历的完全句法分析研究.本文针对中文电子病...完全句法分析是自然语言处理(Natural language processing, NLP)中重要的结构化过程,由于中文电子病历(Chinese electronic medical record, CEMR)句法标注语料匮乏,目前还没有面向中文电子病历的完全句法分析研究.本文针对中文电子病历模式化强的子语言特征,首次以树片段形式化中文电子病历复用的模式,提出了面向数据句法分析(Dataoriented parsing, DOP)和层次句法分析融合模型.在树片段抽取阶段,提出效率更高的标准树片段和局部树片段抽取算法,分别解决了标准树片段的重复比对问题,以及二次树核(Quadratic tree kernel, QTK)的效率低下问题,获得了标准树片段集和局部树片段集.基于上述两个树片段集,提出词汇和词性混合匹配策略和最大化树片段组合算法改进面向数据句法分析模型,缓解了无效树片段带来的噪声.实验结果表明,该融合模型能够有效改善中文电子病历句法分析效果,基于少量标注语料F1值能够达到目前最高的80.87%,并且在跨科室句法分析上超过Stanford parser和Berkeley parser 2%以上.展开更多
健康状态(state of health,SOH)是数据中心阀控式铅酸电池(value regulated lead acid,VRLA)容量及安全管理的关键指标,而常用的SOH测量方法因检测过程放电时间长、深度大无法满足运营需求,因此对数据中心VRLA电池的健康状态估计研究是...健康状态(state of health,SOH)是数据中心阀控式铅酸电池(value regulated lead acid,VRLA)容量及安全管理的关键指标,而常用的SOH测量方法因检测过程放电时间长、深度大无法满足运营需求,因此对数据中心VRLA电池的健康状态估计研究是非常必要的。针对SOH数据驱动建模存在的估计精度低的问题,提出一种基于时空注意力(spatio-temporal attention,STA)和长短期记忆(long short term memory,LSTM)网络的STA-LSTM深度学习模型。该模型用时空注意力机制在输入数据的特征和时间步上分配注意力权重从而生成新的输入,使用LSTM网络对新的输入进行编码以及实现SOH估计输出。基于电池放电深度50%的数据建模应用结果表明,STA-LSTM模型取得最优估计精度,注意力机制的引入提升黑箱模型的收敛速度、估计精度及物理可解释性。展开更多
文摘健康状态(state of health,SOH)是数据中心阀控式铅酸电池(value regulated lead acid,VRLA)容量及安全管理的关键指标,而常用的SOH测量方法因检测过程放电时间长、深度大无法满足运营需求,因此对数据中心VRLA电池的健康状态估计研究是非常必要的。针对SOH数据驱动建模存在的估计精度低的问题,提出一种基于时空注意力(spatio-temporal attention,STA)和长短期记忆(long short term memory,LSTM)网络的STA-LSTM深度学习模型。该模型用时空注意力机制在输入数据的特征和时间步上分配注意力权重从而生成新的输入,使用LSTM网络对新的输入进行编码以及实现SOH估计输出。基于电池放电深度50%的数据建模应用结果表明,STA-LSTM模型取得最优估计精度,注意力机制的引入提升黑箱模型的收敛速度、估计精度及物理可解释性。