期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
融合抽取式和抽象式的藏文摘要算法
1
作者 高一鸣 魏志恒 +3 位作者 多拉 王文强 左祥建 贾星星 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第6期1215-1222,共8页
为了推动文本摘要技术在藏文领域的发展,采用两阶段微调的方法,构建了一种融合抽取式和抽象式的藏文摘要模型(BERT-ext-abs),保留了摘要的流畅性和语义一致性。训练抽取式藏文摘要模型BERT-ext,在此基础上进行第二次微调,得到抽象式藏... 为了推动文本摘要技术在藏文领域的发展,采用两阶段微调的方法,构建了一种融合抽取式和抽象式的藏文摘要模型(BERT-ext-abs),保留了摘要的流畅性和语义一致性。训练抽取式藏文摘要模型BERT-ext,在此基础上进行第二次微调,得到抽象式藏文摘要模型BERT-ext-abs。从训练模型结构和数据规模两个角度分别设置对比实验,结果表明,相较于未经过二次微调的抽象式藏文摘要模型BERT-abs, BERT-ext-abs模型在ROUGE-1分数上提高了3.23%,在BERT Score分数上提高了0.95%。此外,与BERT-abs相比,BERT-ext-abs的模型参数量和训练数据量更少,能更高效地生成流畅且语义一致的摘要。 展开更多
关键词 抽取式摘要 抽象式摘要 预训练模型 双向编码器表征法 藏文
在线阅读 下载PDF
基于文本提取的法律案件智能判决方法
2
作者 范阿曼 王延川 《微电子学与计算机》 2024年第1期45-52,共8页
深度学习在自然语言处理方面取得了巨大进展,以深度神经网络为代表的模型开始在法律智能判决上被广泛使用。基于Transformer的双向编码器表征法(Bidirectional Encoder Representations from Transformers,BERT)模型能够挖掘法律描述文... 深度学习在自然语言处理方面取得了巨大进展,以深度神经网络为代表的模型开始在法律智能判决上被广泛使用。基于Transformer的双向编码器表征法(Bidirectional Encoder Representations from Transformers,BERT)模型能够挖掘法律描述文本中双向上下文信息,利用BERT中自注意力机制完成了罪名预测、法律条款推荐、刑期预测多个司法智能审判任务。为了在长文本案情描述文本上获得更好的效果,进一步解决BERT模型输入文本的长度限制,对于过长的输入文本进行关键信息提取。在文本提取的过程中,充分利用前期训练的基于BERT智能审判模型,对于案情描述中句子的重要性进行评估,提取关键句子减少判断模型的输入长度。将精简后的案情描述文本再送入BERT模型进行司法智能审判学习。相比于直接输入原始案情描述文本的方法,基于文本提取处理后的法律描述在智能审判任务中能够取得更好的效果。 展开更多
关键词 律智能审判 文本提取 多任务学习 双向编码器表征法 自然语言处理
在线阅读 下载PDF
基于命名实体识别的水电工程施工安全规范实体识别模型
3
作者 陈述 张超 +2 位作者 陈云 张光飞 李智 《中国安全科学学报》 CAS CSCD 北大核心 2024年第9期19-26,共8页
为准确识别水电工程施工安全规范实体,通过预训练模型中双向编码器表征法(BERT)挖掘文本中丰富的语义信息,利用双向长短期记忆神经网络(BILSTM)提取规范实体语义特征,依靠条件随机场(CRF)分析实体之间的依赖关系,构建水电工程施工安全... 为准确识别水电工程施工安全规范实体,通过预训练模型中双向编码器表征法(BERT)挖掘文本中丰富的语义信息,利用双向长短期记忆神经网络(BILSTM)提取规范实体语义特征,依靠条件随机场(CRF)分析实体之间的依赖关系,构建水电工程施工安全规范的命名实体识别模型;以《水利水电工程施工安全防护技术规范》(SL714—2015)为例,计算命名实体识别模型精确率。结果表明:BERT-BILSTM-CRF模型准确率为94.35%,相比于3种传统方法,准确率显著提高。研究成果有助于水电工程施工安全规范知识智能管理,为施工安全隐患智能判别提供支撑。 展开更多
关键词 命名实体识别 水电工程施工 安全规范 双向编码器表征法(BERT) 双向长短期记忆神经网络(BILSTM) 条件随机场(CRF)
在线阅读 下载PDF
面向电子装备领域的标准数字化探索应用
4
作者 杜广涛 查珊珊 《空天预警研究学报》 CSCD 2024年第3期220-225,共6页
针对数字化转型过程中传统纸质或影印标准文件难以满足标准知识的实时性、准确性、关联性、对比性以及快速响应的获取需求,结合典型电子装备领域行业标准文件,采用TF-IDF和余弦相似度计算方法对标准文本进行词频统计及关联性分析,构建... 针对数字化转型过程中传统纸质或影印标准文件难以满足标准知识的实时性、准确性、关联性、对比性以及快速响应的获取需求,结合典型电子装备领域行业标准文件,采用TF-IDF和余弦相似度计算方法对标准文本进行词频统计及关联性分析,构建电子装备领域词表;然后利用基于规则和BERT-BiLSTM-CRF模型完成了分层知识抽取,采用Neo4j图数据库构建了电子装备领域知识图谱;最后设计了电子装备领域知识图谱应用系统架构、功能模块以及应用原型系统界面,为电子装备领域标准数字化的应用提供了解决方案和思路. 展开更多
关键词 电子装备 知识图谱 标准数字化 双向编码器表征法 双向长短时记忆网络 条件随机场
在线阅读 下载PDF
空管不正常事件风险信息抽取与识别方法研究
5
作者 王洁宁 王帅翔 孙禾 《安全与环境学报》 2025年第4期1444-1454,共11页
目前,空管各类安全管理信息化平台积累了大量非结构化文本数据,但未得到充分利用,为了挖掘空管不正常事件中潜藏的风险,研究利用收集的四千余条空管站不正常事件数据和自构建的4836个空管领域专业术语词,提出了一个基于空管专业信息词... 目前,空管各类安全管理信息化平台积累了大量非结构化文本数据,但未得到充分利用,为了挖掘空管不正常事件中潜藏的风险,研究利用收集的四千余条空管站不正常事件数据和自构建的4836个空管领域专业术语词,提出了一个基于空管专业信息词抽取的双向编码器表征法和双向长短时记忆网络的深度学习模型(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory,BERT-BiLSTM)。该模型通过对不正常事件文本进行信息抽取,过滤其中无用信息,并将双向编码器表征法(Bidirectional Encoder Representations from Transformers,BERT)模型输出的特征向量序列作为双向长短时记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的输入序列,以对空管不正常事件文本风险识别任务进行对比试验。试验结果显示,在风险识别试验中,基于空管专业信息词抽取的BERT-BiLSTM模型相比于通用领域的BERT模型,风险识别准确率提升了3百分点。可以看出该模型有效提升了空管安全信息处理能力,能够有效识别空管部门日常运行中出现的不正常事件所带来的风险,同时可以为空管安全领域信息挖掘相关任务提供基础参考。 展开更多
关键词 安全工程 双向编码器表征法 双向长短时记忆网络 空管不正常事件 风险识别
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部