期刊文献+
共找到58篇文章
< 1 2 3 >
每页显示 20 50 100
基于双向长短期记忆循环神经网络和条件随机场的钻井工况识别方法 被引量:3
1
作者 王海涛 王建华 +2 位作者 邱晨 毛金涛 李辉 《石油钻采工艺》 CAS 北大核心 2023年第5期540-547,554,共9页
传统钻井作业中,钻井工况主要通过基于机理模型与人工判断的方法进行识别,无法保证钻井工况识别的实时性与精准度。为此,采用近年来热门的人工智能算法,将井深与钻头位置的差、钻头位置、井深、大钩高度、大钩载荷、转速、钻压、扭矩、... 传统钻井作业中,钻井工况主要通过基于机理模型与人工判断的方法进行识别,无法保证钻井工况识别的实时性与精准度。为此,采用近年来热门的人工智能算法,将井深与钻头位置的差、钻头位置、井深、大钩高度、大钩载荷、转速、钻压、扭矩、排量共9项钻井参数作为输入特征项,训练调优并建立了基于双向长短期记忆循环神经网络和条件随机场的钻井工况智能识别模型,对复合钻进、滑动钻进、上提开泵划眼、下放开泵划眼、静止、坐卡、原地循环等共计20种钻机动态进行实时智能识别,训练集、测试集的正确率分别为96.49%、97.23%。该模型的成功建立,验证了人工智能算法的优越性,为人工智能算法在钻井工程领域的后续应用提供了丰富经验。 展开更多
关键词 钻井工况 智能识别 双向长短记忆循环神经网络 条件随机 深度学习
在线阅读 下载PDF
基于BERT-BiLSTM-CRF模型的畜禽疫病文本分词研究 被引量:3
2
作者 余礼根 郭晓利 +3 位作者 赵红涛 杨淦 张俊 李奇峰 《农业机械学报》 EI CAS CSCD 北大核心 2024年第2期287-294,共8页
针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectiona... 针对畜禽疫病文本语料匮乏、文本内包含大量疫病名称及短语等未登录词问题,提出了一种结合词典匹配的BERT-BiLSTM-CRF畜禽疫病文本分词模型。以羊疫病为研究对象,构建了常见疫病文本数据集,将其与通用语料PKU结合,利用BERT(Bidirectional encoder representation from transformers)预训练语言模型进行文本向量化表示;通过双向长短时记忆网络(Bidirectional long short-term memory network,BiLSTM)获取上下文语义特征;由条件随机场(Conditional random field,CRF)输出全局最优标签序列。基于此,在CRF层后加入畜禽疫病领域词典进行分词匹配修正,减少在分词过程中出现的疫病名称及短语等造成的歧义切分,进一步提高了分词准确率。实验结果表明,结合词典匹配的BERT-BiLSTM-CRF模型在羊常见疫病文本数据集上的F1值为96.38%,与jieba分词器、BiLSTM-Softmax模型、BiLSTM-CRF模型、未结合词典匹配的本文模型相比,分别提升11.01、10.62、8.3、0.72个百分点,验证了方法的有效性。与单一语料相比,通用语料PKU和羊常见疫病文本数据集结合的混合语料,能够同时对畜禽疫病专业术语及疫病文本中常用词进行准确切分,在通用语料及疫病文本数据集上F1值都达到95%以上,具有较好的模型泛化能力。该方法可用于畜禽疫病文本分词。 展开更多
关键词 畜禽疫病 文本分词 预训练语言模型 双向长短记忆网络 条件随机
在线阅读 下载PDF
一种用于关系抽取的双层时空图卷积神经网络
3
作者 李灵芳 陈效成 +2 位作者 李宝山 杜永兴 杨颜博 《内蒙古科技大学学报》 CAS 2022年第3期274-279,共6页
关系抽取是自然语言处理中一项基础的上游任务.句子的结构信息在某种意义上蕴含了实体及其关系信息,有助于提高关系抽取的准确率,然而使用现有自然语言处理(Natural Language Processing,NLP)语言工具进行句法分析时会引入一定的错误传... 关系抽取是自然语言处理中一项基础的上游任务.句子的结构信息在某种意义上蕴含了实体及其关系信息,有助于提高关系抽取的准确率,然而使用现有自然语言处理(Natural Language Processing,NLP)语言工具进行句法分析时会引入一定的错误传播问题,且现有的基于图结构的关系抽取模型在一定程度上忽略了句子的时序信息.通过结合双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi LSTM)捕获句子序列的上下文关系,同时使用传统条件随机场(Conditional Random Field,CRF)的关系标注结果矫正NLP工具的错误传播问题,提出了一种用于关系抽取的双层时空图卷积神经网络(Bilayer Spatiotemporal Graph Convolution Neural Network,Bi SpGCN)模型.该模型在中文糖尿病数据集和中文人物关系数据集上的实验结果表明,相较于传统的多头注意力引导的图卷积神经网络(Attention Guided Graph Convolutional Networks for Relation Extraction,AGGCN)模型,BiSpGCN模型能够充分利用句子的有效信息,具有更好的关系抽取性能. 展开更多
关键词 关系抽取 条件随机 图卷积神经网络 双向长短记忆网络 双层编码
在线阅读 下载PDF
基于U-net-BiLSTM-CRF的心律失常多目标检测
4
作者 王雨轩 朱俊江 +1 位作者 黄浩 濮玉 《计算机应用与软件》 北大核心 2024年第4期142-150,共9页
由于卷积滤波尺寸等限制,U-net无法学习到心电(Electrocardiographic,ECG)信号的长时序关联性以及标签间的相关性。对此提出一种基于U-net-BiLSTM-CRF的心律失常多目标检测方法,可同时输出目标心拍所属类型和位置信息。使用U-net学习融... 由于卷积滤波尺寸等限制,U-net无法学习到心电(Electrocardiographic,ECG)信号的长时序关联性以及标签间的相关性。对此提出一种基于U-net-BiLSTM-CRF的心律失常多目标检测方法,可同时输出目标心拍所属类型和位置信息。使用U-net学习融合特征,再将其输入到双向长短时记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)中学习长时序依赖特征,最后使用条件随机场(Conditional Random Field,CRF)对标签间的关系建模,优化分类结果。依据ANSI/AAMI EC57:2012的心搏分类标准,对MIT-BIH心律失常数据库中共85609个心拍记录进行划分,在划分后数据集上的实验结果表明,该方法对心拍分类的准确率达99.11%,特异性为99.76%,灵敏度为97.21%,优于传统U-net在MIT-BIH心律失常数据库上的分类性能。 展开更多
关键词 心律失常检测 U-net 双向长短记忆网络 条件随机
在线阅读 下载PDF
基于双向编码器表示模型和注意力机制的食品安全命名实体识别 被引量:13
5
作者 姜同强 王岚熙 《科学技术与工程》 北大核心 2021年第3期1103-1108,共6页
针对于目前传统的命名实体识别模型在食品案件纠纷裁判文书领域的准确率不足的问题,在双向长短时记忆网络的基础上提出一种基于双向编码器表示模型(bidirectional encoder representations from transformers, Bert)和注意力机制的命名... 针对于目前传统的命名实体识别模型在食品案件纠纷裁判文书领域的准确率不足的问题,在双向长短时记忆网络的基础上提出一种基于双向编码器表示模型(bidirectional encoder representations from transformers, Bert)和注意力机制的命名实体识别模型。模型通过Bert层进行字向量预训练,根据上下文语意生成字向量,字向量序列输入双向长短期记忆网络(bi-directional long short-term memory, BiLSTM)层和Attention层提取语义特征,再通过条件随机场(conditional random field, CRF)层预测并输出字的最优标签序列,最终得到食品案件纠纷裁判文书中的实体。实验表明,该模型在食品纠纷法律文书上面的准确率和F1值分别达到了92.56%和90.25%,准确率相较于目前应用最多的BiLSTM-CRF模型提升了6.76%。Bert-BiLSTM-Attention-CRF模型通过对字向量的预训练,充分结合上下文语意,能够有效克服传统命名实体识别模型丢失字的多义性的问题,提高了食品案件纠纷裁判文书领域命名实体识别的准确率。 展开更多
关键词 命名实体识别 字向量 裁判文书 双向长短记忆网络 条件随机
在线阅读 下载PDF
机床夹具设计知识图谱构建及应用
6
作者 张称心 孙家盛 段阳 《机电工程》 北大核心 2025年第1期106-116,共11页
针对目前机床夹具设计领域中存在的知识挖掘深度不足、利用率不高且过度依赖设计人员经验等问题,提出了一种基于自顶向下方式的机床夹具设计知识图谱构建方法。首先,将机床夹具设计知识分为原理规则类和功能描述类,利用本体建模语言(OWL... 针对目前机床夹具设计领域中存在的知识挖掘深度不足、利用率不高且过度依赖设计人员经验等问题,提出了一种基于自顶向下方式的机床夹具设计知识图谱构建方法。首先,将机床夹具设计知识分为原理规则类和功能描述类,利用本体建模语言(OWL)对这两类知识进行了本体建模,构建了知识图谱的模式层;其次,在模式层的指导下,以机床夹具设计原理规则文档和设计实例为数据源,利用双向长短期记忆网络-条件随机场算法(BiLSTM-CRF)对其进行了知识抽取,得到了结构化的机床夹具设计知识;然后,运用Neo4j图数据库存储结构化的机床夹具设计知识,得到了知识图谱的数据层;最后,以轴承套筒法兰的夹具设计为例,对该方法的可行性进行了验证;考虑到企业对同一夹具结构的不同技术需求,提出了一种基于图形数据科学算法(GDS)的相似元件替代法,对夹具知识图谱中47个定位元件节点进行了相似度计算,得到了1081条相似度数据样本,并构建了综合评判模型。研究结果表明:当相似度阈值设置为0.76时,将定位元件进行替换的精确率达到了84%。通过建立知识图谱,完成了机床夹具设计的两类知识的有效关联,为构建数据驱动的机床夹具智能设计奠定了基础。 展开更多
关键词 机械设计 智能设计 知识图谱 知识抽取 知识融合 本体建模语言 双向长短记忆网络-条件随机算法 图形数据科学算法
在线阅读 下载PDF
基于BiLSTM-CRF的玻璃文物知识点抽取研究 被引量:4
7
作者 杨云 宋清漪 +2 位作者 云馨雨 史雯倩 尚梦丹 《陕西科技大学学报》 北大核心 2022年第3期179-184,共6页
在玻璃文物领域中,有大量的文物数据没有被充分研究并利用.提出基于字向量的BiLSTM-CRF模型与玻璃文物特征字典相结合的命名实体识别方法,首先基于玻璃文物特征字典BIO标注文本并构建玻璃文物语料库,接着使用BiLSTM训练语料库并输出结果... 在玻璃文物领域中,有大量的文物数据没有被充分研究并利用.提出基于字向量的BiLSTM-CRF模型与玻璃文物特征字典相结合的命名实体识别方法,首先基于玻璃文物特征字典BIO标注文本并构建玻璃文物语料库,接着使用BiLSTM训练语料库并输出结果,最后CRF层结合训练结果对实体进行筛选并分类,抽取出正确的实体.实验表明,该方法在玻璃文物语料库中准确率达到91.56%,召回率达到88.25%,综合评价指标达到89.87%. 展开更多
关键词 玻璃文物 玻璃文物特征字典 命名实体识别 双向长短记忆网络 条件随机
在线阅读 下载PDF
基于BI_LSTM_CRF神经网络的序列标注中文分词方法 被引量:14
8
作者 姚茂建 李晗静 +1 位作者 吕会华 姚登峰 《现代电子技术》 北大核心 2019年第1期95-99,共5页
当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上下文依赖信息进... 当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上下文依赖信息进行建模,同时CRF层考虑了句子字符前后的标签信息,对文本信息进行了推理。该分词模型不仅在MSRA,PKU,CTB 6.0数据集上取得了很好的分词结果,而且在新闻数据、微博数据、汽车论坛数据、餐饮点评数据上进行了实验,实验结果表明,BI_LSTM_CRF模型不仅在测试集上有很好的分词性能,同时在跨领域数据测试上也有很好的泛化能力。 展开更多
关键词 自然语言处理 中文分词 神经网络 双向长短记忆条件随机 字嵌入 序列标注
在线阅读 下载PDF
基于BiLSTM-CRF的商情实体识别模型 被引量:42
9
作者 张应成 杨洋 +3 位作者 蒋瑞 全兵 张利君 任晓雷 《计算机工程》 CAS CSCD 北大核心 2019年第5期308-314,共7页
结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的... 结合语言模型条件随机场(CRF)和双向长短时记忆(BiLSTM)网络,构建一种BiLSTM-CRF模型,以提取商情文本序列中的招标人、招标代理以及招标编号3类实体信息。将规范化后的招标文本序列按字进行向量化,利用BiLSTM神经网络获取序列化文本的前向、后向文本特征,并通过CRF提取出双向本文特征中相应的实体。实验结果表明,与传统机器学习算法CRF相比,该模型3类实体的精确率、召回率和F1值平均提升15.21%、12.06%和13.70%。 展开更多
关键词 条件随机 双向长短记忆网络 语言模型 命名实体识别 深度学习
在线阅读 下载PDF
结合注意力机制的Bi-LSTM-CRF中文电子病历命名实体识别 被引量:26
10
作者 张华丽 康晓东 +3 位作者 李博 王亚鸽 刘汉卿 白放 《计算机应用》 CSCD 北大核心 2020年第S01期98-102,共5页
在中文电子病历命名实体识别任务中,为了消除传统命名实体识别方法高度依赖人工提取特征这一不足,设计了双向长短时记忆(Bi-LSTM)网络与条件随机场(CRF)结合的网络模型,并在联合网络的基础上添加注意力机制,从而优化实体识别准确率。首... 在中文电子病历命名实体识别任务中,为了消除传统命名实体识别方法高度依赖人工提取特征这一不足,设计了双向长短时记忆(Bi-LSTM)网络与条件随机场(CRF)结合的网络模型,并在联合网络的基础上添加注意力机制,从而优化实体识别准确率。首先,将中文电子病历数据集进行脱敏处理及序列标注等预处理;其次,结合词嵌入技术将电子病历文本序列进行词向量化表示,并利用Bi-LSTM网络模型构造包含前向和后向文本的语义特征;然后,将双向特征序列输入到注意力层,利用注意力机制对文本特征向量的语义编码分配不同的注意力权重,进一步强化当前信息与上下文信息之间潜在的语义关联性;最后,输入到CRF层中,由此提取出实体。实验结果表明,该注意力机制与Bi-LSTM-CRF模型融合的新方法能有效提高中文电子病历命名实体识别的准确率。 展开更多
关键词 电子病历 双向长短记忆网络 条件随机 注意力机制 实体识别
在线阅读 下载PDF
基于BiLSTM-CRF纪检监察事件命名实体识别 被引量:4
11
作者 樊昊 陈俊杰 +1 位作者 高静 刘晓玲 《计算机仿真》 北大核心 2022年第6期464-468,共5页
根据纪检监察领域的任务需求,构建了纪检监察事件语料库为数据集,使用BIOES序列标注方法标记该数据集的实体,并提出BiLSTM-CRF(双向长短期记忆网络-条件随机场)深度学习模型进行纪检监察事件的命名实体识别,该方法对事件中纪检监察机构... 根据纪检监察领域的任务需求,构建了纪检监察事件语料库为数据集,使用BIOES序列标注方法标记该数据集的实体,并提出BiLSTM-CRF(双向长短期记忆网络-条件随机场)深度学习模型进行纪检监察事件的命名实体识别,该方法对事件中纪检监察机构,人名以及该嫌疑人所受处分名三类命名实体进行识别。采用BiLSTM,BiLSTM-CRF进行对比实验。实验结果显示,使用的方法对三类实体识别的P、R、F值分别为99.63%,99.63%,99.63%,验证了所提方法在纪检监察领域的有效性,证明本研究可以有效获取纪检监察事件中的重要实体信息。 展开更多
关键词 纪检监察 双向长短记忆网络-条件随机 深度学习 命名实体识别
在线阅读 下载PDF
基于注意力机制和BiLSTM-CRF的消极情绪意见目标抽取 被引量:6
12
作者 丁锋 孙晓 《计算机科学》 CSCD 北大核心 2022年第2期223-230,共8页
基于方面情感分析(Aspect-Based Sentiment Analysis,ABSA)是自然语言处理的热门课题,其中意见目标抽取和意见目标情感极性分类是ABSA的基本子任务之一。而很少有研究直接抽取特定情感极性的意见目标,尤其是抽取更有潜在价值的消极情绪... 基于方面情感分析(Aspect-Based Sentiment Analysis,ABSA)是自然语言处理的热门课题,其中意见目标抽取和意见目标情感极性分类是ABSA的基本子任务之一。而很少有研究直接抽取特定情感极性的意见目标,尤其是抽取更有潜在价值的消极情绪意见目标。文中提出了一种全新的ABSA子任务--抽取消极情绪意见目标(Negative-Emotion Opinion Target Extraction,NE-OTE),并提出了基于注意力机制和单词与字符混合嵌入的BiLSTM-CRF模型(Attention-based BiLSTM-CRF with Word Embedding and Character Embedding,AB-CE),在双向长短时记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)学习文本语义信息和捕获长距离双向语义依赖关系的基础上,通过注意力机制使模型更好地关注输入序列中的关键部分和捕获与意见目标及其情感倾向相关的隐含特征,最终通过CRF层预测句子级别的全局最佳标签序列,实现对消极情绪意见目标的抽取。文中基于主流ABSA任务基准数据集构建了3个NE-OTE任务数据集,并在这些数据集上进行了广泛的实验,实验结果显示,所提模型能够有效识别消极情绪意见目标,且识别效果明显优于其他基线模型,验证了所提方法的有效性。 展开更多
关键词 情感分析 消极情绪意见目标 注意力机制 双向长短记忆网络 条件随机
在线阅读 下载PDF
基于Bi-LSTM-CRF的中文电力实体识别 被引量:20
13
作者 杨秋勇 彭泽武 +3 位作者 苏华权 邓伟民 张焕明 李梦诗 《信息技术》 2021年第9期45-50,共6页
电力系统科学研究与生产实践的长期发展,积累了大量的非结构化和半结构化文本。对电力领域文本进行中文实体识别,是其进一步信息抽取的基础工作。为探索有效的电力实体识别方法,文中首先把电力实体分成十六种并对三类电力文本信息进行标... 电力系统科学研究与生产实践的长期发展,积累了大量的非结构化和半结构化文本。对电力领域文本进行中文实体识别,是其进一步信息抽取的基础工作。为探索有效的电力实体识别方法,文中首先把电力实体分成十六种并对三类电力文本信息进行标注,进而采用双向长短时记忆网络和条件随机场的混合方法,对标注的电力文本进行了中文实体识别实验,并与隐马尔科夫法、独立的条件随机场法和独立的双向长短时记忆网络法进行对比。实验结果表明,文中采用的Bi-LSTM-CRF方法可以更加准确有效地识别文本中的电力实体。 展开更多
关键词 电力系统 实体识别 双向长短记忆网络 条件随机
在线阅读 下载PDF
基于置信度的Active-BiLSTM-CRF中文层级地址分词方法 被引量:3
14
作者 侯位昭 张欣海 +2 位作者 宋凯磊 韩志卓 张世立 《中国电子科学研究院学报》 北大核心 2021年第7期639-644,660,共7页
中文层级地址分词是中文地址标准化的基础工作和地理编码的重要手段,同时也是中文分词和地理研究领域中关注的重点。高质量中文地址层级提取方法通常依赖于大量人工标注数据,而获取带标注的数据集耗时长,成本昂贵,不易实现。为解决上述... 中文层级地址分词是中文地址标准化的基础工作和地理编码的重要手段,同时也是中文分词和地理研究领域中关注的重点。高质量中文地址层级提取方法通常依赖于大量人工标注数据,而获取带标注的数据集耗时长,成本昂贵,不易实现。为解决上述问题,文中提出基于置信度的双向长短时记忆和条件随机场主动学习混合模型(Active-BiLSTM-CRF)来构建地址词库,创新性的基于CRF模型在样本上的置信度高效筛出需要标注的关键地址样本,利用BiLSTM记忆地址的上下文信息,通过CRF的转移概率矩阵控制地址标注输出的能力,循环标注并训练模型。最后基于某区县户籍地址数据验证了该方法在有限标注成本下的准确率及召回率,实验显示当标记数据占比在20%时,Active-BiLSTM-CRF模型准确率能达到97.71%,召回率能达到97.34%。 展开更多
关键词 主动学习 置信度 地址分词 双向长短记忆网络 条件随机 地址分词标注
在线阅读 下载PDF
基于Bert-BiLSTM-CRF模型的电子病历隐私信息识别方法 被引量:1
15
作者 陈逸墨 叶辉 +3 位作者 易珺 周华文 方丹丹 曹东 《自动化与信息工程》 2022年第2期35-40,共6页
随着电子病历数据开放共享的需求越来越大,电子病历去隐私性问题亟需解决。利用自然语言处理技术,提出一种基于Bert-BiLSTM-CRF模型的电子病历隐私信息识别方法。采用某三甲中医院的电子病历作为数据来源,结合当前公开的数据集进行训练... 随着电子病历数据开放共享的需求越来越大,电子病历去隐私性问题亟需解决。利用自然语言处理技术,提出一种基于Bert-BiLSTM-CRF模型的电子病历隐私信息识别方法。采用某三甲中医院的电子病历作为数据来源,结合当前公开的数据集进行训练,得到正确率为94.02%、召回率为94.25%、F1为93.98%的中医电子病历隐私信息识别模型。与其他传统模型进行对比实验表明,Bert-BiLSTM-CRF模型能有效识别并保护电子病历中的隐私数据,有助于医疗数据的开放共享。 展开更多
关键词 隐私信息 Bert 双向长短记忆网络 条件随机 电子病历
在线阅读 下载PDF
基于知识图谱的网络安全数据组织方法 被引量:10
16
作者 张阳 王佳贺 +1 位作者 魏凡翔 魏松杰 《指挥信息系统与技术》 2019年第6期25-31,共7页
针对未来空管系统向网络化方向发展过程中存在的网络安全数据组织形式关联性不强以及融合度偏低等问题,提出了一种基于知识图谱的网络安全数据组织方法。通过专家经验构建网络安全基本知识库、制订特征模板及引入Bert模型训练字向量等步... 针对未来空管系统向网络化方向发展过程中存在的网络安全数据组织形式关联性不强以及融合度偏低等问题,提出了一种基于知识图谱的网络安全数据组织方法。通过专家经验构建网络安全基本知识库、制订特征模板及引入Bert模型训练字向量等步骤,以双向长短时记忆网络(BiLSTM)模型为基础,结合条件随机场(CRF)算法完成实体识别和关系抽取。最后,选取不同命名实体的18921条语料进行验证。试验结果表明,依照评价指标,该方法模型在准确率、召回率和F1值等方面均明显优于其他模型,实体识别F1值达89.66%,关系抽取F1值超出支持向量机(SVM)模型近10%,均体现出较优的数据组织效果。 展开更多
关键词 网络安全数据 知识图谱 特征模板 双向长短记忆网络 条件随机 数据组织
在线阅读 下载PDF
基于深度学习的暗网市场命名实体识别研究 被引量:3
17
作者 范晓霞 周安民 +1 位作者 郑荣锋 李孟铭 《信息安全研究》 2021年第1期37-43,共7页
对网络安全从业人员来说,基于暗网市场的研究扮演了一个非常重要的角色.与此同时,由于暗网市场文本数据本身的特点,针对暗网市场的命名实体识别研究面临着巨大的挑战.提出了一个针对暗网市场文本的命名实体识别系统(DNER),使用卷积神经... 对网络安全从业人员来说,基于暗网市场的研究扮演了一个非常重要的角色.与此同时,由于暗网市场文本数据本身的特点,针对暗网市场的命名实体识别研究面临着巨大的挑战.提出了一个针对暗网市场文本的命名实体识别系统(DNER),使用卷积神经网络(CNN)进行字符向量化以学习单词形态特征,使得系统能从单词级和字符级2方面学习特征.同时,将双向长短时记忆神经网络(Bi-LSTM)应用于暗网市场文本的命名实体识别,并采用CRF模型实现序列标签之间的约束性.此外,对暗网市场文本进行了词性标注.最后,比较了DNER和其他基本命名实体识别模型在暗网市场文本命名实体识别的效果.实验结果显示,DNER系统在暗网市场文本的准确率达到98.59%,召回率达到93.82%,F1值达到了96.15%. 展开更多
关键词 暗网市 命名实体识别 双向长短记忆网络 卷积神经网络 条件随机
在线阅读 下载PDF
基于Bi-LSTM和CRF的中文网购评论中商品属性提取 被引量:4
18
作者 张诗林 《计算机与现代化》 2019年第2期93-97,共5页
随着电子商务系统评价体系的完善,网购评论的内容对消费者的购物起到十分重要的指导作用。但是消费者不能从大量评论中找到自己直接关心的商品属性(如:手机产品的属性"电池")以及属性相关评价(如:"电池容量很大")... 随着电子商务系统评价体系的完善,网购评论的内容对消费者的购物起到十分重要的指导作用。但是消费者不能从大量评论中找到自己直接关心的商品属性(如:手机产品的属性"电池")以及属性相关评价(如:"电池容量很大")。相对于构建知识库和传统机器学习的方法,需要人工总结复杂的特征和规则来提取商品属性和属性相关评价。本文应用基于词嵌入融合双向长短时记忆网络(Bi-LSTM)和条件随机场(CRF)的方法并根据在评论中属性多为名词、属性评价多为形容词的特点在Bi-LSTM+CRF模型中融入词性特征,实现对评论中的商品属性以及属性评价的自动化提取,在避免总结规则的同时更具领域普适性。通过测试相机、男装、儿童安全座椅3个商品领域,得到了宏精确度为86. 74%,宏召回率为85. 89%。 展开更多
关键词 双向长短记忆神经网络 条件随机 中文网购评论 词性特征
在线阅读 下载PDF
机场不正常事件实体检测与识别方法研究 被引量:3
19
作者 侯启真 袁天一 王罗平 《计算机测量与控制》 2022年第7期62-69,共8页
民航安全自愿报告系统收集的海量故障报告以非结构化文本形式存储,不便于相关人员针对大量不正常事件加以分析并采取控制措施;命名实体识别技术可以将海量非结构化文本中的关键要素进行检测和识别,抽取成类别分明的结构化信息,作为进一... 民航安全自愿报告系统收集的海量故障报告以非结构化文本形式存储,不便于相关人员针对大量不正常事件加以分析并采取控制措施;命名实体识别技术可以将海量非结构化文本中的关键要素进行检测和识别,抽取成类别分明的结构化信息,作为进一步分析不正常事件并加以控制的基础工作;将机场不正常事件报告作为研究对象,提出了一种基于神经网络的中文命名实体识别模型,对文本进行了结构化处理;针对随机选用的训练样本一些实体类别分布比较稀疏和人工标注费时费力的问题,提出了基于模型预测分数的样本选择策略,实现了预标注样本的高效筛选;经过实验验证,该模型与BiLSTM_CRF模型、BiLSTM_self-attention_CRF模型相比F_(1)值均提高了约6个百分点,该样本选择策略明显提高了人工标注效率,筛选出足够多的含有稀疏实体的样本。 展开更多
关键词 命名实体识别 多尺度注意力 样本选择策略 双向长短记忆网络 条件随机
在线阅读 下载PDF
基于层级式Bi-LSTM-CRF模型的军事目标实体识别方法 被引量:4
20
作者 徐树奎 曹劲然 《信息化研究》 2019年第6期18-22,46,共6页
针对军事情报分析领域难以快速准确抽取军事目标活动相关属性和事件要素问题,本文提出一种基于层级式双向-长短期记忆神经网络-条件随机场(Bi-LSTM-CRF)模型的军事目标实体识别方法。结合军事目标及属性特点,采用树形结构定义层级式目... 针对军事情报分析领域难以快速准确抽取军事目标活动相关属性和事件要素问题,本文提出一种基于层级式双向-长短期记忆神经网络-条件随机场(Bi-LSTM-CRF)模型的军事目标实体识别方法。结合军事目标及属性特点,采用树形结构定义层级式目标及属性实体、活动要素及属性实体,细化了实体类别粒度,实现实体识别同时自动关联实体及相关属性。之后依据层级式特点进行军事情报语料标注,将训练好的词向量和训练语料输入Bi-LSTM-CRF模型,其中模型的CRF层依据标签转移条件添加固定约束矩阵,弥补了样本覆盖面补全问题,有效提高实体识别精度。 展开更多
关键词 实体识别 层级式 双向-长短记忆神经网络-条件随机
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部