-
题名基于多颗粒度文本表征的中文命名实体识别方法
被引量:4
- 1
-
-
作者
田雨
张桂平
蔡东风
陈华威
宋彦
-
机构
沈阳航空航天大学人机智能研究中心
香港中文大学(深圳)数据科学学院
-
出处
《中文信息学报》
CSCD
北大核心
2022年第4期90-99,共10页
-
基金
国家自然科学基金(U1908216)
辽宁省重点研发计划(2019JH2/10100020)。
-
文摘
中文命名实体识别常使用字符嵌入作为神经网络模型的输入,但是中文没有明确的词语边界,字符嵌入的方法会导致部分语义信息的丢失。针对此问题,该文提出了一种基于多颗粒度文本表征的中文命名实体识别模型。首先,在模型输入端结合了字词表征,然后借助N-gram编码器挖掘N-gram中潜在的成词信息,有效地联合了三种不同颗粒度的文本表征,丰富了序列的上下文表示。该文在Weibo、Resume和OntoNotes4数据集上进行了实验,实验结果的F_(1)值分别达到了72.41%、96.52%、82.83%。与基准模型相比,该文提出的模型具有更好的性能。
-
关键词
中文命名实体识别
多颗粒度文本表征
N-GRAM
-
Keywords
Chinese named entity recognition
multi-granular text representation
N-gram
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-