摘要
命名实体识别是信息抽取中的一项重要任务,针对某一领域的识别更是能够为该领域信息充分融合的相关研究提供帮助。研究选取药品说明书中的适应症作为实验语料,试图通过识别疾病和症状类实体对构建医药领域知识图谱提供帮助。文章基于条件随机场(CRF)模型,借助开源的CRF++工具包进行实体识别,通过进行标注集的统一整理、修改词性标注、增加高频词特征、调整特征模板等调整,不断提高模型的识别效果。实验结果表明,对实体标注进行修正后,F值可达0.885,有显著提高。
出处
《长江信息通信》
2021年第10期232-234,共3页
Changjiang Information & Communications