期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
一种基于词频统计的组织机构名识别方法 被引量:15
1
作者 胡万亭 杨燕 +2 位作者 尹红风 贾真 刘利 《计算机应用研究》 CSCD 北大核心 2013年第7期2014-2016,共3页
命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成... 命名实体识别是自然语言处理必不可少的重要部分,其中组织机构名识别占了很大的比例。提出了基于词频统计的组织机构名识别方法。训练数据主要通过百度百科词条整理得到。训练时,利用百度百科词条名在词条文本中的频数统计进行机构构成词的词频统计。在此基础上,构建了数学模型,实现了组织机构名识别算法。该识别算法集成到了中文分词中,取得了较好的识别结果,可以满足一定的实际应用需求。 展开更多
关键词 统计 词频 机构构成词 组织机构名识别
在线阅读 下载PDF
采用主动学习策略的组织机构名识别 被引量:12
2
作者 冯冲 陈肇雄 黄河燕 《小型微型计算机系统》 CSCD 北大核心 2006年第4期710-714,共5页
组织机构名等命名实体的识别是信息抽取、机器翻译等任务的重要基础.为了克服识别器训练过程中对标注数据的依赖,本文提出了一种基于主动学习的训练策略,改进了基本的最大熵模型的解码算法和训练过程.实验表明采用主动学习策略的最大熵... 组织机构名等命名实体的识别是信息抽取、机器翻译等任务的重要基础.为了克服识别器训练过程中对标注数据的依赖,本文提出了一种基于主动学习的训练策略,改进了基本的最大熵模型的解码算法和训练过程.实验表明采用主动学习策略的最大熵模型训练算法能够有效减少标注数据的使用. 展开更多
关键词 主动学习 实体识别 最大熵模型 组织机构名
在线阅读 下载PDF
基于HMM的中国组织机构名自动识别 被引量:18
3
作者 郑家恒 张辉 《计算机应用》 CSCD 北大核心 2002年第11期1-2,25,共3页
以 2 0 0 0年 11~ 12月《人民日报》网页中涉及社会、经济、法律等内容的 5 0万汉字语料为基础 ,利用基于隐马尔可夫模型并结合概率估值公式来评价在真实文本中构成组织机构名的能力 ,实现了中国组织机构名自动识别系统。实验研究表明... 以 2 0 0 0年 11~ 12月《人民日报》网页中涉及社会、经济、法律等内容的 5 0万汉字语料为基础 ,利用基于隐马尔可夫模型并结合概率估值公式来评价在真实文本中构成组织机构名的能力 ,实现了中国组织机构名自动识别系统。实验研究表明准确率达 89%,召回率为 94 .5 %。 展开更多
关键词 HMM 中国组织机构名 自动识别 隐马尔可夫模型 中文信息处理
在线阅读 下载PDF
基于Tri-training半监督学习的中文组织机构名识别 被引量:4
4
作者 蔡月红 朱倩 程显毅 《计算机应用研究》 CSCD 北大核心 2010年第1期193-195,共3页
针对中文组织机构名识别中的标注语料匮乏问题,提出了一种基于协同训练机制的组织机构名识别方法。该算法利用Tri-training学习方式将基于条件随机场的分类器、基于支持向量机的分类器和基于记忆学习方法的分类器组合成一个分类体系,并... 针对中文组织机构名识别中的标注语料匮乏问题,提出了一种基于协同训练机制的组织机构名识别方法。该算法利用Tri-training学习方式将基于条件随机场的分类器、基于支持向量机的分类器和基于记忆学习方法的分类器组合成一个分类体系,并依据最优效用选择策略进行新加入样本的选择。在大规模真实语料上与co-training方法进行了比较实验,实验结果表明,此方法能有效利用大量未标注语料提高算法的泛化能力。 展开更多
关键词 中文组织机构名 半监督学习 协同训练 Tri—training
在线阅读 下载PDF
中国组织机构名自动识别系统的设计与实现 被引量:7
5
作者 张辉 徐健 《电脑开发与应用》 2002年第1期5-6,9,共3页
以搜狐网站的 2 0 0 0年 11~ 12月人民日报网页中涉及社会、经济、法律等内容的 5 0万汉字语料为基础 ,首先利用基于隐马尔可夫模型进行初识别 ,然后建立了一定规模的规则集 ,实现了中国组织机构名自动识别系统。经测试准确率达 89% ,... 以搜狐网站的 2 0 0 0年 11~ 12月人民日报网页中涉及社会、经济、法律等内容的 5 0万汉字语料为基础 ,首先利用基于隐马尔可夫模型进行初识别 ,然后建立了一定规模的规则集 ,实现了中国组织机构名自动识别系统。经测试准确率达 89% ,召回率为 94 .5 %。 展开更多
关键词 专用 隐马尔可夫模型 自动识别系统 中国组织机构名 计算机
在线阅读 下载PDF
基于最大熵的中文组织机构名识别模型 被引量:2
6
作者 冯丽萍 焦莉娟 《计算机与数字工程》 2010年第12期36-40,共5页
中文组织机构名识别的精确率一直是影响自然语言处理的因素之一.根据中文组织机构名的特点,提出采用最大熵的识别方法.实验系统在较大规模的数据集上对比了不同特征选择方法对模型的影响,同时考查了词面、词性、语法等信息对模型的贡献... 中文组织机构名识别的精确率一直是影响自然语言处理的因素之一.根据中文组织机构名的特点,提出采用最大熵的识别方法.实验系统在较大规模的数据集上对比了不同特征选择方法对模型的影响,同时考查了词面、词性、语法等信息对模型的贡献.实验结果表明,不同的特征选择算法,开放测试的平均值只相差0.2~0.5个百分点. 展开更多
关键词 最大熵 中文组织机构名 识别模型 Chinese MAXIMUM ENTROPY Based 自然语言处理 特征选择算法 机构识别 选择方法 实验系统 实验结果 识别方法 数据集 平均值 精确率 语法 信息 相差 特点
在线阅读 下载PDF
结合多特征的支持向量机中文组织机构名识别模型 被引量:2
7
作者 冯丽萍 焦莉娟 《现代计算机》 2010年第7期24-27,共4页
以支持向量机(SVM)为基本框架,提出一种结合多特征的支持向量机中文组织机构名识别模型。考虑中文组织机构名的特点,抽取局部特征与全局特征,并将特征向量转化为二进制表示,在此基础上建立训练集。基于1998年《人民日报》语料的实验结... 以支持向量机(SVM)为基本框架,提出一种结合多特征的支持向量机中文组织机构名识别模型。考虑中文组织机构名的特点,抽取局部特征与全局特征,并将特征向量转化为二进制表示,在此基础上建立训练集。基于1998年《人民日报》语料的实验结果表明,该混合模型对中文组织机构名的识别是有效的。同时基于不同测试数据的实验结果表明,该模型对不同测试数据源具有一致性。 展开更多
关键词 支持向量机 中文组织机构名识别 全局特征 局部特征
在线阅读 下载PDF
基于统计的中文组织机构名识别
8
作者 冯丽萍 《福建电脑》 2006年第1期147-147,124,共2页
本文针对有特征词的中文组织机构名进行了研究,以搜狐网站的2004年11 ̄ ̄12月人民日报网页中涉及社会、经济、法律、教育等内容的50万字语料为基础。通过计算中文组织机构名的构词可信度对组织机构名进行识别。经测试准确率达90%以上,... 本文针对有特征词的中文组织机构名进行了研究,以搜狐网站的2004年11 ̄ ̄12月人民日报网页中涉及社会、经济、法律、教育等内容的50万字语料为基础。通过计算中文组织机构名的构词可信度对组织机构名进行识别。经测试准确率达90%以上,召回率达93.5%以上。 展开更多
关键词 组织机构名 自动识别 中文信息处理构词可信度
在线阅读 下载PDF
一种基于改进ELMO模型的组织机构名识别方法
9
作者 胡万亭 郭建英 张继永 《计算机技术与发展》 2020年第11期25-29,共5页
组织机构名识别是命名实体识别的核心任务之一,也是最困难的任务。近年来,预训练模型在中文自然语言处理领域得到广泛应用,预训练的词嵌入模型在中文命名实体识别上取得了非常好的效果,但是在组织机构名识别上还有很大的提升空间。针对... 组织机构名识别是命名实体识别的核心任务之一,也是最困难的任务。近年来,预训练模型在中文自然语言处理领域得到广泛应用,预训练的词嵌入模型在中文命名实体识别上取得了非常好的效果,但是在组织机构名识别上还有很大的提升空间。针对这一问题,改进ELMO(embedding from language models)预训练模型,结合双向LSTM神经网络模型和条件随机场模型,去识别组织机构名。对于ELMO的改进,主要通过筛选高频机构词,然后将高频机构词加入中文字典,通过ELMO模型训练生成机构词向量和普通字向量。字向量不用考虑未登录词的问题,机构词向量引入了先验知识,结合起来可以使得生成的字词向量能够更好地表征组织机构名。实验结果表明,预训练模型的数据集相对较小时,该方法比字向量嵌入的方法有更好的效果,F1值提高了1.3%。 展开更多
关键词 ELMO模型 LSTM模型 机构 条件随机场 组织机构名识别
在线阅读 下载PDF
湖北省职工焊接技术协会第二届理事会组织机构名单
10
《现代焊接》 2010年第6期23-23,共1页
关键词 湖北省 理事会 焊接 理事长 组织机构名 科技咨询 职工 技术协会 武汉市 服务中心
在线阅读 下载PDF
江西省中长期科学和技术发展规划领导和组织机构名单
11
《江西省人民政府公报》 2005年第6期27-28,共2页
关键词 技术发展规划 江西省 科学院 办公室主任 副主任 组织机构名 厅长 研究员 领导小组 大学教授
在线阅读 下载PDF
四川省图书馆学会理事会名单及组织机构名单
12
《四川图书馆学报》 1979年第1期72-,71,共2页
关键词 四川省 组织机构名 理事会 市图书馆 大学图书馆 省图书馆 医学院图书馆 图书馆学会 情报研究所
在线阅读 下载PDF
基于编辑距离的中文组织机构名简称-全称匹配算法 被引量:14
13
作者 黄林晟 邓志鸿 +2 位作者 唐世渭 王文清 陈凌 《山东大学学报(理学版)》 CAS CSCD 北大核心 2012年第5期43-48,共6页
在面对中文语言环境下组织机构名简称-全称匹配这一具体问题时,经典的基于编辑距离进行字符串相似匹配方法的实用性有所下降。基于编辑距离的思想,提出了一种改进匹配算法:首先对简称和全称进行分词,以切合中文的语法结构特点;之后结合... 在面对中文语言环境下组织机构名简称-全称匹配这一具体问题时,经典的基于编辑距离进行字符串相似匹配方法的实用性有所下降。基于编辑距离的思想,提出了一种改进匹配算法:首先对简称和全称进行分词,以切合中文的语法结构特点;之后结合重定义的词汇语义相似度度量方法,修改编辑操作权重,并通过自适应学习的方式进一步修正;最后选择与简称编辑距离最小的全称作为匹配结果。实验结果表明,该算法匹配准确率比原始方法有较大提升。 展开更多
关键词 文本挖掘 机器学习 编辑距离 组织机构名 简称-全称匹配
原文传递
“ABC+GloWbE”模式下银行组织机构名规范化翻译对策探讨
14
作者 傅恒 《上海翻译》 CSSCI 北大核心 2016年第6期44-47,共4页
国内银行组织机构皆按国家标准统一设置规范命名,但英译名却存在多个译名不统一、错译、误译等问题。本文通过分析国内17家银行组织机构英译名,从银行组织机构通名、职能词汇专名、中国特色词汇三个层面进行探讨,构建"ABC+GloWbE&q... 国内银行组织机构皆按国家标准统一设置规范命名,但英译名却存在多个译名不统一、错译、误译等问题。本文通过分析国内17家银行组织机构英译名,从银行组织机构通名、职能词汇专名、中国特色词汇三个层面进行探讨,构建"ABC+GloWbE"这一与时俱进的实用翻译策略。 展开更多
关键词 银行组织机构名英译 ABC+GloWbE 机构 职能词汇 中国特色词汇
原文传递
基于分词信息的中文机构名简称自动生成方法 被引量:3
15
作者 连誉舜 赵宇明 《计算机应用与软件》 CSCD 北大核心 2014年第4期153-156,共4页
在日常生活中,中文组织机构名简称被广泛使用。作为新词的重要来源之一,简称的识别和生成已成为自然语言处理领域研究的重点之一。分析中文组织机构名简称生成的特点,提出一种基于中文分词信息的组织机构名简称生成方法,并使用条件随机... 在日常生活中,中文组织机构名简称被广泛使用。作为新词的重要来源之一,简称的识别和生成已成为自然语言处理领域研究的重点之一。分析中文组织机构名简称生成的特点,提出一种基于中文分词信息的组织机构名简称生成方法,并使用条件随机场建立自动生成模型。采用上海组织机构简称实际数据的实验结果,其Top-5的覆盖率达到了96.34%。 展开更多
关键词 组织机构名 中文简称 中文分词 条件随机场
在线阅读 下载PDF
社区居委会名初探
16
作者 张亚杰 《中国方域(行政区划与地名)》 2004年第4期24-27,共4页
从语言学的角度研究,社区居委会名属于专有名词的范畴,是专有名词的一部分。所谓专有名词是指某个(些)个人、地方、机构等专有的名称。专有名词具有名实一一对应的特点,其外延很广,如人名、地名、企事业单位名、组织机构名、商标名... 从语言学的角度研究,社区居委会名属于专有名词的范畴,是专有名词的一部分。所谓专有名词是指某个(些)个人、地方、机构等专有的名称。专有名词具有名实一一对应的特点,其外延很广,如人名、地名、企事业单位名、组织机构名、商标名、天体名、民族名等,都是专有名词,社区居委会名是专有名词中组织机构名的一种。 展开更多
关键词 社区居委会 语言学 专有 组织机构名
在线阅读 下载PDF
WHO监管评估体系概况及对我国药品监管国际化的思考 被引量:1
17
作者 张帆 张志娟 宋瑞霖 《中国食品药品监管》 2024年第7期16-25,共10页
为应对全球复杂监管环境带来的挑战,推动医疗产品全球化监管协同,世界卫生组织(WHO)制定了一套统一的全球基准评估工具(GBT),并在此基础上发布WHO列名监管机构(WLAs)清单,为监管机构获得全球认可提供透明且基于证据的途径。长久以来,我... 为应对全球复杂监管环境带来的挑战,推动医疗产品全球化监管协同,世界卫生组织(WHO)制定了一套统一的全球基准评估工具(GBT),并在此基础上发布WHO列名监管机构(WLAs)清单,为监管机构获得全球认可提供透明且基于证据的途径。长久以来,我国高度关注与WHO的交流合作,在疫苗监管和全球化领域已取得了丰硕的成果。在药品监管领域,我国已重塑了整个药品监管生态系统,具备了独立审查创新产品的能力,但在国际社会尚未形成普遍认知。本文从GBT和WLAs清单关注的监管透明度建设角度出发,探索分析我国药品监管体系面临的挑战,并提出改进建议,以期助力我国更加深入地融入全球监管协同、监管信赖的国际大趋势中。 展开更多
关键词 全球基准评估工具 成熟度水平 世界卫生组织监管机构 监管能力评估 监管国际化 国际互信 透明度
在线阅读 下载PDF
语文词语是词汇使用与学习的重心 被引量:1
18
作者 苏新春 《长江学术》 2007年第1期9-10,共2页
在总语料的9亿字中,切分出来的“字符串”(分词单位)4.1亿条,不同的词种数165万条,这是“中国语言生活状况报告(2005)”中对现代汉语词汇使用现状概貌的反映。
关键词 语文 词语 使用现状 语料库 现代汉语词汇 言语词 分词单位 词频 组织机构名 中国语言
在线阅读 下载PDF
加权平均Word2Vec实体对齐方法 被引量:6
19
作者 罗钰敏 刘丹 +1 位作者 尹凯 赵宏森 《计算机工程与设计》 北大核心 2019年第7期1927-1933,共7页
针对已有文本相似度计算方法应用在实体对齐上准确率低的问题,提出一种加权平均Word2Vec的实体对齐方法。利用Word2Vec训练文本,得到词向量模型;使用LTP(language technology platform)工具抽取文本中的命名实体并对其进行分词、去停用... 针对已有文本相似度计算方法应用在实体对齐上准确率低的问题,提出一种加权平均Word2Vec的实体对齐方法。利用Word2Vec训练文本,得到词向量模型;使用LTP(language technology platform)工具抽取文本中的命名实体并对其进行分词、去停用词处理,由Word2Vec得到处理后的词向量;根据分词后出现相同词的情况进行加权归一,得到各实体的特征向量;利用特征向量计算余弦相似度得到对齐结果。实验结果表明,与已有的文本相似度方法及未改进的Word2Vec方法对比,所提方法降低了实体对齐的漏检率,提高了准确性。 展开更多
关键词 词嵌入 实体识别 中文组织机构名 实体对齐 词向量
在线阅读 下载PDF
《辞海》(1999年版) 被引量:1
20
作者 池岩 《辞书研究》 CSSCI 1999年第6期70-71,共2页
关键词 《辞海》 中华人民共和国行政区划 1999年 普及本 汉语拼音方案 中国少数民族 辅助索引 综合性辞典 组织机构名 元素周期表
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部