期刊导航
期刊开放获取
唐山市科学技术情报研究..
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
171
篇文章
<
1
2
…
9
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于改进潜在语义分析的跨语言检索
被引量:
14
1
作者
宁健
林鸿飞
《中文信息学报》
CSCD
北大核心
2010年第3期105-111,共7页
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用...
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索。
展开更多
关键词
计算机应用
中文信息处理
改进潜在语义分析
语义空间
跨语言检索
SVD
NMF
在线阅读
下载PDF
职称材料
基于主题图的数字图书馆英汉跨语言检索模型
被引量:
1
2
作者
夏立新
张进
王忠义
《情报学报》
CSSCI
北大核心
2008年第3期468-473,共6页
数字图书馆海量信息的多语种问题,成为人们获取信息资源的一大障碍,而当前的跨语言检索系统普遍存在翻译准确性差、效率低、成本高等不足。主题图作为一种可合并的索引,在知识表示、知识描述、资源定位、语境等方面的优势,可为翻译...
数字图书馆海量信息的多语种问题,成为人们获取信息资源的一大障碍,而当前的跨语言检索系统普遍存在翻译准确性差、效率低、成本高等不足。主题图作为一种可合并的索引,在知识表示、知识描述、资源定位、语境等方面的优势,可为翻译提供充实的上下文信息。本文正是针对跨语言检索的上述问题,在深入分析主题图技术的基础上,提出一种新的基于主题图的数字图书馆英汉跨语言检索模型。该模型采用索引翻译的策略,实现跨语言检索的目的。其最大的优点是在提高翻译准确性的同时,降低了翻译的工作量和成本。
展开更多
关键词
主题图
OAI
跨语言检索
在线阅读
下载PDF
职称材料
基于词共现的跨语言检索平台研究
被引量:
3
3
作者
李佳
《情报杂志》
CSSCI
北大核心
2015年第8期195-198,共4页
在分析跨语言检索平台建设原理的基础上,综合本人及其它学者相关研究成果,提出基于共现词语义标识的跨语言检索平台(以下简称:平台)建设的方法、模型。以科技论文中英文关键词、主题词作为语料库,通过词共现方式实现同义词、词性及相关...
在分析跨语言检索平台建设原理的基础上,综合本人及其它学者相关研究成果,提出基于共现词语义标识的跨语言检索平台(以下简称:平台)建设的方法、模型。以科技论文中英文关键词、主题词作为语料库,通过词共现方式实现同义词、词性及相关语义的标识。由于关键词作为自然语言,具有广泛的表达适应性,作为平台与用户的接口语言;主题词作为控制语言,通过与副主题词的组配使用,可作为平台实现对检索词的逻辑语义表达的理解,实现信息的准确定位,从而使得跨语言检索平台具有良好的翻译与检索能力。
展开更多
关键词
共现词
语义标识
跨语言检索
平台
语义理解
在线阅读
下载PDF
职称材料
基于词典的藏汉跨语言检索系统研究
被引量:
1
4
作者
李亚超
江涛
+1 位作者
于洪志
加羊吉
《西北民族大学学报(自然科学版)》
2011年第4期40-43,52,共5页
针对跨语言检索中查询翻译歧义问题,文章从藏汉跨语言检索的特点出发,采用了平衡翻译(BalancedTranslation)方法,减少了歧义翻译数量,提高了翻译的准确度.在文档索引上,为了弥补藏文分词对于命名实体识别的不足,采用了4元组的索引方法,...
针对跨语言检索中查询翻译歧义问题,文章从藏汉跨语言检索的特点出发,采用了平衡翻译(BalancedTranslation)方法,减少了歧义翻译数量,提高了翻译的准确度.在文档索引上,为了弥补藏文分词对于命名实体识别的不足,采用了4元组的索引方法,明显提高了检索的速度和准确度.
展开更多
关键词
跨语言检索
藏文分词
查询翻译
在线阅读
下载PDF
职称材料
融合加权模式挖掘与规则混合扩展的跨语言检索
被引量:
11
5
作者
黄名选
夏国恩
+1 位作者
高荣
蒋曹清
《小型微型计算机系统》
CSCD
北大核心
2019年第9期2013-2020,共8页
针对信息检索中查询主题漂移和词不匹配问题,本文给出项集有效性计算方法及其剪枝策略,构建一种关联模式评价框架ACSC(Availability_Chis-Square_Confidence)和基于ACSC挖掘的规则混合扩展模型,提出一种融合加权关联模式挖掘与规则混合...
针对信息检索中查询主题漂移和词不匹配问题,本文给出项集有效性计算方法及其剪枝策略,构建一种关联模式评价框架ACSC(Availability_Chis-Square_Confidence)和基于ACSC挖掘的规则混合扩展模型,提出一种融合加权关联模式挖掘与规则混合扩展模型的跨语言信息检索算法.该算法通过项集权值比较从跨语言初检相关文档集挖掘含有原查询词项的频繁项集,利用基于有效性的剪枝方法对项集进行剪枝得到有效频繁项集,从有效频繁项集挖掘加权关联规则,根据规则混合扩展模型实现查询扩展,扩展词与原查询词组合为新查询再次检索文档得到最终检索结果.与现有跨语言检索算法比较,实验结果表明,本文算法能有效地减少查询漂移和词不匹配问题,提高和改善跨语言信息检索性能,有效性和置信度可使本文算法分别获得最优的检索结果 R-prec和P@10值.
展开更多
关键词
信息
检索
跨语言检索
文本挖掘
查询扩展
自然
语言
处理
在线阅读
下载PDF
职称材料
网上信息跨语言检索方法
被引量:
6
6
作者
刘卫中
《情报科学》
CSSCI
北大核心
2004年第12期1503-1504,共2页
本文介绍了目前全世界网络语言的现状和实现网上信息跨语言检索的五种方法 。
关键词
跨语言检索
网上信息
检索
翻译方法
在线阅读
下载PDF
职称材料
汉蒙跨语言检索系统设计与实现
被引量:
5
7
作者
鲍玉来
白淑霞
+1 位作者
飞龙
王炜华
《情报理论与实践》
CSSCI
北大核心
2017年第4期128-132,144,共6页
[目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统。[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索。在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻...
[目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统。[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索。在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻译,并实现了基于规则和统计的传统蒙古文到西里尔蒙古文转换;在文档检索方面,基于Lucene全文索引工具包对大量的西里尔蒙古文文档建立索引,并根据向量空间模型对查询和文档的相似度进行排序,得到与查询最为匹配的文档集。[结果/结论]本系统响应速度较快,准确率较高,达到可用水平。一方面促进中国与蒙古国之间的科技、文化、教育的交流;另一方面对我国西里尔蒙古文的研究有一定的促进作用。
展开更多
关键词
跨
语言
信息
检索
信息
检索
系统
检索
方法
在线阅读
下载PDF
职称材料
英汉交互式跨语言检索系统设计与实现
被引量:
10
8
作者
吴丹
《现代图书情报技术》
CSSCI
北大核心
2009年第2期89-95,共7页
针对跨语言信息检索的查询翻译歧义性问题,采用交互式系统开发设计方法,对基于相关反馈的跨语言信息检索技术进行研究和分析,提出一个英汉交互式跨语言信息检索系统,实现用户辅助查询翻译、多级用户相关性判断,以及翻译优化与查询扩展...
针对跨语言信息检索的查询翻译歧义性问题,采用交互式系统开发设计方法,对基于相关反馈的跨语言信息检索技术进行研究和分析,提出一个英汉交互式跨语言信息检索系统,实现用户辅助查询翻译、多级用户相关性判断,以及翻译优化与查询扩展等相关反馈功能,结果明显提高了检索效果。
展开更多
关键词
跨
语言
信息
检索
用户交互
信息
检索
系统
在线阅读
下载PDF
职称材料
汉英跨语言检索系统中关键词提取方法的研究
9
作者
陈文君
於文雪
《电脑知识与技术》
2009年第10期7848-7849,7857,共3页
设计与实现了基于语句的汉英跨语言检索系统的关键词提取模块,关键词提取模块包括中文关键词提取和翻译转换两部分,此模块为后续的检索模块提供输入信息.其性能及效率对整个跨语言检索系统有重要影响。该文首先通过Dijkstra算法的改...
设计与实现了基于语句的汉英跨语言检索系统的关键词提取模块,关键词提取模块包括中文关键词提取和翻译转换两部分,此模块为后续的检索模块提供输入信息.其性能及效率对整个跨语言检索系统有重要影响。该文首先通过Dijkstra算法的改进方法求解分词的最短路径,实现了汉语检索语句的分词处理。然后以汉英双语词典为基础,对语法提取后的中文关键词实现了汉英翻译转换。最后提取的关键词供检索使用,实验结果表明用本文方法提取的关键词能满足检索要求。
展开更多
关键词
跨语言检索
关键词提取
中文分词
翻译转换
自然
语言
处理
在线阅读
下载PDF
职称材料
跨语言检索中统一提问式翻译与检索过程方法探讨
10
作者
郝嘉树
王惠临
《现代图书情报技术》
CSSCI
北大核心
2008年第4期18-22,共5页
在指出跨语言信息检索技术中大部分实现方法存在分离现象的基础上,介绍将提问式翻译与检索过程统一的思想,并探讨将提问式翻译与检索过程统一的方法。
关键词
跨
语言
信息
检索
分离问题
统一提问式翻译和
检索
统一
检索
过程
统一方法
在线阅读
下载PDF
职称材料
浅谈跨语言检索的方法
11
作者
郑萍
《宁德师范学院学报(哲学社会科学版)》
2012年第2期106-108,共3页
跨语言检索是为了满足网络资源语种多样性,克服用户掌握语言差异性所带来的检索语言障碍。全球化信息结构引发了对跨语言信息检索的迫切需要。当前跨语言检索在分类与语言学资源等方面尚存在着亟待解决的问题。
关键词
跨
语言
信息
检索
跨
语言
信息
检索
的分类
语言
学资源
中间
语言
在线阅读
下载PDF
职称材料
面向汉越跨语言事件检索的事件预训练方法
12
作者
吴少扬
余正涛
+3 位作者
黄于欣
朱恩昌
高盛祥
邓同杰
《中文信息学报》
CSCD
北大核心
2024年第4期78-85,共8页
汉越跨语言事件检索是用汉语查询检索越南语事件新闻的任务。由于越南语属于典型的低资源语言,汉越跨语言事件检索缺乏大规模的标注数据,并且现有的跨语言预训练模型无法很好地表征文本中丰富的汉越对齐事件知识,不适用于该任务。因此,...
汉越跨语言事件检索是用汉语查询检索越南语事件新闻的任务。由于越南语属于典型的低资源语言,汉越跨语言事件检索缺乏大规模的标注数据,并且现有的跨语言预训练模型无法很好地表征文本中丰富的汉越对齐事件知识,不适用于该任务。因此,为了将汉越双语对齐的事件知识融入到多语言预训练语言模型中,该文提出了两个预训练方法,即事件要素掩码预训练以及跨语言事件对比预训练。在该文构造的汉越跨语言事件检索数据集和公开跨语言问答数据集上进行了实验,比基线提升1%~3%MAP值,2%~4%NDCG值,证明了该文方法的有效性。
展开更多
关键词
事件预训练
跨
语言
事件
检索
掩码
语言
模型
对比学习
在线阅读
下载PDF
职称材料
基于要素关联图的汉越跨语言事件检索方法
13
作者
赵周颖
余正涛
+2 位作者
黄于欣
陈瑞清
朱恩昌
《现代电子技术》
北大核心
2024年第7期127-132,共6页
汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪...
汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪声文本,现有的模型不能很好地捕获事件匹配特征,匹配效果欠佳。基于此,文中提出基于要素关联图的汉越跨语言事件检索方法。首先,预训练一个汉越双语词嵌入来解决跨语言问题;然后,抽取查询文档中的关键信息(关键词和实体)以构建要素关联图;最后,通过引入一个图编码器对构建的要素图进行编码,生成结构化的事件信息来增强传统的事件检索模型。实验结果表明文中提出的方法优于传统的基线方法。
展开更多
关键词
跨
语言
事件
检索
跨
语言
词嵌入
要素关联图
图神经网络
文本匹配
事件
检索
在线阅读
下载PDF
职称材料
跨语言信息检索研究进展
被引量:
17
14
作者
张俊林
曲为民
+1 位作者
杜林
孙玉芳
《计算机科学》
CSCD
北大核心
2004年第7期16-19,共4页
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际...
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。
展开更多
关键词
跨
语言
信息
检索
汉英
跨语言检索
中文信息处理
受控词汇
检索
在线阅读
下载PDF
职称材料
网上信息的跨语言检索
被引量:
12
15
作者
李培
武丽辉
《情报资料工作》
CSSCI
北大核心
2004年第2期71-74,共4页
文章对跨语言信息检索的相关技术和实现方法进行了系统地论述,对跨语言 检索中的语言资源、翻译歧义性消解等关键性问题的研究进行了归纳与梳理,指出我国跨 语言检索研究距世界先进水平尚有一定差距,应加强该领域的研究。
关键词
网络信息
检索
跨语言检索
翻译歧义性
自动翻译
计算机
检索
机器翻译
语料库
原文传递
基于主题图的英汉跨语言检索模型构建
被引量:
7
16
作者
夏立新
王忠义
《图书情报工作》
CSSCI
北大核心
2008年第11期70-74,共5页
针对现有跨语言检索模型普遍存在的翻译准确性差、效率低、成本高等不足,在深入分析主题图技术在揭示语词概念之间的语义关系和多语言支持等方面的优越性能的基础上,提出一个基于主题图的英汉跨语言检索模型,该模型采用索引翻译的策略...
针对现有跨语言检索模型普遍存在的翻译准确性差、效率低、成本高等不足,在深入分析主题图技术在揭示语词概念之间的语义关系和多语言支持等方面的优越性能的基础上,提出一个基于主题图的英汉跨语言检索模型,该模型采用索引翻译的策略来实现跨语言检索,其突出特点是能够在提高翻译准确性的同时,有效降低翻译成本,并且实现起来也比较简单。
展开更多
关键词
主题图
OAI
跨语言检索
原文传递
跨语言信息检索中的多语言处理技术研究
17
作者
朱玉
李枫
《信息记录材料》
2024年第9期98-101,共4页
全球化时代下,跨语言信息检索系统成为连接不同语言和文化用户的关键技术。而作为系统的技术要点,多语言处理技术则在全球化程度日益加深的进程中,表现出了更重要的科学价值。本文深入探讨了跨语言信息检索中的多语言处理技术,包括语言...
全球化时代下,跨语言信息检索系统成为连接不同语言和文化用户的关键技术。而作为系统的技术要点,多语言处理技术则在全球化程度日益加深的进程中,表现出了更重要的科学价值。本文深入探讨了跨语言信息检索中的多语言处理技术,包括语言检测、机器翻译、词干提取、词嵌入以及深度学习模型等。通过深入分析此类技术在应对多语言复杂性,以及提高跨语言信息检索效率和准确性方面的作用,针对当前系统的性能瓶颈提出了具有参考价值的技术优化方案,为未来的进一步研究提供了方向。
展开更多
关键词
跨
语言
信息
检索
多
语言
处理
数学模型
在线阅读
下载PDF
职称材料
基于本体的跨语言信息检索在数字图书馆中的应用
被引量:
5
18
作者
鲍丽倩
张自然
《现代情报》
CSSCI
2011年第7期169-172,共4页
首先对跨语言信息检索和相关技术进行了介绍,了解当前跨语言信息检索技术的不足,然后阐述了传统跨语言信息检索技术在数字图书馆应用中的局限性,并由此引出了基于本体的跨语言技术。最后提出了一种基于本体的数字图书馆跨语言信息检索系...
首先对跨语言信息检索和相关技术进行了介绍,了解当前跨语言信息检索技术的不足,然后阐述了传统跨语言信息检索技术在数字图书馆应用中的局限性,并由此引出了基于本体的跨语言技术。最后提出了一种基于本体的数字图书馆跨语言信息检索系统,并详细阐述了系统的流程,着重讲述了数字图书馆跨语言领域本体的构建。由于本体具有良好的概念层次和对逻辑推理的支持,对源语言和目标语言进行语义扩展,提高了数字图书馆跨语言系统的检索效率。
展开更多
关键词
跨语言检索
数字图书馆
本体
在线阅读
下载PDF
职称材料
“一带一路”多语种共享型数据库的跨语言检索功能分析与开发策略
被引量:
11
19
作者
司莉
周璟
《图书情报工作》
CSSCI
北大核心
2021年第3期20-27,共8页
[目的/意义]要实现"一带一路"多语种共享型数据库资源的有效利用,必须解决跨语言检索问题,基于已建"一带一路"数据库检索功能调查结果,分析"一带一路"多语种共享型数据库检索功能需求,以调研跨语言检索...
[目的/意义]要实现"一带一路"多语种共享型数据库资源的有效利用,必须解决跨语言检索问题,基于已建"一带一路"数据库检索功能调查结果,分析"一带一路"多语种共享型数据库检索功能需求,以调研跨语言检索平台为视角,为"一带一路"多语种共享型数据库的跨语言检索功能设计与开发提供参考。[方法/过程]采用文献调研法和网络调研法,选取11个国内外典型的跨语言检索平台,从跨语言检索方法、跨语言翻译实现方法、检索功能设置、检索结果呈现、界面与检索支持语种6个方面进行分析,总结其实现方法。[结果/结论]为"一带一路"多语种共享型数据库的跨语言检索功能设计与开发提出策略:应采用基于神经网络机器翻译的提问式-文献翻译方法,实现多种检索功能,应用可视化技术呈现检索结果,提供多语言检索界面和资源。
展开更多
关键词
"一带一路"
数据库
多语种
跨语言检索
原文传递
跨语言检索中机器翻译技术的应用和进展
被引量:
6
20
作者
刘群
骆卫华
《数字图书馆论坛》
2006年第9期12-19,共8页
本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展。文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点、特别是近年来统计机器翻译的发展。本文通过一...
本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展。文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点、特别是近年来统计机器翻译的发展。本文通过一个实例较为详细地介绍了目前主流的基于短语的统计机器翻译原理,然后通过一个实际的新闻长句子对几个典型的基于规则的和基于统计的机器翻译系统的翻译结果给出了细致的比较和分析。最后对机器翻译在跨语言检索中的应用前景做出了展望。
展开更多
关键词
跨语言检索
统计机器翻译
在线阅读
下载PDF
职称材料
题名
基于改进潜在语义分析的跨语言检索
被引量:
14
1
作者
宁健
林鸿飞
机构
大连理工大学计算机科学与技术学院
出处
《中文信息学报》
CSCD
北大核心
2010年第3期105-111,共7页
基金
国家自然科学基金资助项目(60673039
60973068)
+2 种基金
国家863高科技计划资助项目(2006AA01Z151)
教育部留学人员归国科研启动基金
教育部博士点基金资助(20090041110002)
文摘
该文采用基于SVD和NMF矩阵分解相结合的改进潜在语义分析的方法为生物医学文献双语摘要进行建模,该模型将英汉双语摘要映射到同一语义空间,不需要外部词典和知识库,建立不同语言之间的对应关系,便于在双语空间中进行检索。该文充分利用医学文献双语摘要语料中的锚信息,通过不同的k值构建多个检索模型,计算每个模型的信任度,使得多个模型都对查询和文本的相似度做出贡献。在语义空间上进行项与项、文本与文本、项与文本之间的相似度计算,实现了双语摘要的跨语言检索。
关键词
计算机应用
中文信息处理
改进潜在语义分析
语义空间
跨语言检索
SVD
NMF
Keywords
computer application
Chinese information processing
improved latent semantic indexing
semantic spacel cross language IR
SVD
NMF
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于主题图的数字图书馆英汉跨语言检索模型
被引量:
1
2
作者
夏立新
张进
王忠义
机构
华中师范大学信息管理系
美国威斯康星州大学密尔沃基分校信息研究学院
出处
《情报学报》
CSSCI
北大核心
2008年第3期468-473,共6页
基金
本文系“高等学校学科创新引智计划”项目(项目编号:B07042)的研究成果之一.
文摘
数字图书馆海量信息的多语种问题,成为人们获取信息资源的一大障碍,而当前的跨语言检索系统普遍存在翻译准确性差、效率低、成本高等不足。主题图作为一种可合并的索引,在知识表示、知识描述、资源定位、语境等方面的优势,可为翻译提供充实的上下文信息。本文正是针对跨语言检索的上述问题,在深入分析主题图技术的基础上,提出一种新的基于主题图的数字图书馆英汉跨语言检索模型。该模型采用索引翻译的策略,实现跨语言检索的目的。其最大的优点是在提高翻译准确性的同时,降低了翻译的工作量和成本。
关键词
主题图
OAI
跨语言检索
Keywords
topic map, OAI, cross-language information retrieval
分类号
G250.73 [文化科学—图书馆学]
G250.76 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
基于词共现的跨语言检索平台研究
被引量:
3
3
作者
李佳
机构
广东医学院图书馆
出处
《情报杂志》
CSSCI
北大核心
2015年第8期195-198,共4页
基金
湛江市科技攻关项目"基于共现词网改造的跨语言检索平台研究"(编号:2012C3101014)
文摘
在分析跨语言检索平台建设原理的基础上,综合本人及其它学者相关研究成果,提出基于共现词语义标识的跨语言检索平台(以下简称:平台)建设的方法、模型。以科技论文中英文关键词、主题词作为语料库,通过词共现方式实现同义词、词性及相关语义的标识。由于关键词作为自然语言,具有广泛的表达适应性,作为平台与用户的接口语言;主题词作为控制语言,通过与副主题词的组配使用,可作为平台实现对检索词的逻辑语义表达的理解,实现信息的准确定位,从而使得跨语言检索平台具有良好的翻译与检索能力。
关键词
共现词
语义标识
跨语言检索
平台
语义理解
Keywords
eo-oocurrence word semantic identity cross-language retrieval platform semantic comprehension
分类号
G350 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
基于词典的藏汉跨语言检索系统研究
被引量:
1
4
作者
李亚超
江涛
于洪志
加羊吉
机构
西北民族大学中国民族语言文字信息技术重点实验室
出处
《西北民族大学学报(自然科学版)》
2011年第4期40-43,52,共5页
基金
国家自然基金重点项目(61032008)
模式识别重点实验室开发课题(201001051)
+1 种基金
西北民族大学中央高校基本科研业务费专项资金资助研究生项目(ycx11135)
西北民族大学中央高校基本科研业务费(zyz2011101)
文摘
针对跨语言检索中查询翻译歧义问题,文章从藏汉跨语言检索的特点出发,采用了平衡翻译(BalancedTranslation)方法,减少了歧义翻译数量,提高了翻译的准确度.在文档索引上,为了弥补藏文分词对于命名实体识别的不足,采用了4元组的索引方法,明显提高了检索的速度和准确度.
关键词
跨语言检索
藏文分词
查询翻译
Keywords
CLIR
Tibetan word segmentation
Query translation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
融合加权模式挖掘与规则混合扩展的跨语言检索
被引量:
11
5
作者
黄名选
夏国恩
高荣
蒋曹清
机构
广西财经学院广西(东盟)财经研究中心
广西跨境电商智能信息处理重点实验室(广西财经学院)
广西财经学院信息与统计学院
广西财经学院工商管理学院
出处
《小型微型计算机系统》
CSCD
北大核心
2019年第9期2013-2020,共8页
基金
国家自然科学基金项目(61762006,71862003,61662003)资助
广西应用经济学一流学科(培育)开放性课题项目(2018MA07)资助
+1 种基金
广西(东盟)财经研究中心开放性课题项目(2018DMCJYB08)资助
广西自然科学基金项目(2015GXNSFAA139310)资助
文摘
针对信息检索中查询主题漂移和词不匹配问题,本文给出项集有效性计算方法及其剪枝策略,构建一种关联模式评价框架ACSC(Availability_Chis-Square_Confidence)和基于ACSC挖掘的规则混合扩展模型,提出一种融合加权关联模式挖掘与规则混合扩展模型的跨语言信息检索算法.该算法通过项集权值比较从跨语言初检相关文档集挖掘含有原查询词项的频繁项集,利用基于有效性的剪枝方法对项集进行剪枝得到有效频繁项集,从有效频繁项集挖掘加权关联规则,根据规则混合扩展模型实现查询扩展,扩展词与原查询词组合为新查询再次检索文档得到最终检索结果.与现有跨语言检索算法比较,实验结果表明,本文算法能有效地减少查询漂移和词不匹配问题,提高和改善跨语言信息检索性能,有效性和置信度可使本文算法分别获得最优的检索结果 R-prec和P@10值.
关键词
信息
检索
跨语言检索
文本挖掘
查询扩展
自然
语言
处理
Keywords
information retrieval
cross language retrieval
text mining
query expansion
natural language processing
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
网上信息跨语言检索方法
被引量:
6
6
作者
刘卫中
机构
吉林省经济管理干部学院图书馆
出处
《情报科学》
CSSCI
北大核心
2004年第12期1503-1504,共2页
文摘
本文介绍了目前全世界网络语言的现状和实现网上信息跨语言检索的五种方法 。
关键词
跨语言检索
网上信息
检索
翻译方法
Keywords
Cross-language retrieval On-line information retrieval Translation method
分类号
G203 [文化科学—传播学]
在线阅读
下载PDF
职称材料
题名
汉蒙跨语言检索系统设计与实现
被引量:
5
7
作者
鲍玉来
白淑霞
飞龙
王炜华
机构
内蒙古大学图书馆
内蒙古大学计算机学院
出处
《情报理论与实践》
CSSCI
北大核心
2017年第4期128-132,144,共6页
基金
国家自然科学基金项目"基于领域本体的蒙古文数字资源整合机制研究"的成果
项目编号:71163029
文摘
[目的/意义]基于汉蒙间跨语言检索系统发展现状,设计并实现通过汉文、传统蒙古文关键词检索西里尔蒙古文文档的系统。[方法/过程]汉蒙跨语言检索系统包括机器翻译和文档检索。在机器翻译方面,实现了基于词典的汉文到西里尔蒙古文机器翻译,并实现了基于规则和统计的传统蒙古文到西里尔蒙古文转换;在文档检索方面,基于Lucene全文索引工具包对大量的西里尔蒙古文文档建立索引,并根据向量空间模型对查询和文档的相似度进行排序,得到与查询最为匹配的文档集。[结果/结论]本系统响应速度较快,准确率较高,达到可用水平。一方面促进中国与蒙古国之间的科技、文化、教育的交流;另一方面对我国西里尔蒙古文的研究有一定的促进作用。
关键词
跨
语言
信息
检索
信息
检索
系统
检索
方法
Keywords
cross-language information retrieval
information retrieval system
retrieval method
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
英汉交互式跨语言检索系统设计与实现
被引量:
10
8
作者
吴丹
机构
武汉大学信息管理学院
出处
《现代图书情报技术》
CSSCI
北大核心
2009年第2期89-95,共7页
基金
国家"985工程"项目"语言科学技术与当代社会建设跨学科创新平台"(项目编号:985YK003)的研究成果之一
文摘
针对跨语言信息检索的查询翻译歧义性问题,采用交互式系统开发设计方法,对基于相关反馈的跨语言信息检索技术进行研究和分析,提出一个英汉交互式跨语言信息检索系统,实现用户辅助查询翻译、多级用户相关性判断,以及翻译优化与查询扩展等相关反馈功能,结果明显提高了检索效果。
关键词
跨
语言
信息
检索
用户交互
信息
检索
系统
Keywords
Cross -language information retrieval User interaction Information retrieval system
分类号
G354 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
汉英跨语言检索系统中关键词提取方法的研究
9
作者
陈文君
於文雪
机构
东南大学影像科学与技术实验室
出处
《电脑知识与技术》
2009年第10期7848-7849,7857,共3页
文摘
设计与实现了基于语句的汉英跨语言检索系统的关键词提取模块,关键词提取模块包括中文关键词提取和翻译转换两部分,此模块为后续的检索模块提供输入信息.其性能及效率对整个跨语言检索系统有重要影响。该文首先通过Dijkstra算法的改进方法求解分词的最短路径,实现了汉语检索语句的分词处理。然后以汉英双语词典为基础,对语法提取后的中文关键词实现了汉英翻译转换。最后提取的关键词供检索使用,实验结果表明用本文方法提取的关键词能满足检索要求。
关键词
跨语言检索
关键词提取
中文分词
翻译转换
自然
语言
处理
Keywords
cross-language retrieval
keywords extraction
Chinese word segmentation
translation transforming
natural language processing
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
在线阅读
下载PDF
职称材料
题名
跨语言检索中统一提问式翻译与检索过程方法探讨
10
作者
郝嘉树
王惠临
机构
中国科学技术信息研究所
出处
《现代图书情报技术》
CSSCI
北大核心
2008年第4期18-22,共5页
基金
国家科技支撑计划"多语言信息服务环境关键技术研究与应用"(项目编号:06BTQ030)
国家社会科学基金"基于本体的跨语言信息检索理论与实验研究"(项目编号:2006BAHO3B02)
+1 种基金
教育部人文社会科学基金"领域Ontology自动构建研究"(项目编号:06JC870001)
中国科学技术信息研究所2007年度学科建设项目"语言技术和知识技术"(项目编号:2007DP01-8)的研究成果之一
文摘
在指出跨语言信息检索技术中大部分实现方法存在分离现象的基础上,介绍将提问式翻译与检索过程统一的思想,并探讨将提问式翻译与检索过程统一的方法。
关键词
跨
语言
信息
检索
分离问题
统一提问式翻译和
检索
统一
检索
过程
统一方法
Keywords
CLIR Separated problems Integration of query translation with retri eval Integration of retrieval process Integrating methods
分类号
G354.49 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
浅谈跨语言检索的方法
11
作者
郑萍
机构
宁德师范学院图书馆
出处
《宁德师范学院学报(哲学社会科学版)》
2012年第2期106-108,共3页
文摘
跨语言检索是为了满足网络资源语种多样性,克服用户掌握语言差异性所带来的检索语言障碍。全球化信息结构引发了对跨语言信息检索的迫切需要。当前跨语言检索在分类与语言学资源等方面尚存在着亟待解决的问题。
关键词
跨
语言
信息
检索
跨
语言
信息
检索
的分类
语言
学资源
中间
语言
分类号
G354 [文化科学—情报学]
在线阅读
下载PDF
职称材料
题名
面向汉越跨语言事件检索的事件预训练方法
12
作者
吴少扬
余正涛
黄于欣
朱恩昌
高盛祥
邓同杰
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
出处
《中文信息学报》
CSCD
北大核心
2024年第4期78-85,共8页
基金
国家自然科学基金(U21B2027,61972186,61732005,61866019)
云南省重大科技专项(202002AD080001,202202AD080003,202103AA080015)
云南省高新技术产业专项(201606)。
文摘
汉越跨语言事件检索是用汉语查询检索越南语事件新闻的任务。由于越南语属于典型的低资源语言,汉越跨语言事件检索缺乏大规模的标注数据,并且现有的跨语言预训练模型无法很好地表征文本中丰富的汉越对齐事件知识,不适用于该任务。因此,为了将汉越双语对齐的事件知识融入到多语言预训练语言模型中,该文提出了两个预训练方法,即事件要素掩码预训练以及跨语言事件对比预训练。在该文构造的汉越跨语言事件检索数据集和公开跨语言问答数据集上进行了实验,比基线提升1%~3%MAP值,2%~4%NDCG值,证明了该文方法的有效性。
关键词
事件预训练
跨
语言
事件
检索
掩码
语言
模型
对比学习
Keywords
event pre-training
cross-lingual event retrieval
masked language model
contrastive learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于要素关联图的汉越跨语言事件检索方法
13
作者
赵周颖
余正涛
黄于欣
陈瑞清
朱恩昌
机构
昆明理工大学信息工程与自动化学院
昆明理工大学云南省人工智能重点实验室
出处
《现代电子技术》
北大核心
2024年第7期127-132,共6页
文摘
汉越跨语言事件检索旨在根据输入的中文事件查询短语,检索出相关的越南语新闻事件文档。由于查询文档的新闻文本较长,中文事件查询短语与越南语的查询文档长度不一,表达差异较大,且查询文档中往往会包含大量与其描述的核心事件无关的噪声文本,现有的模型不能很好地捕获事件匹配特征,匹配效果欠佳。基于此,文中提出基于要素关联图的汉越跨语言事件检索方法。首先,预训练一个汉越双语词嵌入来解决跨语言问题;然后,抽取查询文档中的关键信息(关键词和实体)以构建要素关联图;最后,通过引入一个图编码器对构建的要素图进行编码,生成结构化的事件信息来增强传统的事件检索模型。实验结果表明文中提出的方法优于传统的基线方法。
关键词
跨
语言
事件
检索
跨
语言
词嵌入
要素关联图
图神经网络
文本匹配
事件
检索
Keywords
cross⁃lingual event retrieval
cross⁃lingual word embedding
arguments relational graph
graph neural network
text match
fact retrieval
分类号
TN911-34 [电子电信—通信与信息系统]
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
跨语言信息检索研究进展
被引量:
17
14
作者
张俊林
曲为民
杜林
孙玉芳
机构
中科院软件所开放系统与中文信息处理中心
出处
《计算机科学》
CSCD
北大核心
2004年第7期16-19,共4页
基金
863计划(No.2001AA114040)
国家自然科学基金(69983009)
文摘
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。
关键词
跨
语言
信息
检索
汉英
跨语言检索
中文信息处理
受控词汇
检索
Keywords
Cross-language information retrieval, Chinese-english CLIR, Chinese information processing
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
网上信息的跨语言检索
被引量:
12
15
作者
李培
武丽辉
机构
南开大学国际商学院图书馆学系
出处
《情报资料工作》
CSSCI
北大核心
2004年第2期71-74,共4页
文摘
文章对跨语言信息检索的相关技术和实现方法进行了系统地论述,对跨语言 检索中的语言资源、翻译歧义性消解等关键性问题的研究进行了归纳与梳理,指出我国跨 语言检索研究距世界先进水平尚有一定差距,应加强该领域的研究。
关键词
网络信息
检索
跨语言检索
翻译歧义性
自动翻译
计算机
检索
机器翻译
语料库
分类号
G354 [文化科学—情报学]
原文传递
题名
基于主题图的英汉跨语言检索模型构建
被引量:
7
16
作者
夏立新
王忠义
机构
华中师范大学信息管理系
出处
《图书情报工作》
CSSCI
北大核心
2008年第11期70-74,共5页
基金
教育部/国家外国专家局项目"高等学校学科创新引智计划"(项目编号:B07042)研究成果之一
文摘
针对现有跨语言检索模型普遍存在的翻译准确性差、效率低、成本高等不足,在深入分析主题图技术在揭示语词概念之间的语义关系和多语言支持等方面的优越性能的基础上,提出一个基于主题图的英汉跨语言检索模型,该模型采用索引翻译的策略来实现跨语言检索,其突出特点是能够在提高翻译准确性的同时,有效降低翻译成本,并且实现起来也比较简单。
关键词
主题图
OAI
跨语言检索
Keywords
topic map OAI cross-language information retrieval
分类号
G354 [文化科学—情报学]
原文传递
题名
跨语言信息检索中的多语言处理技术研究
17
作者
朱玉
李枫
机构
山西警察学院
出处
《信息记录材料》
2024年第9期98-101,共4页
文摘
全球化时代下,跨语言信息检索系统成为连接不同语言和文化用户的关键技术。而作为系统的技术要点,多语言处理技术则在全球化程度日益加深的进程中,表现出了更重要的科学价值。本文深入探讨了跨语言信息检索中的多语言处理技术,包括语言检测、机器翻译、词干提取、词嵌入以及深度学习模型等。通过深入分析此类技术在应对多语言复杂性,以及提高跨语言信息检索效率和准确性方面的作用,针对当前系统的性能瓶颈提出了具有参考价值的技术优化方案,为未来的进一步研究提供了方向。
关键词
跨
语言
信息
检索
多
语言
处理
数学模型
分类号
TP391 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
基于本体的跨语言信息检索在数字图书馆中的应用
被引量:
5
18
作者
鲍丽倩
张自然
机构
华中师范大学信息管理系
出处
《现代情报》
CSSCI
2011年第7期169-172,共4页
文摘
首先对跨语言信息检索和相关技术进行了介绍,了解当前跨语言信息检索技术的不足,然后阐述了传统跨语言信息检索技术在数字图书馆应用中的局限性,并由此引出了基于本体的跨语言技术。最后提出了一种基于本体的数字图书馆跨语言信息检索系统,并详细阐述了系统的流程,着重讲述了数字图书馆跨语言领域本体的构建。由于本体具有良好的概念层次和对逻辑推理的支持,对源语言和目标语言进行语义扩展,提高了数字图书馆跨语言系统的检索效率。
关键词
跨语言检索
数字图书馆
本体
Keywords
cross- language information retrieval
digital library
ontology
分类号
G254.92 [文化科学—图书馆学]
在线阅读
下载PDF
职称材料
题名
“一带一路”多语种共享型数据库的跨语言检索功能分析与开发策略
被引量:
11
19
作者
司莉
周璟
机构
武汉大学信息管理学院
出处
《图书情报工作》
CSSCI
北大核心
2021年第3期20-27,共8页
基金
教育部哲学社会科学研究重大课题攻关项目"‘一带一路’沿线国家多语种、共享型经济管理数据库建设研究"(项目编号:19JZD020)研究成果之一。
文摘
[目的/意义]要实现"一带一路"多语种共享型数据库资源的有效利用,必须解决跨语言检索问题,基于已建"一带一路"数据库检索功能调查结果,分析"一带一路"多语种共享型数据库检索功能需求,以调研跨语言检索平台为视角,为"一带一路"多语种共享型数据库的跨语言检索功能设计与开发提供参考。[方法/过程]采用文献调研法和网络调研法,选取11个国内外典型的跨语言检索平台,从跨语言检索方法、跨语言翻译实现方法、检索功能设置、检索结果呈现、界面与检索支持语种6个方面进行分析,总结其实现方法。[结果/结论]为"一带一路"多语种共享型数据库的跨语言检索功能设计与开发提出策略:应采用基于神经网络机器翻译的提问式-文献翻译方法,实现多种检索功能,应用可视化技术呈现检索结果,提供多语言检索界面和资源。
关键词
"一带一路"
数据库
多语种
跨语言检索
Keywords
"the Belt and Road"
database
multilingual
cross-language retrieval
分类号
G250.74 [文化科学—图书馆学]
原文传递
题名
跨语言检索中机器翻译技术的应用和进展
被引量:
6
20
作者
刘群
骆卫华
机构
中国科学院计算技术研究所
出处
《数字图书馆论坛》
2006年第9期12-19,共8页
文摘
本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展。文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点、特别是近年来统计机器翻译的发展。本文通过一个实例较为详细地介绍了目前主流的基于短语的统计机器翻译原理,然后通过一个实际的新闻长句子对几个典型的基于规则的和基于统计的机器翻译系统的翻译结果给出了细致的比较和分析。最后对机器翻译在跨语言检索中的应用前景做出了展望。
关键词
跨语言检索
统计机器翻译
Keywords
Cross-language information retriveval,Statistical machine translation
分类号
TP391.2 [自动化与计算机技术—计算机应用技术]
在线阅读
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于改进潜在语义分析的跨语言检索
宁健
林鸿飞
《中文信息学报》
CSCD
北大核心
2010
14
在线阅读
下载PDF
职称材料
2
基于主题图的数字图书馆英汉跨语言检索模型
夏立新
张进
王忠义
《情报学报》
CSSCI
北大核心
2008
1
在线阅读
下载PDF
职称材料
3
基于词共现的跨语言检索平台研究
李佳
《情报杂志》
CSSCI
北大核心
2015
3
在线阅读
下载PDF
职称材料
4
基于词典的藏汉跨语言检索系统研究
李亚超
江涛
于洪志
加羊吉
《西北民族大学学报(自然科学版)》
2011
1
在线阅读
下载PDF
职称材料
5
融合加权模式挖掘与规则混合扩展的跨语言检索
黄名选
夏国恩
高荣
蒋曹清
《小型微型计算机系统》
CSCD
北大核心
2019
11
在线阅读
下载PDF
职称材料
6
网上信息跨语言检索方法
刘卫中
《情报科学》
CSSCI
北大核心
2004
6
在线阅读
下载PDF
职称材料
7
汉蒙跨语言检索系统设计与实现
鲍玉来
白淑霞
飞龙
王炜华
《情报理论与实践》
CSSCI
北大核心
2017
5
在线阅读
下载PDF
职称材料
8
英汉交互式跨语言检索系统设计与实现
吴丹
《现代图书情报技术》
CSSCI
北大核心
2009
10
在线阅读
下载PDF
职称材料
9
汉英跨语言检索系统中关键词提取方法的研究
陈文君
於文雪
《电脑知识与技术》
2009
0
在线阅读
下载PDF
职称材料
10
跨语言检索中统一提问式翻译与检索过程方法探讨
郝嘉树
王惠临
《现代图书情报技术》
CSSCI
北大核心
2008
0
在线阅读
下载PDF
职称材料
11
浅谈跨语言检索的方法
郑萍
《宁德师范学院学报(哲学社会科学版)》
2012
0
在线阅读
下载PDF
职称材料
12
面向汉越跨语言事件检索的事件预训练方法
吴少扬
余正涛
黄于欣
朱恩昌
高盛祥
邓同杰
《中文信息学报》
CSCD
北大核心
2024
0
在线阅读
下载PDF
职称材料
13
基于要素关联图的汉越跨语言事件检索方法
赵周颖
余正涛
黄于欣
陈瑞清
朱恩昌
《现代电子技术》
北大核心
2024
0
在线阅读
下载PDF
职称材料
14
跨语言信息检索研究进展
张俊林
曲为民
杜林
孙玉芳
《计算机科学》
CSCD
北大核心
2004
17
在线阅读
下载PDF
职称材料
15
网上信息的跨语言检索
李培
武丽辉
《情报资料工作》
CSSCI
北大核心
2004
12
原文传递
16
基于主题图的英汉跨语言检索模型构建
夏立新
王忠义
《图书情报工作》
CSSCI
北大核心
2008
7
原文传递
17
跨语言信息检索中的多语言处理技术研究
朱玉
李枫
《信息记录材料》
2024
0
在线阅读
下载PDF
职称材料
18
基于本体的跨语言信息检索在数字图书馆中的应用
鲍丽倩
张自然
《现代情报》
CSSCI
2011
5
在线阅读
下载PDF
职称材料
19
“一带一路”多语种共享型数据库的跨语言检索功能分析与开发策略
司莉
周璟
《图书情报工作》
CSSCI
北大核心
2021
11
原文传递
20
跨语言检索中机器翻译技术的应用和进展
刘群
骆卫华
《数字图书馆论坛》
2006
6
在线阅读
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
9
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部