期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于语境类似度的并列成分的判定方法 被引量:2
1
作者 简幼良 高健 王秀坤 《中文信息学报》 CSCD 北大核心 1997年第1期51-58,共8页
本文针对日语处理中的疑难问题之一──长句并列成分的系受关系和范围的判定,介绍了日本长尾真等人提出的关于并列关键字语境类似度的日语并引成分的分析方法。该方法对日语并列的分类、关列关键字的确定、类似性的决定因素及其量化、... 本文针对日语处理中的疑难问题之一──长句并列成分的系受关系和范围的判定,介绍了日本长尾真等人提出的关于并列关键字语境类似度的日语并引成分的分析方法。该方法对日语并列的分类、关列关键字的确定、类似性的决定因素及其量化、并列构造范围的求解等进行了详细的讨论,并给出了算法。我们把这种算法应用到我处开发日中翻译系统”孙悟空”里,并进行了一定的调整和补充。取得了比较满意的效果。 展开更多
关键词 日语处理 语境类似度 并列成分 机器翻译
在线阅读 下载PDF
基于语句类似度优化计算的改进自动摘要算法研究 被引量:3
2
作者 高雪霞 贾海龙 《计算机应用与软件》 CSCD 北大核心 2013年第9期160-162,182,共4页
计算语句的类似度在自动问答、机器翻译、信息检索和自动摘要等算法中有着非常重要的作用。首先归纳了语句类似度计算的方法,综合考虑关键词特征、语义特征、句式特征和语句长度特征等信息并提出一种优化语句类似度计算方法,以语句权重... 计算语句的类似度在自动问答、机器翻译、信息检索和自动摘要等算法中有着非常重要的作用。首先归纳了语句类似度计算的方法,综合考虑关键词特征、语义特征、句式特征和语句长度特征等信息并提出一种优化语句类似度计算方法,以语句权重计算方法以及冗余处理优化处理为基础,实现一个改进的自动摘要算法。通过在DUC的测评语料上进行仿真,实验结果证明了该算法对于摘要质量优化的高效性。最后,讨论了自动摘要研究存在的问题,并指出自动摘要的研究趋势。 展开更多
关键词 语句类似度 自动摘要 语句权重计算 冗余处理
在线阅读 下载PDF
基于语境类似度的并列成分的判定方法
3
作者 简幼良 高健 +1 位作者 王秀坤 唱红涛 《大连理工大学学报》 CAS CSCD 北大核心 1996年第4期504-510,共7页
针对日语处理中的疑难问题之一长句并列成分的系受关系和范围的判定,介绍了日本长尾真等人提出的关于并列关键字语境类似度的日语并列成分的分析方法.该方法对日语并列的分类、并列关键字的确定、类似性的决定因素及其量化、并列构造... 针对日语处理中的疑难问题之一长句并列成分的系受关系和范围的判定,介绍了日本长尾真等人提出的关于并列关键字语境类似度的日语并列成分的分析方法.该方法对日语并列的分类、并列关键字的确定、类似性的决定因素及其量化、并列构造范围的求解等进行了详细的讨论,并给出了算法.把这种算法应用到我所开发的“孙悟空”日中翻译系统里,并进行了一定的调整和补充。 展开更多
关键词 机器翻译 日语处理 语境类似度 并列成分
在线阅读 下载PDF
灰度散布分类指导挖掘的高类似度文本分类
4
作者 王长杰 王卫华 《科技通报》 北大核心 2014年第4期179-181,共3页
提出一种灰度散布分类指导挖掘的高类似度文本分类方法,采用灰度散布分类的思想对海量文本下的数据挖掘进行指导,采用灰度散布分类思想对特征更细分类能力,将相似度高的文本更细的分开,最后采用一组特征接近的随机词汇进行特征分类实验... 提出一种灰度散布分类指导挖掘的高类似度文本分类方法,采用灰度散布分类的思想对海量文本下的数据挖掘进行指导,采用灰度散布分类思想对特征更细分类能力,将相似度高的文本更细的分开,最后采用一组特征接近的随机词汇进行特征分类实验。结果显示,采用基于灰度散布分类指导挖掘方法,使特征类似度很高的文本可以被很好的区分开来,具有广泛的分类应用价值。 展开更多
关键词 散布 分类指导 类似度文本分类
在线阅读 下载PDF
日中同形語字形類似度の統計 自然言語処理における漢字分割法の利用を中心に
5
作者 叶栩邑 《日本学研究》 2017年第1期74-89,共16页
近30年来关于中日同形词对照的研究为数众多,其中不乏有许多在中日字形方面进行比较的质性研究,但对于中日整体字形对照比较的量性研究却极少,同时现有的调查在统计类似度时所使用的判定基准也存在诸多问题。本文利用自然语言处理中的... 近30年来关于中日同形词对照的研究为数众多,其中不乏有许多在中日字形方面进行比较的质性研究,但对于中日整体字形对照比较的量性研究却极少,同时现有的调查在统计类似度时所使用的判定基准也存在诸多问题。本文利用自然语言处理中的汉字分割法,按照汉字本身构造分割成字根进行中日间对比,整理出中日同形词汉字结构对应的各个类型,并且以1000词为例按照对应字根在整体汉字中所占的比例分析统计了中日同形词的类似度情况。 展开更多
关键词 日中同形語 類似 部件 構造分析 分割法
原文传递
禾本科植物内生真菌研究22:Epichloe festucae E2368基因组中非核糖体肽合成酶编码基因的挖掘与分析
6
作者 纪燕玲 韩魁 +2 位作者 茅冬梅 陈永敢 王志伟 《南京农业大学学报》 CAS CSCD 北大核心 2024年第6期1097-1104,共8页
[目的]Epichloe内生真菌能够产生抵御牲畜和害虫啃食的生物碱,其中部分生物碱由非核糖体肽合成酶(non-ribosomal peptide synthetase,NRPS)合成。本研究旨在分析E.festucae基因组内的NRPS编码基因,并预测其功能。[方法]以E.festucae E2... [目的]Epichloe内生真菌能够产生抵御牲畜和害虫啃食的生物碱,其中部分生物碱由非核糖体肽合成酶(non-ribosomal peptide synthetase,NRPS)合成。本研究旨在分析E.festucae基因组内的NRPS编码基因,并预测其功能。[方法]以E.festucae E2368菌株基因组数据为对象,综合运用HMMER和全局比对等分析方法以及ClustScan、PKS/NRPS Analysis和NCBI等数据库进行信息比对。[结果]E2368基因组中含有至少19个候选NRPS基因,其中11个未在Epichloe内生真菌中报道。序列比对结果表明候选基因均为子囊菌中已报道的序列,但其中8个基因的功能未知;E2368基因组中存在环孢菌素合成酶基因扩增现象。构建候选NRPS基因所有A结构域氨基酸序列发育树,发现不同NRPS基因的A结构域会聚到同一分枝,而相同NRPS基因的A结构域则分散于不同分枝,说明采用简并引物扩增NRPS基因存在一定的局限性。[结论]对E2368基因组中NRPS基因的挖掘,将有助于解析NRPS基因的多样性,促进对新的天然产物的发现和生物合成途径的认识。 展开更多
关键词 NRPS数据库 基因挖掘 生物碱 类似度分析 禾本科植物内生真菌
在线阅读 下载PDF
异常反应模式的识别和分类 被引量:9
7
作者 曹亦薇 《心理学报》 CSSCI CSCD 北大核心 2001年第6期558-563,共6页
通过对Drasgow等人的个人适合指标lz 公式的再分解 ,发现该指标也属于残差型类的指标。特别是和Tat suoka的广义个人适合指标 ζ指标具有类似的数学结构 ,除符号相反外 ,不同之处仅是公式中加权项。其次 ,该研究定义了任意两个异常反应... 通过对Drasgow等人的个人适合指标lz 公式的再分解 ,发现该指标也属于残差型类的指标。特别是和Tat suoka的广义个人适合指标 ζ指标具有类似的数学结构 ,除符号相反外 ,不同之处仅是公式中加权项。其次 ,该研究定义了任意两个异常反应对象的类似度 ,在此基础上试用多维标度法对异常反应模式进行再分类。结果说明分类是有效、实用的。 展开更多
关键词 项目反应理论 个人适合指标 类似度 多维标
在线阅读 下载PDF
虚拟化网络中的异常大数据剔除算法仿真
8
作者 李军华 丁宪成 《计算机仿真》 北大核心 2021年第10期410-413,475,共5页
网络中的冗余数据过多会导致网络运行速度降低,为此提出虚拟化网络中的异常大数据剔除算法。分析虚拟化网络中异常大数据的类似度,使用决策树模型分解提取异常大数据数值属性特征以及分类属性特征,再利用关联规则分析法融合模糊数据,计... 网络中的冗余数据过多会导致网络运行速度降低,为此提出虚拟化网络中的异常大数据剔除算法。分析虚拟化网络中异常大数据的类似度,使用决策树模型分解提取异常大数据数值属性特征以及分类属性特征,再利用关联规则分析法融合模糊数据,计算出属性值自相关的特征分块函数,即可挖掘出异常数据。利用测量数据间的接近度验证虚拟化网络数据,把节点数据作为一个集合,通过模糊集合间的接近度,设定冗余数据的判定门限值,将滤除数据带入粒子群优化以及支持向量机内构建数据库,并对所有粒子位置更新,采用最优粒子构建检测模型,同时调整异常特征剔除窗口参数,实现异常大数据剔除。仿真结果证明,所提方法能够全面剔除数据,且误剔除率低。 展开更多
关键词 虚拟化网络 异常大数据 数据剔除 类似度分析 冗余过滤
在线阅读 下载PDF
一种统计特征点网格分布的表格图像识别方法 被引量:5
9
作者 李海涛 柳健明 +1 位作者 德烈 张小惠 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第9期60-63,共4页
提出一种统计特征点网格分布的表格图像识别方法 ,该方法以表格框线间的交叉点类型作为表格分类的主要结构特征 ,把表格图像外接矩形区域归一化为N×N的网格 ,并统计每一网格内各种类型特征点的分布情况 ,由此形成的N×N个向量... 提出一种统计特征点网格分布的表格图像识别方法 ,该方法以表格框线间的交叉点类型作为表格分类的主要结构特征 ,把表格图像外接矩形区域归一化为N×N的网格 ,并统计每一网格内各种类型特征点的分布情况 ,由此形成的N×N个向量作为表格识别的特征向量 .采用了类似度的方法作为表格分类的判别准则 ,将未知表格类型的特征向量与预先经过学习建立的表格模板库中的标准特征向量进行相似性度量 ,取其类似度最高的模板类型作为识别结果 .实验表明该方法可行、高效 . 展开更多
关键词 统计特征点 网格分布 表格图像 图像识别 旋转校正 特征提取 类似度 文档识别
在线阅读 下载PDF
一种新的基于运动矢量的MPEGVIDEO码流cut检出算法 被引量:1
10
作者 周小明 李凤亭 《中国图象图形学报(A辑)》 CSCD 1999年第4期323-326,共4页
介绍了一种对MPEGVIDEO码流中场景切换点进行高速检出的新方法,在计算各帧相对于预测帧的类似度之后进行了类似度的归一化,降低了cut检出算法的复杂度。
关键词 cut检出 运动矢量 类似度 视频编码 MPEG 码流
在线阅读 下载PDF
Clustering analysis algorithm for security supervising data based on semantic description in coal mines 被引量:1
11
作者 孟凡荣 周勇 夏士雄 《Journal of Southeast University(English Edition)》 EI CAS 2008年第3期354-357,共4页
In order to mine production and security information from security supervising data and to ensure security and safety involved in production and decision-making,a clustering analysis algorithm for security supervising... In order to mine production and security information from security supervising data and to ensure security and safety involved in production and decision-making,a clustering analysis algorithm for security supervising data based on a semantic description in coal mines is studied.First,the semantic and numerical-based hybrid description method of security supervising data in coal mines is described.Secondly,the similarity measurement method of semantic and numerical data are separately given and a weight-based hybrid similarity measurement method for the security supervising data based on a semantic description in coal mines is presented.Thirdly,taking the hybrid similarity measurement method as the distance criteria and using a grid methodology for reference,an improved CURE clustering algorithm based on the grid is presented.Finally,the simulation results of a security supervising data set in coal mines validate the efficiency of the algorithm. 展开更多
关键词 semantic description clustering analysis algorithm similarity measurement
在线阅读 下载PDF
Ontology-based similarity measure for text clustering 被引量:1
12
作者 颜端武 李晓鹏 +1 位作者 王磊 成晓 《Journal of Southeast University(English Edition)》 EI CAS 2006年第3期389-393,共5页
A method that combines category-based and keyword-based concepts for a better information retrieval system is introduced. To improve document clustering, a document similarity measure based on cosine vector and keywor... A method that combines category-based and keyword-based concepts for a better information retrieval system is introduced. To improve document clustering, a document similarity measure based on cosine vector and keywords frequency in documents is proposed, but also with an input ontology. The ontology is domain specific and includes a list of keywords organized by degree of importance to the categories of the ontology, and by means of semantic knowledge, the ontology can improve the effects of document similarity measure and feedback of information retrieval systems. Two approaches to evaluating the performance of this similarity measure and the comparison with standard cosine vector similarity measure are also described. 展开更多
关键词 similarity measure text clustering ONTOLOGY information retrieval system
在线阅读 下载PDF
Part-level 3-D object classification with improved interpretation tree
13
作者 邢薇薇 刘渭滨 袁保宗 《Journal of Southeast University(English Edition)》 EI CAS 2007年第2期221-225,共5页
For classifying unknown 3-D objects into a set of predetermined object classes, a part-level object classification method based on the improved interpretation tree is presented. The part-level representation is implem... For classifying unknown 3-D objects into a set of predetermined object classes, a part-level object classification method based on the improved interpretation tree is presented. The part-level representation is implemented, which enables a more compact shape description of 3-D objects. The proposed classification method consists of two key processing stages: the improved constrained search on an interpretation tree and the following shape similarity measure computation. By the classification method, both whole match and partial match with shape similarity ranks are achieved; especially, focus match can be accomplished, where different key parts may be labeled and all the matched models containing corresponding key parts may be obtained. A series of experiments show the effectiveness of the presented 3-D object classification method. 展开更多
关键词 3-D object classification shape match similarity measure interpretation tree
在线阅读 下载PDF
工程制图课件的自主学习技术研究
14
作者 樊显昧 《安徽建筑工业学院学报(自然科学版)》 2001年第4期58-60,共3页
通过引入复合类似度方法和图像识别技术 ,使得烦琐的工程制图作业批改能利用计算机完成。工程制图作业批改系统是在 Visual Basic5 .
关键词 工程制图 CAI 图像识别 象素提取 复合类似度
在线阅读 下载PDF
抗肿瘤药物帕玛度胺类似物的合成
15
作者 孙道安 周恒 +2 位作者 史群峰 刘增路 毛振民 《现代生物医学进展》 CAS 2013年第36期7127-7130,共4页
目的:设计并合成抗肿瘤药物帕玛度胺的3位N取代的新型类似物。方法:从3-硝基邻苯二甲酸(2)和N-(叔丁氧羰基)-L-谷氨酰胺(4)出发,经过六步反应得到目标化合物。3-硝基邻苯二甲酸(2)经脱水制得3-硝基邻苯二甲酸酐(3)。用N-(叔丁氧羰基)-L... 目的:设计并合成抗肿瘤药物帕玛度胺的3位N取代的新型类似物。方法:从3-硝基邻苯二甲酸(2)和N-(叔丁氧羰基)-L-谷氨酰胺(4)出发,经过六步反应得到目标化合物。3-硝基邻苯二甲酸(2)经脱水制得3-硝基邻苯二甲酸酐(3)。用N-(叔丁氧羰基)-L-谷氨酰胺(4)经闭环、脱保护制得3-氨基-2,6-哌啶二酮三氟乙酸盐(6)。4与6经缩合、钯碳催化氢化制得免疫调节剂Pomalidomide(8),(8)经过酰化得到3-乙酰氨基-N-(2,6-二氧代-3-哌啶基)邻苯二甲酰亚胺(1)。以(4)计总收率约34.9%。结果:得到3-乙酰氨基-N-(2,6-二氧代-3-哌啶基)-邻苯二甲酰亚胺(1),应用于细胞活性测试。结论:改进了帕玛度胺的合成工艺,得到了3位N乙酰化的新型帕玛度胺类似物(1),初步研究显示(1)的生物活性与帕玛度胺接近。 展开更多
关键词 帕玛类似 抗肿瘤药 合成
原文传递
A quasi-synoptic interpretation of water mass distribution and circulation in the western North Pacific:I.Water mass distribution 被引量:6
16
作者 谢玲玲 田纪伟 +1 位作者 胡敦欣 王凡 《Chinese Journal of Oceanology and Limnology》 SCIE CAS CSCD 2009年第3期630-639,共10页
With high-resolution conductivity-temperature-depth (CTD) observations conducted in Oct.-Nov. 2005, this study provides a detailed quasi-synoptic description of the North Pacific Tropic Water (NPTW), North Pacific... With high-resolution conductivity-temperature-depth (CTD) observations conducted in Oct.-Nov. 2005, this study provides a detailed quasi-synoptic description of the North Pacific Tropic Water (NPTW), North Pacific Intermediate Water (NPIW) and Antarctic Intermediate Water (AAIW) in the western North Pacific. Some novel features are found. NPTW enters the western ocean with highest-salinity core off shore at 15°-18°N, and then splits to flow northward and southward along the western boundary. Its salinity decreases and density increases outside the core region. NPIW spreads westward north of 15°N with lowest salinity off shore at 21°N, but mainly hugs the Mindanao coast south of 12°N. It shoals and thins toward the south, with salinity increasing and density decreasing. AAIW extends to higher latitude off shore than that in shore, and it is traced as a salinity minimum to only 10°N at 130°E. Most of the South Pacific waters turn northeastward rather than directly flow northward upon reaching to the Mindanao coast, indicating the eastward shift of the Mindanao Undercurrent (MUC). 展开更多
关键词 North Pacific Intermediate Water (NPIW) North Pacific Tropic Water (NPTW) Antarctic Intermediate Water (AAIW)
在线阅读 下载PDF
免疫调节剂治疗多发性骨髓瘤的抗血管生成及免疫调节作用机制
17
作者 火俊 林天宝 侯健 《第二军医大学学报》 CAS CSCD 北大核心 2010年第9期1023-1025,共3页
多发性骨髓瘤是一种多进程疾病,不同疾病进程对化疗和放疗的敏感性不同,敏感性减低可造成疾病复发或成为难治性多发性骨髓瘤。骨髓瘤细胞的生长、凋亡的抑制及耐药性依赖于参与免疫调节的细胞因子和血管生成的生长因子,如IL-6、VEGF等... 多发性骨髓瘤是一种多进程疾病,不同疾病进程对化疗和放疗的敏感性不同,敏感性减低可造成疾病复发或成为难治性多发性骨髓瘤。骨髓瘤细胞的生长、凋亡的抑制及耐药性依赖于参与免疫调节的细胞因子和血管生成的生长因子,如IL-6、VEGF等。沙利度胺既具有抗血管生成作用,又具有免疫调节功能,是治疗多发性骨髓瘤的有效药物之一,但长期服用沙利度胺可引起深静脉血栓等严重并发症,使与沙利度胺结构相似但比其更安全、高效的免疫调节类药物(immunomodulato-ry drugs,IMiDs)的探讨成为热点。IMiDs具有抗新生血管形成作用,同时可共刺激T细胞亚群,诱导细胞因子产生并提升NK细胞数量与功能,通过增强抗体依赖细胞介导的细胞毒性杀伤肿瘤细胞。本文简述IMiDs治疗多发性骨髓瘤的机制及其初步临床试验结果。 展开更多
关键词 免疫调节 血管生成 沙利类似 多发性骨髓瘤
在线阅读 下载PDF
Power interconnected system clustering with advanced fuzzy C-mean algorithm 被引量:6
18
作者 王洪梅 KIM Jae-Hyung +2 位作者 JUNG Dong-Yean LEE Sang-Min LEE Sang-Hyuk 《Journal of Central South University》 SCIE EI CAS 2011年第1期190-195,共6页
An advanced fuzzy C-mean (FCM) algorithm was proposed for the efficient regional clustering of multi-nodes interconnected systems. Due to various locational prices and regional coherencies for each node and point, m... An advanced fuzzy C-mean (FCM) algorithm was proposed for the efficient regional clustering of multi-nodes interconnected systems. Due to various locational prices and regional coherencies for each node and point, modified similarity measure was considered to gather nodes having similar characteristics. The similarity measure was needed to contain locafi0nal prices as well as regional coherency. In order to consider the two properties simultaneously, distance measure of fuzzy C-mean algorithm had to be modified. Regional clustering algorithm for interconnected power systems was designed based on the modified fuzzy C-mean algorithm. The proposed algorithm produces proper classification for the interconnected power system and the results are demonstrated in the example of IEEE 39-bus interconnected electricity system. 展开更多
关键词 fuzzy C-mean similarity measure distance measure interconnected system CLUSTERING
在线阅读 下载PDF
Vari-gram language model based on word clustering
19
作者 袁里驰 《Journal of Central South University》 SCIE EI CAS 2012年第4期1057-1062,共6页
Category-based statistic language model is an important method to solve the problem of sparse data.But there are two bottlenecks:1) The problem of word clustering.It is hard to find a suitable clustering method with g... Category-based statistic language model is an important method to solve the problem of sparse data.But there are two bottlenecks:1) The problem of word clustering.It is hard to find a suitable clustering method with good performance and less computation.2) Class-based method always loses the prediction ability to adapt the text in different domains.In order to solve above problems,a definition of word similarity by utilizing mutual information was presented.Based on word similarity,the definition of word set similarity was given.Experiments show that word clustering algorithm based on similarity is better than conventional greedy clustering method in speed and performance,and the perplexity is reduced from 283 to 218.At the same time,an absolute weighted difference method was presented and was used to construct vari-gram language model which has good prediction ability.The perplexity of vari-gram model is reduced from 234.65 to 219.14 on Chinese corpora,and is reduced from 195.56 to 184.25 on English corpora compared with category-based model. 展开更多
关键词 word similarity word clustering statistical language model vari-gram language model
在线阅读 下载PDF
Color image segmentation using mean shift and improved ant clustering 被引量:3
20
作者 刘玲星 谭冠政 M.Sami Soliman 《Journal of Central South University》 SCIE EI CAS 2012年第4期1040-1048,共9页
To improve the segmentation quality and efficiency of color image,a novel approach which combines the advantages of the mean shift(MS) segmentation and improved ant clustering method is proposed.The regions which can ... To improve the segmentation quality and efficiency of color image,a novel approach which combines the advantages of the mean shift(MS) segmentation and improved ant clustering method is proposed.The regions which can preserve the discontinuity characteristics of an image are segmented by MS algorithm,and then they are represented by a graph in which every region is represented by a node.In order to solve the graph partition problem,an improved ant clustering algorithm,called similarity carrying ant model(SCAM-ant),is proposed,in which a new similarity calculation method is given.Using SCAM-ant,the maximum number of items that each ant can carry will increase,the clustering time will be effectively reduced,and globally optimized clustering can also be realized.Because the graph is not based on the pixels of original image but on the segmentation result of MS algorithm,the computational complexity is greatly reduced.Experiments show that the proposed method can realize color image segmentation efficiently,and compared with the conventional methods based on the image pixels,it improves the image segmentation quality and the anti-interference ability. 展开更多
关键词 color image segmentation improved ant clustering graph partition mean shift
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部