期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
迈向科学学大变革的时代 被引量:41
1
作者 刘则渊 陈超美 +1 位作者 侯海燕 王贤文 《科学学与科学技术管理》 CSSCI 北大核心 2009年第7期5-12,共8页
对国际科学学及科学计量学研究热点的可视化分析,表明充满变革性的纳米科技、生物科技、交叉科学和发现理论,正成为21世纪初科学学研究的焦点与热点,亦标志着科学学正进入大变革的时代。迅速崛起的e-科学研究前沿可视化分析,展示出基于... 对国际科学学及科学计量学研究热点的可视化分析,表明充满变革性的纳米科技、生物科技、交叉科学和发现理论,正成为21世纪初科学学研究的焦点与热点,亦标志着科学学正进入大变革的时代。迅速崛起的e-科学研究前沿可视化分析,展示出基于网格技术的e-科学及其工作流,正在引起当代科学研究方式的深刻变革,也是对科学学大变革的时代呼唤。正在启动的NSF关于CDI的项目计划,创造了"赛博实现的发现与创新(CDI)"这一全新概念和基于计算思维的发现模式与创新模式;在这一背景下,一个由长江学者领军的科学学研究团队,开展了带有CDI变革性特征的多学科性、跨国性研究,并在此领域取得阶段性成果。 展开更多
关键词 科学学 科学计量学 大变革时代 e-科学 CDI 科学发现理论
在线阅读 下载PDF
CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化 被引量:1419
2
作者 陈超美(著) 陈悦(译) +1 位作者 侯剑华(译) 梁永霞(译) 《情报学报》 CSSCI 北大核心 2009年第3期401-421,共21页
本文介绍了在科学文献中识别并显示科学发展新趋势和新动态的一种通用方法的最新研究进展。这项研究在理论和方法上极大地促进了知识领域可视化研究。研究领域(specialty)的概念和可视化基于信息科学中的两个概念——"研究前沿"和... 本文介绍了在科学文献中识别并显示科学发展新趋势和新动态的一种通用方法的最新研究进展。这项研究在理论和方法上极大地促进了知识领域可视化研究。研究领域(specialty)的概念和可视化基于信息科学中的两个概念——"研究前沿"和"知识基础"间的时变对偶(time-variant duality)。研究前沿(research front)被定义为一组突现的动态概念和潜在的研究问题。研究前沿的知识基础(intellecture base)是它在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络)的引文和共引轨迹。Kleinberg设计的跳跃检测算法(burst detection algorithm)适用于辨认新兴研究前沿专业术语概念。Freeman提出的中间中心性测度可以用来使表示潜在范式变化的关键点凸显出来。我们设计并实现了两个互补的视图:聚类视图(cluster views)和时区视图(time-zone views)。这种方法的贡献在于:①通过对研究前沿术语的算法运算,在动态中认识知识基础的本质 ②用研究前沿专业术语概念明确标出共引聚类的确切含义 ③直观地和靠算法识别的关键点的一致性大大简化了可视化的复杂性。CiteSpaceⅡ应用Java程序实现了大规模生物集群灭绝(mass extinction)(1981~2004年)和恐怖主义(terrorism)(1990~2003年)两个研究领域的建模和可视化过程。可视化网络中的突出的趋势和关键点的作用经各自领域专家直接验证,这些专家本身就是关键点文章的的作者。本文讨论了这项研究的实际意义,并明确了今后研究工作中存在的一系列挑战和机会。 展开更多
关键词 CITESPACE 信息可视化 科学前沿图谱 知识传播
在线阅读 下载PDF
不完备区间值信息系统中的粗集理论 被引量:18
3
作者 魏利华 唐振民 +2 位作者 丁辉 杨习贝 李燕林 《信息与控制》 CSCD 北大核心 2009年第3期286-292,共7页
针对不完备区间值信息系统,提出了一种用于分类的偏序关系,并给出了计算这种偏序关系约简的实际操作方法。在不完备区间值决策系统中,根据基于偏序关系的粗糙集模型,引入了上、下近似约简的概念。上、下近似约简是保持所有决策类的下、... 针对不完备区间值信息系统,提出了一种用于分类的偏序关系,并给出了计算这种偏序关系约简的实际操作方法。在不完备区间值决策系统中,根据基于偏序关系的粗糙集模型,引入了上、下近似约简的概念。上、下近似约简是保持所有决策类的下、上近似都不发生变化的最小属性子集,借此获取简化的决策规则。 展开更多
关键词 不完备区间信息系统 偏序关系 粗糙集 知识约简 决策规则
在线阅读 下载PDF
不完备目标信息系统中基于差异关系的粗糙集 被引量:6
4
作者 魏利华 唐振民 +1 位作者 丁辉 吴刚 《南京理工大学学报》 EI CAS CSCD 北大核心 2010年第4期415-419,共5页
针对建立在等价关系上的传统粗糙集对差异关系研究不足的情况,基于差异关系对传统粗糙集模型进行了扩展。在不完备目标信息系统中定义差异关系并基于这种差异关系扩充粗糙集模型。等价关系反映事物共性,差异关系反映事物个性,基于差异... 针对建立在等价关系上的传统粗糙集对差异关系研究不足的情况,基于差异关系对传统粗糙集模型进行了扩展。在不完备目标信息系统中定义差异关系并基于这种差异关系扩充粗糙集模型。等价关系反映事物共性,差异关系反映事物个性,基于差异关系的粗糙集可用于约简否定规则。文中定义了一种差异关系,证明了基于差异关系的下、上近似集的主要性质,建立了相应的近似约简模型,最后给出了近似约简的判定定理和计算方法。 展开更多
关键词 不完备目标信息系统 等价关系 差异关系 下近似集 上近似集 近似约简
在线阅读 下载PDF
数据挖掘技术在软件工程中的应用综述 被引量:21
5
作者 毛澄映 卢炎生 胡小华 《计算机科学》 CSCD 北大核心 2009年第5期1-6,26,共7页
随着软件系统的规模和复杂性日益增长,软件开发已经演变成一项复杂的系统工程。软件工程中的对象、活动和过程更加难以控制和管理,因此该领域原有的经验直觉型的处理模式已经不能适应新的需求,而数据挖掘技术的引入为实现知识智能型软... 随着软件系统的规模和复杂性日益增长,软件开发已经演变成一项复杂的系统工程。软件工程中的对象、活动和过程更加难以控制和管理,因此该领域原有的经验直觉型的处理模式已经不能适应新的需求,而数据挖掘技术的引入为实现知识智能型软件工程提供了重要契机。以软件工程领域中的数据对象为主线,对在程序代码分析、故障检测、软件项目管理、开源软件开发等软件活动中所运用到的数据挖掘技术进行了系统的介绍和归纳,并在每一环节作了方法间的优劣性对比分析。最后还指出了若干值得进一步研究的方向。 展开更多
关键词 数据挖掘 软件工程 预测 软件项目管理 开源软件
在线阅读 下载PDF
科学发现的结构与时间属性 被引量:48
6
作者 陈超美 陈悦 《科学与管理》 2014年第3期27-32,F0003,共7页
社会网络分析理论认为在一个社会网络中节点对其他节点潜在的影响是因所在位置而不同的,因而网络中各个位置并非等同。我们也知道弱连接往往比强联系更有价值。复杂网络分析理论已证实许多常见网络具有小世界属性。我们能从这些社会网... 社会网络分析理论认为在一个社会网络中节点对其他节点潜在的影响是因所在位置而不同的,因而网络中各个位置并非等同。我们也知道弱连接往往比强联系更有价值。复杂网络分析理论已证实许多常见网络具有小世界属性。我们能从这些社会网络和信息网络的研究结果中获得什么?这些研究结果也存在于诸如作者合作和文献共被引这样的科学网络中吗?从根本上来说,是否存在一种能辨识出来的用于阐释科学发现演变的机制?正是针对这些问题,我们拟议了一个理论框架。这一框架强调基本理论及其在科学发现语境下的相互联系,包括社会网络中的结构洞理论、跨学科合作的边界客体概念和信息觅食理论。关于"科学知识创造与传播的识别"研究是富有挑战性的议题。 展开更多
关键词 科学发现 结构洞 边界客体 信息觅食 知识可视化
在线阅读 下载PDF
基于位置语言模型的中文信息检索系统的研究 被引量:3
7
作者 陈雅兰 胡小华 +1 位作者 涂新辉 何婷婷 《计算机科学》 CSCD 北大核心 2015年第7期265-269,共5页
在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位... 在大多数现有的检索模型中常常忽略了如下事实:一个文档中匹配到的查询词项的近邻性和打分时所基于的段落检索也可以被用来促进文档的打分。受此启发,提出了基于位置语言模型的中文信息检索系统,首先通过定义位置传播数的概念,为每个位置单独地建立语言模型;然后通过引入KL-divergence检索模型,并结合位置语言模型给每个位置单独打分;最后由多参数打分策略得到文档的最终得分。实验中还重点比较了基于词表和基于二元两种中文索引方法在位置语言模型中的检索效果。在标准NTCIR5、NTCIR6测试集上的实验结果表明,该检索方法在两种索引方式上都显著改善了中文检索系统的性能,并且优于向量空间模型、BM25概率模型、统计语言模型。 展开更多
关键词 位置语言模型 近邻性 段落检索 传播数
在线阅读 下载PDF
一种高效的数据流挖掘增量模糊决策树分类算法 被引量:18
8
作者 王涛 李舟军 +2 位作者 胡小华 颜跃进 陈火旺 《计算机学报》 EI CSCD 北大核心 2007年第8期1244-1250,共7页
数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域的研究工作带来了新挑战,而其中分类算法更是当前的研究热点.Domingos等在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决... 数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域的研究工作带来了新挑战,而其中分类算法更是当前的研究热点.Domingos等在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题.Gama等对VFDT进行扩展并实现了VFDTc,使系统能够处理连续属性.Peng等在传统数据挖掘环境下提出了基于模糊理论的连续属性平滑离散化方法.基于前述工作,作者设计并实现了一种基于线索化排序二叉树的增量模糊决策树分类算法fVFDT,其主要贡献有如下4点:(1)第一次设计并实现了数据流上的基于线索化二叉排序树(TBST)的连续属性处理方法.相比VFDT,fVFDT的样本插入时间复杂度由O(n2)降低到O(nlogn).当新样本到达时,VFDTc需要更新O(logn)个属性节点,而fVFDT只需要更新相应的一个节点即可;(2)改进了VFDTc连续属性的最佳划分节点选取的计算方法,使其时间复杂度由O(nlogn)降低到O(n);(3)根据Fayyad等的研究成果,相比VFDTc,fVFDT只需从更少的备选划分节点中选取最佳节点,备选划分节点数由O(n)降低到O(logn);(4)改进了传统数据挖掘环境下的基于模糊理论的连续属性平滑离散化方法,有效地处理了噪声数据,很好地提高了分类精度. 展开更多
关键词 数据流 线索化二叉排序树 连续属性 模糊离散化 增量 VFDT
在线阅读 下载PDF
共被引网络中介中心性的Zipf—Pareto分布研究 被引量:187
9
作者 林德明 陈超美 刘则渊 《情报学报》 CSSCI 北大核心 2011年第1期76-82,共7页
针对共被引网络的统计特性的研究,以科学计量学领域的权威期刊《科学计量学》(Scientometrics)为数据来源,建立共被引网络,明确了《科学计量学》(Scientometrics)中高被引文献与高中心性引文的特点;以该共被引网络为例,应用复杂网... 针对共被引网络的统计特性的研究,以科学计量学领域的权威期刊《科学计量学》(Scientometrics)为数据来源,建立共被引网络,明确了《科学计量学》(Scientometrics)中高被引文献与高中心性引文的特点;以该共被引网络为例,应用复杂网络分析方法,分析了共被引网络的统计特性,包括度分布、中介中心性的分布等。结果表明共被引网络是一个具有小世界、无标度特性的复杂网络;中介中心性的分布符合Zipf-Pareto分布;而且只有少部分引文节点具有高中介中心性的值,多数引文节点的中介中心性值都很小。 展开更多
关键词 共被引分析 共被引网络 中介中心性 Zipf-Pareto分布
在线阅读 下载PDF
不完备模糊系统的优势关系粗糙集与知识约简 被引量:8
10
作者 魏利华 唐振民 +1 位作者 杨习贝 祁云嵩 《计算机科学》 CSCD 北大核心 2009年第6期192-195,共4页
以不完备模糊决策系统为研究对象,根据拓展的优势关系,构建了粗糙模糊集模型,以获取不完备模糊决策系统中的"at least"和"at most"决策规则。为了获取简化的"at least"和"at most"规则,在不完... 以不完备模糊决策系统为研究对象,根据拓展的优势关系,构建了粗糙模糊集模型,以获取不完备模糊决策系统中的"at least"和"at most"决策规则。为了获取简化的"at least"和"at most"规则,在不完备模糊决策系统中,提出了两种相对约简(相对下近似约简与相对上近似约简)的概念,给出了求得这两种约简的判定定理及区分函数,并进行了实例分析。 展开更多
关键词 不完备模糊决策系统 优势关系 粗糙模糊集 决策规则 相对约简
在线阅读 下载PDF
基于冗余的仿真问答系统的轻量级局部文本分析
11
作者 胡小华 刘轩 +1 位作者 刘丹 陆伟 《图书情报知识》 CSSCI 北大核心 2009年第1期33-38,共6页
近年来,基于冗余的仿真问答系统因其轻量性及高效性受到越来越多的关注。与分析法不同的是,冗余法不需要大量的语料库也能得到满意的检索结果。这些方法通常重视全文信息而忽视局部环境,而局部环境往往可能包含了大量关于自然语言问题... 近年来,基于冗余的仿真问答系统因其轻量性及高效性受到越来越多的关注。与分析法不同的是,冗余法不需要大量的语料库也能得到满意的检索结果。这些方法通常重视全文信息而忽视局部环境,而局部环境往往可能包含了大量关于自然语言问题和答案间语义及语法关系的信息。本文中,我们介绍了一种新的轻量级局部文本分析技术以及实现该技术的Askdragon问答系统。该系统只需向搜索引擎提交一个不太严谨或较为模糊的问题,然后选取小部分高质量的检索结果进行答案抽取即可。问答系统在保持较高精度的同时还显著提升了效率。文章最后使用TREC(Text Retrieval Conference)问题集和四个时间类问题集对该系统进行了评测,评测结果显示系统的性能可以匹敌甚至超越了目前最先进的问答系统,如ARANEA和QUANTA。 展开更多
关键词 问答系统 局部文本分析 基于冗余的问答系统 仿真问答系统
在线阅读 下载PDF
海洋生态系统生物学简介 被引量:2
12
作者 蒋兴鹏 胡小华 《数学建模及其应用》 2013年第1期12-21,共10页
微生物以极大的数量统治了全球海洋,但是对其群体动力学、代谢复杂性以及协同作用等仍知之甚少。近年来,大规模测序技术的应用,尤其是宏基因组测序和16S rRNA测序已经逐渐成为研究海洋微生物生态系统的主要工具。这种不培养单个物种,而... 微生物以极大的数量统治了全球海洋,但是对其群体动力学、代谢复杂性以及协同作用等仍知之甚少。近年来,大规模测序技术的应用,尤其是宏基因组测序和16S rRNA测序已经逐渐成为研究海洋微生物生态系统的主要工具。这种不培养单个物种,而是直接通过测序提取所有微生物个体的遗传信息去研究微生物生态系统的成分和功能的方法,极大地促进了人们对海洋微生物世界的认识。本文简要介绍海洋生态系统学中的基本问题和最新计算分析方法。 展开更多
关键词 海洋生态系统生物学 数据降维 宏基因组谱 非负矩阵分解 复杂网络分析 动力学模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部