-
题名数据挖掘中采样技术的研究
被引量:5
- 1
-
-
作者
郑吉平
秦小麟
-
机构
南京航空航天大学信息科学与技术学院
-
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2005年第11期1946-1949,共4页
-
基金
航空科学基金资助课题(02F52033)
-
文摘
针对日益增长的海量数据和信息,通常采取有效的采样技术对大数据集进行采样,然后通过对样本的分析得到数据总体的相关模式。首先论述了关于样本的一些基本概念:利用采样技术对大数据集和海量数据进行分析处理,讨论了普通抽样技术与数据挖掘中的采样技术的异同。然后对目前普遍采用的采样技术进行了分类,重点研究了简单随机采样和分层随机采样,并对不同采样技术进行了比较。最后给出数据挖掘中利用采样技术的一个实现。
-
关键词
样本
简单随机采样
分层随机采样
数据挖掘
模式
-
Keywords
sample
simple-random-sampling
stratified-random-sampling
data-mining
pattern
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名不同采样设计评估鱼类群落效果比较
被引量:24
- 2
-
-
作者
赵静
章守宇
林军
周曦杰
-
机构
上海海洋大学海洋科学学院
上海海洋大学海洋生态系统与环境实验室
-
出处
《应用生态学报》
CAS
CSCD
北大核心
2014年第4期1181-1187,共7页
-
基金
国家自然科学基金项目(41176110)
国家"973"计划前期研究专项(2011CB111608)
+1 种基金
国家海洋公益性项目(201005013)
浙江省自然科学基金项目(LY13D060006)资助
-
文摘
鱼类群落生态学研究结果的准确性很大程度上依赖于采样设计的合理性和准确性,正确的采样调查设计不仅可以降低调查成本,其结果也对渔业资源的评估或者管理起到相当重要的作用.本文利用计算机模拟定点采样、简单随机采样和分层采样,比较了3种采样设计的采样效果、相对误差及相对偏差.结果表明:定点采样设计的采样效果(采样效果平均值为3.37)要弱于简单随机采样和分层随机采样(采样效果平均值为0.961).3种采样设计中,分层采样设计在鱼类群落丰富度评估时表现最好,其采样效果、相对误差和相对偏差表现最佳.随着采样数的增加,分层采样设计的采样效果有所下降,但其采样精度提高.
-
关键词
采样设计
鱼类群落
丰富度
定点采样
简单随机采样
分层采样
-
Keywords
sampling design
fish community
richness index
stationary sampling
sample ran-dom sampling
stratified random sampling.
-
分类号
S932.4
[农业科学—渔业资源]
-