期刊文献+
共找到125篇文章
< 1 2 7 >
每页显示 20 50 100
基于熵权与集成学习的半监督小样本树种分类研究
1
作者 王静 李静 《森林工程》 北大核心 2025年第1期151-161,共11页
针对传统半监督自训练分类方法易导致数据集混乱,影响后续小样本树种分类精度这一问题,基于熵权法(en-tropy weight,EW)与集成学习(ensemble learning,EL)提出EW-EL的半监督小样本树种分类方法。EW-EL在传统半监督自训练分类方法的理论... 针对传统半监督自训练分类方法易导致数据集混乱,影响后续小样本树种分类精度这一问题,基于熵权法(en-tropy weight,EW)与集成学习(ensemble learning,EL)提出EW-EL的半监督小样本树种分类方法。EW-EL在传统半监督自训练分类方法的理论上引入EL的思想,以熵权法作为基础理论设计按基分类器当前训练周期下的F1分数计算的信息熵作为计算权重因子,再依信息熵越大基分类器越不稳定思想设计权重,使集成分类器分类概率更集中,减少集成分类器偏向性。结果显示,EW-EL较传统半监督自训练方法能更有效地均衡数据分布,使新加入数据的伪标签样本类别更准确。EW-EL所得到的小样本树种分类总精度(OA)为0.97、召回率(Recall)为0.96及Kappa系数为0.97,3种指标均优于监督分类、传统半监督自训练方法及利用传统EL机制所构建的半监督自训练方法。其中,EW-EL方法较融合软投票机制的半监督自训练方法,OA与Recall均提升了1%。EW-EL联合简单线性迭代聚类所制成的树种图在所选测试区内达到了94%。此外,进一步分析证明,EW-EL能通过集成诸多分类器,来实现更佳的小样本树种分类结果,更适用于低成本下的相关部门进行林业资源统计的工作。 展开更多
关键词 无人机影像 熵权法 深度学习 集成学习 监督小样本分类 树种分类 树种制图 EW-EL
在线阅读 下载PDF
一种半稠密视差图修补的深度学习半监督方法
2
作者 王淑香 官恺 +3 位作者 刘智 牛泽璇 金飞 林雨准 《测绘科学技术学报》 2024年第6期607-614,共8页
目前主流的匹配方法如块匹配、半全局块匹配方法等生成的视差图为半稠密状,在一些需要稠密视差图的场景无法使用,因此必须进行修补。然而传统的修补方法视差图精度有限,无法满足高精度场景需求。针对该问题提出了一种基于深度学习半监... 目前主流的匹配方法如块匹配、半全局块匹配方法等生成的视差图为半稠密状,在一些需要稠密视差图的场景无法使用,因此必须进行修补。然而传统的修补方法视差图精度有限,无法满足高精度场景需求。针对该问题提出了一种基于深度学习半监督的修补方法,该方法以传统匹配方法为基础,利用深度学习提取特征的优势,修补了视差图中的缺失区域。实验结果表明:1)基于半监督的修补方法精度远高于传统修补方法,实验中绝对终点误差和3像素误差相比于传统修补方法分别降低了33.98%和17.83%;2)虚拟场景的训练结果迁移学习至真实场景可进一步提升修补精度,绝对终点误差和3像素误差分别降低了5.17%和12.58%,而且能够加速收敛,具有重要的实用价值。 展开更多
关键词 全局块匹配方法 监督 视差图 深度学习 密集匹配
在线阅读 下载PDF
基于集成学习的半监督情感分类方法研究 被引量:12
3
作者 高伟 王中卿 李寿山 《中文信息学报》 CSCD 北大核心 2013年第3期120-126,共7页
情感分类旨在对文本所表达的情感色彩类别进行分类的任务。该文研究基于半监督学习的情感分类方法,即在很少规模的标注样本的基础上,借助非标注样本提高情感分类性能。为了提高半监督学习能力,该文提出了一种基于一致性标签的集成方法,... 情感分类旨在对文本所表达的情感色彩类别进行分类的任务。该文研究基于半监督学习的情感分类方法,即在很少规模的标注样本的基础上,借助非标注样本提高情感分类性能。为了提高半监督学习能力,该文提出了一种基于一致性标签的集成方法,用于融合两种主流的半监督情感分类方法:基于随机特征子空间的协同训练方法和标签传播方法。首先,使用这两种半监督学习方法训练出的分类器对未标注样本进行标注;其次,选取出标注一致的未标注样本;最后,使用这些挑选出的样本更新训练模型。实验结果表明,该方法能够有效降低对未标注样本的误标注率,从而获得比任一种半监督学习方法更好的分类效果。 展开更多
关键词 情感分类 监督 集成学习
在线阅读 下载PDF
基于多核集成的在线半监督学习方法 被引量:12
4
作者 黎铭 周志华 《计算机研究与发展》 EI CSCD 北大核心 2008年第12期2060-2068,共9页
在很多实时预测任务中,学习器需对实时采集到的数据在线地进行学习.由于数据采集的实时性,往往难以为采集到的所有数据提供标记.然而,目前的在线学习方法并不能利用未标记数据进行学习,致使学得的模型并不能即时反映数据的动态变化,降... 在很多实时预测任务中,学习器需对实时采集到的数据在线地进行学习.由于数据采集的实时性,往往难以为采集到的所有数据提供标记.然而,目前的在线学习方法并不能利用未标记数据进行学习,致使学得的模型并不能即时反映数据的动态变化,降低其实时响应能力.提出一种基于多核集成的在线半监督学习方法,使得在线学习器即使在接收到没有标记的数据时也能进行在线学习.该方法采用多个定义在不同RKHS中的函数对未标记数据预测的一致程度作为正则化项,在此基础上导出了多核集成在线半监督学习的即时风险函数,然后借助在线凸规划技术进行求解.在UCI数据集上的实验结果以及在网络入侵检测上的应用表明,该方法能够有效利用数据流中未标记数据来提升在线学习的性能. 展开更多
关键词 机器学习 数据挖掘 监督学习 在线学习 多核学习 集成学习
在线阅读 下载PDF
基于分类风险的半监督集成学习算法
5
作者 何玉林 朱鹏辉 +1 位作者 黄哲学 PHILIPPE Fournier-Viger 《模式识别与人工智能》 EI CSCD 北大核心 2024年第4期339-351,共13页
针对当前半监督集成学习算法对无标记样本预测时容易出现的标注混沌问题,文中提出基于分类风险的半监督集成学习算法(Classification Risk-Based Semi-supervised Ensemble Learning Algorithm,CR-SSEL).采用分类风险作为无标记样本置... 针对当前半监督集成学习算法对无标记样本预测时容易出现的标注混沌问题,文中提出基于分类风险的半监督集成学习算法(Classification Risk-Based Semi-supervised Ensemble Learning Algorithm,CR-SSEL).采用分类风险作为无标记样本置信度的评判标准,可有效衡量样本标注的不确定性程度.迭代地训练分类器,对高置信度样本进行再强化,使样本标注的不确定性逐渐降低,增强半监督集成学习算法的分类性能.在多个标准数据集上验证CR-SSEL的学习参数影响、训练过程收敛和泛化性能提升,实验表明随着基分类器个数的增加,CR-SSEL的训练过程呈收敛趋势,获得较优的分类精度. 展开更多
关键词 监督集成学习 集成学习 监督学习 分类风险 不确定性 置信度
在线阅读 下载PDF
基于一致性正则化的深度偏标记半监督学习方法
6
作者 祝彪 李艳 王硕 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第5期27-39,共13页
大部分偏标记学习方法假设所有训练样本都具有候选标记集,然而在许多现实场景下存在大量无标记样本.如何同时利用偏标记和无标记样本所隐含的信息构建学习模型,是偏标记半监督学习研究的关键问题.针对只含有少量标记样本、偏标记样本和... 大部分偏标记学习方法假设所有训练样本都具有候选标记集,然而在许多现实场景下存在大量无标记样本.如何同时利用偏标记和无标记样本所隐含的信息构建学习模型,是偏标记半监督学习研究的关键问题.针对只含有少量标记样本、偏标记样本和大量无标记样本的图像分类问题,运用一致性正则化方法和伪标记方法建立深度学习模型.对于偏标记和无标记样本,基于其弱增强的输出结果生成伪标记,且偏标记样本的伪标记限制于其候选标记集中.研究设计了新的损失函数,包含3个损失项,可以同时利用数据中的监督信息、弱监督信息和无监督信息.为了提高参与训练过程样本的可靠性,只选择高置信度伪标记的样本来计算两种增强后的输出交叉熵损失.实验结果说明,该方法(CR-SSPL)比现有半监督学习SOTA方法FlexMatch和偏标记学习代表方法具有更高的精度和稳定性,收敛速度也有明显提升. 展开更多
关键词 偏标记学习 监督学习 一致性正则化 伪标记方法 图像分类 深度学习
在线阅读 下载PDF
结合从句级远程监督与半监督集成学习的关系抽取方法 被引量:9
7
作者 余小康 陈岭 +3 位作者 郭敬 蔡雅雅 吴勇 王敬昌 《模式识别与人工智能》 EI CSCD 北大核心 2017年第1期54-63,共10页
针对传统基于远程监督的关系抽取方法中存在噪声和负例数据利用不足的问题,提出结合从句级远程监督和半监督集成学习的关系抽取方法.首先通过远程监督构建关系实例集,使用基于从句识别的去噪算法去除关系实例集中的噪声.然后抽取关系实... 针对传统基于远程监督的关系抽取方法中存在噪声和负例数据利用不足的问题,提出结合从句级远程监督和半监督集成学习的关系抽取方法.首先通过远程监督构建关系实例集,使用基于从句识别的去噪算法去除关系实例集中的噪声.然后抽取关系实例的词法特征并转化为分布式表征向量,构建特征数据集.最后选择特征数据集中所有正例数据和部分负例数据组成标注数据集,其余的负例数据组成未标注数据集,通过改进的半监督集成学习算法训练关系分类器.实验表明,相比基线方法,文中方法可以获得更高的分类准确率和召回率. 展开更多
关键词 关系抽取 远程监督 从句识别 去噪 监督集成学习
在线阅读 下载PDF
基于优化样本分布抽样集成学习的半监督文本分类方法研究 被引量:11
8
作者 徐禹洪 黄沛杰 《中文信息学报》 CSCD 北大核心 2017年第6期180-189,共10页
针对现有文本分类方法在即时性文本信息上面临的挑战,考虑到即时性文本信息具有已标注数据规模小的特点,为了提高半监督学习的分类性能,该文提出一种基于优化样本分布抽样集成学习的半监督文本分类方法。首先,通过运用一种新的样本抽样... 针对现有文本分类方法在即时性文本信息上面临的挑战,考虑到即时性文本信息具有已标注数据规模小的特点,为了提高半监督学习的分类性能,该文提出一种基于优化样本分布抽样集成学习的半监督文本分类方法。首先,通过运用一种新的样本抽样的优化策略,获取多个新的子分类器训练集,以增加训练集之间的多样性和减少噪声的扩散范围,从而提高分类器的总体泛化能力;然后,采用基于置信度相乘的投票机制对预测结果进行集成,对未标注数据进行标注;最后,选取适量的数据来更新训练模型。实验结果表明,该方法在长文本和短文本上都取得了优于研究进展方法的分类性能。 展开更多
关键词 文本分类 监督学习 集成学习 样本抽样策略
在线阅读 下载PDF
基于多视图的半监督集成学习方法
9
作者 张振良 刘君强 +1 位作者 黄亮 张曦 《计算机与数字工程》 2021年第1期130-137,共8页
针对集成学习方法中分类器差异性不足以及已标记样本少的问题,提出了一种新的半监督集成学习算法,将半监督方法引入到集成学习中,利用大量未标记样本的信息来细化每个基分类器,并且构造差异性更大的基分类器,首先通过多视图方法选取合... 针对集成学习方法中分类器差异性不足以及已标记样本少的问题,提出了一种新的半监督集成学习算法,将半监督方法引入到集成学习中,利用大量未标记样本的信息来细化每个基分类器,并且构造差异性更大的基分类器,首先通过多视图方法选取合适的未标记样本,并使用多视图方法将大量繁杂的特征属性分类,使用不同的特征降维方法对不同的视图进行降维,便与输入到学习模型中,同时采用相互独立的学习模型来增加集成的多样性。在UCI数据集上的实验结果表明,与使用单视图数据相比,使用多视图数据可以实现更准确的分类,并且与现有的诸如Boosting、三重训练算法比较,使用差异性更高的基学习器以及引入半监督方法能够有效提升集成学习的性能效果。 展开更多
关键词 监督 集成学习 多视图 特征降维
在线阅读 下载PDF
一种基于半监督集成学习的软件缺陷预测方法
10
作者 张莹 朱丽娜 《计算机与数字工程》 2023年第10期2390-2394,共5页
软件缺陷预测是提高软件质量的有效途径。为应对软件缺陷数据的不平衡分布和特征冗余等问题,提出一种改进的基于半监督集成学习的软件缺陷预测方法SSFSAdaBoost(Semi-supervised software defect prediction based on sampling,feature ... 软件缺陷预测是提高软件质量的有效途径。为应对软件缺陷数据的不平衡分布和特征冗余等问题,提出一种改进的基于半监督集成学习的软件缺陷预测方法SSFSAdaBoost(Semi-supervised software defect prediction based on sampling,feature selection and AdaBoost)。首先对训练集进行混合采样,其次使用SMA优化算法对采样后的训练集和测试集做特征选择,最后使用改进的半监督算法SUDAdaBoost进行集成。实验在三种公共数据集上进行验证,实验结果表明,该方法优于初始的Adaboost算法,并对缓解类不平衡问题具有良好的性能。 展开更多
关键词 软件缺陷预测 监督学习 集成学习 数据采样 特征选择
在线阅读 下载PDF
半监督集成学习综述 被引量:33
11
作者 蔡毅 朱秀芳 +1 位作者 孙章丽 陈阿娇 《计算机科学》 CSCD 北大核心 2017年第S1期7-13,共7页
半监督学习和集成学习是目前机器学习领域中两个非常重要的研究方向,半监督学习注重利用有标记样本与无标记样本来获得高性能分类器,而集成学习旨在利用多个学习器进行集成以提升弱学习器的精度。半监督集成学习是将半监督学习和集成学... 半监督学习和集成学习是目前机器学习领域中两个非常重要的研究方向,半监督学习注重利用有标记样本与无标记样本来获得高性能分类器,而集成学习旨在利用多个学习器进行集成以提升弱学习器的精度。半监督集成学习是将半监督学习和集成学习进行组合来提升分类器泛化性能的机器学习新方法。首先,在分析半监督集成学习发展过程的基础上,发现半监督集成学习起源于基于分歧的半监督学习方法;然后,综合分析现有半监督集成学习方法,将其分为基于半监督的集成学习与基于集成的半监督学习两大类,并对主要的半监督集成方法进行了介绍;最后,对现有研究进了总结,并讨论了未来值得研究的问题。 展开更多
关键词 监督学习 集成学习 监督集成学习 BOOSTING BAGGING 泛化性能
在线阅读 下载PDF
基于半监督集成学习的软件缺陷预测 被引量:8
12
作者 王铁建 吴飞 荆晓远 《模式识别与人工智能》 EI CSCD 北大核心 2017年第7期646-652,共7页
在软件缺陷预测中,标记样本不足与类不平衡问题会影响预测结果.为了解决这些问题,文中提出基于半监督集成学习的软件缺陷预测方法.该方法利用大量存在的未标记样本进行学习,得到较好的分类器,同时能集成一系列弱分类器,减少多数类数据... 在软件缺陷预测中,标记样本不足与类不平衡问题会影响预测结果.为了解决这些问题,文中提出基于半监督集成学习的软件缺陷预测方法.该方法利用大量存在的未标记样本进行学习,得到较好的分类器,同时能集成一系列弱分类器,减少多数类数据对预测产生的偏倚.考虑到预测风险成本问题,文中还采用训练样本集权重向量更新策略,降低有缺陷模块预测为无缺陷模块的风险.在NASA MDP数据集上的对比实验表明,文中方法具有较好的预测效果. 展开更多
关键词 软件缺陷预测 类不平衡 监督学习 集成学习
在线阅读 下载PDF
基于局部聚类与图方法的半监督学习算法 被引量:6
13
作者 李明 杨艳屏 占惠融 《自动化学报》 EI CSCD 北大核心 2010年第12期1655-1660,共6页
基于图的算法已经成为半监督学习中的一种流行方法,该方法把数据定义为图的节点,用图的边表示数据之间的关系,在各种数据分布情况下都具有很高的分类准确度.然而图方法的计算复杂度比较高,当图的规模比较大时,计算所需要的时间和存储都... 基于图的算法已经成为半监督学习中的一种流行方法,该方法把数据定义为图的节点,用图的边表示数据之间的关系,在各种数据分布情况下都具有很高的分类准确度.然而图方法的计算复杂度比较高,当图的规模比较大时,计算所需要的时间和存储都非常大,这在一定程度上限制了图方法的使用.因此,如何控制图的大小是基于图的半监督学习算法中的一个重要问题.本文提出了一种基于密度估计的快速聚类方法,可以在局部范围对数据点进行聚类,以聚类形成的子集作为构图的节点,从而大大降低了图的复杂度.新的聚类方法计算量较小,通过推导得到的距离函数能较好地保持原有数据分布.实验结果表明,通过局部聚类后构建的小图在分类效果上与在原图上的结果相当,同时在计算速度上有极大的提高. 展开更多
关键词 监督学习 方法 密度估计 局部聚类
在线阅读 下载PDF
SUCE:基于聚类集成的半监督二分类方法 被引量:4
14
作者 闵帆 王宏杰 +1 位作者 刘福伦 王轩 《智能系统学报》 CSCD 北大核心 2018年第6期974-980,共7页
半监督学习和集成学习是目前机器学习领域中的重要方法。半监督学习利用未标记样本,而集成学习综合多个弱学习器,以提高分类精度。针对名词型数据,本文提出一种融合聚类和集成学习的半监督分类方法SUCE。在不同的参数设置下,采用多个聚... 半监督学习和集成学习是目前机器学习领域中的重要方法。半监督学习利用未标记样本,而集成学习综合多个弱学习器,以提高分类精度。针对名词型数据,本文提出一种融合聚类和集成学习的半监督分类方法SUCE。在不同的参数设置下,采用多个聚类算法生成大量的弱学习器;利用已有的类标签信息,对弱学习器进行评价和选择;通过集成弱学习器对测试集进行预分类,并将置信度高的样本放入训练集;利用扩展的训练集,使用ID3、Nave Bayes、 kNN、C4.5、OneR、Logistic等基础算法对其他样本进行分类。在UCI数据集上的实验结果表明,当训练样本较少时,本方法能稳定提高多数基础算法的准确性。 展开更多
关键词 集成学习 聚类 聚类集成 监督 二分类
在线阅读 下载PDF
基于半监督学习的客户信用评估集成模型研究 被引量:7
15
作者 黄静 薛书田 肖进 《软科学》 CSSCI 北大核心 2017年第7期131-134,共4页
将半监督学习技术与多分类器集成模型Bagging相结合,构建类别分布不平衡环境下基于Bagging的半监督集成模型(SSEBI),综合利用有、无类别标签的样本来提高模型的性能。该模型主要包括三个阶段:(1)从无类别标签数据集中选择性标记一部分... 将半监督学习技术与多分类器集成模型Bagging相结合,构建类别分布不平衡环境下基于Bagging的半监督集成模型(SSEBI),综合利用有、无类别标签的样本来提高模型的性能。该模型主要包括三个阶段:(1)从无类别标签数据集中选择性标记一部分样本并训练若干个基本分类器;(2)使用训练好的基本分类器对测试集样本进行分类;(3)对分类结果进行集成得到最终分类结果。在五个客户信用评估数据集上进行实证分析,结果表明本研究提出的SSEBI模型的有效性。 展开更多
关键词 信用评估 类别分布不平衡 监督学习 BAGGING 监督集成
在线阅读 下载PDF
基于多分类器投票集成的半监督情感分类方法研究 被引量:9
16
作者 黄伟 范磊 《中文信息学报》 CSCD 北大核心 2016年第2期41-49,106,共10页
情感分类是目前自然语言处理领域的一个具有挑战性的研究热点,该文主要研究基于半监督的文本情感分类问题。传统基于Co-training的半监督情感分类方法要求文本具备大量有用的属性集,其训练过程是线性时间的计算复杂度并且不适用于非平... 情感分类是目前自然语言处理领域的一个具有挑战性的研究热点,该文主要研究基于半监督的文本情感分类问题。传统基于Co-training的半监督情感分类方法要求文本具备大量有用的属性集,其训练过程是线性时间的计算复杂度并且不适用于非平衡语料。该文提出了一种基于多分类器投票集成的半监督情感分类方法,通过选取不同的训练集、特征参数和分类方法构建了一组有差异的子分类器,每轮通过简单投票挑选出置信度最高的样本使训练集扩大一倍并更新训练模型。该方法使得子分类器可共享有用的属性集,具有对数时间复杂度并且可用于非平衡语料。实验结果表明我们的方法在不同语种、不同领域、不同规模大小,平衡和非平衡语料的情感分类中均具有良好效果。 展开更多
关键词 情感分类 集成学习 监督学习
在线阅读 下载PDF
基于半监督深度学习法的网络大数据集成挖掘 被引量:8
17
作者 纪冲 刘岩 《计算机仿真》 北大核心 2021年第7期313-316,共4页
传统的数据集成挖掘方法在集成与挖掘两个步骤之间存在较大误差,导致大数据出现乱码问题,数据显示不全。为解决上述问题,提出基于半监督深度学习法的大数据集成挖掘方法。利用有监督与无监督深度学习间的机器学习,组成半监督深度学习。... 传统的数据集成挖掘方法在集成与挖掘两个步骤之间存在较大误差,导致大数据出现乱码问题,数据显示不全。为解决上述问题,提出基于半监督深度学习法的大数据集成挖掘方法。利用有监督与无监督深度学习间的机器学习,组成半监督深度学习。利用支持向量数据组建立超球体。依据超球体结合标记样本,组建半监督深度学习数据检测模型,筛选样本特征词,利用半监督深度学习方法训练单分类SVDD模型,实现网络大数据集成挖掘。仿真结果证明,所提方法能够高精度、高效的对大数据完成集成挖掘,具有理想的应用性能。 展开更多
关键词 监督学习 网络大数据 集成挖掘 检测模型
在线阅读 下载PDF
交叉口车辆行为感知在线半监督混合方法
18
作者 张海伦 王广玮 +3 位作者 孟庆文 许庆 王建强 李克强 《汽车工程》 EI CSCD 北大核心 2024年第11期1993-2004,共12页
自动驾驶感知系统须对目标车辆运动进行感知,以制定合理交互决策。针对行为感知在时间上的滞后性和数据中可能存在的波动和异常值导致感知准确率差的问题,本文提出一种在线半监督混合方法。首先,采用自回归积分移动平均和在线梯度下降... 自动驾驶感知系统须对目标车辆运动进行感知,以制定合理交互决策。针对行为感知在时间上的滞后性和数据中可能存在的波动和异常值导致感知准确率差的问题,本文提出一种在线半监督混合方法。首先,采用自回归积分移动平均和在线梯度下降优化器设计基于数据驱动的车辆运动状态在线预测算法。然后,构建基于微簇的初始模型,并以K近邻为基分类器建立集成学习策略,设计错误驱动代表性学习和指数衰减策略实现对初始模型的迭代更新。最后,基于驾驶模拟平台采集了验证所提算法有效性的实验数据。结果表明,所提出的方法对于车辆行为波动具有快速适应性,在线预测算法可准确预测车辆运动趋势,行为感知算法对于不同预测时间下的车辆行为均有较强适应能力。 展开更多
关键词 自动驾驶 行为预测 自回归积分移动平均 集成学习 监督学习
在线阅读 下载PDF
基于Tri-training GPR的半监督软测量建模方法
19
作者 马君霞 李林涛 熊伟丽 《化工学报》 EI CSCD 北大核心 2024年第7期2613-2623,共11页
集成学习因通过构建并结合多个学习器,常获得比单一学习器显著优越的泛化能力。但是在标记数据比例较少时,建立高性能的集成学习软测量模型依然是个挑战。针对这一个问题,提出一种基于半监督集成学习的软测量建模方法——Tri-training ... 集成学习因通过构建并结合多个学习器,常获得比单一学习器显著优越的泛化能力。但是在标记数据比例较少时,建立高性能的集成学习软测量模型依然是个挑战。针对这一个问题,提出一种基于半监督集成学习的软测量建模方法——Tri-training GPR模型。该建模策略充分发挥了半监督学习的优势,减轻建模过程对标记样本数据的需求,在低数据标签率下,仍能通过对无标记数据进行筛选从而扩充可用于建模的有标记样本数据集,并进一步结合半监督学习和集成学习的优势,提出一种新的选择高置信度样本的思路。将所提方法应用于青霉素发酵和脱丁烷塔过程,建立青霉素和丁烷浓度预测软测量模型,与传统的建模方法相比获得了更优的预测结果,验证了模型的有效性。 展开更多
关键词 软测量 集成学习 监督学习 TRI-TRAINING 高斯过程回归 过程控制 动力学模型 化学过程
在线阅读 下载PDF
一种半监督集成跨项目软件缺陷预测方法 被引量:17
20
作者 何吉元 孟昭鹏 +2 位作者 陈翔 王赞 樊向宇 《软件学报》 EI CSCD 北大核心 2017年第6期1455-1473,共19页
软件缺陷预测方法可以在项目的开发初期,通过预先识别出所有可能含有缺陷的软件模块来优化测试资源的分配.早期的缺陷预测研究大多集中于同项目缺陷预测,但同项目缺陷预测需要充足的历史数据,而在实际应用中,可能需要预测项目的历史数... 软件缺陷预测方法可以在项目的开发初期,通过预先识别出所有可能含有缺陷的软件模块来优化测试资源的分配.早期的缺陷预测研究大多集中于同项目缺陷预测,但同项目缺陷预测需要充足的历史数据,而在实际应用中,可能需要预测项目的历史数据较为稀缺,或这个项目是一个全新项目.因此,跨项目缺陷预测问题成为当前软件缺陷预测领域内的一个研究热点,其研究挑战在于源项目与目标项目数据集间存在的分布差异性以及数据集内存在的类不平衡问题.受到基于搜索的软件工程思想的启发,提出了一种基于搜索的半监督集成跨项目软件缺陷预测方法 S^3EL.该方法首先通过调整训练集中各类数据的分布比例,构建出多个朴素贝叶斯基分类器;随后,利用具有全局搜索能力的遗传算法,基于少量已标记目标实例对上述基分类器进行集成,并构建出最终的缺陷预测模型.在Promise数据集及AEEEM数据集上与多个经典的跨项目缺陷预测方法(Burak过滤法、Peters过滤法、TCA+、CODEP及HYDRA)进行了对比.以F1值作为评测指标,结果表明:在大部分情况下,S^3EL方法可以取得最好的预测性能. 展开更多
关键词 跨项目软件缺陷预测 监督学习 集成学习 遗传算法 朴素贝叶斯
在线阅读 下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部