期刊文献+
共找到713篇文章
< 1 2 36 >
每页显示 20 50 100
基于Stacking集成学习算法的工作人员用车记录异常数据识别方法
1
作者 魏葳 耿一婷 +1 位作者 吕倩 杨显军 《计算机应用文摘》 2023年第7期124-126,共3页
针对电网企业工作人员用车记录核验效率较低的问题,文章提出基于Stacking集成学习算法的工作人员用车记录异常数据识别方法。挖掘工作人员用车记录异常数据,通过数据清洗、数据插值操作预处理异常数据,基于Stacking算法中集成学习器的训... 针对电网企业工作人员用车记录核验效率较低的问题,文章提出基于Stacking集成学习算法的工作人员用车记录异常数据识别方法。挖掘工作人员用车记录异常数据,通过数据清洗、数据插值操作预处理异常数据,基于Stacking算法中集成学习器的训练,实现异常数据识别。实验结果表明,文章方法识别工作人员用车记录异常数据的精确率为98.55%、召回率为95.86%,验证了该方法的可行性。 展开更多
关键词 stacking集成学习算法 用车记录 异常数据 识别方法
在线阅读 下载PDF
基于Stacking集成学习算法的个人信用评估模型 被引量:3
2
作者 彭润泽 《统计学与应用》 2017年第4期411-417,共7页
传统机器学习算法的预测精度往往依赖于具体的问题,集成学习通过综合若干基分类器的预测结果,实现了分类效果的显著提升。对集成学习的思想进行了简单地介绍,阐述了Stacking集成相对于传统经典集成算法的优势。并基于Stacking集成框架,... 传统机器学习算法的预测精度往往依赖于具体的问题,集成学习通过综合若干基分类器的预测结果,实现了分类效果的显著提升。对集成学习的思想进行了简单地介绍,阐述了Stacking集成相对于传统经典集成算法的优势。并基于Stacking集成框架,利用UCI的信用评估数据集,构建两层分类器学习模型对个人信用进行评估。实证分析的结果表明,相对于单一的机器学习方法,以及对这些单一机器学习方法的结果进行简单的平均集成,两层分类器的Stacking集成学习有着更好的预测效果。 展开更多
关键词 集成学习 stacking 信用评估
在线阅读 下载PDF
基于递归分析和Stacking集成学习的轴承故障诊断方法
3
作者 黄静静 武文媗 +2 位作者 田宇 王灿 王茂发 《南京信息工程大学学报》 北大核心 2025年第2期235-244,共10页
为了更加有效地挖掘滚动轴承信号中所具有的非线性信息并提高轴承故障诊断的准确率,提出一种基于递归分析和Stacking集成学习的轴承故障诊断方法.通过递归分析理论将轴承信号中的非线性信息映射到二维递归图中,分别从图像识别和递归定... 为了更加有效地挖掘滚动轴承信号中所具有的非线性信息并提高轴承故障诊断的准确率,提出一种基于递归分析和Stacking集成学习的轴承故障诊断方法.通过递归分析理论将轴承信号中的非线性信息映射到二维递归图中,分别从图像识别和递归定量分析的角度出发,对应建立了卷积神经网络和支持向量机两个子模型.使用Stacking方法将两个模型进行集成,可以在一定程度上结合两个模型的不同特点,充分发挥两个不同模型的优势.实验结果表明,该方法可以有效提高轴承振动信号的分类准确率,并在不同负载条件下表现出色且稳定,为轴承故障诊断提供了一种可靠的解决方案. 展开更多
关键词 故障诊断 滚动轴承 递归分析 stacking集成学习
在线阅读 下载PDF
基于Stacking集成学习的恶意URL识别方法
4
作者 孙杨 邱祥锋 《集美大学学报(自然科学版)》 2025年第2期179-185,共7页
针对传统URL(uniform resource locator)检测方法在恶意URL检测时存在的精确率不高、实时性差等问题,提出一种基于Stacking集成学习的算法模型。该模型用ADB(adaptive boosting)、LR(logistic regression)、SVM(support vector machine)... 针对传统URL(uniform resource locator)检测方法在恶意URL检测时存在的精确率不高、实时性差等问题,提出一种基于Stacking集成学习的算法模型。该模型用ADB(adaptive boosting)、LR(logistic regression)、SVM(support vector machine)、GBDT(gradient boosting decision tree)和GNB(gaussian naive bayes)5种机器学习算法作为初级分类器,其多层结构使不同机器学习模型之间可以优势互补,提升检测系统的整体性能表现。最后,通过在测试集上进行性能评估,选出性能最优的集成组合。实验结果表明,基于Stacking方法融合基学习器的集成学习模型在召回率、准确率、精确率、F 1值等多项指标上优于传统机器学习模型,对恶意URL检测的准确率可达96.77%。 展开更多
关键词 恶意URL 机器识别 stacking模型 集成学习 学习
在线阅读 下载PDF
基于特征过滤法和Stacking集成学习的无人机影像作物精细分类
5
作者 刘朝辉 杨风暴 张琳 《现代电子技术》 北大核心 2025年第7期1-10,共10页
针对目前多种典型作物分类中特征冗余导致同科作物混淆、分类精度低的问题,文中提出一种结合特征过滤法筛选特征和Stacking集成学习的作物精细分类方法。首先,结合敏感波段构造新型植被指数并进行阈值分割,实现作物区域提取;然后,提取... 针对目前多种典型作物分类中特征冗余导致同科作物混淆、分类精度低的问题,文中提出一种结合特征过滤法筛选特征和Stacking集成学习的作物精细分类方法。首先,结合敏感波段构造新型植被指数并进行阈值分割,实现作物区域提取;然后,提取不同作物的颜色和纹理特征,进而计算单类作物特征系数和作物间特征差异系数,实现各典型作物的分类特征过滤法优选;最后,构建融合多种机器学习算法的Stacking集成学习作物分类模型,其中第一层的基学习器选择随机森林、支持向量机、K⁃最近邻算法,第二层的元学习器选择逻辑回归模型,实现多种典型作物精细分类。实验结果表明,所提方法对7种典型作物的总体分类精度和Kappa系数分别为85.2%和83.34%,相比于未进行特征选择的分类结果分别提升了2.18%和3.68%,具有较高的分类精度,为多种典型作物的精细分类提供了新方法。 展开更多
关键词 作物分类 特征选择 stacking集成学习 植被指数 阈值分割 衍生特征
在线阅读 下载PDF
rtTorTIM:基于多模态特征融合和Stacking集成学习的实时Tor流量识别方法
6
作者 王宇飞 刘强 +3 位作者 张唯贞 伍晓洁 李佳雯 王煜恒 《计算机工程与科学》 北大核心 2025年第2期238-246,共9页
以Tor网络为代表的匿名网络在带来强隐私性保护的同时也为网络违法犯罪活动提供了温床,因此,开展实时、高精度的Tor网络流量识别研究具有重要的现实意义。为此,针对现有研究存在泛化性不强和实时性差等问题,提出了一种基于多模态特征融... 以Tor网络为代表的匿名网络在带来强隐私性保护的同时也为网络违法犯罪活动提供了温床,因此,开展实时、高精度的Tor网络流量识别研究具有重要的现实意义。为此,针对现有研究存在泛化性不强和实时性差等问题,提出了一种基于多模态特征融合和Stacking集成学习技术的Tor网络流量识别方法rtTorTIM。具体来讲,该方法首先提取Tor网络流量的主机级、流级和包级3种模态相关特征并构造特征数据集;随后,rtTorTIM选取随机森林、线性回归和K-近邻方法作为基学习器,并使用一个线性神经网络进行决策融合,从而构建起一个2层Stacking流量分类器。基于ISCX Tor 2016公开数据集的对比实验结果表明,rtTorTIM方法在Tor流量识别上的准确率、精确率和召回率均达到了99%,同时该方法在分类实时性上也展现出更优的性能。 展开更多
关键词 Tor匿名网络 多模态特征提取 实时流量识别 stacking集成学习 机器学习
在线阅读 下载PDF
基于异质Stacking集成学习的大学生学业风险预测及早预警
7
作者 杨舟 崔彩霞 《太原师范学院学报(自然科学版)》 2025年第1期22-29,39,共9页
针对学生学业风险预测提出一种基于异质Stacking集成学习模型,对有潜在学业危机的学生进行早预警,减少学生的辍学率和教育资源的浪费,进行有效的补救及调整.该模型运用皮尔逊相关分析技术对原始数据集进行特征选择,然后通过支持向量机... 针对学生学业风险预测提出一种基于异质Stacking集成学习模型,对有潜在学业危机的学生进行早预警,减少学生的辍学率和教育资源的浪费,进行有效的补救及调整.该模型运用皮尔逊相关分析技术对原始数据集进行特征选择,然后通过支持向量机、极端梯度提升树、K近邻和随机森林等4个基础模型来构建初级分类器,逻辑回归为次级分类器两层结构来构建Stacking集成学习模型.实验结果表明,与传统机器学习模型相比,该模型在准确率、精确率、召回率、F1分数和G-Mean等指标上有明显提升. 展开更多
关键词 stacking 集成学习 学业风险预测 早预警
在线阅读 下载PDF
基于Stacking算法集成学习的页岩油储层总有机碳含量评价方法
8
作者 宋延杰 刘英杰 +1 位作者 唐晓敏 张兆谦 《测井技术》 CAS 2024年第2期163-178,共16页
总有机碳含量(TOC)是页岩油储层评价的重要参数,而传统总有机碳含量测井评价方法精度较低且普适性较差,机器学习模型在一定程度上提高了总有机碳含量预测精度,但结果存在不稳定性。为了进一步提高页岩油储层总有机碳含量预测精度,基于... 总有机碳含量(TOC)是页岩油储层评价的重要参数,而传统总有机碳含量测井评价方法精度较低且普适性较差,机器学习模型在一定程度上提高了总有机碳含量预测精度,但结果存在不稳定性。为了进一步提高页岩油储层总有机碳含量预测精度,基于有机质岩石物理特征和不同总有机碳含量测井响应特征的深入分析,优选出深侧向电阻率、声波时差、补偿中子和密度测井曲线作为总有机碳含量的敏感测井响应,并将其作为输入特征,以岩心分析总有机碳含量作为期望输出值,分别建立了决策树模型、支持向量回归机模型、BP(Back Propagation)神经网络模型,并建立了以决策树模型为基模型、支持向量回归机模型为元模型的Stacking算法集成学习模型。利用B油田A区块的岩心样本数据和实际井数据对不同模型预测总有机碳含量结果进行了验证,结果表明,基于Stacking算法的集成学习模型的总有机碳含量预测精度最高,相较于决策树模型、支持向量回归机模型、BP神经网络模型和改进的ΔlgR法,预测精度有较大提高。因此,基于Stacking算法的集成学习模型为该研究区最有效的总有机碳含量计算方法,这为准确地评估页岩油储层的生烃潜力、确保页岩油储层的高效开采及资源利用奠定了基础。 展开更多
关键词 页岩油储层评价 总有机碳含量 决策树 支持向量回归机 stacking算法 集成学习
在线阅读 下载PDF
基于ISSA-Stacking集成学习的共享单车租赁量预测
9
作者 张泽 韩晓明 韩晓霞 《控制工程》 北大核心 2025年第1期39-50,共12页
针对共享单车供需不平衡问题,结合Stacking算法和改进麻雀搜索算法(improved sparrow search algorithm,ISSA),提出了一种基于ISSA-Stacking算法的共享单车租赁量预测模型。首先,利用相关性分析法和轻量级梯度提升机进行特征选择;然后,... 针对共享单车供需不平衡问题,结合Stacking算法和改进麻雀搜索算法(improved sparrow search algorithm,ISSA),提出了一种基于ISSA-Stacking算法的共享单车租赁量预测模型。首先,利用相关性分析法和轻量级梯度提升机进行特征选择;然后,建立多种异质回归预测模型并采用ISSA对各模型的关键超参数进行优化,通过引入精英反向学习策略和自适应种群比例因子来提高麻雀搜索算法的全局搜索能力和收敛速度;最后,利用Stacking算法的集成学习思想对各模型进行融合。实验使用美国华盛顿地区的共享单车出行数据进行租赁量预测,通过对比分析验证了所提融合模型相比单一模型在共享单车租赁量预测方面具有更高的预测精度。 展开更多
关键词 共享单车租赁量预测 集成学习 改进麻雀搜索算法 特征选择
在线阅读 下载PDF
基于Stacking集成学习模型的轨道交通客流量关键特征分析与预测控制研究——以武汉市为例
10
作者 王寒 任双喜 +1 位作者 侯凯达 刘展 《统计与管理》 2025年第4期49-58,共10页
文章利用国家气象统计局、武汉地铁运营、武汉地铁数据库、武汉交通运输局提供的武汉市气象数据、武汉市活动举办数据,构建了以月份、天气、工作日、节假日属性、活动类型、网络热度等为自变量,客流量为因变量的数据集。首先,利用随机... 文章利用国家气象统计局、武汉地铁运营、武汉地铁数据库、武汉交通运输局提供的武汉市气象数据、武汉市活动举办数据,构建了以月份、天气、工作日、节假日属性、活动类型、网络热度等为自变量,客流量为因变量的数据集。首先,利用随机森林算法识别出影响客流量的六大关键特征:节假日属性、音乐类活动、雨雪天气、抖音热度、工作日和体育类活动。其次,通过Stacking模型集成LightGBM、XGBoost和LSTM模型,结合交叉验证和SHAP模型进行性能评估与超参数优化,避免过拟合并增强泛化能力。接着,基于蚁群算法,进一步求解客流顶峰的产生规律及条件,提出了最大和最小客流量的典型场景。最后,基于训练良好的预测模型,提出客流量干预方法。文章为武汉市轨道交通管理提供了科学的决策支持,并为运用数据分析技术优化城市公共交通系统提供了重要参考。 展开更多
关键词 stacking集成学习模型 随机森林算法 蚁群算法 预测控制 武汉市轨道交通
在线阅读 下载PDF
基于Stacking集成学习的链路质量评估模型
11
作者 胡余强 《计算机与数字工程》 2025年第2期510-516,共7页
为了提高不同实验场景中无线传感网络的链路质量评估效果,论文通过分析单分类器与集成分类器分别在链路质量样本数据中分类效果选择综合效果好的基学习器,然后在基学习器的基础上选择元学习器,实现构建一种基于Stacking集成学习的链路... 为了提高不同实验场景中无线传感网络的链路质量评估效果,论文通过分析单分类器与集成分类器分别在链路质量样本数据中分类效果选择综合效果好的基学习器,然后在基学习器的基础上选择元学习器,实现构建一种基于Stacking集成学习的链路质量评估模型。实验表明,该评估模型在准确率、精确率、召回率、F1-score评估指标上有更好的效果。 展开更多
关键词 无线传感网络 链路质量评估 stacking集成学习
在线阅读 下载PDF
基于IHHO-Stacking集成模型的车辆驾驶性评估
12
作者 莫易敏 王相 +2 位作者 王哲 蒋华梁 李琼 《汽车技术》 北大核心 2025年第3期39-45,共7页
为解决车辆驾驶性主观评价一致性差及客观评价无法反映主观感受的问题,提出了一种基于堆叠(Stacking)集成学习方法的评价模型,首先研究了车辆加速工况特性,定义了工况驾驶性客观评价指标,使用评价指标作为输入特征训练Stacking集成模型... 为解决车辆驾驶性主观评价一致性差及客观评价无法反映主观感受的问题,提出了一种基于堆叠(Stacking)集成学习方法的评价模型,首先研究了车辆加速工况特性,定义了工况驾驶性客观评价指标,使用评价指标作为输入特征训练Stacking集成模型,并且使用改进的哈里斯鹰优化(IHHO)算法优化了Stacking集成模型,提高了预测性能。最后通过道路试验表明,IHHO-Stacking集成模型的性能均优于单个机器学习模型,IHHO-Stacking集成模型预测合格率达95%,能够更有效完成驾驶性评价。 展开更多
关键词 驾驶性 主观评价 改进的哈里斯鹰算法 stacking 集成模型 客观评价
在线阅读 下载PDF
考虑复合指标优化模态分解和Stacking集成的综合能源系统多元负荷预测
13
作者 冉启武 石卓见 +2 位作者 刘阳 黄杰 张宇航 《电网技术》 北大核心 2025年第3期1098-1108,I0071-I0075,共16页
为提高综合能源系统多元负荷分解水平及预测模型的整体性能,提出考虑复合指标优化模态分解和Stacking集成的综合能源系统多元负荷预测方法。首先以排列熵结合互信息为适应度函数,利用金豺优化算法自适应获取变分模态分解的最优参数组合... 为提高综合能源系统多元负荷分解水平及预测模型的整体性能,提出考虑复合指标优化模态分解和Stacking集成的综合能源系统多元负荷预测方法。首先以排列熵结合互信息为适应度函数,利用金豺优化算法自适应获取变分模态分解的最优参数组合,进而将多元负荷序列分解为本征模态函数集合;其次,通过基于反向传播(back propagation,BP)神经网络扰动的平均影响值(mean impact value,MIV)算法对与多元负荷相关的气象、日期及负荷因素进行特征筛选,从而为多元负荷构建高耦合度的特征矩阵;充分考虑到各单一模型的差异性及优势性,在采用k折交叉验证法减少过拟合的基础上,构建Stacking集成学习模型对多元负荷进行预测;最后采用美国亚利桑那州立大学坦佩校区多元负荷数据集进行实例验证,结果显示所提方法在电、冷、热负荷预测中的平均绝对百分比误差分别达到了0.903%、2.713%和1.616%,预测精度相比其他预测模型具有较大提升。 展开更多
关键词 多元负荷预测 综合能源系统 平均影响值算法 stacking集成学习 金豺优化算法 复合指标
在线阅读 下载PDF
融合属性编码与集成学习的混合推荐算法
14
作者 邱宁佳 董伟杰 《计算机工程与设计》 北大核心 2025年第2期508-514,共7页
为解决传统推荐算法对用户与物品的基础属性信息利用不充分,以及使用单一推荐算法导致推荐模型表达能力不足的问题。提出一种融合属性编码与集成学习的混合推荐算法。利用轻量的梯度提升机算法对用户与物品的基本属性信息进行融合编码处... 为解决传统推荐算法对用户与物品的基础属性信息利用不充分,以及使用单一推荐算法导致推荐模型表达能力不足的问题。提出一种融合属性编码与集成学习的混合推荐算法。利用轻量的梯度提升机算法对用户与物品的基本属性信息进行融合编码处理,丰富数据特征多样性;将线性算法与非线性算法混合作为基本模型,采用袋装的方式进行集成,提高算法模型推荐效果。实验结果表明,该混合推荐算法在多个评估标准上相比传统算法均有改善和提升。 展开更多
关键词 混合推荐算法 集成学习 特征编码 特征融合 特征剪枝 自助采样 并行训练
在线阅读 下载PDF
基于Levy飞行和麻雀搜索算法优化集成学习模型的水质估算
15
作者 李爱民 康轩 +3 位作者 袁铮 王海隆 闫翔宇 许有成 《同济大学学报(自然科学版)》 北大核心 2025年第3期450-461,共12页
由于水体的光学复杂性和不同水质参数之间的相互作用,利用集成学习方法估算水质参数具有优势;然而,在建模过程中如何合理选择超参数仍然是一个难题。麻雀搜索算法能够快速搜索集成学习模型的最优参数;而Levy飞行算法可以防止麻雀搜索算... 由于水体的光学复杂性和不同水质参数之间的相互作用,利用集成学习方法估算水质参数具有优势;然而,在建模过程中如何合理选择超参数仍然是一个难题。麻雀搜索算法能够快速搜索集成学习模型的最优参数;而Levy飞行算法可以防止麻雀搜索算法(Sparrow Search Algorithm,SSA)陷入局部最优,并提高模型的准确性和效率。使用Levy飞行算法和麻雀搜索算法对随机森林(RandomForest,RF)、自适应回归(AdaBoost Regression,ABR)和类别提升回归(CatBoost Regression,CBR)3种集成学习模型进行了优化。以郑州东风渠和熊耳河为研究区,基于实测叶绿素a(chlorophyll-a,Chl-a)和总悬浮物(total suspended solids,TSM)数据,构建了LSSA-RF、LSSA-ABR和LSSA-CBR这3种估算模型。实验结果表明:模型经过优化后,各项指标均有不同程度的提高。其中表现最优的是LSSA-CBR模型;CBR模型是在梯度提升框架下进行的建模,对比RF和CBR模型具有更高维度的学习能力。在叶绿素a的估算中,LSSA-CBR估算模型的均方根误差为2.325μg·L^(-1),决定系数为0.896;在总悬浮物的估算中,LSSA-CBR模型的均方根误差为1.598 mg·L^(-1),决定系数为0.882。最后,将精度较好的LSSA-CBR模型应用于卫星Planet影像中,以评估河流叶绿素a和总悬浮物的空间分布情况。研究结果可为环保部门快速了解城市河流水质分布及进行水质评价与管理提供参考。 展开更多
关键词 叶绿素a 总悬浮物 集成学习模型 Levy飞行—麻雀搜索算法 城市河流
在线阅读 下载PDF
基于组合时域特征提取和Stacking集成学习的燃煤锅炉NO_(x)排放浓度预测 被引量:3
16
作者 唐振浩 隋梦璇 曹生现 《中国电机工程学报》 EI CSCD 北大核心 2024年第16期6551-6564,I0022,共15页
为提高火电厂锅炉出口NO_(x)排放浓度的预测精度,提出一种考虑组合时域特征的Stacking集成学习模型。首先,为挖掘数据深层信息,采用时序分析、完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with ada... 为提高火电厂锅炉出口NO_(x)排放浓度的预测精度,提出一种考虑组合时域特征的Stacking集成学习模型。首先,为挖掘数据深层信息,采用时序分析、完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise analysis,CEEMDAN)和统计学计算数据标准差、偏度等特征的方法进行组合时域特征提取以构建重构数据;其次,考虑到重构数据中存在的冗余变量对模型的精度有所影响,利用遗传算法(genetic algorithm,GA)对重构数据进行特征降维;最后,为充分发挥各个模型的优势以提高模型的预测精度,构建以极限学习机(extreme learning machines,ELM)、深度神经网络(deep neural networks,DNN)、多层感知器(multilayer perceptron,MLP)、极限梯度提升算法(extreme gradient boosting,XGBoost)为基模型和以回声状态网络(echo state network,ESN)为元模型的Stacking集成学习NOx排放浓度预测模型。实验结果表明:该预测模型在不同数据集下都有着不错的预测效果,预测误差均小于2%,能够对锅炉NOx排放浓度实现精准预测。 展开更多
关键词 NO_(x)排放浓度 时序特征 时域特征 数据重构 stacking集成学习
在线阅读 下载PDF
基于Stacking集成学习的声波时差测井曲线复原研究 被引量:1
17
作者 曹志民 丁璐 韩建 《化工自动化及仪表》 CAS 2024年第3期470-476,共7页
声波时差测井曲线在石油勘探中发挥着不可或缺的作用,但是受地质或仪器的影响,经常会出现部分甚至完整的声波测井曲线缺失的情况。针对这一问题,提出了一种基于Stacking集成学习的声波时差测井曲线复原方法,该模型使用随机森林(RF)、梯... 声波时差测井曲线在石油勘探中发挥着不可或缺的作用,但是受地质或仪器的影响,经常会出现部分甚至完整的声波测井曲线缺失的情况。针对这一问题,提出了一种基于Stacking集成学习的声波时差测井曲线复原方法,该模型使用随机森林(RF)、梯度提升决策树(GBDT)、轻量梯度提升机(LightGBM)和极限梯度提升(XGBoost)作为基学习器,支持向量回归(SVR)作为元学习器,同时采用5折交叉验证的方法。实验选取了大庆油田某区块的实际测井数据,分别进行了同井和异井间的缺失声波时差测井曲线复原实验,结果表明,所提方法比单一模型预测更加准确,验证了此方法的可行性。 展开更多
关键词 声波时差测井曲线 stacking集成学习 测井曲线复原 5折交叉验证
在线阅读 下载PDF
基于VMD-Stacking集成学习的新能源发电功率预测模型 被引量:1
18
作者 慈铁军 廖子恒 +2 位作者 任梦晨 梁音 吴自高 《电力科学与工程》 2024年第9期14-23,共10页
在“双碳”背景下,新能源发电功率的准确预测对于电力系统的平稳运行至关重要。提出了一种自适应性的VMD-Stacking集成模型,以解决数据集变化时传统学习模型预测精度不高的问题。利用皮尔逊相关系数选择与发电功率强相关的气象特征,通... 在“双碳”背景下,新能源发电功率的准确预测对于电力系统的平稳运行至关重要。提出了一种自适应性的VMD-Stacking集成模型,以解决数据集变化时传统学习模型预测精度不高的问题。利用皮尔逊相关系数选择与发电功率强相关的气象特征,通过变分模态分解(Variational mode decomposition,VMD)将功率数据分解为多个模态分量,由此构成新的数据集。运用贝叶斯优化算法调整超参数,综合评判随机森林等8种学习模型的评价指标,自适应选出预测性能最优的3种模型作为基学习器,并选用稳定性和泛化能力相对较强的线性回归(Linear Regression)作为元学习器,建立Stacking融合模型。对各分量的预测值叠加,得到最终预测结果。以某新能源场站为例,对风、光电站的发电功率进行预测。算例验证结果表明,该模型在面对不同数据集时,体现出较强的适应性,预测性能也得到显著的提升。 展开更多
关键词 新能源功率预测 stacking集成学习 VMD 皮尔逊相关系数 贝叶斯超参数优化
在线阅读 下载PDF
近红外光谱结合Stacking集成学习的猕猴桃糖度检测研究
19
作者 郭志强 张博涛 曾云流 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2024年第10期2932-2940,共9页
利用近红外光谱技术Stacking集成学习对猕猴桃糖度的无损检测。以湖北“云海一号”猕猴桃为研究对象,采用红外分析仪获取了280个样本的光谱数据,包含了4000~10000cm^(-1)范围内的1557个波长数据,使用折射仪测量糖度值。通过蒙特卡洛随... 利用近红外光谱技术Stacking集成学习对猕猴桃糖度的无损检测。以湖北“云海一号”猕猴桃为研究对象,采用红外分析仪获取了280个样本的光谱数据,包含了4000~10000cm^(-1)范围内的1557个波长数据,使用折射仪测量糖度值。通过蒙特卡洛随机采样结合T检验的奇异样本识别算法筛除异常值样本。利用SPXY算法按照4∶1的比例划分训练集和测试集。使用多元散射校正(MSC)、SG平滑滤波(SG)、趋势校正(DT)、矢量归一化(VN)、标准正态变换(SNV)五种方法对数据进行预处理。使用无信息变量消除法(UVE)、竞争性自适应重加权算法(CARS)和区间变量迭代空间收缩特征选择算法(iVISSA)提取特征波长,使用连续投影算法(SPA)进行二次提取,消除共线性变量。由于单一模型的泛化能力有限,为了扩大建模能力,设计了一种基于Stacking算法的集成学习模型。选择贝叶斯岭回归(BRR)、偏最小二乘回归(PLSR)、支持向量机回归(SVR)以及人工神经网络(ANN)作为基学习器,线性回归(LR)作为元学习器建立集成模型,比较不同组合下集成模型的性能。使用Pearson相关系数分析基学习器与集成模型之间的关系。结果表明:在五种预处理方法之中,矢量归一化的效果最佳。对预处理后的光谱进行特征波长提取,结果显示VN-CARS-PLSR模型效果最好,在测试集上的RP2为0.805,RMSEP为0.498。模型提取了177个特征波长,数据量相比于原始光谱减少了88.6%。通过Stacking算法对基学习器进行融合,对比不同的组合方式,发现PLS+SVR+ANN集成模型预测精度最高,RP2达到了0.853,RMSEP下降至0.433。通过Pearson相关系数分析了基学习器对集成模型性能的影响。研究表明,与单一模型相比,Stacking集成模型能够进行更加全面的建模,具有更高的泛化能力,该方法为猕猴桃糖度品质的无损检测提供了技术支持。 展开更多
关键词 猕猴桃 近红外光谱 糖度 stacking集成学习 模型融合
在线阅读 下载PDF
基于集成学习算法的尾气处理装置SO_(2)排放预测模型
20
作者 张宝东 杜支文 +1 位作者 闫昭 侯磊 《石油与天然气化工》 北大核心 2025年第1期9-17,共9页
目的精确预测天然气净化厂尾气处理装置烟气中二氧化硫(SO_(2))排放质量浓度。方法利用某天然气净化厂2018—2023年每小时44000条尾气处理日报数据构建数据集,进行数据处理,并利用重要性分析方法提取27个重要特征。针对烟气中SO_(2)排... 目的精确预测天然气净化厂尾气处理装置烟气中二氧化硫(SO_(2))排放质量浓度。方法利用某天然气净化厂2018—2023年每小时44000条尾气处理日报数据构建数据集,进行数据处理,并利用重要性分析方法提取27个重要特征。针对烟气中SO_(2)排放质量浓度的预测任务,采用了随机森林(Random Forest)、梯度提升(Gradient Boost)和极值梯度提升(XGBoost)3种集成学习算法,以及基于径向基(RBF)内核的支持向量机(SVM)替代仿真模型进行建模。结果3种集成学习模型比SVM单模型的预测效果更为精准,而Random Forest模型展现出最佳性能,决定系数为0.89,均方误差为1250.59,相对于8800个真实测试集样本数据,其预测偏差为9.86%,相比于Random Forest模型(数据未处理),其决定系数提高了61.82%。结论Random Forest模型在准确预测尾气处理装置SO_(2)排放质量浓度方面具有实际生产应用价值,可为后续尾气处理装置的工艺参数优化提供可靠的模型支持。 展开更多
关键词 天然气净化 硫磺回收 尾气处理 二氧化硫排放 预测模型 集成学习算法
在线阅读 下载PDF
上一页 1 2 36 下一页 到第
使用帮助 返回顶部