期刊文献+
共找到70篇文章
< 1 2 4 >
每页显示 20 50 100
基于样本均衡蒸馏的少样本人脸识别方法
1
作者 钟锐 王晨 +1 位作者 宋亚锋 廖华江 《计算机工程与设计》 北大核心 2024年第11期3457-3462,共6页
为解决实际应用场景中人脸识别模型复杂度高和训练样本数量不足的问题,提出一种基于样本均衡蒸馏(sample balance distillation,SBD)的轻量高效人脸识别方法。通过构造样本均衡Focalloss损失函数解决训练样本数量不足的问题,该损失函数... 为解决实际应用场景中人脸识别模型复杂度高和训练样本数量不足的问题,提出一种基于样本均衡蒸馏(sample balance distillation,SBD)的轻量高效人脸识别方法。通过构造样本均衡Focalloss损失函数解决训练样本数量不足的问题,该损失函数能够在模型训练过程中增加稀少样本的权重,使模型能够对稀少样本进行准确分类,将蒸馏损失函数与样本均衡Focalloss损失函数进行加权融合,将教师网络强大的特征表达能力迁移至学生网络中,达到提高模型训练效率和分类精度的目标。为验证模型有效性,在多个样本数量分布不均衡数据集中进行大量实验,其结果表明,所提模型的训练时间和识别效率得到了显著提高,具有较高识别率。 展开更多
关键词 人脸识别 知识蒸馏 样本均衡蒸馏 轻量高效 深度神经网络 样本 Focalloss
在线阅读 下载PDF
YOLOv4-Balance:样本均衡的目标检测网络
2
作者 周泽清 於跃成 顾宙瑜 《软件导刊》 2024年第2期1-8,共8页
针对因数据集中小目标样本数量不足且分布不均衡,导致算法对小目标检测精度低的问题,在多尺度目标检测模型YOLOv4的基础上,提出一种融合动态损失反馈与数据增强的多尺度目标检测算法YOLOv4-Balance。首先,提出一种基于图像组合拼接的数... 针对因数据集中小目标样本数量不足且分布不均衡,导致算法对小目标检测精度低的问题,在多尺度目标检测模型YOLOv4的基础上,提出一种融合动态损失反馈与数据增强的多尺度目标检测算法YOLOv4-Balance。首先,提出一种基于图像组合拼接的数据增强算法U-Mix,均衡小目标样本的分布,提高数据集中的小目标学习样本质量。其次,基于模型训练迭代时的Loss反馈,提出一种利用动态损失反馈的多尺度模型训练算法DLF,以提高训练过程中小目标样本损失对模型学习的贡献度。实验结果表明,该算法在MSCOCO数据集上的平均精度较基线模型YO⁃LOv4提升了约2.1%,对小目标样本的检测精度提升了约2.8%。该算法不会引入额外的计算开销,且模型收敛快速,有助于高效进行训练。 展开更多
关键词 目标检测 样本均衡 数据增强 反馈驱动 多尺度
在线阅读 下载PDF
基于SVM SMOTE的电力变压器故障样本均衡化方法 被引量:57
3
作者 刘云鹏 和家慧 +3 位作者 许自强 王权 李哲 高树国 《高电压技术》 EI CAS CSCD 北大核心 2020年第7期2522-2529,共8页
在变压器故障诊断领域,数据集不平衡性带来的极端值、噪声等问题严重影响了分类算法的故障识别能力。为此,提出了一种基于支持向量机(supportvectormachine,SVM)合成少数类过采样(syntheticminority over-samplingtechnique,SMOTE)算法... 在变压器故障诊断领域,数据集不平衡性带来的极端值、噪声等问题严重影响了分类算法的故障识别能力。为此,提出了一种基于支持向量机(supportvectormachine,SVM)合成少数类过采样(syntheticminority over-samplingtechnique,SMOTE)算法的电力变压器故障样本均衡化方法,并结合机器学习进行故障诊断,以解决不平衡数据集下变压器故障诊断整体精度低的问题。首先,从原理、特点、应用等方面对传统SMOTE算法和SVM SMOTE算法进行了大量研究和分析;然后,以变压器油中溶解气体为样本集,构建了基于故障样本均衡化的变压器故障诊断模型;最后,对所提方法进行了算例仿真。结果显示:相较于传统变压器故障诊断算法,采用SVMSMOTE算法对故障样本进行均衡化后,各评价指标均有大幅提升,其中整体分类准确度αmacro-F1提升了18.9%。研究结果证明所提方法可以有效解决不平衡数据集下变压器故障样本漏判率高的问题,并在其分类上具有更高的精度。 展开更多
关键词 变压器 SVM SMOTE 样本均衡 油中气体分析 评价指标 故障诊断
在线阅读 下载PDF
基于样本均衡技术的专利侵权预警研究 被引量:1
4
作者 刘洋 张莉 《服务科学和管理》 2019年第6期227-233,共7页
知识产权的保护影响科研人员的创造力和企业的研发动力,是创新的重要驱动力和法律保障,专利侵权预警是知识产权保护的重要组成,而大量的专利侵权诉讼案件数据为挖掘、分析专利侵权行为模式,发现专利侵权的风险提供了基础。本文利用专利... 知识产权的保护影响科研人员的创造力和企业的研发动力,是创新的重要驱动力和法律保障,专利侵权预警是知识产权保护的重要组成,而大量的专利侵权诉讼案件数据为挖掘、分析专利侵权行为模式,发现专利侵权的风险提供了基础。本文利用专利相关的特征信息,基于样本均衡技术构建了专利预警模型,对比分析了随机森林、贝叶斯网络、神经网络、决策树模型、逻辑回归模型和SVM算法的性能。实验结果表明,随机森林模型在样本均衡后可取得更好的预警效果,能够更好地发现公司与专利之间的侵权诉讼关系,从而有效地实现专利侵权预警的功能。 展开更多
关键词 专利预警 知识产权 样本均衡 随机森林
在线阅读 下载PDF
考虑样本均衡机制的大脑皮层点云语义分割方法
5
作者 胡海涛 桑颜婷 +2 位作者 许树颖 陈世伟 彭文 《计算机应用》 CSCD 北大核心 2022年第S02期47-52,共6页
已有的大脑皮层分割方法多是在磁共振成像(MRI)图像的大脑结构分割基础上,再提取皮层信息作为最终分割结果。针对现有方法存在的数据量大、分割效率低、准确率易受到大脑内部结构分割结果影响的问题,提出了一种考虑样本均衡机制的大脑... 已有的大脑皮层分割方法多是在磁共振成像(MRI)图像的大脑结构分割基础上,再提取皮层信息作为最终分割结果。针对现有方法存在的数据量大、分割效率低、准确率易受到大脑内部结构分割结果影响的问题,提出了一种考虑样本均衡机制的大脑皮层点云语义分割方法。首先在充分考虑大脑皮层点云集合数据特点的基础上,应用PointNet分割网络对大脑皮层进行语义分割;然后引入样本均衡机制改善分割模型的损失函数,以提升较小语义分区对分割结果的贡献度。不同数据集上的实验结果表明,与SLANT-27相比,使用PointNet大脑皮层点云语义分割方法能够有效提高分割准确率和分割效率,而融入样本均衡机制后的大脑皮层点云语义分割方法在小分区的分割准确率上提高了至少16个百分点。研究结果显示PointNet能够很好地解决大脑皮层分割问题,并且样本均衡机制能够明显提升语义分区的平均准确率。 展开更多
关键词 大脑皮层 语义分割 点云 PointNet 样本均衡
在线阅读 下载PDF
基于自适应样本均衡与信息融合的林火检测数据增强方法 被引量:2
6
作者 吴福明 宋智豪 +2 位作者 王超 符利勇 业巧林 《林业科学》 EI CAS CSCD 北大核心 2023年第6期88-101,共14页
【目的】提出一种基于自适应样本均衡与信息融合的林火检测数据增强(SMA)方法,以解决因林火样本数据难以获取、各类别分布不均衡、场景表达能力不充分等导致林火检测效果不佳的问题。【方法】以河北省张家口市崇礼区采集的无人机林火图... 【目的】提出一种基于自适应样本均衡与信息融合的林火检测数据增强(SMA)方法,以解决因林火样本数据难以获取、各类别分布不均衡、场景表达能力不充分等导致林火检测效果不佳的问题。【方法】以河北省张家口市崇礼区采集的无人机林火图像为研究对象:1)对无人机视频进行预处理,构建原始数据集;2)采用类别统计、标注框中心化等方法分析数据存在的问题,如小目标居多、类别分布不均衡和标注框尺寸分散等;3)针对类别分布失衡问题,引入自适应参数,实现样本动态调整;4)为保证信息跨样本融合的有效性,提出新的参数指标IOA作为判定阈值,并给出合理参考值;5)设计12组消融试验,以无人机采集数据为样本,根据控制变量原则,对比原始数据、随机数据增强、马赛克数据增强和SMA方法在SSD、YOLOv3、YOLOv4主流算法中的林火检测结果;6)以MAP(平均查准率)为指标,评估不同数据增强方法在同一算法中的效果。【结果】消融试验结果显示,SMA方法在SSD、YOLOv3、YOLOv4算法中MAP分别为48.16%、82.02%、67.79%,相比原始数据分别提升12.14%、11.50%、36.83%,相比随机数据增强分别提升11.95%、4.86%、16.33%,相比马赛克数据增强分别提升1.06%、18.24%、1.79%。【结论】现有数据增强方法未能充分利用林火数据中蕴涵的信息,SMA方法引入自适应参数可解决样本分布不均衡问题,IOA指标引入能够实现数据跨样本融合。SMA方法在SSD、YOLOv3和YOLOv4算法中MAP相较传统方法均有提升,表现出对林火数据检测的有效性。 展开更多
关键词 森林防火 烟火检测 样本均衡 自适应 数据增强 信息融合
在线阅读 下载PDF
基于生成对抗网络的乳腺癌组织病理图像样本均衡化 被引量:3
7
作者 杨俊豪 李东升 +2 位作者 陈春晓 闫强 陆熊 《生物医学工程研究》 2020年第2期161-166,共6页
针对乳腺癌组织病理图像中各类样本的不均衡性,本研究构建了基于条件控制和深度卷积的两种乳腺癌组织病理图像样本生成对抗网络并生成人造样本,以实现样本均衡化。实验验证了两种网络用于数据均衡化的可靠性,发现在处理不均衡数据时基... 针对乳腺癌组织病理图像中各类样本的不均衡性,本研究构建了基于条件控制和深度卷积的两种乳腺癌组织病理图像样本生成对抗网络并生成人造样本,以实现样本均衡化。实验验证了两种网络用于数据均衡化的可靠性,发现在处理不均衡数据时基于深度卷积的生成对抗网络效果更好,基于条件控制的生成对抗网络鲁棒性更强;分析了增加人造样本对深度学习算法的影响。结果表明,本研究提出的数据均衡化方法将训练所得网络的分类准确率平均提升了近5%,生成对抗网络可以缓解深度学习在医学领域的应用中数据分布不平衡的问题。 展开更多
关键词 机器学习 样本均衡 生成对抗网络 组织切片 数据增强
在线阅读 下载PDF
样本均衡与特征选择在员工离职倾向预测上的应用 被引量:1
8
作者 吴学亮 娄莉 《智能计算机与应用》 2022年第7期181-184,共4页
本文采用SMOTE、ADASYN、SMOTETOMEK、SMOTEENN和Borderline-SMOTE 5种样本均衡方法,对数据进行了样本均衡。使用遗传算法对样本均衡前后的数据进行特征选择,并将LightGBM集成学习算法应用于员工数据,进行了离职倾向预测。结果表明,使用... 本文采用SMOTE、ADASYN、SMOTETOMEK、SMOTEENN和Borderline-SMOTE 5种样本均衡方法,对数据进行了样本均衡。使用遗传算法对样本均衡前后的数据进行特征选择,并将LightGBM集成学习算法应用于员工数据,进行了离职倾向预测。结果表明,使用SMOTEENN方法对标准化后的数据进行样本均衡处理后,再使用遗传算法对其进行特征选择,LightGBM预测效果最佳,验证了其优越性。 展开更多
关键词 LightGBM 样本均衡 特征选择 员工离职 机器学习
在线阅读 下载PDF
基于局部采样样本均衡的P2P借贷违约预警模型
9
作者 张雪飞 《金融》 2020年第5期455-464,共10页
随着互联网金融的不断发展,P2P网络借贷的借贷人违约风险识别引起金融机构的重点关注,且随着互联网金融整改措施的实施,借贷违约量不断减少,因此在这P2P网络借贷历史违约数据不断减少的环境下,基于不均衡数据的违约预警分析显得尤为重... 随着互联网金融的不断发展,P2P网络借贷的借贷人违约风险识别引起金融机构的重点关注,且随着互联网金融整改措施的实施,借贷违约量不断减少,因此在这P2P网络借贷历史违约数据不断减少的环境下,基于不均衡数据的违约预警分析显得尤为重要。本文在BSL不均衡样本抽样算法的基础上,通过Kmeans聚类算法降低抽样时间复杂度,并使用随机森林与其他机器学习分类算法进行对比实验,同时加入借款描述与借款标题的文本分析,最终建立了基于随机森林的P2P网络借贷违约预警模型来实现对于数据不均衡的P2P借贷违约风险识别。在满足高效率、高识别率的同时,满足了增量学习的现实需求,为P2P网络借贷平台提供一定的监管指导意见。 展开更多
关键词 P2P网络借贷 违约预警 随机森林 样本均衡
在线阅读 下载PDF
基于多特征融合的数字档案标签非均衡样本分类算法
10
作者 周红林 曾春生 刘国强 《电子设计工程》 2025年第2期163-166,171,共5页
由于数字档案标签样本存在较多冗余信息,不同类别的样本数量不平衡,且在分类过程中,无法保证数据信息的完整性,导致分类不精准。为此,提出基于多特征融合的数字档案标签非均衡样本分类算法。利用多特征融合模型,计算相似性特征,推导数... 由于数字档案标签样本存在较多冗余信息,不同类别的样本数量不平衡,且在分类过程中,无法保证数据信息的完整性,导致分类不精准。为此,提出基于多特征融合的数字档案标签非均衡样本分类算法。利用多特征融合模型,计算相似性特征,推导数据样本的标准融合条件,求解降维参数,完成数字档案标签降维处理。构造非均衡样本的关系特征,并联合迭代分类标准,确定数字档案标签非均衡样本分类。实验结果表明,所提算法的应用可以将数字档案信息传输至正确目标位置,符合精准分类应用需求。 展开更多
关键词 多特征融合 数字档案标签 均衡样本 相似性特征 降维参数 迭代分类
在线阅读 下载PDF
考虑训练样本分布不均衡的超短期风电功率概率预测 被引量:3
11
作者 李丹 方泽仁 +3 位作者 缪书唯 胡越 梁云嫣 贺帅 《电网技术》 EI CSCD 北大核心 2024年第3期1133-1145,共13页
提出一种考虑训练样本分布不均衡的超短期风电概率预测方法。首先构建深度信念混合密度网络,通过深度信念网络独特的预训练和微调机制提取输入变量的隐特征,利用Beta混合概率分布的有界性准确表征风电预测功率的概率分布,实现隐特征与... 提出一种考虑训练样本分布不均衡的超短期风电概率预测方法。首先构建深度信念混合密度网络,通过深度信念网络独特的预训练和微调机制提取输入变量的隐特征,利用Beta混合概率分布的有界性准确表征风电预测功率的概率分布,实现隐特征与预测功率概率分布参数之间的非线性映射;然后引入训练样本分布平滑策略,其中特征分布平滑技术用于校准输入特征,标签分布平滑技术用于对各样本误差赋予差异化权重,从输入和输出两方面改善训练样本分布不均衡现象对预测结果的不利影响。实际算例结果表明,与常见风电功率概率预测模型相比,所提模型在点预测和概率预测方面均能获得较高的预测精度,尤其能有效提高低密度样本区域的预测精度。 展开更多
关键词 风电功率概率预测 深度信念网络 混合密度网络 训练样本分布不均衡 特征分布平滑 标签分布平滑
在线阅读 下载PDF
面向数据不均衡的高效轻量脉冲诊断分类模型
12
作者 邱泽浩 杨晶东 《软件导刊》 2025年第4期25-31,共7页
为解决脉诊数据集在现实条件下存在的样本不均衡,以及现有高血压危险三分层脉搏波预测模型效率较低和分类精度较差的问题,提出一种面向数据不均衡的高效轻量脉冲诊断分类模型。首先,在预处理阶段提出一种改进的频域特征提取方法 MFCC-P... 为解决脉诊数据集在现实条件下存在的样本不均衡,以及现有高血压危险三分层脉搏波预测模型效率较低和分类精度较差的问题,提出一种面向数据不均衡的高效轻量脉冲诊断分类模型。首先,在预处理阶段提出一种改进的频域特征提取方法 MFCC-PCA,从数据中提取相关特征,应用SMOTE+ENN对数据集进行均衡化处理;其次,提出一种结合网格搜索与贝叶斯优化的超参数优化算法GBO优化XGBoost模型超参数,构建一种基于XGBoost算法的高血压预测模型GBO-XGBoost;最后,利用SHAP方法分析各高血压危险三分层的脉搏波特征对检测的重要性,为高血压预防和临床诊断提供参考。在脉诊数据集上的实验表明,GBO-XGBoost模型的Accuracy、Precision、F1-score和AUC值分别为98.27%、98.28%、98.36%、99.96%,相较于经典机器学习方法的分类精度更高。 展开更多
关键词 脉搏波 高血压 特征提取 超参数优化 样本均衡 特征重要性
在线阅读 下载PDF
基于投票网络解决样本非均衡的入侵检测识别模型 被引量:1
13
作者 李熙 梅倩 +2 位作者 陶洁 余嘉伟 冯常奇 《江汉大学学报(自然科学版)》 2024年第3期74-86,共13页
目前主流入侵检测系统通过学习人工标识的网络流量数据获得自动检测未知威胁的能力,但人工标识的数据出现偏差、缺失、小类样本过少等现象时,本应是攻击样本常会被认定为无害样本,致使入侵检测系统失效。大多数研究入侵检测的工作将整... 目前主流入侵检测系统通过学习人工标识的网络流量数据获得自动检测未知威胁的能力,但人工标识的数据出现偏差、缺失、小类样本过少等现象时,本应是攻击样本常会被认定为无害样本,致使入侵检测系统失效。大多数研究入侵检测的工作将整体性能作为检测性能的量化标准,而忽视了入侵检测的原始初衷,导致警告系统遭受攻击。针对以上问题,提出基于投票网络的智能识别模型来解决入侵检测系统训练数据不均衡的问题。通过可训练的投票模型,整合了传统机器学习模型与深度学习模型,在关注整体性能的同时,提升致命攻击的被检出率。实验结果显示,本模型在3种不同样本分布类型的数据集上均有较好的整体表现,并且有效地提高了小类别的检出率。 展开更多
关键词 入侵检测 网络攻击识别 均衡样本数据集 深度学习 机器学习
在线阅读 下载PDF
滑坡易发性评价中样本不均衡问题处理研究
14
作者 田尤 高波 +4 位作者 殷红 李元灵 张佳佳 陈龙 李洪梁 《水文地质工程地质》 CAS CSCD 北大核心 2024年第6期171-181,共11页
滑坡易发性评价中,样本不均衡问题的不同处理方案通常会带来评价结果的大量不确定性。针对这一问题,以藏东昌都市部分县(区)为研究区,构建滑坡/非滑坡样本不均衡数据集,采用不处理、下采样和合成少数类过采样(synthetic minority oversa... 滑坡易发性评价中,样本不均衡问题的不同处理方案通常会带来评价结果的大量不确定性。针对这一问题,以藏东昌都市部分县(区)为研究区,构建滑坡/非滑坡样本不均衡数据集,采用不处理、下采样和合成少数类过采样(synthetic minority oversampling technique,SMOTE)3种处置方案,运用逻辑回归方法分别构建滑坡易发性评价模型。基于ROC曲线、准确度、精确率、召回率、漏检率等评价指标,采用综合评价指标F_(1)′同数对模型分类的精度进行验证。结果表明:数据处理成均衡数据集(过采样/下采样)建立的模型效果较不处理数据建立的模型效果有了大幅提升,F_(1)′同数的值最大提高了53.17%;在下采样、过采样两种数据处理方案中,过采样方法比下采样方法F_(1)′分数的值提高了16.30%,表明过采样方法对处理样本不均衡数据问题方面具有较好效果。研究成果可为滑坡预测和地质灾害预测前的数据集处理提供参考,为进一步提高区域防灾减灾水平提供理论与技术支持。 展开更多
关键词 滑坡易发性 合成少数类过采样技术 评价模型 昌都市 样本均衡数据
在线阅读 下载PDF
基于改进SMOTE不均衡样本处理和IHPO-DBN的变压器故障诊断方法研究 被引量:1
15
作者 周萱 吴伟丽 《电力系统保护与控制》 EI CSCD 北大核心 2024年第11期21-30,共10页
针对由于变压器故障样本不均衡和故障模型陷入局部最优而导致的分类准确率低的问题,提出了基于改进的合成少数类过采样技术和优化深度置信网络(deep belief network, DBN)的变压器故障诊断方法。首先采用聚类融合的K-means算法,通过分... 针对由于变压器故障样本不均衡和故障模型陷入局部最优而导致的分类准确率低的问题,提出了基于改进的合成少数类过采样技术和优化深度置信网络(deep belief network, DBN)的变压器故障诊断方法。首先采用聚类融合的K-means算法,通过分簇和匹配的方式筛选出不稳定的少数类样本用以改进中心点合成少数类过采样技术(center point synthetic minority oversampling technique, CP-SMOTE)算法,并对少数类样本进行扩增,解决了变压器故障数据分布不均衡的问题。其次,通过加入随机逆向学习和自适应惯性权重技术对猎食者优化算法进行改进,并用改进后的算法对DBN的内部参数进行优化调整,提高了模型精度。最后,将不同数据预处理情况下以及不同数据规模下的变压器故障模型进行仿真对比。结果表明,经过数据预处理和模型优化后的变压器故障识别准确率能够提高到98%,有效地解决了故障数据不平衡导致的分类精度低的问题。 展开更多
关键词 变压器故障诊断 均衡样本 K-MEANS聚类 改进合成少数过采样 改进猎食者优化
在线阅读 下载PDF
非均衡样本视域下房地产上市公司财务风险预测分析
16
作者 马臻 黄成世 +2 位作者 常莹 鲁志娟 丛禹月 《中国管理信息化》 2024年第14期10-12,共3页
文章基于非均衡房地产上市公司样本视角,结合逻辑回归(Logistic Regression)算法对中国房地产上市公司的财务风险进行预测分析。研究结果表明,ADASYN-Logistic Regression模型能够有效解决房地产上市公司的非均衡样本问题,具备较好的预... 文章基于非均衡房地产上市公司样本视角,结合逻辑回归(Logistic Regression)算法对中国房地产上市公司的财务风险进行预测分析。研究结果表明,ADASYN-Logistic Regression模型能够有效解决房地产上市公司的非均衡样本问题,具备较好的预测性能。基于此,文章运用非均衡样本处理方法构建财务风险预测模型,旨在识别存在财务风险的公司,采取预防措施,提升公司竞争力。 展开更多
关键词 均衡样本 房地产公司 财务风险 逻辑回归
在线阅读 下载PDF
中心效应及中心间样本不均衡对临床疗效评价的影响 被引量:4
17
作者 林洁 魏永越 +1 位作者 陈峰 于浩 《中国临床药理学与治疗学》 CAS CSCD 2012年第4期428-432,共5页
目的:本文分析和探讨在多中心临床试验中,中心效应、中心与处理的交互作用以及各中心样本量不均衡对治疗效果评价的影响。方法:以二分类资料两组比较为例,采用计算机模拟试验,分别探讨各中心10种不同样本分配比例、3种中心效应时,对临... 目的:本文分析和探讨在多中心临床试验中,中心效应、中心与处理的交互作用以及各中心样本量不均衡对治疗效果评价的影响。方法:以二分类资料两组比较为例,采用计算机模拟试验,分别探讨各中心10种不同样本分配比例、3种中心效应时,对临床疗效的检验效能及Ⅰ类错误的影响。结果:在不存在中心效应,或有中心效应但中心与处理间无交互作用情况下,不同样本量的分配比例对检验效能的影响不大,Ⅰ类错误可控。当中心与处理间存在交互作用时,即使中心间样本量均衡,检验效能也有所下降,Ⅰ类错误亦增加,随着各中心样本均衡性变差,检验效能随之略有降低,I类错误亦随之少许增加。结论:在多中心临床试验中,若中心与处理间存在交互作用,会对疗效评价有影响,而中心间样本均衡性对结果影响较小。在临床试验设计时应给予高度重视。 展开更多
关键词 多中心临床试验 样本均衡 中心效应 交互作用
在线阅读 下载PDF
C-SVM在不同类别样本数目不均衡下的优化 被引量:3
18
作者 张秋余 赵付清 +3 位作者 王静 余冬梅 李建建 张润花 《兰州理工大学学报》 CAS 北大核心 2007年第4期90-92,共3页
在解决故障检测等分类问题时,若不同类别样本数目相差很大,C-SVM训练的分类错误总偏向于样本数较少的类别,因而影响了分类的精确性.为提高精确性,提出一种优化算法,在训练过程中针对不同类样本,采用不同的权值来优化训练过程,按正负类... 在解决故障检测等分类问题时,若不同类别样本数目相差很大,C-SVM训练的分类错误总偏向于样本数较少的类别,因而影响了分类的精确性.为提高精确性,提出一种优化算法,在训练过程中针对不同类样本,采用不同的权值来优化训练过程,按正负类样本在总样本中所占的比例,加大样本数较少的类别权值,降低样本数较大的类别权值来实现两类样本间的均衡.实验结果表明,该方法对两类样本数目相差很大的问题有效. 展开更多
关键词 C-SVM 均衡样本 参数优化 加权
在线阅读 下载PDF
基于非均衡样本集的煤矿突水预测模型 被引量:2
19
作者 谢天保 赵萌 雷西玲 《计算机系统应用》 2018年第4期124-130,共7页
针对煤矿突水样本集呈非均衡分布的特点,提出基于集成学习分类的煤矿突水预测模型,重点研究基分类器的构建方法、性能衡量指标和权重分析,以及基于改进型Boosting的集成学习算法.实验结果表明,该算法以牺牲不突水样本的最小误判率为代价... 针对煤矿突水样本集呈非均衡分布的特点,提出基于集成学习分类的煤矿突水预测模型,重点研究基分类器的构建方法、性能衡量指标和权重分析,以及基于改进型Boosting的集成学习算法.实验结果表明,该算法以牺牲不突水样本的最小误判率为代价,实现突水样本100%的判别准确率,且计算量小,易于实现. 展开更多
关键词 煤矿突水预测 均衡样本 基分类器 Boosting改进算法
在线阅读 下载PDF
基于数据均衡化的船舶涡轮增压系统故障诊断
20
作者 李星贤 肖文 +2 位作者 张斌 龚梅杰 陈辉 《武汉理工大学学报(交通科学与工程版)》 2024年第3期453-458,共6页
在船舶涡轮增压系统的故障诊断方面,针对正常状态与故障状态数据不平衡的问题,采用基于熵权重的Entropy-Weight SMOTE方法对数据样本进行增强,改善样本的不均衡性,并结合支持向量机(SVM)进行故障诊断.基于已有SMOTE算法与熵理论,以舰船... 在船舶涡轮增压系统的故障诊断方面,针对正常状态与故障状态数据不平衡的问题,采用基于熵权重的Entropy-Weight SMOTE方法对数据样本进行增强,改善样本的不均衡性,并结合支持向量机(SVM)进行故障诊断.基于已有SMOTE算法与熵理论,以舰船动力系统仿真平台运行数据作为样本集,搭建基于熵理论的Entropy-Weight SMOTE与SVM的涡轮增压系统故障诊断模型;将舰船动力仿真平台数据样本导入模型进行仿真计算,综合各类评价指标,评判该方法的可行性.仿真实验表明在采用Entropy-Weight SMOTE进行样本均衡化后,分类准确度和综合指标(F-Measure)提升了5.1%和6.5%.结果表明:该方法可以有效提高数据样本不平衡时涡轮增压系统的故障分类效果. 展开更多
关键词 支持向量机 涡轮增压系统 样本均衡 故障诊断 熵权重
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部